3줄 요약

  1. Uber COO Andrew Macdonald가 Rapid Response 인터뷰(2026-05-23 공개)에서 사내 AI 지출, 특히 Claude Code 토큰 비용을 정당화하기가 점점 어려워지고 있다고 발언했다.
  2. 토큰 사용량이 늘었지만 “25% 더 유용한 소비자 기능이 만들어졌다"는 식의 비례 산출은 보이지 않는다 — 그 인과의 연결선이 아직 없다는 진단이다.
  3. CEO Khosrowshahi는 채용 둔화로 AI 비용을 상쇄하고 있으며, Big Tech의 tokenmaxxing 흐름과 달리 Duolingo는 ‘AI를 위한 AI 사용’을 평가에서 빼는 방향으로 후퇴했다.

Andrew Macdonald, Uber COO, on Centre Stage during day one of Collision 2022 at Enercare Centre in Toronto, Canada. Andrew Macdonald, Uber COO. (Sam Barnes/Sportsfile for Collision via Getty Images)

발언의 배경 — Claude Code 예산 초과 사건

Macdonald 발언의 도화선은 4월에 있었다. Uber CTO Praveen Neppalli Naga는 The Information 인터뷰에서 “Uber는 이미 2026년 Claude Code 예산을 다 써버렸다”고 밝혔고, 이 발언이 사내에서 “head-exploding moment”가 됐다. 이후 회사 내부에서는 AI 토큰 소비량과 그것이 만들어 내는 트레이드오프 — 가령 인력 — 에 관한 논의가 본격적으로 시작됐다.

Macdonald는 이번 Rapid Response 인터뷰에서 시니어 엔지니어링 리더들과의 대화를 토대로 자신의 판단을 정리했다.

“그 연결선이 아직 없다” — 토큰 ↔ 기능 인과의 결손

핵심 진단은 단순하다. 토큰 사용량이 증가했다고 해서 유용한 소비자 기능이 그만큼 비례해 늘어나지는 않는다.

“That link is not there yet, right? I think maybe implicitly there is more that is getting shipped, but it’s very hard to draw a line between one of those stats and, ‘Okay, now we’re actually producing 25% more useful consumer features.’”

— Andrew Macdonald

암묵적으로는 더 많이 출시되고 있을 수도 있다. 하지만 토큰 통계 한 줄과 “이제 우리가 25% 더 유용한 소비자 기능을 만들고 있다"는 결론 사이에 직선을 그을 수 없다는 것이다. Macdonald는 이어 AI가 “사용자가 그냥 앉아서 흥미로운 use case를 떠올리기만 한다면” 공짜처럼 느껴질 수 있지만, 결국 청구서를 내는 것은 회사라는 점을 짚었다.

트레이드오프: 채용 둔화로 AI 비용 상쇄

항목내용
발신자CEO Dara Khosrowshahi
시점2026년 5월 실적 발표 (earnings call)
발표 내용Uber가 AI 투자 비용을 상쇄하기 위해 채용을 늦추고 있다

Macdonald는 이런 트레이드오프(예: 인력)를 직접 인과로 정당화하기가 어렵다고 본다. 토큰 지출과 산출(기능·생산성) 사이의 연결선이 약한 상태에서, 그 비용을 채용 둔화로 메우는 결정은 더 강한 정당화 근거를 필요로 한다는 신호다.

tokenmaxxing의 반례 — Duolingo의 후퇴

기사가 대조점으로 제시하는 사례는 Duolingo다. Meta·Google·JPMorgan 등 Big Tech가 직원 평가에 AI 사용 정도를 포함시키는 tokenmaxxing 방향으로 가는 반면, Duolingo는 그 결정을 철회했다. 직원들이 “AI를 위한 AI 사용"에 의문을 제기했기 때문이다.

“It felt like, rather than being held accountable for the actual outcome, we were trying to just push something that in some cases did not fit.”

— Luis von Ahn, Duolingo CEO (April podcast interview)

실제 결과로 책임을 묻는 대신, 일부 상황에는 맞지 않는 무언가를 그냥 밀어붙이고 있다는 느낌이었다는 진술이다. AI 사용 자체를 KPI로 둘 때 발생하는 수단의 목표화가 명시적으로 지적된 보기 드문 사례다.

가장 흥미로운 지점

이 기사가 흥미로운 이유는 tokenmaxxing의 정당화 압력이 어디서 균열을 내고 있는지를 보여주기 때문이다. 4월에는 CTO가 “예산 소진"을 자랑처럼 흘렸고, 5월에는 COO가 “그 연결선이 아직 없다"고 말한다. 같은 회사 안에서 한 달 만에 톤이 자랑에서 경계로 옮겨갔다는 신호다.

특히 Macdonald가 짚은 “AI가 공짜처럼 느껴진다"는 사용자 측 환상은, AI를 쓰는 개별 엔지니어의 시야와 토큰 청구서를 보는 재무·운영 임원의 시야가 분리되어 있다는 조직 내 정보 비대칭 문제로도 읽힌다. 토큰 사용량을 평가 지표로 삼는 회사일수록 이 비대칭은 더 벌어진다 — 사용자는 더 많이 쓸 인센티브를 받고, 회사는 그것이 산출로 이어졌는지 검증할 도구가 없는 상태에 놓인다.

Duolingo의 후퇴는 이 비대칭에 대한 한 가지 응답으로 보인다. “AI를 얼마나 썼나"가 아니라 “실제 결과가 무엇인가"로 평가 지표를 되돌리는 방향이다. Uber도 같은 질문 앞에 서 있다.

출처