Token maxxing? 뭔... 개소리세요?

실리콘밸리 개발자들이 도대체 뭘 쓰길래 30일에 60조 토큰이 나오는지 궁금했다. 근데.. 내가 더 많이 쓰는구나.. 그리고 그게 능력으로 평가받는 시대라는데, 그게 맞나?

Jun Noh

어제 메타에서 클로드 코드 토큰을 한 달에 60조개를 쓴다는 기사를 봤다.

“얘넨 도대체 뭘 하길래 이렇게나 많이 씀??”

이라는 생각을 하면서… 조금 더 읽어봤다.

대충 요약하면 내용은 이렇다.

메타 사내 인트라넷에 “Claudeonomics” 라는 이름의 토큰 사용량 leaderboard가 있는데(메타 리더십이 만든 게 아니라 한 직원이 자발적으로 만든 거라고 한다), 거기서 추적한 30일간 메타 직원 85,000명이 60조개의 토큰을 썼다.

Sonnet 가격 기준으로 보수적으로 잡아도 월 약 $180M, 한화로 2,500억 원. 1년이면 2~3조. (물론 엔터프라이즈 계약이니 실제 단가는 훨씬 낮겠지만.)

도대체 뭘 했길래 60조가 나오나.

마침 글 소재도 마땅히 없어서, 오늘은 이거다! 하는 생각으로 조금 더 파봤다.

실리콘밸리 개발자가 어떻게 쓰는지 추측해보고, 내 사용량과 비교도 해보고, “역시 거기는 미친 듯이 쓰는 곳이구나” 하는 결론으로 깔끔하게 글을 쓰려고 했다.

근데… 뭔가 글의 방향이 이상하게 흘러갔다.

1. 일단 평균부터 계산해보자

60조를 8.5만 명, 30일로 나누면 — 1인당 일 약 2,350만 토큰, 월로는 약 7억 토큰이다.

비용으로 환산하면 보수적으로 1인당 월 $2,000 내외.

음… 의외로 평범하다. 개발자 한 명이 Claude Code 같은 거 켜놓고 하루 코딩하면 가뿐히 나오는 양 같은데? 회사 카드로 결제한다고 치면 그렇게 미친 액수도 아니다.

어… 그러면 60조라는 숫자가 그냥 머리 수가 많아서 나온 합계지, 1인당으로는 평범한 거 아닌가?

호기심이 좀 줄어들었다.

의외로… 평범해서 그냥 뭐, 여기도 똑같네 하고 말려고 했다.

근데 그 다음이 문제였다.

2. 그래서 내 토큰 사용량을 까봤다

평균이 1인당 7억 토큰/월이라니, 평범한 K-개발자인 나는 그것보다 적게 쓰겠지. “메타 직원이 평균적으로 나보다 몇 배 더 쓴다” 같은 글이 나오겠지.

ccusage 한 번 돌렸다. 결과를 보고 좀 멍해졌다.

4/27 ~ 5/15 (19일)
  총 비용:   $3,678.12
  총 토큰:   약 58억 7천만 (cache 포함)
  일 평균:   $193 / 약 3억 토큰

30일로 환산하면 — 약 $5,800 / 92억 토큰.

메타 직원 1명 평균과 비교하면 약 13배 정도 토큰을 많이 쓰는거다.

뭐야 나 왜 이렇게 많이 씀?

그렇게 놀랄 일은 아니다. 난 어차피 Claude Max 를 쓰니.., 월 $200 정액에 토큰 많이 써도 추가 청구가 없다.

위 $5,800은 “만약 종량제로 썼다면 들었을 가상 비용”이지 실제 카드값은 아니다.

그래도 내가 개발자가 메타 직원 평균보다 13배 더 토큰을 태우고 있다는 사실 자체는 변하지 않는다.

3. 근데 뭐, 평균의 역설이 아니겠나?

내가 메타 평균보다 13배 쓴다는 게 충격이긴 한데, 좀 진정하고 다시 보면 이상한 일도 아니다.

평균이라는 게 그렇다. 8.5만 명 중에 코딩 안 하는 직군(디자이너, PM, HR, 운영, 마케팅) 이 절반 가까이 될 거고, 코딩하는 직군 중에서도 회의 / 결재 / 슬랙에 시간 쪼개느라 가볍게 쓰는 사람이 대다수일 거다.

거기서 진짜 헤비유저들 — AI팀, 인프라 코어 개발자, agent 만지는 친구들 — 이 미친 듯이 쓰면서 평균을 끌어올리는 거다.

1인 개발자 한 명이 그 헤비유저 그룹에 자연스럽게 들어가는 건 별로 이상한 일이 아니다. 옆에 동료 없이 깨어있는 시간 다 코딩하는 사람이니까. 어쩌면 그 헤비유저들끼리 비교하면, 내가 13배가 아니라 오히려 적게 쓰는 쪽일지도 모른다.

근데 좀, 생각해보니 이상하다. 뭣하러 토큰 리더보드를 만들어 놓음???

갑자기 이런 생각이 들었다. 애초에 왜 리더보드가 있었는가.

8.5만 명짜리 회사 안에서 “누가 토큰을 가장 많이 썼나” 를 게이미피케이션 leaderboard 까지 만들어서 추적할 동기가 도대체 뭔가? 토큰을 절약하는 사람을 칭찬하는 게 아니라, 많이 쓰는 사람한테 타이틀을 주는 구조잖아.

회사 비용 입장에선 토큰 사용량은 줄여야 할 숫자지, 늘려야 할 숫자가 아니다. 근데 메타에서는 늘리는 사람이 영웅 취급을 받는다고? 어… 이게 뭐지?

이 의문이 풀리지 않아서, 좀 더 검색해봤다. 그러다 진짜 신기한 단어를 마주쳤다.

4. “Token maxxing” 이라는 신조어가 진짜 생겨났다

검색하다 보니 “Token maxxing” 이라는 단어가 진짜 굴러다닌다.

토큰 사용량을 어떻게든 최대치로 끌어올리는 것 자체가 능력 지표라는 사고방식.

엔비디아 CEO 젠슨 황이 Podcast 에서 이런 말도 했다.

“$500K 받는 엔지니어가 $250K 어치 토큰을 안 쓰면 나는 걱정될 거다.”

그리고 토큰을 채용 패키지에 넣는 시대가 올 거라고도 했다. “How many tokens come along with my job?” 이 면접에서 “스톡옵션 얼마예요?” 만큼 표준 질문이 될 거라고.

이제 메타 leaderboard 의 타이틀들도 좀 다르게 보이기 시작한다. “Token Legend”, “Session Immortal”, “Model Connoisseur”, “Cache Wizard”. 이름 자체가 길드 등급 올라가는 모바일 게임 그 자체다. 토큰을 많이 쓰는 게 곧 영웅적 행위라는 분위기를 노골적으로 드러낸다.

거기서 1위 한 사람은 30일에 281B(2,810억) 토큰을 썼다. 일로 환산하면 9.36B/일. 내 30배. 메타 평균의 약 400배. 사람이 직접 코딩해서 가능한 양이 아니다. 알고 보니 AI agent를 몇 시간씩 돌려놓고 leaderboard 위로 올리려고 한 사람들도 있었다고 한다. 즉 본인이 일하면서 쓴 토큰이 아니라 방치한 봇이 굴린 토큰.

leaderboard 는 결국 데이터 유출 사건 이후 폐쇄됐다.

회사 단위로도 비슷한 일이 벌어진다. Uber는 5,000 엔지니어한테 Claude Code 풀어줬다가 4개월 만에 연간 AI 예산 $3.4B 를 다 태웠다. CTO가 “예산 다 썼다” 를 4개월 차에 보고했고, 그게 통제 실패가 아니라 “투자 성공” 으로 받아들여진 분위기다.

이러니 leaderboard 가 만들어진 거다. 회사 비용을 줄이려는 게 아니라, “우리 회사는 이만큼 AI 적극적이다” 를 증명하는 도구로. 토큰 사용량이 곧 회사의 자랑이 되고, 그걸 가장 많이 끌어올린 직원이 영웅이 되는 — 그런 등식이 슬쩍 자리 잡고 있다.

5. 근데 이게 진짜 능력 지표가 맞나?

근데 이게 잘 와닿지가 않았다.

뭐 게으른 천재? 그런것도 아니고.. 무슨 토큰 쓰는게 능력이라고 하는거지?

보니까 이걸 비판하는 사람들도 꽤 있다.

토큰 양은 측정하기 쉬운 거지, 가치 있는 게 아니다. 진짜 봐야 할 건 “value per token” — 같은 토큰으로 얼마나 가치를 만들었느냐.

이 말 듣고 좀 뜨끔했다.

내 92억 토큰을 떠올려봤다. 그 안에 진짜로 결과를 만든 토큰이 얼마고, “Claude한테 한 번 더 물어볼까?” 하면서 의미 없이 굴린 토큰이 얼마인지 — 솔직히 모르겠다. 70%는 후자일 가능성이 높다.

또 하나 떠오르는 비판도 있었다. 이게 옛날 “lines of code” metric의 agentic 버전이라는 거다.

옛날엔 “코드 몇 줄 쳤냐” 로 개발자 능력을 평가하다가, 그게 멍청한 짓이라는 게 합의되는 데 시간이 꽤 걸렸다. 그런데 지금 이걸 또 같은 실수를 metric만 바꿔서 다시 하고 있는 셈이다. “토큰 몇 개 썼냐” 로.

메타 leaderboard 에서 봇 돌려놓고 순위 올리던 사람들이, 옛날에 의미 없는 코드 줄 수 늘리던 그 패턴이랑 정확히 같다.

6. 그래서 나는?

솔직히 — 아닌 것 같다.

내가 토큰을 많이 쓰는 이유는 단순하다.

  • 1인 개발자라 옆에 물어볼 동료가 없다. 동료 대신 Claude.
  • 회의 / 결재 / 슬랙 같은 마찰이 0이다. 깨어있는 시간 다 코딩.
  • “한 번 더 물어볼까?”, “인스펙터 돌릴까?” 의 임계치가 낮다. 어차피 추가 비용 없으니까.

이게 능력이라기보다 “환경이 토큰을 많이 쓰게 만들어준다” 에 가깝다.

같은 양으로 같은 결과를 메타 평균 직원이 만들어내고 있다면, 진짜 능력 있는 건 그쪽이다.

그러니까 내 92억 토큰 / 메타 헤비유저의 281B 토큰 / Uber의 $3.4B 예산 — 이 모든 숫자가 “잘 쓴 거” 가 아니라 “많이 쓴 거” 라는 거다.

이건 절대 그 사람의 어떤 창의력이라던지 높은 지능의 지표가 될 수 없다.

뭐, 그게 어떤 도구든 — 사용량 자체가 자랑이 되는 시대는 보통 도구의 가격이 싼 동안만 지속된다.

AI 비용이 본격적으로 청구되기 시작하면, “value per token” 에 대한 질문이 진짜로 중요해질 거다.

그때 나는 가치가 있는 사람일까? 솔직히 자신 없다.

마치며

뭐, 결국 — 이게 점점 더 진짜 Pay to Win 으로 가고 있다는 게 오늘 내 결론이다.

근데 한 가지 좀 두려운 게 있다.

토큰값이 본격적으로 비싸지면, 그 비용을 감당할 수 있는 사람만 일할 수 있게 된다. 메타나 Uber처럼 회사가 토큰을 다 흡수해주는 곳에 들어가야만 1군 개발자 자리를 지키게 되고, 1인 개발자 입장에선 토큰값 자체가 진입장벽이 되는 거다.

20년 전엔 좋은 컴퓨터 한 대 살 돈만 있으면 일을 시작할 수 있었다. 지금은 도구값을 매달 낼 수 있어야 따라간다. 앞으로는 — 매달 카드값으로 일할 자격을 사는 시대가 될 수도 있겠다.

이게 진짜 그렇게 흘러가면, 일자리가 줄어드는 이유가 단순히 “AI가 사람을 대체해서” 가 아니라, “AI를 살 수 있는 사람만 일하니까” 가 될 수도 있다는 게 좀 무섭다.

마침.

다른 글 보기