3줄 요약

  1. Mnimiy(@Mnilax)가 90일간 Claude Code 사용량을 감사한 X Article이다. 430시간, 600만 입력 토큰, $1,340 지출을 분석했다.
  2. 생산적 토큰은 전체의 27%에 불과했고, 나머지 73%는 9가지 보이지 않는 오버헤드 패턴이 차지했다.
  3. 패턴을 모두 수정한 결과 생산적 토큰 비율이 ~65%로 올라 동일 플랜에서 유효 용량이 2.4배 늘었다.

9가지 낭비 패턴

패턴 1: CLAUDE.md 비대화 (~14%)

4,800토큰짜리 CLAUDE.md가 매 턴 로드되어 전체 입력의 14%를 먹고 있었다. 규칙 파일을 통합하고 불필요한 지시를 제거하여 1,500토큰 이하로 줄이는 것이 해법이다.

패턴 2: 대화 이력 재토큰화 (~13%)

메시지가 쌓일수록 이전 메시지 전체가 매번 재토큰화된다. 30번째 메시지에서는 비용이 30배로 불어난다. 세션당 20메시지 상한을 두면 효과적이다.

패턴 3: 훅 주입 (~11%)

4개 플러그인이 사용자 질문 처리 전에 매번 6,200토큰을 주입하고 있었다. 불필요한 UserPromptSubmit 훅을 비활성화하여 1개만 남기자 요청당 5,800토큰이 절약됐다.

패턴 4: 세션 재개 시 캐시 미스 (~10%)

기본 캐시 수명이 5분이라 커피 한 잔 타고 오면 전체 재토큰화가 발생한다. 캐시 수명을 1시간으로 늘리면 80% 비용 절감이 가능하다.

패턴 5: 불필요 스킬 자동 로딩 (~7%)

9개 스킬이 ‘만약을 위해’ 매번 자동 로드되고 있었다. 실제 사용하는 3~4개만 남기고 비활성화하여 작업당 9,000+ 토큰 절약.

패턴 6: 미사용 MCP 도구 정의 (~6%)

12개 MCP 서버의 도구 스키마가 매 요청에 전송됐다. 실제 필요한 3개만 남기자 요청당 6,000토큰 절약. 도구 정의도 컨텍스트 예산의 일부라는 사실을 잊기 쉽다.

패턴 7: 단순 작업에 Extended thinking (~5%)

변수명 변경 같은 단순 작업에도 고급 추론이 전역으로 켜져 있었다. 메시지별로 thinking 모드를 토글하면 불필요한 5% 오버헤드를 제거할 수 있다.

패턴 8: 잘못된 방향 생성 (~4%)

Claude가 잘못된 방향으로 진행할 때 끝까지 기다리면 출력 토큰이 낭비된다. 즉시 중단(Cmd+.)하는 습관만으로 월 ~$15 절약. 인간의 판단 개입 시점이 비용을 결정한다.

패턴 9: 플러그인 중복 초기화 (~3%)

9개 SessionStart 훅이 매 세션마다 중복 실행됐다. 2개로 통합하여 세션당 1,200토큰 절약.

개선 결과

모든 패턴을 수정한 뒤 생산적 토큰 비율이 **27%에서 ~65%**로 올랐다. 플랜 업그레이드 없이 유효 용량이 두 배 이상 늘어난 셈이다.

저자의 핵심 메시지는 명확하다: 모델 능력이나 프롬프트 품질이 아니라 컨텍스트 비대화가 대부분 사용자의 실제 병목이다.

가장 흥미로운 지점

9가지 패턴 중 상위 4개(CLAUDE.md, 대화 이력, 훅, 캐시)만으로 48%를 차지한다는 점이 눈에 띈다. 모두 ‘보이지 않는’ 오버헤드라서 사용자가 직접 토큰을 추적하지 않으면 발견하기 어렵다. Claude Code의 비용 구조가 “내가 쓰는 프롬프트"가 아니라 “시스템이 매번 주입하는 맥락"에 지배된다는 사실은, 프롬프트 최적화보다 시스템 설정 최적화가 먼저라는 반직관적인 결론으로 이어진다.

출처

Mnimiy (@Mnilax) | X Article | 2026-05-01 원문: https://x.com/Mnilax/status/2050261839653556522