Claude Code Token Cost Simulator

API 호출 턴이 늘어날수록 토큰과 비용이 어떻게 누적되는지 시각화하는 인터랙티브 시뮬레이터

토큰 누적 공식

// "턴" = 1회의 API 호출(모델 요청→응답). 사용자의 채팅 입력 1건이
// 도구 호출 등으로 여러 번의 API 호출을 발생시킬 수 있으므로,
// 사용자 메시지 수 ≠ 턴 수. 실제 턴 수는 이보다 훨씬 많을 수 있음.

// 턴 n의 입력 토큰 (stateless API → 매 턴 전체 재전송)
input(n) = B + n·T + (O + Th)·(n − 1)

B = 시스템 프롬프트 + 도구 정의 (매 턴 고정)
T = 턴당 새 사용자 입력 토큰
O = 턴당 출력 토큰 (히스토리 누적)
Th = 턴당 thinking 토큰 (히스토리 누적)

// 총 입력 = N·B + T·N(N+1)/2 + (O+Th)·N(N−1)/2
// → 삼각수(이차) 성장, O/Th 포함 시 더 가파름

비용 구성 요소

Input 토큰
정가 또는 캐시 가격 적용
Output + Thinking
항상 output 정가로 과금
Cache Write
정가의 125% (신규 캐시 저장)
Cache Read
정가의 10% (캐시 재사용)
Cache Miss
캐시 TTL(5분) 만료, 모델 전환, 또는 프롬프트 변경 시 캐시 적중 실패 → Cache Write 비용으로 재저장

모델별 가격표 ($/M tokens)

모델InputOutputCache WriteCache Read
Sonnet 4/4.6$3$15$3.75$0.30
Opus 4/4.6$15$75$18.75$1.50
Haiku 4.5$0.80$4$1.00$0.08

Opusplan 트레이드오프

Plan 턴은 Opus, 실행 턴은 Sonnet을 사용하는 전략.
  • 유리 복잡한 계획 수립에 Opus의 높은 추론 능력 활용
  • 유리 실행 턴은 Sonnet으로 비용 절감
  • 불리 모델 전환 시 캐시가 격리되어 rebuild 필요
  • 불리 전환 직후 턴은 캐시 히트율 0% → 비용 급증
  • 불리 Opus output/thinking 토큰은 Sonnet의 5배 가격

시뮬레이션 설정

API 호출 턴 수20
Base Tokens (B)30,000
턴당 입력 토큰 (T)4,000
턴당 출력 토큰 (O)2,000
턴당 Thinking 토큰 (Th)8,000
Base 캐시 히트율100%
Conversation 캐시 히트율85%

Opusplan 비교 모드

Plan 턴 수 (Opus)3
Plan 턴 위치
Opus Thinking 토큰16,000
토큰량
총 입력 토큰
-
총 출력 토큰
-
모델별 비용 (캐시 적용)
Sonnet 4/4.6
-
Opus 4/4.6
-
Haiku 4.5
-
Opusplan 비용
-
vs Sonnet
-
vs Opus
-
캐시 Rebuild 비용
-

턴별 입력 토큰 분해

누적 비용 곡선