Claude Code Token Cost Simulator
API 호출 턴이 늘어날수록 토큰과 비용이 어떻게 누적되는지 시각화하는 인터랙티브 시뮬레이터
토큰 누적 공식
// "턴" = 1회의 API 호출(모델 요청→응답). 사용자의 채팅 입력 1건이
// 도구 호출 등으로 여러 번의 API 호출을 발생시킬 수 있으므로,
// 사용자 메시지 수 ≠ 턴 수. 실제 턴 수는 이보다 훨씬 많을 수 있음.
// 턴 n의 입력 토큰 (stateless API → 매 턴 전체 재전송)
input(n)
=
B
+ n·
T
+ (
O
+
Th
)·(n − 1)
B
= 시스템 프롬프트 + 도구 정의 (매 턴 고정)
T
= 턴당 새 사용자 입력 토큰
O
= 턴당 출력 토큰 (히스토리 누적)
Th
= 턴당 thinking 토큰 (히스토리 누적)
// 총 입력 = N·B + T·N(N+1)/2 + (O+Th)·N(N−1)/2
// → 삼각수(이차) 성장, O/Th 포함 시 더 가파름
Claude Code Costs →
비용 구성 요소
Input 토큰
정가 또는 캐시 가격 적용
Output + Thinking
항상 output 정가로 과금
Cache Write
정가의 125% (신규 캐시 저장)
Cache Read
정가의 10% (캐시 재사용)
Cache Miss
캐시 TTL(5분) 만료, 모델 전환, 또는 프롬프트 변경 시 캐시 적중 실패 → Cache Write 비용으로 재저장
Anthropic Prompt Caching →
모델별 가격표 ($/M tokens)
모델
Input
Output
Cache Write
Cache Read
Sonnet 4/4.6
$3
$15
$3.75
$0.30
Opus 4/4.6
$15
$75
$18.75
$1.50
Haiku 4.5
$0.80
$4
$1.00
$0.08
Anthropic Models & Pricing →
Opusplan 트레이드오프
Plan 턴은 Opus, 실행 턴은 Sonnet을 사용하는 전략.
유리
복잡한 계획 수립에 Opus의 높은 추론 능력 활용
유리
실행 턴은 Sonnet으로 비용 절감
불리
모델 전환 시 캐시가 격리되어 rebuild 필요
불리
전환 직후 턴은 캐시 히트율 0% → 비용 급증
불리
Opus output/thinking 토큰은 Sonnet의 5배 가격
시뮬레이션 설정
API 호출 턴 수
20
Base Tokens (B)
30,000
턴당 입력 토큰 (T)
4,000
턴당 출력 토큰 (O)
2,000
턴당 Thinking 토큰 (Th)
8,000
Base 캐시 히트율
100%
Conversation 캐시 히트율
85%
Opusplan 비교 모드
Plan 턴 수 (Opus)
3
Plan 턴 위치
세션 초반
세션 중반
분산 (교차)
Opus Thinking 토큰
16,000
토큰량
총 입력 토큰
-
총 출력 토큰
-
모델별 비용 (캐시 적용)
Sonnet 4/4.6
-
Opus 4/4.6
-
Haiku 4.5
-
Opusplan 비교
Opusplan 비용
-
vs Sonnet
-
vs Opus
-
캐시 Rebuild 비용
-
턴별 입력 토큰 분해
누적 비용 곡선