Claude Code Token Cost Simulator

토큰 누적 공식

// "턴" = 1회의 API 호출(모델 요청→응답). 사용자의 채팅 입력 1건이
// 도구 호출 등으로 여러 번의 API 호출을 발생시킬 수 있으므로,
// 사용자 메시지 수 ≠ 턴 수. 실제 턴 수는 이보다 훨씬 많을 수 있음.

// 턴 n의 입력 토큰 (stateless API → 매 턴 전체 재전송)
input(n) = B + n·T + (O + Th)·(n − 1)

B = 시스템 프롬프트 + 도구 정의 (매 턴 고정)
T = 턴당 새 사용자 입력 토큰
O = 턴당 출력 토큰 (히스토리 누적)
Th = 턴당 thinking 토큰 (히스토리 누적)

// 총 입력 = N·B + T·N(N+1)/2 + (O+Th)·N(N−1)/2
// → 삼각수(이차) 성장, O/Th 포함 시 더 가파름

Claude Code Costs →

비용 구성 요소

Input 토큰
정가 또는 캐시 가격 적용

Output + Thinking
항상 output 정가로 과금

Cache Write
정가의 125% (신규 캐시 저장)

Cache Read
정가의 10% (캐시 재사용)

Cache Miss
캐시 TTL(5분) 만료, 모델 전환, 또는 프롬프트 변경 시 캐시 적중 실패 → Cache Write 비용으로 재저장

Anthropic Prompt Caching →

모델별 가격표 ($/M tokens)

모델	Input	Output	Cache Write	Cache Read
Sonnet 4/4.6	$3	$15	$3.75	$0.30
Opus 4/4.6	$15	$75	$18.75	$1.50
Haiku 4.5	$0.80	$4	$1.00	$0.08

Anthropic Models & Pricing →

Opusplan 트레이드오프

Plan 턴은 Opus, 실행 턴은 Sonnet을 사용하는 전략.

유리 복잡한 계획 수립에 Opus의 높은 추론 능력 활용
유리 실행 턴은 Sonnet으로 비용 절감
불리 모델 전환 시 캐시가 격리되어 rebuild 필요
불리 전환 직후 턴은 캐시 히트율 0% → 비용 급증
불리 Opus output/thinking 토큰은 Sonnet의 5배 가격

Claude Code Token Cost Simulator

토큰 누적 공식

비용 구성 요소

모델별 가격표 ($/M tokens)

Opusplan 트레이드오프

시뮬레이션 설정

Opusplan 비교 모드

턴별 입력 토큰 분해

누적 비용 곡선