Bỏ qua để đến nội dung

Tối ưu Chi phí

Thời gian ước tính: ~35 phút

Yêu cầu trước: Module 14.3 (Tối ưu Chất lượng)

Kết quả: Sau module này, bạn sẽ hiểu Claude Code pricing, biết track và reduce cost, và make informed model/usage decision.


Cuối tháng, API bill gấp 3 lần expected. Tiền đi đâu? Hóa ra developer dùng Opus cho mọi thứ, một người khác để session chạy với huge context. Cost add up nhanh.

Cost optimization cho bạn control. Biết token đi đâu. Chọn đúng model. Tránh waste. Make Claude Code sustainable — không phải budget crisis đợi xảy ra.


Cost = (Input Token × Input Price) + (Output Token × Output Price)
Price vary theo model:
- Opus: Đắt nhất (complex reasoning)
- Sonnet: Trung bình (general coding)
- Haiku: Rẻ nhất (simple task)

⚠️ Pricing thay đổi — verify rate hiện tại tại anthropic.com

ModelInput (per 1M)Output (per 1M)Best For
Opus~$15~$75Complex architecture
Sonnet~$3~$15Daily coding
Haiku~$0.25~$1.25Quick task
High Cost: Low Cost:
─────────────────────────────────────────────────
Large context (80K+) Fresh context
Opus cho mọi thứ Model matching
Long output Concise request
Repeated similar query Caching/reuse
Debug loop Get it right first time

80% cost thường đến từ 20% usage. Identify expensive pattern trước:

  • Big context session
  • Opus overuse
  • Debug loop
High Value + Low Cost → Maximize (Haiku cho simple task)
High Value + High Cost → Justify (Opus cho architecture)
Low Value + Low Cost → Ignore (minimal impact)
Low Value + High Cost → Eliminate (wasteful pattern)

Scenario: Team đang spend $500/month muốn reduce xuống $300 mà không mất productivity.

Cost Breakdown (sample month):
By Model:
- Opus: $350 (70%) ← Red flag: overuse
- Sonnet: $120 (24%)
- Haiku: $30 (6%)
By Activity:
- Code generation: $250
- Debugging: $150 ← Red flag: loop
- Code review: $70
- Documentation: $30
Vấn đềHiện tạiTargetAction
Opus overuse$350$15060% task → Sonnet
Debug loop$150$50Better context, ít attempt
Large context--50%Regular /clear
## Cost Guideline
**Default model**: Sonnet
**Dùng Haiku cho**: formatting, simple edit, quick question
**Chỉ dùng Opus cho**: architecture decision, complex debugging
**Trước khi dùng Opus, hỏi**:
1. Đây có thực sự là complex reasoning?
2. Đã thử Sonnet chưa?
3. Value có đáng 5x cost không?
**Thói quen**:
- `/clear` giữa các task không liên quan
- "Code only" cho implementation task
Task: "Fix typo trong README"
Trước: Opus ($0.50) → Sau: Haiku ($0.02)
Tiết kiệm: 96%
Task: "Implement CRUD endpoint"
Trước: Opus ($2.00) → Sau: Sonnet ($0.40)
Tiết kiệm: 80%
Task: "Design microservices architecture"
Trước: Opus ($3.00) → Sau: Opus ($3.00)
Tiết kiệm: 0% (nhưng justified — appropriate use)
ModelTrướcSauThay đổi
Opus$350$120-66%
Sonnet$120$150+25% (shifted)
Haiku$30$50+67% (shifted)
Total$500$320-36%

Productivity: Maintained. Quality: Maintained.


Mục tiêu: Hiểu spending pattern hiện tại.

Hướng dẫn:

  1. Estimate Claude Code usage tuần này
  2. Breakdown theo: model, task type, outcome
  3. Identify: Cái gì có thể dùng model rẻ hơn?
  4. Tính potential saving
💡 Gợi ý

Track 3 ngày: mỗi lần dùng Claude, note model và task type. Pattern emerge nhanh.

✅ Giải pháp

Finding phổ biến:

  • 50%+ Opus usage có thể là Sonnet
  • Simple question thường gửi model đắt
  • Debug session tích lũy hidden cost

Potential saving typical: 30-50% chỉ với model matching.

Mục tiêu: Tạo quick-reference cho model selection.

Hướng dẫn:

  1. List 10 task phổ biến bạn làm với Claude
  2. Assign optimal model cho mỗi task
  3. Tạo quick reference
  4. Follow 1 tuần
💡 Gợi ý

Hầu hết coding task work fine với Sonnet. Reserve Opus cho true complexity.

✅ Giải pháp

Ví dụ guide:

  • Haiku: typo, formatting, boilerplate, simple question
  • Sonnet: feature, debugging, review, doc
  • Opus: architecture, security audit, novel problem

Dán gần monitor để reference nhanh.

Mục tiêu: Viết cost guideline cho team.

Hướng dẫn:

  1. Draft cost guideline cho CLAUDE.md
  2. Define khi nào dùng model nào
  3. Thêm /clear policy và output preference
  4. Share với team nếu applicable
💡 Gợi ý

Giữ simple — 5-10 bullet max. Policy phức tạp bị ignore.

✅ Giải pháp

Xem CLAUDE.md addition ở Bước 3 trong DEMO — đó là production-ready template.


ModelCostDùng cho
Haiku$Formatting, typo, simple edit, quick question
Sonnet$$Feature, debugging, code review, documentation
Opus$$$Architecture, complex debugging, security, novel problem
✓ Default Sonnet, không Opus
✓ Dùng Haiku cho simple task
✓ /clear giữa project
✓ "Code only" cho implementation
✓ Fix root cause (avoid debug loop)
  • Review weekly usage
  • Alert khi spike bất thường
  • Budget per project/developer

❌ Sai✅ Đúng
Opus cho mọi thứMatch model với task complexity
Never dùng HaikuHaiku cho simple task (huge saving)
Không track costRegular audit và monitoring
Optimize trước khi hiểuAudit trước, optimize sau
Sacrifice quality cho costOptimize waste, không value
Debug loop (5+ attempt)Better prompt, better context
Ignore context size/clear reduce token cost

Scenario: Startup Việt Nam, 8 developer. Claude Code bill nhảy từ $400 lên $1,200 trong 1 tháng. CEO hỏi: “Chuyện gì xảy ra?”

Điều tra:

  • 2 developer discover Opus, dùng cho mọi thứ
  • 1 developer có session chạy cả tuần (150K context)
  • Debug loop trung bình 8 attempt per bug

Kế hoạch Cost Optimization:

TuầnFocusAction
1AwarenessShare pricing: “Opus gấp 5x Sonnet cost”
2GuidelinesModel selection guide trong CLAUDE.md
3MonitoringWeekly cost review, breakdown per-developer

Kết quả (tháng sau):

  • Cost: $1,200 → $380 (giảm 68%)
  • Productivity: Unchanged
  • Quality: Unchanged

Developer quote: “Tôi không biết Haiku có thể làm 80% việc tôi đang dùng Opus.”

CEO quote: “Cost optimization không phải về restriction. Mà về awareness. Developer thấy số liệu, tự nhiên chọn tốt hơn.”


Phase 14 Hoàn Thành! Bạn đã học optimize Claude Code cho task efficiency, speed, quality, và cost.

Phase Tiếp Theo: Phase 15: Templates, Skills & Ecosystem