Tối ưu Tốc độ
Module 14.2: Tối ưu Tốc độ
Phần tiêu đề “Module 14.2: Tối ưu Tốc độ”Thời gian ước tính: ~30 phút
Yêu cầu trước: Module 14.1 (Tối ưu Task)
Kết quả: Sau module này, bạn sẽ biết kỹ thuật reduce response time, hiểu speed/quality tradeoff, và optimize cho different scenario.
1. WHY — Tại sao cần học
Phần tiêu đề “1. WHY — Tại sao cần học”Bạn đang chờ. Claude “thinking” 2 phút cho một simple task. Hoặc tệ hơn, 5 phút rồi không biết nó stuck hay đang working. Time cộng dồn — 10 slow task/ngày × 3 phút extra = 30 phút wasted mỗi ngày.
Speed optimization trả lại thời gian đó. Clear prompt, clean context, right model choice — những thứ này compound thành significant productivity gain.
2. CONCEPT — Khái niệm cốt lõi
Phần tiêu đề “2. CONCEPT — Khái niệm cốt lõi”Speed Factor
Phần tiêu đề “Speed Factor”| Factor | Chậm | Nhanh |
|---|---|---|
| Prompt | Vague, mơ hồ | Clear, specific |
| Context | 100K token | 10K token |
| Task | Complex, multi-step | Focused, single |
| Model | Opus (smartest) | Haiku (fastest) |
| Output | Long explanation | Just code |
Speed Formula
Phần tiêu đề “Speed Formula”Response Time = f(Context Size, Task Complexity, Output Length, Model)
Optimize từng factor:- Context: /clear thường xuyên, loại file không liên quan- Complexity: Break thành task đơn giản hơn (Module 14.1)- Output: "Code only, no explanation"- Model: Dùng model nhanh nhất mà vẫn workContext Management cho Speed
Phần tiêu đề “Context Management cho Speed”Heavy context: Light context:─────────────────────────────────────────────────50 file loaded 3 file liên quanFull conversation history Fresh sessionAll project documentation Chỉ những gì cần ↓ ↓Result: 60 sec response Result: 10 sec responseModel Selection Strategy
Phần tiêu đề “Model Selection Strategy”Task Complexity → Model Choice────────────────────────────────────────────────Simple (format, small edit) → Haiku (fastest)Medium (implement feature) → Sonnet (balanced)Complex (architecture, debug) → Opus (smartest)Output Optimization
Phần tiêu đề “Output Optimization”- “Code only, no explanation” — tiết kiệm output generation time
- “One file at a time” — nhanh hơn multiple file
- “Diff format” — nhanh hơn full file rewrite
So Sánh Model Chi Tiết Theo Loại Tác Vụ
Phần tiêu đề “So Sánh Model Chi Tiết Theo Loại Tác Vụ”Ngoài tốc độ chung, mỗi model có thế mạnh ở các loại tác vụ khác nhau:
| Loại Tác Vụ | Haiku | Sonnet | Opus | Khuyến Nghị |
|---|---|---|---|---|
| Formatting/Linting | Xuất sắc | Quá mức | Quá mức | Haiku — tốc độ quan trọng nhất, chất lượng đủ |
| Simple CRUD | Tốt | Xuất sắc | Quá mức | Sonnet — cần hiểu pattern |
| Tính năng phức tạp | Kém | Tốt | Xuất sắc | Opus — cần suy luận kiến trúc |
| Sửa Bug | Bug đơn giản | Hầu hết bug | Bug phức tạp | Khớp model với độ phức tạp bug |
| Code Review | Vấn đề style | Vấn đề logic | Vấn đề kiến trúc | Khớp model với độ sâu review |
| Viết Test | Test cơ bản | Test kỹ lưỡng | Test edge case | Sonnet cho hầu hết, Opus cho critical paths |
| Documentation | Tốt | Xuất sắc | Quá mức | Sonnet — cần hiểu context |
| Refactoring | Đổi tên/di chuyển | Tái cấu trúc | Kiến trúc | Khớp model với phạm vi refactoring |
Tốc Độ vs Chất Lượng vs Chi Phí
Phần tiêu đề “Tốc Độ vs Chất Lượng vs Chi Phí” Tốc độ Chất lượng Chi phíHaiku: ██████████ 10/10 ████░░░░░░ 4/10 █░░░░░░░░░ 1/10Sonnet: ██████░░░░ 6/10 ████████░░ 8/10 ████░░░░░░ 4/10Opus: ███░░░░░░░ 3/10 ██████████ 10/10 ████████░░ 8/10Quy tắc: Mặc định dùng Sonnet cho công việc hàng ngày. Chuyển sang Haiku cho batch operations và tác vụ đơn giản. Nâng lên Opus chỉ khi chất lượng output của Sonnet không đủ cho tác vụ cụ thể. Một startup Việt Nam đã giảm chi phí Claude từ $1,200 xuống $380/tháng bằng cách áp dụng cách tiếp cận này.
3. DEMO — Từng bước cụ thể
Phần tiêu đề “3. DEMO — Từng bước cụ thể”Scenario: Implement utility function (string helper).
Slow Approach
Phần tiêu đề “Slow Approach”[Session với 50K context từ work trước]
Bạn: Tạo utility function cho app. Cần string helper,date formatter, và validator. Explain mỗi function vàthêm comprehensive documentation.
Claude: [Thinking... 90 giây][Response dài với explanation, 200+ dòng]
Total time: ~3 phútFast Approach
Phần tiêu đề “Fast Approach”$ claude# Fresh session, clean contextBạn: Tạo src/utils/strings.ts với các function:- capitalize(str): Viết hoa chữ đầu- slugify(str): Convert thành URL slug- truncate(str, len): Cắt ngắn với ellipsis
Code only, no explanation.
Claude: [Thinking... 15 giây]export function capitalize(str: string): string { return str.charAt(0).toUpperCase() + str.slice(1);}
export function slugify(str: string): string { return str.toLowerCase().replace(/\s+/g, '-').replace(/[^\w-]/g, '');}
export function truncate(str: string, len: number): string { return str.length > len ? str.slice(0, len) + '...' : str;}Total time: ~20 giây
So sánh Tốc độ
Phần tiêu đề “So sánh Tốc độ”| Metric | Slow | Fast |
|---|---|---|
| Time | 3 phút | 20 giây |
| Speedup | - | 9x nhanh hơn |
Thay đổi gì:
- Fresh context (không 50K baggage)
- Specific scope (một file, ba function)
- “Code only” (không explanation overhead)
- Clear requirement (exact function signature)
Parallel Execution
Phần tiêu đề “Parallel Execution”# Chạy 3 task độc lập cùng lúcclaude -p "Tạo src/utils/strings.ts: capitalize, slugify" &claude -p "Tạo src/utils/dates.ts: formatDate, parseDate" &claude -p "Tạo src/utils/validators.ts: isEmail, isURL" &wait
# Total: ~25 giây (thay vì 75 giây sequential)4. PRACTICE — Luyện tập
Phần tiêu đề “4. PRACTICE — Luyện tập”Bài 1: Context Diet
Phần tiêu đề “Bài 1: Context Diet”Mục tiêu: Trải nghiệm impact của context size.
Hướng dẫn:
- Note context size hiện tại
- Dùng
/clearvà reload chỉ file essential - Chạy cùng task
- So sánh response time
💡 Gợi ý
Lệnh /cost hiện token usage. So sánh trước và sau /clear.
✅ Giải pháp
Kết quả typical:
- Heavy context (50K token): 45-90 giây response
- Light context (5K token): 10-20 giây response
- Speedup: 3-5x nhanh hơn với clean context
Bài 2: Output Trimming
Phần tiêu đề “Bài 2: Output Trimming”Mục tiêu: Đo impact của output length.
Hướng dẫn:
- Yêu cầu Claude implement với full explanation
- Bấm giờ
- Yêu cầu cùng thứ với “code only, no explanation”
- So sánh time
💡 Gợi ý
Output generation tốn time. Less output = faster response.
✅ Giải pháp
Kết quả typical:
- Với explanation: 30-60 giây, 100+ dòng output
- Code only: 10-20 giây, 20 dòng output
- Speedup: 2-3x nhanh hơn
Bài 3: Model Comparison
Phần tiêu đề “Bài 3: Model Comparison”Mục tiêu: Hiểu model speed/quality tradeoff.
Hướng dẫn:
- Pick một medium-complexity task
- Thử với different model nếu available
- So sánh: time, quality, appropriateness
💡 Gợi ý
Haiku nhanh nhất nhưng có thể miss nuance. Opus smart nhất nhưng chậm. Sonnet balance cả hai.
✅ Giải pháp
Cho simple formatting: Haiku (fast, sufficient quality) Cho feature implementation: Sonnet (balanced) Cho complex debugging: Opus (worth the wait)
Match model với task complexity.
5. CHEAT SHEET
Phần tiêu đề “5. CHEAT SHEET”Speed Technique
Phần tiêu đề “Speed Technique”# Fresh context/clear
# Minimal output"Code only, no explanation""Just the function, no tests""Diff format only"
# Focused scope"Only modify [file]""Just the [component]"Model Selection
Phần tiêu đề “Model Selection”| Task Type | Model | Vì sao |
|---|---|---|
| Simple edit | Haiku | Fastest |
| Feature | Sonnet | Balanced |
| Complex debug | Opus | Smartest |
Parallel Execution
Phần tiêu đề “Parallel Execution”claude -p "task 1" &claude -p "task 2" &waitContext Management
Phần tiêu đề “Context Management”/cleargiữa các task không liên quan- Load chỉ file đang work
- Exclude node_modules, build artifact
6. PITFALLS — Sai lầm thường gặp
Phần tiêu đề “6. PITFALLS — Sai lầm thường gặp”| ❌ Sai | ✅ Đúng |
|---|---|
| Never clear context | /clear cho fresh start |
| Always dùng Opus | Match model với task complexity |
| Ask explanation không đọc | ”Code only” cho speed |
| Load entire codebase | Load chỉ relevant file |
| Sequential khi có thể parallel | Use multiple session |
| Optimize quá sớm | Working first, speed sau |
| Sacrifice quality cho speed | Speed maintain quality |
7. REAL CASE — Câu chuyện thực tế
Phần tiêu đề “7. REAL CASE — Câu chuyện thực tế”Scenario: Agency Việt Nam, developer complain Claude “quá chậm” — 2-3 phút response time làm unusable cho quick task.
Audit Finding:
- Average context: 80K token (tích lũy nhiều ngày)
- Ask explanation mọi task
- Dùng Opus cho simple formatting
- Never dùng
/clear
Speed Optimization Protocol:
| Thay đổi | Trước | Sau |
|---|---|---|
| Daily fresh session | Never | Mỗi sáng |
| Context clearing | Never | Giữa project |
| Output style | Với explanation | Code only (default) |
| Model matching | Always Opus | Task-appropriate |
Kết quả:
- Average response: 2.5 phút → 30 giây (5x nhanh hơn)
- Developer satisfaction: “Claude feels snappy now”
- No quality reduction
Quote: “Chúng tôi bắt Claude mang ba lô 80K token đi khắp nơi. Không lạ nó chậm. Đi nhẹ thay đổi mọi thứ.”
Tiếp theo: Module 14.3: Tối ưu Chất lượng →