Tại sao AI coding đơn agent gặp giới hạn — và multi-agent thay đổi thực sự điều gì

Tôi đang ở file thứ 8 trong 15 files. Đang build một feature fullstack cho ShipWithAI — trang toolkit với custom schema, trang overview, trang detail, seed content, và config updates. Claude Code làm rất tốt, file này xong sang file khác, tuần tự.

Rồi tôi nhận ra. Component ở file 8 dùng naming convention hoàn toàn khác với quyết định ở file 2. Tôi giải thích lại convention. Claude Code xin lỗi, sửa. Tiếp tục. File 11 — import paths mâu thuẫn với folder structure từ file 4. Giải thích lại. Sửa. File 13 — nó tạo type conflict với schema từ file 1.

Tôi không code CÙNG AI. Tôi đang trông trẻ.

Đây không phải lời phàn nàn về Claude Code. Đây là khoảnh khắc tôi nhận ra AI coding đơn agent có một giới hạn cấu trúc — và bắt đầu tìm cách vượt qua nó.

Trần nhà của đơn agent

Có một điều không ai nói trong mấy bài viết “AI sẽ tăng productivity 10x”: một agent, một context window, một thread. Điều này hoạt động tuyệt vời cho tasks vừa vặn trong một mental model duy nhất. Refactor function này. Viết test này. Sửa bug này. Claude Code thực sự phép thuật ở những thứ này.

Nhưng khi task của bạn trải rộng 10+ files với các quyết định liên kết nhau — schema choices ảnh hưởng tới components, API contracts quyết định frontend behavior, config ảnh hưởng routing — bạn đâm vào tường.

Không phải lỗi Claude Code. Đây là vật lý. Dù context window có lớn đến đâu, codebases thật có các quyết định phân nhánh tích lũy theo thời gian. Đến khi agent tới file 8, các quyết định từ file 1 đã bị đẩy ra khỏi vùng chú ý. Không phải “quên” theo nghĩa con người — mà là context degradation. Tín hiệu từ quyết định ban đầu bị pha loãng bởi noise của mọi thứ sau đó.

Thực tế diễn ra thế nào:

Nghẽn tuần tự: File A → B → C → D… mỗi file đợi file trước. Feature 15 files mất hàng giờ.
Context degradation: Quyết định từ files đầu bị mất hoặc mâu thuẫn ở files sau.
Bạn thành orchestrator bất đắc dĩ: Tự chia tasks, mở nhiều sessions, merge outputs, bắt conflicts. AI gõ code, nhưng BẠN phải suy nghĩ về coordination.

Kết quả: bạn thành project manager trông một developer tài năng nhưng hay quên. Và nó mệt kinh khủng.

Multi-agent thực sự có nghĩa gì

Bỏ qua buzzword. Đây là analogy giúp tôi hiểu.

Đơn agent = một senior dev làm mọi thứ một mình. Giỏi, nhưng với project lớn thì chậm và bắt đầu tạo inconsistencies vào buổi chiều.

Multi-agent = một tech lead (orchestrator) + team chuyên gia. Tech lead phân tích công việc, giao từng phần cho đúng người, review kết quả. Mỗi chuyên gia tập trung vào scope hẹp nơi họ giỏi nhất.

Oh My Claude Code (OMC) là layer orchestration đó. Nó không thay thế Claude Code — nó phối hợp nhiều instances của Claude Code, mỗi cái có scope tập trung. Architect agent thiết kế approach. Executor agents implement từng phần song song. Reviewer kiểm tra kết quả. Verifier xác nhận mọi thứ hoạt động.

Insight quan trọng: multi-agent không giải quyết giới hạn context window — nó đi vòng qua. Mỗi agent vẫn có context giới hạn. Nhưng nếu task đủ nhỏ, context giới hạn là đủ. Việc của orchestrator là decomposition: chia problems lớn thành pieces đủ nhỏ để một agent giữ được toàn bộ context.

Các modes map vào tình huống thực:

Autopilot: Senior dev làm solo. Tự chủ hoàn toàn, tuần tự. Tốt cho tasks rõ ràng, scope xác định.
Team: Tech lead delegate cho team có phối hợp. Pipeline nhiều giai đoạn với verification mỗi stage.
Ultrapilot: Tech lead giao cho 5 devs chạy song song. Mỗi người nhận files không overlap. Nhanh hơn 3-5x.
Pipeline: Dây chuyền sản xuất. Design → implement → review → test. Output mỗi stage feed vào stage tiếp.
Ecomode: Nhân sự thông minh. Tasks đơn giản giao cho junior (Haiku — rẻ hơn), phức tạp cho senior (Opus).

Thực tế thay đổi gì trong workflow của tôi

Tôi dùng OMC hàng ngày trên nhiều repos suốt nhiều tháng. Đây là báo cáo thành thật — cả thắng lẫn thua.

Thắng: Ultrapilot cho toolkit feature

Cùng feature 15 files mà trước đó mất cả ngày trông trẻ? Tôi mô tả cho ultrapilot. OMC chia công việc: một worker lo schema, một lo trang overview, một lo trang detail, một lo seed content. Chạy song song, files không overlap.

Có perfect không? Không. Tôi vẫn review output và sửa vài chỗ — vài naming inconsistencies giữa các workers, một import path cần điều chỉnh. Nhưng phần lớn công việc xong nhanh hơn đáng kể so với chế độ đơn agent tuần tự. Và quan trọng, mỗi worker có context tập trung vào phần của mình thay vì cố giữ 15 files trong một bộ não.

Thắng: Team mode cho batch bug fixes

ShipWithAI có 5 bugs style độc lập — vấn đề light theme trên nhiều trang khác nhau. Thay vì feed từng bug một cho Claude Code, tôi dùng team mode. Ba executor agents, mỗi agent nhận bugs từ pool, chạy đồng thời. Năm bugs sửa xong trong một lượt thay vì năm sessions tuần tự.

Thắng: Planning interview tiết kiệm rework

Trước khi build toolkit feature, tôi dùng plan mode. Planner của OMC hỏi các câu hỏi làm rõ: “Static hay dynamic content?” “Bao nhiêu tools ban đầu?” “Content schema như nào?” “Category taxonomy?” Khoảng 8 câu hỏi.

Năm phút làm rõ trước tiết kiệm rework đáng kể. Không có bước này, agents sẽ giả định — và ba trong số giả định đó sẽ sai.

Thua: Ralph mode đi sai hướng

Cái này tôi bị cháy. Tôi dùng ralph mode cho task refactoring mơ hồ: “clean up auth module.” Không có definition of done rõ ràng. Không có acceptance criteria cụ thể.

Ralph là persistence mode — nó tiếp tục iterate cho đến khi architect agent verify công việc hoàn thành. Không có criteria rõ, “hoàn thành” không xác định được. Ralph loop khoảng 45 phút. Mỗi cycle cải thiện chút chút. “Not verified clean yet.” Cycle tiếp. Tweaks nhỏ. “Still not perfect.” Cycle tiếp.

Tôi đốt nhiều tokens cho improvements ngày càng vô nghĩa trước khi phải cancel thủ công.

Bài học: Ralph cần đích đến. “All tests pass, zero type errors, no unused imports” hoạt động. “Clean up the code” thì không.

Bài học lớn: CLAUDE.md là bộ não chung

Đây là insight lớn nhất. Multi-agent mà không có shared context là hỗn loạn.

Lúc đầu, tôi chạy OMC trên repo không có CLAUDE.md. Hai agents edit cùng domain — một dùng camelCase, một dùng snake_case. Một tạo helper functions inline, một trích xuất ra utilities. Chúng literally mâu thuẫn nhau.

Sau khi viết CLAUDE.md chất lượng — conventions, patterns, folder structure, naming rules — mọi agent đọc nó trước khi bắt đầu. Consistency tăng mạnh. CLAUDE.md trở thành “team agreement” mà tất cả agents tuân theo. Nó không phải optional — nó là nền tảng khiến multi-agent hoạt động.

Khi nào dùng mode nào

Sau nhiều tháng dùng hàng ngày, đây là decision framework của tôi:

Tình huống	Dùng cái này	Tại sao
Task rõ ràng, scope xác định	`autopilot`	Tuần tự ổn khi scope hẹp
Feature fullstack, nhiều files	`ultrapilot` hoặc `/team`	Parallelism tỏa sáng với pieces độc lập
Batch items độc lập	`/team N:executor`	Agents nhận tasks từ shared pool
Sequential workflow (analyze → code → test)	`pipeline`	Output mỗi stage feed vào stage tiếp
Batch work độ phức tạp khác nhau	`eco`	Route tasks đơn giản về model rẻ hơn
Requirements mơ hồ	`plan` trước	Làm rõ trước khi build
Phải đúng, có done criteria rõ	`ralph`	Kiên trì đến khi verified — nhưng ĐỊNH NGHĨA “done”
Task nhỏ, 1-2 files	Vanilla Claude Code	Overhead OMC lớn hơn lợi ích

Insight quan trọng: việc của orchestrator là decomposition, không phải phép thuật. Decompose tốt, mỗi agent nhận task tập trung với context đủ. Decompose tệ, agents conflict và bạn tốn thời gian sửa coordination issues nhiều hơn thời gian tiết kiệm được.

Kết luận thành thật

OMC không biến AI thành senior developer. Nó biến BẠN thành tech lead của team AI. Và giống mọi tech lead, bạn vẫn review code, xử lý escalations, và dọn dẹp. Nhưng throughput tăng đáng kể khi bạn biết cách delegate.

Nó có perfect không? Không. Ralph mode sẽ đốt tokens nếu bạn không cho criteria rõ. Agents sẽ conflict nếu CLAUDE.md yếu. Debug khó hơn khi output đến từ 5 agents song song thay vì một session tuần tự. Và bạn vẫn phải hiểu mỗi dòng code trước khi ship.

Nhưng lần đầu tiên, tôi không còn là bottleneck trên multi-file features. Bức tường vẫn ở đó — mỗi agent vẫn có context window. Nhưng thay vì một agent đập vào tường liên tục, tôi có team focused agents mỗi cái hoạt động trong giới hạn của mình. Và điều đó thay đổi tất cả.

Hướng dẫn cài đặt và review chi tiết xem tại trang toolkit Oh My Claude Code. Tìm hiểu sâu về multi-agent architecture tại Module 7.3: Multi-Agent Architecture.