Cách Anthropic xây dựng AI coding agent
được sử dụng rộng rãi nhất

Khi Claude Code được phát hành trên npm, source maps cũng đi kèm theo. Chúng tôi đã đọc từng tập tin. Cuốn sách này đúc kết kiến trúc, các quyết định thiết kế và các mẫu thiết kế có thể ứng dụng thành 18 chương mà bạn có thể học hỏi và áp dụng vào cấu trúc hệ thống của riêng mình.

Bắt đầu đọc

Bạn sẽ học được gì

Agent Loop

Cách một async generator điều khiển toàn bộ hệ thống — phát trực tuyến đầu ra của model, thực thi công cụ, phục hồi sau lỗi và nén ngữ cảnh qua 4 lớp.

Thực thi công cụ ở quy mô lớn

Một pipeline 14 bước từ yêu cầu model đến kết quả công cụ. Phân giải quyền, speculative execution, và phân lô đồng thời dựa trên phân loại an toàn.

Điều phối đa tác nhân (Multi-agent orchestration)

Cách các sub-agent chia sẻ prompt cache prefixes để giảm 95% chi phí. Fork Agents, coordinator mode, các nhóm swarm với giao tiếp thông qua mailbox.

Bộ nhớ không cần cơ sở dữ liệu

Bộ nhớ dựa trên tệp với hệ thống LLM-powered recall. Bốn loại bộ nhớ, cảnh báo độ trễ (staleness), và một Sonnet side-query đánh bại tìm kiếm thông qua embedding.

Kỹ thuật hiệu suất

Khởi động trong 240ms thông qua parallel I/O. Slot reservation giúp tiết kiệm ngữ cảnh trong 99% yêu cầu. Bitmap pre-filters dùng cho tìm kiếm mờ. Mỗi mili-giây đều được tính toán.

Khả năng mở rộng và bảo mật

Hai giai đoạn tải kỹ năng (tải siêu dữ liệu khi khởi động, tải nội dung theo yêu cầu). 27 lifecycle hooks cùng các bản chụp cấu hình được đóng băng ngay lúc khởi động để ngăn chặn injection.

Khám phá kiến trúc

Sáu thành phần trừu tượng cốt lõi hỗ trợ Claude Code. Kéo các node để sắp xếp lại, di chuột để xem chi tiết, nhấp để đọc chương.

Dành cho ai

Kỹ sư xây dựng các hệ thống agentic. Mỗi chương kết thúc bằng mục "Apply This" — 5 mẫu thiết kế có thể ứng dụng cùng với lời khuyên thích ứng cụ thể. Học hỏi kiến trúc, bỏ qua những sai lầm.

Các nhà lãnh đạo kỹ thuật đang đánh giá các kiến trúc. Theo dõi câu chuyện mà không cần đọc từng khối mã. Hiểu rõ tại sao các quyết định được đưa ra chứ không chỉ là điều gì đã được xây dựng.

Bất kỳ ai tò mò về cách các công cụ AI hoạt động trong thực tế. Claude Code được hàng trăm ngàn nhà phát triển sử dụng. Đây là cách nó hoạt động ở bên trong.

Mục lục

Phần 1

Nền tảng

Trước khi tác nhân có thể suy nghĩ, quá trình này phải tồn tại.

Kiến trúc của AI Agent

6 phần tử trừu tượng cốt lõi, luồng dữ liệu, hệ thống phân quyền, hệ thống build

Khởi đầu Nhanh — The Bootstrap Pipeline

Khởi tạo 5 giai đoạn, I/O song song ở mức module, ranh giới độ tin cậy

Trạng thái — The Two-Tier Architecture

Bootstrap singleton, AppState store, sticky latches, theo dõi chi phí

Giao tiếp cùng Claude — The API Layer

Proxy đa nhà cung cấp, prompt cache, phát trực tuyến, phục hồi lỗi

Phần 2

Vòng lặp Cốt lõi

Nhịp đập của tác nhân: phát trực tuyến, hành động, quan sát, lặp lại.

Agent Loop

Phân tích tự động query.ts, nén 4 lớp, phục hồi lỗi, định mức token

Công cụ — Từ Định nghĩa đến Thực thi

Giao diện công cụ, đường ống 14 bước, hệ thống phân quyền

Thực thi Công cụ Đồng thời

Thuật toán chia mảng, streaming executor, speculative execution

Phần 3

Điều phối đa tác nhân

Một tác nhân thì mạnh mẽ. Nhiều tác nhân cùng làm việc thì tạo ra sự thay đổi lớn.

Khởi tạo Sub-Agents

AgentTool, vòng đời 15 bước runAgent, các loại tác nhân tích hợp

Fork Agents và Prompt Cache

Kỹ thuật byte-identical prefix, chia sẻ bộ nhớ cache, tối ưu chi phí

Tác vụ, Điều phối và Swarms

Cỗ máy trạng thái tác vụ, coordinator mode, nhắn tin swarm

Phần 4

Sự nhất quán và Trí thông minh

Một tác nhân không có bộ nhớ sẽ mãi mắc cùng một lỗi.

Bộ nhớ — Học hỏi qua Các Bình luận

Bộ nhớ trên tệp, phân loại 4 chuẩn, LLM recall, cảnh báo trễ tệp

Khả năng Mở rộng — Kỹ năng và Hooks

Tải công cụ hai giai đoạn, lifecycle hooks, snapshot security

Phần 5

Giao diện

Mọi thứ người dùng nhìn thấy đều đi qua lớp này.

Terminal UI

Fork tùy chỉnh từ biến Ink, tính toán render, bộ đệm kép, các pools phân tán

Đầu vào và Tương tác

Phân loại thao tác phím, keybindings, chuẩn ngõ chép chord, chế độ vim

Phần 6

Khả năng kết nối

Tác nhân vươn ra khỏi localhost.

MCP — Giao thức Truyền vận Phổ quát

Truyền vận 8 mô hình, OAuth dành cho MCP, quá trình bọc các lệnh công cụ

Điều khiển Từ xa và Vân hành Cụm mây (Cloud)

Bridge thuật v1/v2, CCR, proxy upstream hệ thống gốc

Phần 7

Kỹ thuật Hiệu suất

Làm cho mọi thứ nhanh tới mức con người không nhận ra hệ thống máy móc ở dưới.

Hiệu suất — Mỗi Mili-giây và Token

Nhịp khởi động, khoang ngữ cảnh nội bộ, prompt cache, kỹ thuật hiển thị render

Đoạn Kết — Những Bài học Đáng Giá

5 chuẩn dự án mang tính kiến trúc lớn nhất, thứ truyền vào, chuẩn hướng sắp tới

Cuốn sách này được tạo ra như thế nào

Mã nguồn được trích xuất từ source maps của npm — các tập tin .js.map đi kèm với Claude Code chứa một trường sourcesContent bao gồm toàn bộ TypeScript gốc ban đầu. Gần hai ngàn tập tin cấu thành toàn bộ kiến trúc.

36 AI agents đã phân tích và viết toàn bộ cuốn sách trong bốn giai đoạn:

Khám phá 6 agent chạy song song đọc từng tập tin trong cây mã nguồn

Phân tích 12 agent viết 494KB tài liệu kỹ thuật thô

Viết sách 15 agent viết lại mọi thứ từ đầu thành các chương theo trình tự

Đánh giá & Chỉnh sửa 3 người đánh giá đưa ra 900 dòng phản hồi; 3 agent khác áp dụng toàn bộ sửa đổi

Toàn bộ quy trình — từ lúc trích xuất đến cuốn sách hoàn chỉnh cuối cùng — mất khoảng 6 giờ. Một đợt rà soát cuối cùng đảm bảo không còn mã nguồn nguyên bản nào sót lại — mọi đoạn mã đều được viết lại dưới dạng mã giả (pseudocode) với các tên biến khác đi.

10 mẫu thiết kế làm nên hệ thống

Nếu bạn không nhớ gì khác, thì đây là những lựa chọn thiết kế cốt lõi trong Claude Code.

AsyncGenerator vận hành Agent Loop — phát ra (yields) các Message, dùng kiểu trả về Terminal, xử lý tự nhiên backpressure và huỷ bỏ (cancellation)

Speculative tool execution — chạy sớm các công cụ chỉ đọc trong khi model đang streaming, ngay cả trước khi phản hồi hoàn tất

Phân lô an toàn đồng thời (Concurrent-safe batching) — phân nhóm công cụ theo độ an toàn, đọc song song, và ghi tuần tự

Fork agents để chia sẻ bộ nhớ đệm — các tiến trình con (children) chia sẻ các prompt prefix khớp từng byte, tiết kiệm ~95% input tokens

Nén ngữ cảnh 4 lớp — snip, microcompact, collapse, autocompact — mỗi lớp nhẹ hơn lớp trước đó

Bộ nhớ dựa trên tệp tích hợp LLM-powered recall — Sonnet side-query chọn lọc những đoạn nhớ liên quan, chứ không chỉ so khớp từ khóa

Tải công cụ hai giai đoạn — chỉ tải frontmatter khi khởi động, tải đầy đủ nội dung khi được gọi

Sticky latches giữ ổn định cache — một khi beta header được gửi đi, sẽ không bị huỷ bỏ (unset) giữa chừng của phiên làm việc

Slot reservation — giới hạn đầu ra mặc định 8K, mở rộng lên 64K khi đạt ngưỡng (tiết kiệm ngữ cảnh trong 99% yêu cầu)

Hook config snapshot — đóng băng lúc khởi động để ngăn chặn các cuộc tấn công injection lúc runtime

Hoàn toàn vì mục đích giáo dục. Cuốn sách này không chứa mã nguồn gốc từ Claude Code — mọi khối mã đều là mã giả nguyên gốc (pseudocode) được viết nhằm minh họa cho các mẫu thiết kế. Mục tiêu là giúp các kỹ sư hiểu về cách những AI agents ở cấp độ production được xây dựng, không phải để sao chép phần mềm độc quyền. Bìa sách "NO'REILLY" chỉ là tài liệu chế (meme) với mục đích vui vẻ và trực quan — không có liên kết nào đến O'Reilly Media.

Cách Anthropic xây dựng AI coding agent được sử dụng rộng rãi nhất

Bạn sẽ học được gì

Agent Loop

Thực thi công cụ ở quy mô lớn

Điều phối đa tác nhân (Multi-agent orchestration)

Bộ nhớ không cần cơ sở dữ liệu

Kỹ thuật hiệu suất

Khả năng mở rộng và bảo mật

Khám phá kiến trúc

Dành cho ai

Mục lục

Nền tảng

Vòng lặp Cốt lõi

Điều phối đa tác nhân

Sự nhất quán và Trí thông minh

Giao diện

Khả năng kết nối

Kỹ thuật Hiệu suất

Cuốn sách này được tạo ra như thế nào

10 mẫu thiết kế làm nên hệ thống

Cách Anthropic xây dựng AI coding agent
được sử dụng rộng rãi nhất