Lý do vì sao Claude Sonnet là mô hình AI thông minh nhất hiện nay

Anthropic đã công bố hệ thống Context Management vào ngày 28/09/2025 với hai tính năng chính là Context Editing và Memory Tool, tích hợp trực tiếp trong Claude Sonnet 4.5. Đây là bước tiến quan trọng trong việc chuyển từ prompt engineering sang context engineering, tập trung vào việc tối ưu hóa cấu hình context thay vì chỉ viết prompt tốt hơn.

Context Editing

Context Editing sử dụng chiến lược clear_tool_uses_20250919 để tự động xóa các tool results cũ khi context vượt ngưỡng đã cấu hình. Thay vì xóa và summarize toàn bộ context như cách truyền thống, Context Editing xóa từng cặp tool use/result theo thứ tự thời gian (xóa cũ nhất trước), thay thế bằng placeholder text để Claude biết thông tin đã bị xóa.

Các tham số cấu hình chính bao gồm:

trigger: Mặc định kích hoạt ở 100,000 input tokens, có thể đặt theo số tokens hoặc số lần tool uses
keep: Giữ lại 3 tool use/result pairs gần nhất (mặc định)
clear_at_least: Đảm bảo xóa tối thiểu số tokens chỉ định để xứng đáng việc làm mất cache
exclude_tools: Danh sách tools không bao giờ bị xóa, giữ lại context quan trọng
clear_tool_inputs: Mặc định false, chỉ xóa tool results và giữ lại tool calls

Context Editing tương thích với prompt caching nhưng sẽ invalidate cache prefix mỗi lần xóa content, do đó Anthropic khuyến nghị xóa đủ nhiều tokens để việc mất cache là đáng giá.

Memory Tool

Memory Tool hoạt động hoàn toàn client-side thông qua tool calls, cho phép Claude tạo, đọc, cập nhật và xóa files trong thư mục /memories được lưu trên infrastructure của developer. Khác với các Memory MCP bên thứ ba, hệ thống này đảm bảo bảo mật tuyệt đối vì dữ liệu nằm hoàn toàn trên máy local.

Trong Claude Code, Memory được tổ chức theo cấu trúc phân cấp với 4 loại:

Enterprise policy (/Library/Application Support/ClaudeCode/CLAUDE.md): Chính sách toàn tổ chức
Project memory (./CLAUDE.md): Hướng dẫn chung của team, được chia sẻ qua source control
User memory (~/.claude/CLAUDE.md): Preferences cá nhân áp dụng cho tất cả projects
Project memory (local) (./CLAUDE.local.md): Preferences cá nhân cho từng project (đang deprecated)

Claude tự động load tất cả memory files khi khởi động, với thứ tự ưu tiên từ cao xuống thấp theo hierarchy. Model được train để tự biết khi nào cần đọc memory file để lấy thông tin.

Hiệu suất và Tối ưu

Trong đánh giá nội bộ của Anthropic trên agentic search tasks:

Context editing + Memory: Tăng 39% hiệu suất so với baseline
Context editing riêng: Tăng 29% hiệu suất
Giảm token consumption: 84% trong evaluation 100-turn web search

Context editing không chỉ giúp agents chạy lâu hơn mà còn cải thiện performance vì Claude chỉ tập trung vào context có liên quan, loại bỏ nhiễu từ thông tin cũ.

Triết lý Context Engineering

Anthropic nhấn mạnh rằng context window lớn chưa chắc đã tốt - context càng chứa nhiều thông tin không liên quan sẽ làm model bối rối và tốn kém chi phí compute. Đây là hướng tiếp cận thực tế và hiệu quả hơn việc chạy đua phóng đại context window.

Phương pháp này đặc biệt phù hợp với các use cases như coding (xóa file reads cũ nhưng giữ architectural decisions), research (xóa search results cũ nhưng lưu key findings), và data processing (xóa raw data nhưng giữ intermediate results).

Tính năng đang ở public beta trên Claude Developer Platform, Amazon Bedrock và Google Cloud Vertex AI, hỗ trợ các models Claude Opus 4.1, Opus 4, Sonnet 4.5 và Sonnet 4.

Đừng quên claim ngay Perplexity Pro 1 năm hoàn toàn miễn phí, chi tiết hướng dẫn xem thêm ở bài viết này