Nâng caoHướng dẫnClaude ChatNguồn: Anthropic

Claude Context Window Optimization — Tận dụng 1M token hiệu quả

Minh TuấnCTO, Transform GroupTheo dõi

28/03/2026 716 0 12 phút đọc

Nghe bài viết

00:00

1 Doanh thu năm 2024 đạt 150 tỷ đồng, tăng 25% so với năm trước.
2 Chiến lược 3: Chunking — Chia để trị Khi dữ liệu vượt quá khả năng xử lý hiệu quả trong một lần, hãy chia thành các phần nhỏ (chunks) và xử lý tuần tự: Sequential Chunking Xử lý từng phần một và tích lũy kết quả: Tôi sẽ gửi cho bạn 5 phần của một tài liệu dài.
3 Chiến lược 1: Phân lớp thông tin theo mức độ ưu tiên Khi làm việc với lượng dữ liệu lớn, hãy phân loại thông tin thành các lớp: Lớp 1 — Bắt buộc (Critical Context) Đây là những thông tin mà Claude cần để hiểu đúng yêu cầu và tạo ra output chính xác.
4 Có nhiều cách nén: Nén bằng tóm tắt Thay vì đưa toàn bộ tài liệu vào, hãy yêu cầu Claude tóm tắt trước, sau đó làm việc với bản tóm tắt: Bước 1: Hãy đọc tài liệu này và tạo bản tóm tắt có cấu trúc, giữ lại tất cả các số liệu, tên riêng và thông tin quan trọng.
5 Nén bằng cấu trúc dữ liệu Chuyển văn bản tự sự thành dạng có cấu trúc để giảm số token mà vẫn giữ nguyên thông tin: Thay vì: "Công ty ABC được thành lập năm 2015 tại TP.HCM, hoạt động trong lĩnh vực công nghệ thông tin.

Claude cung cấp context window lên tới 1 triệu token — một trong những cửa sổ ngữ cảnh lớn nhất trong các mô hình AI hiện nay. Tuy nhiên, việc có nhiều không gian không đồng nghĩa với việc sử dụng hiệu quả. Bài viết này hướng dẫn bạn cách tận dụng tối đa context window để đạt kết quả tốt nhất trong mọi tình huống sử dụng.

Context window là gì và tại sao 1M token quan trọng?

Context window là tổng lượng thông tin (tính bằng token) mà mô hình AI có thể "nhìn thấy" trong một phiên làm việc. Một token tương đương khoảng 3/4 từ tiếng Anh hoặc khoảng 1-2 âm tiết tiếng Việt. Với 1 triệu token, Claude có thể xử lý:

Khoảng 700.000 từ tiếng Anh hoặc 400.000-500.000 từ tiếng Việt
Khoảng 1.500-2.000 trang tài liệu A4
Nhiều file mã nguồn cùng lúc (toàn bộ codebase trung bình)
Lịch sử hội thoại dài mà không mất ngữ cảnh

Tuy nhiên, nghiên cứu cho thấy hiệu suất của mô hình có thể thay đổi tùy vào cách bạn tổ chức thông tin trong context window. Việc hiểu và áp dụng các chiến lược tối ưu sẽ giúp bạn đạt được kết quả chính xác hơn và nhanh hơn.

Nguyên tắc cơ bản về context window

1. Hiệu ứng "Lost in the Middle"

Nghiên cứu từ Anthropic và các tổ chức khác chỉ ra rằng các mô hình ngôn ngữ lớn có xu hướng chú ý tốt hơn đến thông tin ở đầu và cuối context window, trong khi thông tin ở giữa có thể bị "bỏ qua" một phần. Claude đã được tối ưu để giảm thiểu hiệu ứng này, nhưng bạn vẫn nên lưu ý:

Đặt thông tin quan trọng nhất ở đầu prompt (system prompt, hướng dẫn chính)
Đặt câu hỏi hoặc yêu cầu cụ thể ở cuối prompt
Thông tin bổ sung, ví dụ, tài liệu tham khảo đặt ở giữa

2. Token không phải tất cả đều bằng nhau

Không phải mọi token đều có giá trị như nhau trong việc tạo ra output chất lượng. Một số token mang thông tin cốt lõi, trong khi nhiều token khác chỉ là "nhiễu" — padding, lặp lại, hoặc thông tin không liên quan. Chiến lược tối ưu là tăng tỷ lệ "token có giá trị" trong context window.

3. Cấu trúc thông tin ảnh hưởng trực tiếp đến chất lượng

Cùng một lượng thông tin nhưng được tổ chức khác nhau sẽ cho kết quả khác nhau đáng kể. Thông tin có cấu trúc rõ ràng (headings, bullet points, bảng) giúp Claude xử lý hiệu quả hơn so với văn bản liên tục không có cấu trúc.

Chiến lược 1: Phân lớp thông tin theo mức độ ưu tiên

Khi làm việc với lượng dữ liệu lớn, hãy phân loại thông tin thành các lớp:

Lớp 1 — Bắt buộc (Critical Context)

Đây là những thông tin mà Claude cần để hiểu đúng yêu cầu và tạo ra output chính xác. Ví dụ: định nghĩa thuật ngữ, ràng buộc kinh doanh, format output mong muốn.

Lớp 2 — Quan trọng (Important Context)

Thông tin bổ sung giúp Claude tạo ra output tốt hơn nhưng không phải là bắt buộc. Ví dụ: ví dụ tham khảo, lịch sử quyết định, context về dự án.

Lớp 3 — Tham khảo (Reference Context)

Dữ liệu thô hoặc tài liệu gốc mà Claude có thể cần truy xuất khi xử lý. Ví dụ: bảng dữ liệu, nội dung tài liệu, mã nguồn.

System prompt (Lớp 1 — luôn đặt ở đầu):
Bạn là chuyên gia phân tích tài chính. Nhiệm vụ của bạn là phân tích
báo cáo tài chính theo chuẩn VAS (Vietnam Accounting Standards).
Luật áp dụng: Luật Kế toán 2015 và các Thông tư hướng dẫn.

Định nghĩa thuật ngữ quan trọng:
- EBITDA: Lợi nhuận trước lãi vay, thuế, khấu hao
- ROE: Tỷ suất lợi nhuận trên vốn chủ sở hữu
- Current Ratio: Hệ số thanh toán hiện hành

---

Tài liệu tham khảo (Lớp 2-3):
[Dán nội dung báo cáo tài chính — có thể rất dài]

---

Yêu cầu cụ thể (luôn đặt ở cuối):
Phân tích báo cáo tài chính ở trên và cho biết:
1. Các chỉ số tài chính chính (ROE, ROA, EBITDA margin)
2. Xu hướng so với năm trước
3. Rủi ro tiềm ẩn
4. Đề xuất cho nhà đầu tư

Chiến lược 2: Nén thông tin hiệu quả

Khi cần đưa nhiều thông tin vào context window, việc nén (compress) thông tin giúp bạn tận dụng không gian hiệu quả hơn. Có nhiều cách nén:

Nén bằng tóm tắt

Thay vì đưa toàn bộ tài liệu vào, hãy yêu cầu Claude tóm tắt trước, sau đó làm việc với bản tóm tắt:

Bước 1: Hãy đọc tài liệu này và tạo bản tóm tắt có cấu trúc,
giữ lại tất cả các số liệu, tên riêng và thông tin quan trọng.
Giới hạn trong 2000 từ.

[Dán tài liệu gốc]

Bước 2: Dựa trên bản tóm tắt vừa tạo, hãy phân tích...

Nén bằng cấu trúc dữ liệu

Chuyển văn bản tự sự thành dạng có cấu trúc để giảm số token mà vẫn giữ nguyên thông tin:

Thay vì:
"Công ty ABC được thành lập năm 2015 tại TP.HCM, hoạt động
trong lĩnh vực công nghệ thông tin. Doanh thu năm 2024 đạt
150 tỷ đồng, tăng 25% so với năm trước. Lợi nhuận ròng đạt
22 tỷ đồng, tương ứng tỷ suất lợi nhuận 14.7%."

Hãy chuyển thành:
Công ty: ABC | Thành lập: 2015 | Trụ sở: TP.HCM | Lĩnh vực: CNTT
Doanh thu 2024: 150 tỷ (+25% YoY) | Lợi nhuận ròng: 22 tỷ (14.7%)

Nén bằng loại bỏ trùng lặp

Khi đưa nhiều tài liệu có nội dung chồng chéo, hãy loại bỏ các phần lặp lại và chỉ giữ lại phần duy nhất của mỗi tài liệu.

Chiến lược 3: Chunking — Chia để trị

Khi dữ liệu vượt quá khả năng xử lý hiệu quả trong một lần, hãy chia thành các phần nhỏ (chunks) và xử lý tuần tự:

Sequential Chunking

Xử lý từng phần một và tích lũy kết quả:

Tôi sẽ gửi cho bạn 5 phần của một tài liệu dài.
Sau mỗi phần, hãy trích xuất các thông tin quan trọng
theo format sau:
- Chủ đề chính
- Số liệu quan trọng
- Quyết định/hành động được đề cập
- Rủi ro hoặc vấn đề được nêu

Sau phần cuối cùng, hãy tổng hợp tất cả thành một báo cáo
hoàn chỉnh.

PHẦN 1/5:
[Nội dung phần 1]

Parallel Chunking với Map-Reduce

Khi sử dụng Claude API, bạn có thể xử lý nhiều chunk song song rồi tổng hợp. Đây là pattern phổ biến trong các ứng dụng production cần xử lý khối lượng tài liệu lớn. Ý tưởng là chia tài liệu thành các phần, gửi mỗi phần đến một phiên Claude riêng biệt (map phase), sau đó gộp tất cả kết quả lại và yêu cầu Claude tổng hợp (reduce phase).

Chiến lược 4: Quản lý lịch sử hội thoại

Trong các phiên làm việc dài, lịch sử hội thoại có thể chiếm phần lớn context window. Các kỹ thuật quản lý:

Periodic Summarization

Định kỳ yêu cầu Claude tóm tắt những gì đã thảo luận và bắt đầu phiên mới với bản tóm tắt:

Chúng ta đã thảo luận khá nhiều. Hãy tóm tắt tất cả
các quyết định đã đưa ra, các vấn đề chưa giải quyết,
và trạng thái hiện tại của công việc.

Tôi sẽ sử dụng bản tóm tắt này để bắt đầu phiên mới
nếu cần.

Selective Context Loading

Chỉ tải lại những phần lịch sử thực sự liên quan đến công việc hiện tại, thay vì toàn bộ lịch sử:

Đây là tóm tắt các quyết định trước đó liên quan đến
module thanh toán:
[Tóm tắt]

Bây giờ chúng ta tiếp tục làm việc trên phần xử lý
lỗi thanh toán. Đây là code hiện tại:
[Code]

Hãy đề xuất cách xử lý trường hợp thanh toán thất bại
do timeout.

Chiến lược 5: Sử dụng System Prompt hiệu quả

System prompt nằm ở vị trí đặc biệt trong context window — nó luôn được Claude ưu tiên chú ý. Hãy tận dụng điều này:

System prompt nên bao gồm:
1. Vai trò và chuyên môn của Claude trong phiên này
2. Ràng buộc và quy tắc bắt buộc
3. Format output mong muốn
4. Danh sách thuật ngữ và định nghĩa quan trọng
5. Các ví dụ ngắn gọn về output tốt và không tốt

KHÔNG nên đưa vào system prompt:
- Dữ liệu thô cần xử lý (đặt ở user message)
- Lịch sử hội thoại (để Claude tự quản lý)
- Hướng dẫn quá chi tiết cho mọi trường hợp

Chiến lược 6: Tối ưu cho các use case cụ thể

Phân tích code (Codebase Analysis)

Khi đưa code vào context window, hãy sắp xếp theo thứ tự:

Cấu trúc thư mục tổng quan (tree output)
File entry point chính (index, main, app)
Các file liên quan trực tiếp đến vấn đề cần giải quyết
Các file phụ thuộc (dependencies, configs)
Test files (nếu liên quan)

Phân tích tài liệu dài (Long Document Analysis)

Với tài liệu dài như hợp đồng, báo cáo, luật:

Tôi sẽ cung cấp một hợp đồng dài 50 trang. Trước khi phân tích
chi tiết, hãy:

1. Đọc toàn bộ và tạo mục lục với các điều khoản chính
2. Đánh dấu các điều khoản có rủi ro hoặc bất thường
3. Liệt kê các thuật ngữ được định nghĩa trong hợp đồng
4. Xác định các bên liên quan và nghĩa vụ của mỗi bên

Sau đó tôi sẽ hỏi cụ thể về từng phần.

[Nội dung hợp đồng]

Multi-document Analysis

Khi cần so sánh hoặc tổng hợp từ nhiều tài liệu:

Tôi có 3 báo cáo nghiên cứu thị trường từ 3 nguồn khác nhau.
Hãy phân tích chéo (cross-reference) để tìm:

1. Thông tin nhất quán giữa cả 3 báo cáo
2. Thông tin mâu thuẫn hoặc khác biệt
3. Thông tin chỉ có trong 1 báo cáo (unique insights)
4. Độ tin cậy tổng thể của từng báo cáo

Báo cáo 1 (Nielsen, Q4/2024): [Nội dung]
Báo cáo 2 (Kantar, Q4/2024): [Nội dung]
Báo cáo 3 (Internal Research, Q4/2024): [Nội dung]

Các lỗi thường gặp khi sử dụng context window lớn

Lỗi 1: Dump tất cả thông tin không chọn lọc

Việc "dump" toàn bộ dữ liệu vào context window mà không sắp xếp, lọc hoặc đánh dấu mức độ quan trọng sẽ làm giảm chất lượng output. Dù Claude có thể đọc được tất cả, nhưng việc xử lý thông tin không có cấu trúc luôn kém hiệu quả hơn.

Giải pháp: Luôn dành 5-10 phút để tổ chức thông tin trước khi gửi cho Claude. Đặt tiêu đề cho mỗi phần, loại bỏ thông tin không liên quan, và đánh dấu phần nào là quan trọng nhất.

Lỗi 2: Không tận dụng vị trí chiến lược

Nhiều người đặt yêu cầu chính ở đầu rồi theo sau bằng dữ liệu dài. Kết quả là yêu cầu bị "chìm" trong biển dữ liệu.

Giải pháp: Áp dụng cấu trúc "sandwich" — hướng dẫn chung ở đầu, dữ liệu ở giữa, yêu cầu cụ thể ở cuối.

Lỗi 3: Sử dụng hết context window khi không cần thiết

Lớn hơn không phải luôn tốt hơn. Với nhiều tác vụ, một prompt ngắn gọn 500 token có thể cho kết quả tốt hơn một prompt 100.000 token đầy dữ liệu không cần thiết.

Giải pháp: Tự hỏi "Thông tin này có thực sự cần thiết để trả lời câu hỏi không?" trước khi thêm bất kỳ dữ liệu nào vào prompt.

Lỗi 4: Không sử dụng các tính năng hỗ trợ

Claude có nhiều tính năng hỗ trợ quản lý context hiệu quả:

Claude Projects: Lưu trữ tài liệu thường xuyên sử dụng mà không cần paste lại mỗi lần
Artifacts: Tách riêng output dài (code, báo cáo) khỏi hội thoại chính
File upload: Upload file trực tiếp thay vì copy-paste để giữ nguyên format

Đo lường hiệu quả sử dụng context window

Để biết bạn có đang sử dụng context window hiệu quả hay không, hãy theo dõi các chỉ số:

Signal-to-Noise Ratio: Tỷ lệ thông tin thực sự hữu ích trên tổng số token sử dụng
First-attempt Accuracy: Claude có trả lời đúng từ lần đầu không, hay bạn phải hỏi lại nhiều lần?
Context Utilization: Claude có tham chiếu đến thông tin bạn cung cấp không, hay nó trả lời từ kiến thức chung?

Workflow tối ưu cho dự án thực tế

Một workflow hoàn chỉnh để sử dụng context window 1M token hiệu quả:

Bước 1 — Chuẩn bị context:
- Xác định mục tiêu của phiên làm việc
- Phân loại tài liệu theo Lớp 1/2/3
- Nén thông tin ở Lớp 2-3 nếu có thể
- Sắp xếp theo thứ tự: System prompt, Lớp 1, Lớp 2, Lớp 3, Yêu cầu

Bước 2 — Thiết lập phiên:
- Đặt system prompt với vai trò, ràng buộc và format
- Tải Lớp 1 context
- Gửi yêu cầu đầu tiên để xác nhận Claude hiểu đúng

Bước 3 — Làm việc iterative:
- Tải thêm Lớp 2-3 context khi cần
- Định kỳ kiểm tra Claude còn "nhớ" thông tin quan trọng không
- Tóm tắt và làm mới phiên nếu cần

Bước 4 — Xuất kết quả:
- Yêu cầu Claude tổng hợp tất cả thành output cuối cùng
- Kiểm tra output có tham chiếu đúng đến thông tin đã cung cấp
- Lưu lại context setup để tái sử dụng

Tips nâng cao cho người dùng chuyên nghiệp

Sử dụng XML tags để đánh dấu rõ ràng các phần khác nhau trong prompt — Claude hiểu và xử lý XML tags rất tốt
Đặt metadata (ngày, nguồn, độ tin cậy) cho mỗi tài liệu để Claude có thể đánh giá và ưu tiên
Khi làm việc với code, cung cấp cả test cases để Claude hiểu rõ expected behavior
Sử dụng "few-shot examples" ở đầu context để thiết lập pattern cho output
Với các phiên làm việc dài, tạo "checkpoint" bằng cách yêu cầu Claude tóm tắt trạng thái hiện tại

Bước tiếp theo

Bạn đã nắm được các chiến lược tối ưu context window 1M token của Claude. Bước tiếp theo là áp dụng vào việc thiết kế system prompt production-grade — một kỹ năng then chốt để khai thác sức mạnh của Claude trong môi trường chuyên nghiệp. Khám phá thêm tại Thư viện Nâng cao.

Tính năng liên quan:Context Window Token Optimization Long Context Prompt Engineering

Bai viet co huu ich khong?

Writer cho nền tảng kiến thức Claude AI cho người Việt. Software engineer với hơn 20 năm kinh nghiệm, đam mê AI và chia sẻ kiến thức công nghệ.

5 bài viết · 16K lượt đọc

Bình luận (0)

Đăng nhập để bình luận...

Đăng nhập để bình luận

Đang tải bình luận...

Gợi ý cho bạn

Best Practices cho Vision — Tối ưu hình ảnh gửi Claude