Cơ bảnPhân tích

So sánh Opus vs Sonnet vs Haiku — Chọn model Claude nào?

Minh TuấnCTO, Transform GroupTheo dõi

26/03/2026 0 19 0 10 phút đọc

Nghe bài viết

00:00

Tại sao Anthropic có nhiều model?

Một câu hỏi phổ biến của người mới bắt đầu với Claude là: "Tại sao có đến 3 model? Tôi nên dùng cái nào?" Câu trả lời nằm ở sự đánh đổi giữa ba yếu tố: năng lực, tốc độ, và chi phí.

Không có model nào là "tốt nhất" trong mọi trường hợp. Model mạnh nhất (Opus) cũng chậm nhất và tốn kém nhất. Model nhanh nhất (Haiku) lại ít phù hợp với các bài toán phức tạp. Sonnet nằm ở giữa và thường là lựa chọn phổ biến nhất trong thực tế.

Bài viết này phân tích chi tiết từng model để bạn đưa ra quyết định đúng cho use case của mình.

Bảng so sánh tổng quan

Tiêu chí	Claude Opus 4	Claude Sonnet 4	Claude Haiku 3.5
Năng lực tổng thể	Cao nhất	Rất cao	Tốt
Tốc độ phản hồi	Chậm nhất	Trung bình	Nhanh nhất
Chi phí API (input)	$15/M tokens	$3/M tokens	$0.25/M tokens
Chi phí API (output)	$75/M tokens	$15/M tokens	$1.25/M tokens
Context window	200K tokens	200K tokens	200K tokens
Extended Thinking	Có	Có	Không
Vision (phân tích ảnh)	Có	Có	Có
Tool use / Function calling	Có	Có	Có

Lưu ý: Giá trên là tham khảo theo API pricing của Anthropic. Giá có thể thay đổi — kiểm tra tại anthropic.com/pricing để có số liệu mới nhất.

Claude Opus 4 — Phân tích chi tiết

Điểm mạnh

Opus 4 là model đỉnh cao nhất của Anthropic, được thiết kế cho những tác vụ đòi hỏi suy luận nhiều bước, phân tích sâu, và tư duy phản biện phức tạp.

Extended Thinking là tính năng nổi bật nhất của Opus. Khi được bật, model sẽ "suy nghĩ" trong một scratchpad ẩn trước khi đưa ra câu trả lời cuối cùng — tương tự như cách con người giải toán: phác thảo nháp trước, rồi mới trình bày sạch. Điều này cải thiện đáng kể độ chính xác với các bài toán logic và toán học.

Lý luận phức tạp: Phân tích triết học, lập luận pháp lý nhiều tầng, giải toán olympiad
Coding phức tạp: Refactor kiến trúc hệ thống lớn, debug logic lỗi khó, thiết kế algorithm
Phân tích tài liệu dài: Đọc và tổng hợp báo cáo tài chính hàng trăm trang, so sánh hợp đồng
Nghiên cứu học thuật: Review literature, tổng hợp nghiên cứu, viết technical paper

Điểm yếu

Chi phí cao nhất — không phù hợp cho các tác vụ lặp lại khối lượng lớn
Tốc độ chậm hơn — có thể gây trải nghiệm người dùng kém trong ứng dụng realtime
Với nhiều tác vụ đơn giản, Sonnet cho kết quả tương đương ở mức chi phí thấp hơn nhiều

Khi nào nên dùng Opus?

Dùng Opus khi câu trả lời sai có chi phí cao: quyết định kinh doanh quan trọng, phân tích pháp lý, nghiên cứu y tế, hoặc bất kỳ tác vụ nào mà chất lượng quan trọng hơn chi phí.

Ví dụ thực tế: Một luật sư cần Claude phân tích 200 trang hợp đồng mua bán công ty và xác định các điều khoản rủi ro — đây là use case điển hình cho Opus. Một blogger cần viết bài 500 từ mỗi ngày — Sonnet là lựa chọn hợp lý hơn.

Claude Sonnet 4 — Phân tích chi tiết

Điểm mạnh

Sonnet 4 là "sweet spot" của dòng Claude — lý do Anthropic chọn nó làm model mặc định cho Claude.ai Pro. Nó gần tương đương Opus ở nhiều tác vụ thông thường nhưng nhanh hơn đáng kể và rẻ hơn 5 lần về chi phí input, 5 lần về output.

Sonnet 4 cũng hỗ trợ Extended Thinking, mặc dù thời gian thinking thường ngắn hơn Opus. Đây là điều bất ngờ tích cực cho người dùng không muốn trả giá Opus nhưng vẫn cần tính năng này.

Coding hàng ngày: Viết function, review PR, debug, giải thích code — Sonnet xử lý xuất sắc
Content creation: Blog, email, report, script — chất lượng cao, tốc độ chấp nhận được
Phân tích trung bình: Tóm tắt tài liệu, phân tích dữ liệu, so sánh options
Chatbot sản phẩm: Đủ thông minh để xử lý câu hỏi phức tạp, đủ nhanh để không làm frustrate người dùng

Điểm yếu

Với các bài toán cực kỳ phức tạp, đôi khi thua Opus rõ ràng
Vẫn đắt hơn Haiku 12 lần — không lý tưởng cho volume lớn

Khi nào nên dùng Sonnet?

Sonnet là lựa chọn mặc định cho đa số trường hợp. Nếu bạn không chắc nên dùng model nào, hãy bắt đầu với Sonnet và chỉ chuyển sang Opus khi thấy kết quả chưa đủ tốt.

Trong thực tế, hầu hết các sản phẩm AI B2B đều dùng Sonnet làm backbone — cân bằng tốt giữa chất lượng trải nghiệm người dùng và chi phí vận hành.

Claude Haiku 3.5 — Phân tích chi tiết

Điểm mạnh

Haiku 3.5 được thiết kế cho một mục đích rất cụ thể: xử lý nhanh, chi phí thấp, volume cao. Với giá chỉ $0.25/M input tokens và $1.25/M output tokens, Haiku rẻ hơn Sonnet 12 lần và rẻ hơn Opus 60 lần.

Đừng nhầm lẫn "nhỏ" với "yếu". Haiku 3.5 vẫn mạnh hơn nhiều model "đầy đủ" của các nhà cung cấp khác. Nó hoàn toàn đủ sức cho:

Phân loại nội dung: Xác định sentiment, topic, ngôn ngữ của văn bản
Summarization đơn giản: Tóm tắt email, tin tức, comment
Trả lời FAQ: Customer service bot với knowledge base cố định
Data extraction: Trích xuất thông tin có cấu trúc từ văn bản không có cấu trúc
Translation: Dịch thuật chất lượng tốt với chi phí thấp
Moderation: Kiểm tra nội dung user-generated trước khi publish

Điểm yếu

Không có Extended Thinking — không phù hợp cho suy luận phức tạp nhiều bước
Với coding phức tạp, kết quả kém hơn Sonnet rõ rệt
Đôi khi bỏ qua các yêu cầu tinh tế trong prompt dài

Khi nào nên dùng Haiku?

Dùng Haiku khi bạn cần xử lý volume lớn hoặc realtime response và tác vụ đủ đơn giản để Haiku xử lý tốt. Một ứng dụng xử lý 1 triệu tin nhắn/ngày sẽ tiết kiệm hàng chục nghìn đô la mỗi tháng khi dùng Haiku thay Sonnet.

Chiến lược kết hợp nhiều model

Trong kiến trúc sản phẩm thực tế, nhiều team không chỉ dùng một model. Một chiến lược phổ biến là model routing:

Haiku phân loại: Request đến, Haiku phân loại xem đây là câu hỏi đơn giản hay phức tạp
Sonnet xử lý trung bình: 80% request được Sonnet xử lý
Opus cho edge cases: 5-10% request phức tạp nhất được escalate lên Opus

Chiến lược này cho phép tối ưu chi phí tổng thể trong khi vẫn đảm bảo chất lượng với các tác vụ khó.

// Ví dụ routing logic đơn giản
function selectModel(taskComplexity) {
  if (taskComplexity === 'simple') return 'claude-haiku-3-5';
  if (taskComplexity === 'medium') return 'claude-sonnet-4-5';
  return 'claude-opus-4'; // complex
}

Ví dụ thực tế: Cùng prompt, khác model

Để thấy sự khác biệt cụ thể, hãy xem cùng một prompt với các model khác nhau:

Prompt: "Giải thích tại sao quicksort có worst case O(n²) và cách tránh nó."

Haiku: Đưa ra câu trả lời đúng, giải thích pivot chọn kém, đề cập randomized quicksort. Đủ tốt cho người học cơ bản.
Sonnet: Giải thích sâu hơn với ví dụ cụ thể, đề cập median-of-three, phân tích probabilistic argument. Tốt cho developer muốn hiểu thực sự.
Opus: Phân tích đầy đủ nhất: recurrence relation, worst case proof, các variant (introsort, pdqsort), so sánh với mergesort/heapsort, khi nào nên dùng cái gì. Phù hợp cho giảng dạy hoặc technical interview prep.

Quyết định nhanh: Chọn model nào?

Dùng bảng quyết định này:

Tình huống	Model khuyến nghị
Phân tích học thuật / nghiên cứu chuyên sâu	Opus
Coding phức tạp, refactor kiến trúc	Opus hoặc Sonnet
Viết content hàng ngày	Sonnet
Chatbot sản phẩm B2B/B2C	Sonnet
Customer service bot FAQ	Haiku
Phân loại / moderation nội dung	Haiku
Xử lý volume lớn (1M+ requests/ngày)	Haiku
Prototype / thử nghiệm nhanh	Sonnet
Không chắc chắn	Bắt đầu với Sonnet

Kết luận

Không có model "tốt nhất" — chỉ có model phù hợp nhất với use case và ngân sách của bạn. Sonnet là lựa chọn an toàn nhất cho hầu hết mọi người. Opus dành cho khi bạn cần chất lượng tuyệt đối. Haiku dành cho khi bạn cần tốc độ và hiệu quả chi phí.

Lời khuyên thực tế: Hãy thử với Sonnet trước. Nếu kết quả chưa đủ tốt với một tác vụ cụ thể, thử Opus. Nếu chi phí quá cao với volume của bạn, thử Haiku. Anthropic cho phép bạn dễ dàng chuyển đổi giữa các model chỉ bằng cách thay đổi một tham số trong API call.

Tính năng liên quan:Extended thinking Vision Tool use

Bai viet co huu ich khong?

Writer cho nền tảng kiến thức Claude AI cho người Việt. Software engineer với hơn 20 năm kinh nghiệm, đam mê AI và chia sẻ kiến thức công nghệ.

5 bài viết · 16K lượt đọc

Bình luận (2)

Đăng nhập để bình luận...

Đăng nhập để bình luận

Đang tải bình luận...

Gợi ý cho bạn

Claude vs ChatGPT vs Gemini 2026 — So sánh chi tiết

So sánh Opus vs Sonnet vs Haiku — Chọn model Claude nào?

Tại sao Anthropic có nhiều model?

Bảng so sánh tổng quan

Claude Opus 4 — Phân tích chi tiết

Điểm mạnh

Điểm yếu

Khi nào nên dùng Opus?

Claude Sonnet 4 — Phân tích chi tiết

Điểm mạnh

Điểm yếu

Khi nào nên dùng Sonnet?

Claude Haiku 3.5 — Phân tích chi tiết

Điểm mạnh

Điểm yếu

Khi nào nên dùng Haiku?

Chiến lược kết hợp nhiều model

Ví dụ thực tế: Cùng prompt, khác model

Quyết định nhanh: Chọn model nào?

Kết luận

Gợi ý cho bạn

Claude vs ChatGPT vs Gemini 2026 — So sánh chi tiết

Claude.ai toàn tập — Mọi tính năng bạn cần biết

Claude cho Data Analysis — Phân tích dữ liệu không cần code

Chọn model Claude nào? Haiku vs Sonnet vs Opus — Hướng dẫn theo use case

Tin liên quan nên xem

Claude Computer Use — AI điều khiển máy tính của bạn

Claude trong hệ sinh thái AI 2026 — Vị trí và triển vọng

Tương lai của AI Agents — Dự đoán 2026-2027

Claude vs Claude Code vs Claude Cowork: Bạn Thực Sự Cần Cái Nào?

So sánh Opus vs Sonnet vs Haiku — Chọn model Claude nào?

Tại sao Anthropic có nhiều model?

Bảng so sánh tổng quan

Claude Opus 4 — Phân tích chi tiết

Điểm mạnh

Điểm yếu

Khi nào nên dùng Opus?

Claude Sonnet 4 — Phân tích chi tiết

Điểm mạnh

Điểm yếu

Khi nào nên dùng Sonnet?

Claude Haiku 3.5 — Phân tích chi tiết

Điểm mạnh

Điểm yếu

Khi nào nên dùng Haiku?

Chiến lược kết hợp nhiều model

Ví dụ thực tế: Cùng prompt, khác model

Quyết định nhanh: Chọn model nào?

Kết luận

Gợi ý cho bạn

Claude vs ChatGPT vs Gemini 2026 — So sánh chi tiết

Claude.ai toàn tập — Mọi tính năng bạn cần biết

Claude cho Data Analysis — Phân tích dữ liệu không cần code

Chọn model Claude nào? Haiku vs Sonnet vs Opus — Hướng dẫn theo use case

Tin liên quan nên xem

Claude Computer Use — AI điều khiển máy tính của bạn

Claude trong hệ sinh thái AI 2026 — Vị trí và triển vọng

Tương lai của AI Agents — Dự đoán 2026-2027

Claude vs Claude Code vs Claude Cowork: Bạn Thực Sự Cần Cái Nào?

Đăng ký nhận bản tin