{"product_id":"chọn-model-claude-nao-haiku-vs-sonnet-vs-opus-hướng-dẫn-theo-use-case","title":"Chọn model Claude nào? Haiku vs Sonnet vs Opus — Hướng dẫn theo use case","description":"\n\u003cp\u003eAnthropic cung cấp ba dòng model Claude với đặc tính khác nhau: Haiku (nhanh, rẻ), Sonnet (cân bằng), và Opus (mạnh nhất). Việc chọn đúng model cho từng tác vụ không chỉ ảnh hưởng đến chất lượng đầu ra mà còn quyết định chi phí vận hành. Bài viết này giúp bạn hiểu rõ sự khác biệt giữa các model và đưa ra quyết định phù hợp cho từng trường hợp sử dụng.\u003c\/p\u003e\n\n\u003ch2\u003eTổng quan ba dòng model\u003c\/h2\u003e\n\u003cp\u003eAnthropic đặt tên các model theo ba loại bài thơ haiku Nhật Bản: Haiku (ngắn gọn, tinh tế), Sonnet (cân bằng, phong phú), và Opus (đồ sộ, phức tạp). Cách đặt tên này phản ánh chính xác đặc tính của từng model.\u003c\/p\u003e\n\n\u003ch3\u003eClaude Haiku — Nhanh và tiết kiệm\u003c\/h3\u003e\n\u003cp\u003eHaiku là model nhỏ nhất và nhanh nhất trong họ Claude. Phiên bản mới nhất là Claude 3.5 Haiku. Đặc điểm chính:\u003c\/p\u003e\n\u003cul\u003e\n  \u003cli\u003e\n\u003cstrong\u003eTốc độ:\u003c\/strong\u003e Nhanh nhất trong ba model, phản hồi gần như tức thì\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eChi phí:\u003c\/strong\u003e Thấp nhất — $0.80\/triệu input tokens, $4\/triệu output tokens (Claude 3.5 Haiku)\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eContext window:\u003c\/strong\u003e 200K tokens\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eĐiểm mạnh:\u003c\/strong\u003e Phân loại, trích xuất dữ liệu có cấu trúc, trả lời câu hỏi đơn giản, moderation\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eHạn chế:\u003c\/strong\u003e Suy luận phức tạp, viết sáng tạo dài, phân tích nhiều bước\u003c\/li\u003e\n\u003c\/ul\u003e\n\n\u003ch3\u003eClaude Sonnet — Cân bằng hiệu suất và chi phí\u003c\/h3\u003e\n\u003cp\u003eSonnet là lựa chọn mặc định cho hầu hết ứng dụng. Phiên bản mới nhất là Claude Sonnet 4. Đặc điểm chính:\u003c\/p\u003e\n\u003cul\u003e\n  \u003cli\u003e\n\u003cstrong\u003eTốc độ:\u003c\/strong\u003e Nhanh, chậm hơn Haiku nhưng vẫn rất tốt cho production\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eChi phí:\u003c\/strong\u003e $3\/triệu input tokens, $15\/triệu output tokens (Claude Sonnet 4)\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eContext window:\u003c\/strong\u003e 200K tokens\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eĐiểm mạnh:\u003c\/strong\u003e Viết nội dung, code, phân tích dữ liệu, tóm tắt, dịch thuật\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eHạn chế:\u003c\/strong\u003e Các bài toán suy luận cực kỳ phức tạp hoặc cần sáng tạo đột phá\u003c\/li\u003e\n\u003c\/ul\u003e\n\n\u003ch3\u003eClaude Opus — Sức mạnh tối đa\u003c\/h3\u003e\n\u003cp\u003eOpus là model mạnh nhất, được thiết kế cho các tác vụ đòi hỏi suy luận sâu. Phiên bản mới nhất là Claude Opus 4. Đặc điểm chính:\u003c\/p\u003e\n\u003cul\u003e\n  \u003cli\u003e\n\u003cstrong\u003eTốc độ:\u003c\/strong\u003e Chậm nhất trong ba model, nhưng chất lượng output cao nhất\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eChi phí:\u003c\/strong\u003e $15\/triệu input tokens, $75\/triệu output tokens (Claude Opus 4)\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eContext window:\u003c\/strong\u003e 200K tokens\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eĐiểm mạnh:\u003c\/strong\u003e Suy luận phức tạp nhiều bước, phân tích chuyên sâu, nghiên cứu, coding khó\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eHạn chế:\u003c\/strong\u003e Chi phí cao, tốc độ chậm hơn — không phù hợp cho tác vụ đơn giản\u003c\/li\u003e\n\u003c\/ul\u003e\n\n\u003ch2\u003eBảng so sánh chi tiết\u003c\/h2\u003e\n\u003cp\u003eDưới đây là bảng so sánh tổng hợp để bạn dễ dàng đối chiếu:\u003c\/p\u003e\n\u003ctable\u003e\n  \u003cthead\u003e\n    \u003ctr\u003e\n      \u003cth\u003eTiêu chí\u003c\/th\u003e\n      \u003cth\u003eHaiku\u003c\/th\u003e\n      \u003cth\u003eSonnet\u003c\/th\u003e\n      \u003cth\u003eOpus\u003c\/th\u003e\n    \u003c\/tr\u003e\n  \u003c\/thead\u003e\n  \u003ctbody\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eGiá input (\/ triệu tokens)\u003c\/td\u003e\n      \u003ctd\u003e$0.80\u003c\/td\u003e\n      \u003ctd\u003e$3\u003c\/td\u003e\n      \u003ctd\u003e$15\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eGiá output (\/ triệu tokens)\u003c\/td\u003e\n      \u003ctd\u003e$4\u003c\/td\u003e\n      \u003ctd\u003e$15\u003c\/td\u003e\n      \u003ctd\u003e$75\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eTốc độ (tương đối)\u003c\/td\u003e\n      \u003ctd\u003eNhanh nhất\u003c\/td\u003e\n      \u003ctd\u003eNhanh\u003c\/td\u003e\n      \u003ctd\u003eVừa phải\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eChất lượng suy luận\u003c\/td\u003e\n      \u003ctd\u003eTốt\u003c\/td\u003e\n      \u003ctd\u003eRất tốt\u003c\/td\u003e\n      \u003ctd\u003eXuất sắc\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eContext window\u003c\/td\u003e\n      \u003ctd\u003e200K\u003c\/td\u003e\n      \u003ctd\u003e200K\u003c\/td\u003e\n      \u003ctd\u003e200K\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eVision (xem ảnh)\u003c\/td\u003e\n      \u003ctd\u003eCo\u003c\/td\u003e\n      \u003ctd\u003eCo\u003c\/td\u003e\n      \u003ctd\u003eCo\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eTool use\u003c\/td\u003e\n      \u003ctd\u003eCo\u003c\/td\u003e\n      \u003ctd\u003eCo\u003c\/td\u003e\n      \u003ctd\u003eCo\u003c\/td\u003e\n    \u003c\/tr\u003e\n  \u003c\/tbody\u003e\n\u003c\/table\u003e\n\n\u003ch2\u003eChọn model theo use case\u003c\/h2\u003e\n\u003cp\u003eDưới đây là hướng dẫn chi tiết cho từng nhóm use case phổ biến. Nguyên tắc chung: bắt đầu với Sonnet, nâng lên Opus nếu cần chất lượng cao hơn, hạ xuống Haiku nếu cần tiết kiệm chi phí.\u003c\/p\u003e\n\n\u003ch3\u003eDùng Haiku khi nào?\u003c\/h3\u003e\n\u003cp\u003e\u003cstrong\u003ePhân loại và gắn nhãn:\u003c\/strong\u003e Phân loại email, ticket hỗ trợ, sentiment analysis, phân loại nội dung. Haiku xử lý nhanh và chính xác cho các tác vụ phân loại đơn giản.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eTrích xuất dữ liệu có cấu trúc:\u003c\/strong\u003e Lấy thông tin từ văn bản theo format cố định — tên, email, số điện thoại, địa chỉ từ email hoặc form.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eContent moderation:\u003c\/strong\u003e Kiểm tra nội dung vi phạm, lọc spam, đánh giá an toàn. Tốc độ nhanh của Haiku phù hợp cho real-time moderation.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eChatbot FAQ:\u003c\/strong\u003e Trả lời các câu hỏi thường gặp dựa trên knowledge base có sẵn. Câu trả lời ngắn, không cần suy luận phức tạp.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eDịch thuật đơn giản:\u003c\/strong\u003e Dịch các đoạn văn ngắn, tiêu đề, mô tả sản phẩm.\u003c\/p\u003e\n\n\u003ch3\u003eDùng Sonnet khi nào?\u003c\/h3\u003e\n\u003cp\u003e\u003cstrong\u003eViết nội dung:\u003c\/strong\u003e Blog post, email marketing, mô tả sản phẩm, bài đăng mạng xã hội. Sonnet viết tự nhiên và sáng tạo.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eCode generation:\u003c\/strong\u003e Viết code, debug, review code, giải thích code. Sonnet xử lý tốt hầu hết các tác vụ lập trình.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003ePhân tích dữ liệu:\u003c\/strong\u003e Phân tích CSV, tạo báo cáo, tóm tắt xu hướng, đề xuất insight từ dữ liệu.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eTóm tắt tài liệu:\u003c\/strong\u003e Tóm tắt bài viết, báo cáo, biên bản họp, tài liệu kỹ thuật dài.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eHỗ trợ khách hàng nâng cao:\u003c\/strong\u003e Chatbot cần hiểu ngữ cảnh phức tạp, xử lý khiếu nại, đề xuất giải pháp.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eDịch thuật chuyên nghiệp:\u003c\/strong\u003e Dịch tài liệu dài, nội dung kỹ thuật, giữ tone và style.\u003c\/p\u003e\n\n\u003ch3\u003eDùng Opus khi nào?\u003c\/h3\u003e\n\u003cp\u003e\u003cstrong\u003eSuy luận phức tạp nhiều bước:\u003c\/strong\u003e Phân tích chiến lược kinh doanh, đánh giá rủi ro, lập kế hoạch dự án phức tạp.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eNghiên cứu và phân tích sâu:\u003c\/strong\u003e So sánh nhiều nguồn tài liệu, tổng hợp insight, viết báo cáo nghiên cứu.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eCoding phức tạp:\u003c\/strong\u003e Thiết kế kiến trúc hệ thống, refactor codebase lớn, debug lỗi phức tạp.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003ePhân tích pháp lý:\u003c\/strong\u003e Đọc và phân tích hợp đồng, quy định pháp luật, đánh giá tuân thủ.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eToán học và logic:\u003c\/strong\u003e Giải bài toán phức tạp, chứng minh, phân tích logic nhiều bước.\u003c\/p\u003e\n\u003cp\u003e\u003cstrong\u003eAgentic tasks:\u003c\/strong\u003e Các tác vụ cần tự chủ cao, sử dụng tool, lập kế hoạch và thực thi nhiều bước.\u003c\/p\u003e\n\n\u003ch2\u003eSmart Routing: Tự động chọn model\u003c\/h2\u003e\n\u003cp\u003eThay vì chọn model thủ công cho mỗi request, bạn có thể xây dựng hệ thống smart routing tự động chọn model phù hợp dựa trên đặc điểm của input.\u003c\/p\u003e\n\u003cpre\u003e\u003ccode\u003eimport anthropic\n\nclass SmartRouter:\n    \"\"\"\n    Tự động chọn model Claude phù hợp dựa trên đặc điểm request.\n    \"\"\"\n\n    def __init__(self):\n        self.client = anthropic.Anthropic()\n\n    def route(self, task_type: str, input_text: str,\n              priority: str = \"balanced\") -\u0026gt; str:\n        \"\"\"\n        Chọn model phù hợp.\n\n        Args:\n            task_type: Loại tác vụ\n            input_text: Nội dung input\n            priority: \"cost\" | \"balanced\" | \"quality\"\n\n        Returns:\n            Model ID phù hợp\n        \"\"\"\n        # Quy tắc routing dựa trên task type\n        task_routing = {\n            # Haiku tasks\n            \"classification\": \"claude-3-5-haiku-20241022\",\n            \"extraction\": \"claude-3-5-haiku-20241022\",\n            \"moderation\": \"claude-3-5-haiku-20241022\",\n            \"faq\": \"claude-3-5-haiku-20241022\",\n            \"simple_translation\": \"claude-3-5-haiku-20241022\",\n\n            # Sonnet tasks\n            \"writing\": \"claude-sonnet-4-20250514\",\n            \"coding\": \"claude-sonnet-4-20250514\",\n            \"summarization\": \"claude-sonnet-4-20250514\",\n            \"data_analysis\": \"claude-sonnet-4-20250514\",\n            \"customer_support\": \"claude-sonnet-4-20250514\",\n            \"translation\": \"claude-sonnet-4-20250514\",\n\n            # Opus tasks\n            \"complex_reasoning\": \"claude-opus-4-20250514\",\n            \"research\": \"claude-opus-4-20250514\",\n            \"architecture\": \"claude-opus-4-20250514\",\n            \"legal_analysis\": \"claude-opus-4-20250514\",\n            \"math\": \"claude-opus-4-20250514\",\n            \"agentic\": \"claude-opus-4-20250514\",\n        }\n\n        model = task_routing.get(task_type, \"claude-sonnet-4-20250514\")\n\n        # Điều chỉnh theo priority\n        if priority == \"cost\":\n            model = self._downgrade(model)\n        elif priority == \"quality\":\n            model = self._upgrade(model)\n\n        # Điều chỉnh theo độ dài và phức tạp của input\n        if len(input_text) \u0026gt; 50000 and model.startswith(\"claude-3-5-haiku\"):\n            model = \"claude-sonnet-4-20250514\"  # Input dài cần model mạnh hơn\n\n        return model\n\n    def _upgrade(self, model: str) -\u0026gt; str:\n        \"\"\"Nâng cấp lên model mạnh hơn.\"\"\"\n        if \"haiku\" in model:\n            return \"claude-sonnet-4-20250514\"\n        elif \"sonnet\" in model:\n            return \"claude-opus-4-20250514\"\n        return model\n\n    def _downgrade(self, model: str) -\u0026gt; str:\n        \"\"\"Hạ cấp xuống model rẻ hơn.\"\"\"\n        if \"opus\" in model:\n            return \"claude-sonnet-4-20250514\"\n        elif \"sonnet\" in model:\n            return \"claude-3-5-haiku-20241022\"\n        return model\n\n    def send_request(self, task_type: str, input_text: str,\n                     system_prompt: str = \"\", priority: str = \"balanced\") -\u0026gt; dict:\n        \"\"\"\n        Gửi request với model được tự động chọn.\n        \"\"\"\n        model = self.route(task_type, input_text, priority)\n\n        messages = [{\"role\": \"user\", \"content\": input_text}]\n\n        kwargs = {\n            \"model\": model,\n            \"max_tokens\": 4096,\n            \"messages\": messages\n        }\n        if system_prompt:\n            kwargs[\"system\"] = system_prompt\n\n        response = self.client.messages.create(**kwargs)\n\n        return {\n            \"model_used\": model,\n            \"response\": response.content[0].text,\n            \"input_tokens\": response.usage.input_tokens,\n            \"output_tokens\": response.usage.output_tokens,\n            \"estimated_cost\": self._estimate_cost(\n                model, response.usage.input_tokens, response.usage.output_tokens\n            )\n        }\n\n    def _estimate_cost(self, model: str, input_tokens: int,\n                       output_tokens: int) -\u0026gt; float:\n        \"\"\"Ước tính chi phí request (USD).\"\"\"\n        pricing = {\n            \"claude-3-5-haiku-20241022\": (0.80, 4.00),\n            \"claude-sonnet-4-20250514\": (3.00, 15.00),\n            \"claude-opus-4-20250514\": (15.00, 75.00),\n        }\n        input_price, output_price = pricing.get(model, (3.00, 15.00))\n        cost = (input_tokens * input_price + output_tokens * output_price) \/ 1_000_000\n        return round(cost, 6)\u003c\/code\u003e\u003c\/pre\u003e\n\n\u003ch2\u003eƯớc tính chi phí cho ứng dụng của bạn\u003c\/h2\u003e\n\u003cp\u003eDưới đây là công cụ ước tính chi phí đơn giản giúp bạn lên ngân sách trước khi triển khai.\u003c\/p\u003e\n\u003cpre\u003e\u003ccode\u003edef estimate_monthly_cost(\n    daily_requests: int,\n    avg_input_tokens: int,\n    avg_output_tokens: int,\n    model: str\n) -\u0026gt; dict:\n    \"\"\"\n    Ước tính chi phí hàng tháng.\n\n    Args:\n        daily_requests: Số request trung bình mỗi ngày\n        avg_input_tokens: Số input tokens trung bình mỗi request\n        avg_output_tokens: Số output tokens trung bình mỗi request\n        model: Tên model\n    \"\"\"\n    pricing = {\n        \"haiku\": {\"input\": 0.80, \"output\": 4.00},\n        \"sonnet\": {\"input\": 3.00, \"output\": 15.00},\n        \"opus\": {\"input\": 15.00, \"output\": 75.00},\n    }\n\n    prices = pricing[model]\n    monthly_requests = daily_requests * 30\n\n    monthly_input_cost = (monthly_requests * avg_input_tokens * prices[\"input\"]) \/ 1_000_000\n    monthly_output_cost = (monthly_requests * avg_output_tokens * prices[\"output\"]) \/ 1_000_000\n    total = monthly_input_cost + monthly_output_cost\n\n    return {\n        \"model\": model,\n        \"monthly_requests\": monthly_requests,\n        \"monthly_input_tokens\": monthly_requests * avg_input_tokens,\n        \"monthly_output_tokens\": monthly_requests * avg_output_tokens,\n        \"input_cost_usd\": round(monthly_input_cost, 2),\n        \"output_cost_usd\": round(monthly_output_cost, 2),\n        \"total_cost_usd\": round(total, 2),\n        \"total_cost_vnd\": f\"{round(total * 25_500):,} VND\"  # Tỷ giá ước tính\n    }\n\n# Ví dụ: chatbot hỗ trợ khách hàng, 500 request\/ngày\nfor model in [\"haiku\", \"sonnet\", \"opus\"]:\n    result = estimate_monthly_cost(\n        daily_requests=500,\n        avg_input_tokens=1000,\n        avg_output_tokens=500,\n        model=model\n    )\n    print(f\"{model}: ${result['total_cost_usd']}\/tháng ({result['total_cost_vnd']})\")\u003c\/code\u003e\u003c\/pre\u003e\n\u003cp\u003eKết quả ước tính cho chatbot 500 request\/ngày (1000 input + 500 output tokens\/request):\u003c\/p\u003e\n\u003cul\u003e\n  \u003cli\u003e\n\u003cstrong\u003eHaiku:\u003c\/strong\u003e ~$42\/thang (~1,071,000 VND)\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eSonnet:\u003c\/strong\u003e ~$157.5\/thang (~4,016,250 VND)\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eOpus:\u003c\/strong\u003e ~$787.5\/thang (~20,081,250 VND)\u003c\/li\u003e\n\u003c\/ul\u003e\n\u003cp\u003eSự khác biệt chi phí giữa Haiku và Opus lên tới gần 19 lần. Với nhiều ứng dụng, Haiku hoặc Sonnet đã đủ tốt và giúp tiết kiệm đáng kể.\u003c\/p\u003e\n\n\u003ch2\u003eSơ đồ quyết định chọn model\u003c\/h2\u003e\n\u003cp\u003eHãy trả lời các câu hỏi sau để chọn model phù hợp:\u003c\/p\u003e\n\u003col\u003e\n  \u003cli\u003e\n\u003cstrong\u003eTác vụ có cần suy luận nhiều bước không?\u003c\/strong\u003e Nếu co -\u0026gt; Sonnet hoặc Opus. Nếu không -\u0026gt; tiếp câu 2.\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eTác vụ chủ yếu là phân loại, trích xuất, hoặc trả lời ngắn?\u003c\/strong\u003e Nếu co -\u0026gt; Haiku. Nếu không -\u0026gt; tiếp câu 3.\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eOutput cần sáng tạo, chi tiết, hoặc dài hơn 500 từ?\u003c\/strong\u003e Nếu co -\u0026gt; Sonnet. Nếu không -\u0026gt; Haiku.\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eVới Sonnet, chất lượng có đạt yêu cầu không?\u003c\/strong\u003e Nếu co -\u0026gt; Giữ Sonnet. Nếu không -\u0026gt; nâng lên Opus.\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eChi phí có là mối quan tâm chính?\u003c\/strong\u003e Nếu co -\u0026gt; thử Haiku trước, kiểm tra chất lượng, nâng cấp nếu cần.\u003c\/li\u003e\n\u003c\/ol\u003e\n\n\u003ch2\u003eKhi nào nên nâng cấp model?\u003c\/h2\u003e\n\u003cp\u003eCác dấu hiệu bạn cần nâng cấp từ Haiku lên Sonnet, hoặc Sonnet lên Opus:\u003c\/p\u003e\n\u003cul\u003e\n  \u003cli\u003eTỷ lệ câu trả lời không chính xác hoặc thiếu sâu sắc vượt quá 10%\u003c\/li\u003e\n  \u003cli\u003eNgười dùng phàn nàn về chất lượng phản hồi\u003c\/li\u003e\n  \u003cli\u003eModel thường xuyên \"hiểu sai\" ý câu hỏi phức tạp\u003c\/li\u003e\n  \u003cli\u003eOutput thiếu tính sáng tạo hoặc quá generic\u003c\/li\u003e\n  \u003cli\u003eTác vụ yêu cầu phân tích tài liệu dài và phức tạp\u003c\/li\u003e\n\u003c\/ul\u003e\n\n\u003ch2\u003eKhi nào nên hạ cấp model?\u003c\/h2\u003e\n\u003cp\u003eCác dấu hiệu bạn đang dùng model mạnh hơn cần thiết:\u003c\/p\u003e\n\u003cul\u003e\n  \u003cli\u003eHầu hết câu trả lời ngắn hơn 200 từ\u003c\/li\u003e\n  \u003cli\u003eTác vụ chủ yếu lặp đi lặp lại với pattern cố định\u003c\/li\u003e\n  \u003cli\u003eKhông cần suy luận phức tạp, chỉ cần trích xuất hoặc biến đổi dữ liệu\u003c\/li\u003e\n  \u003cli\u003eChi phí API là mối quan tâm chính và chất lượng Haiku\/Sonnet đã đủ tốt\u003c\/li\u003e\n  \u003cli\u003eTốc độ phản hồi quan trọng hơn chất lượng suy luận\u003c\/li\u003e\n\u003c\/ul\u003e\n\n\u003ch2\u003eChiến lược tiết kiệm chi phí\u003c\/h2\u003e\n\u003cp\u003eNgoài việc chọn đúng model, có nhiều cách khác để tối ưu chi phí Claude API:\u003c\/p\u003e\n\u003cul\u003e\n  \u003cli\u003e\n\u003cstrong\u003ePrompt Caching:\u003c\/strong\u003e Sử dụng tính năng cache system prompt để giảm chi phí input tokens cho các request lặp lại. Giảm tới 90% chi phí input tokens khi prompt cache hit.\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eBatch API:\u003c\/strong\u003e Gửi request hàng loạt khi không cần kết quả ngay, giảm 50% chi phí.\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eTối ưu prompt:\u003c\/strong\u003e Viết prompt ngắn gọn, rõ ràng. Mỗi token thừa đều tốn tiền.\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eCascade approach:\u003c\/strong\u003e Bắt đầu với Haiku, nếu confidence thấp thì tự động chuyển lên Sonnet, rồi Opus.\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eGiới hạn max_tokens:\u003c\/strong\u003e Đặt max_tokens phù hợp với nhu cầu thực tế, tránh output dài không cần thiết.\u003c\/li\u003e\n\u003c\/ul\u003e\n\n\u003ch2\u003eBước tiếp theo\u003c\/h2\u003e\n\u003cp\u003eViệc chọn đúng model Claude là bước quan trọng đầu tiên trong hành trình xây dựng ứng dụng AI hiệu quả. Bắt đầu với Sonnet cho hầu hết use case, sau đó điều chỉnh dựa trên dữ liệu thực tế về chất lượng và chi phí. Khám phá thêm các hướng dẫn nền tảng tại \u003ca href=\"\/en\/collections\/nen-tang\"\u003eThư viện Nền tảng Claude\u003c\/a\u003e.\u003c\/p\u003e\n","brand":"Minh Tuấn","offers":[{"title":"Default Title","offer_id":47730159157460,"sku":null,"price":0.0,"currency_code":"VND","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0821\/0264\/9044\/files\/ch_n-model-claude-nao-haiku-vs-sonnet-vs-opus-h_ng-d_n-theo-use-case.jpg?v=1774716018","url":"https:\/\/claude.vn\/en\/products\/ch%e1%bb%8dn-model-claude-nao-haiku-vs-sonnet-vs-opus-h%c6%b0%e1%bb%9bng-d%e1%ba%abn-theo-use-case","provider":"CLAUDE.VN","version":"1.0","type":"link"}