{"product_id":"perplexity-computer-vs-claude-code-vs-cowork-vs-manus-test-thực-tế-4-ai-agents-tren-cung-tasks","title":"Perplexity Computer vs Claude Code vs Cowork vs Manus: Test thực tế 4 AI agents trên cùng tasks","description":"\n\u003ch2\u003eKhi AI agent được test như sản phẩm thực — không phải demo\u003c\/h2\u003e\n\n\u003cp\u003eHầu hết các bài so sánh AI tools đều có một vấn đề: chúng dùng cherry-picked examples hoặc artificial tasks để showcase strengths của một tool cụ thể. \u003cstrong\u003eDaria Cupareanu\u003c\/strong\u003e tại AiBlewMyMind chọn approach khác — và kết quả tiết lộ những điều cộng đồng AI cần biết.\u003c\/p\u003e\n\n\u003cp\u003eMethodology của test:\u003c\/p\u003e\n\u003cul\u003e\n  \u003cli\u003eCùng 2 tasks được assign cho tất cả 4 tools\u003c\/li\u003e\n  \u003cli\u003eOutputs được evaluated bởi \"LLM Council\" — 4 AI models khác nhau chấm điểm ẩn danh, không biết output đến từ tool nào\u003c\/li\u003e\n  \u003cli\u003eDetailed cost tracking cho mỗi task mỗi tool\u003c\/li\u003e\n  \u003cli\u003eEvaluation dựa trên accuracy, actionability, và quality\u003c\/li\u003e\n\u003c\/ul\u003e\n\n\u003ch2\u003eTask 1: Real Estate Property Dossier\u003c\/h2\u003e\n\n\u003cp\u003e\u003cstrong\u003eObjective:\u003c\/strong\u003e Research một property ở Brooklyn và tạo comprehensive report bao gồm comparable sales, zoning data, neighborhood trends, school ratings, walkability scores, và risk flags.\u003c\/p\u003e\n\n\u003cp\u003eĐây là một research task thực tế — loại task mà người dùng thực sự cần làm, với data cần phải accurate.\u003c\/p\u003e\n\n\u003ch3\u003eKết quả\u003c\/h3\u003e\n\n\u003ctable\u003e\n  \u003cthead\u003e\n    \u003ctr\u003e\n      \u003cth\u003eTool\u003c\/th\u003e\n      \u003cth\u003eCost\u003c\/th\u003e\n      \u003cth\u003eLLM Council Rank\u003c\/th\u003e\n      \u003cth\u003eKey finding\u003c\/th\u003e\n    \u003c\/tr\u003e\n  \u003c\/thead\u003e\n  \u003ctbody\u003e\n    \u003ctr\u003e\n      \u003ctd\u003e\u003cstrong\u003ePerplexity Computer\u003c\/strong\u003e\u003c\/td\u003e\n      \u003ctd\u003e~$18\u003c\/td\u003e\n      \u003ctd\u003e🥇 1st\u003c\/td\u003e\n      \u003ctd\u003e\"Only tool to get zoning code (R6A) correct\"\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eClaude Code\u003c\/td\u003e\n      \u003ctd\u003eN\/A (subscription)\u003c\/td\u003e\n      \u003ctd\u003e🥈 2nd\u003c\/td\u003e\n      \u003ctd\u003eSolid executive summary, zoning errors\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eClaude Cowork\u003c\/td\u003e\n      \u003ctd\u003eN\/A (subscription)\u003c\/td\u003e\n      \u003ctd\u003e🥉 3rd\u003c\/td\u003e\n      \u003ctd\u003eGuessed zoning với \"Likely\" — lost credibility\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eManus AI\u003c\/td\u003e\n      \u003ctd\u003e~$0.56\u003c\/td\u003e\n      \u003ctd\u003e4th\u003c\/td\u003e\n      \u003ctd\u003e\"Hallucinated irrelevant info về Marine Terminal\"\u003c\/td\u003e\n    \u003c\/tr\u003e\n  \u003c\/tbody\u003e\n\u003c\/table\u003e\n\n\u003cp\u003ePerplexity Computer thắng rõ ràng với khả năng verify primary sources. \"Acted analytically\" — khi không chắc chắn, nó tìm kiếm thêm thay vì đoán. Claude Cowork mắc lỗi tệ nhất: dùng từ \"Likely\" trước thông tin zoning — điều này tức thì làm mất credibility của toàn bộ report trong mắt LLM Council.\u003c\/p\u003e\n\n\u003ch2\u003eTask 2: AI News Briefing App\u003c\/h2\u003e\n\n\u003cp\u003e\u003cstrong\u003eObjective:\u003c\/strong\u003e Build và deploy một working application tạo personalized AI news filtered by industry, role, và current priorities.\u003c\/p\u003e\n\n\u003cp\u003eĐây là task yêu cầu cả technical implementation VÀ content quality.\u003c\/p\u003e\n\n\u003ch3\u003eKết quả\u003c\/h3\u003e\n\n\u003ctable\u003e\n  \u003cthead\u003e\n    \u003ctr\u003e\n      \u003cth\u003eTool\u003c\/th\u003e\n      \u003cth\u003eCost\u003c\/th\u003e\n      \u003cth\u003eLLM Council Rank\u003c\/th\u003e\n      \u003cth\u003eKey finding\u003c\/th\u003e\n    \u003c\/tr\u003e\n  \u003c\/thead\u003e\n  \u003ctbody\u003e\n    \u003ctr\u003e\n      \u003ctd\u003e\u003cstrong\u003ePerplexity Computer\u003c\/strong\u003e\u003c\/td\u003e\n      \u003ctd\u003e~$7.92\u003c\/td\u003e\n      \u003ctd\u003e🥇 1st\u003c\/td\u003e\n      \u003ctd\u003e\"Acted like high-level consultant, news anchored in present\"\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eClaude Cowork\u003c\/td\u003e\n      \u003ctd\u003eN\/A (subscription)\u003c\/td\u003e\n      \u003ctd\u003e🥈 2nd\u003c\/td\u003e\n      \u003ctd\u003eBest visual design, lacked deep intelligence\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eClaude Code\u003c\/td\u003e\n      \u003ctd\u003eN\/A (subscription)\u003c\/td\u003e\n      \u003ctd\u003e🥉 3rd\u003c\/td\u003e\n      \u003ctd\u003e\"Catastrophic hallucination với 2026 dates\"\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eManus AI\u003c\/td\u003e\n      \u003ctd\u003e~$0.47\u003c\/td\u003e\n      \u003ctd\u003e4th\u003c\/td\u003e\n      \u003ctd\u003e\"Generic news, broken links, zero actionable value\"\u003c\/td\u003e\n    \u003c\/tr\u003e\n  \u003c\/tbody\u003e\n\u003c\/table\u003e\n\n\u003cp\u003eClaude Code's critical failure đáng chú ý: tạo ra app với \"catastrophic hallucination\" về 2026 dates — nghĩa là nó fabricated recent events thay vì acknowledge lack of real-time data. Đây là đúng loại failure mode nguy hiểm nhất trong production contexts.\u003c\/p\u003e\n\n\u003ch2\u003e3 observations quan trọng từ test này\u003c\/h2\u003e\n\n\u003ch3\u003eObservation 1: Design ≠ Accuracy\u003c\/h3\u003e\n\n\u003cp\u003eClaude tools (Cowork và Code) nhất quán tạo ra visually superior outputs. The apps looked better, reports were better formatted. Nhưng appearance không correlate với accuracy hay functionality.\u003c\/p\u003e\n\n\u003cp\u003eLesson cho enterprise buyers: đừng bị distracted bởi polish. Test accuracy với ground-truth-verifiable tasks.\u003c\/p\u003e\n\n\u003ch3\u003eObservation 2: Real-time data access là differentiator lớn\u003c\/h3\u003e\n\n\u003cp\u003ePerplexity Computer thắng largely vì nó có real-time web access và prioritized verification. Claude models — dù mạnh hơn về reasoning — thiếu reliable access to current information và không luôn acknowledge điều này rõ ràng.\u003c\/p\u003e\n\n\u003cp\u003eĐây là gap mà Anthropic đang address với Connectors và web search features, nhưng vẫn còn khoảng cách với Perplexity's core strength.\u003c\/p\u003e\n\n\u003ch3\u003eObservation 3: Cost asymmetry phức tạp hơn nó trông\u003c\/h3\u003e\n\n\u003cp\u003ePerplexity: $7-18 per task (transparent, usage-based)\u003cbr\u003e\nClaude: $0 per task ngoài subscription (opaque per-task cost)\u003c\/p\u003e\n\n\u003cp\u003eAi rẻ hơn phụ thuộc vào usage pattern. Nếu bạn làm 100 tasks\/tháng với Claude: Pro plan $20 = $0.20\/task. Perplexity cùng tasks: có thể $700-1800.\u003c\/p\u003e\n\n\u003cp\u003eNhưng nếu bạn chỉ cần 1-2 high-stakes research tasks\/tháng nơi accuracy là critical: Perplexity ở $7-18\/task có thể là better value.\u003c\/p\u003e\n\n\u003ch2\u003eVerdict: \"Nếu chỉ chọn 1 platform: Claude\"\u003c\/h2\u003e\n\n\u003cp\u003eMặc dù Perplexity thắng cả 2 tasks về accuracy, Kai đưa ra recommendation bất ngờ:\u003c\/p\u003e\n\n\u003cblockquote\u003e\n  \u003cp\u003e\"If you can only pick one platform: Claude at $20\/month for both Cowork and Code. However, for accuracy-dependent research work, supplementing with Perplexity Computer's real-time data access provides measurable value despite higher per-use costs.\"\u003c\/p\u003e\n\u003c\/blockquote\u003e\n\n\u003cp\u003eLý do: Claude ở $20\/month cho cả Cowork VÀ Code là exceptional value nếu bạn dùng cả hai. Perplexity Computer có real-time advantage nhưng cost per-task cao hơn nhiều nếu dùng thường xuyên.\u003c\/p\u003e\n\n\u003cp\u003eRecommended workflow:\u003c\/p\u003e\n\u003cul\u003e\n  \u003cli\u003e\n\u003cstrong\u003eDaily tasks, content creation, coding, automation:\u003c\/strong\u003e Claude (Cowork + Code)\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eHigh-stakes research cần verified real-time data:\u003c\/strong\u003e Supplement với Perplexity Computer\u003c\/li\u003e\n  \u003cli\u003e\n\u003cstrong\u003eCheap prototyping và basic automation:\u003c\/strong\u003e Manus AI ($0.47\/task là remarkably cheap)\u003c\/li\u003e\n\u003c\/ul\u003e\n\n\u003ch2\u003eĐiều này có nghĩa gì cho việc chọn tool?\u003c\/h2\u003e\n\n\u003cp\u003eTest này confirm một truth quan trọng: \u003cstrong\u003ekhông có one-size-fits-all AI agent\u003c\/strong\u003e. Mỗi tool có strength profile riêng:\u003c\/p\u003e\n\n\u003cul\u003e\n  \u003cli\u003ePerplexity: Accuracy king cho current events và verifiable facts\u003c\/li\u003e\n  \u003cli\u003eClaude Code: Technical execution excellence, best design quality\u003c\/li\u003e\n  \u003cli\u003eClaude Cowork: Workflow automation, best UX cho non-technical users\u003c\/li\u003e\n  \u003cli\u003eManus AI: Cheapest option cho simple, low-stakes tasks\u003c\/li\u003e\n\u003c\/ul\u003e\n\n\u003cp\u003eProfessionals với diverse needs sẽ có multi-tool stack. Individuals với budget constraints sẽ focus vào tool phù hợp nhất với primary use case của mình.\u003c\/p\u003e\n\n\u003ch2\u003ePhân tích sâu: Tại sao Claude bị kém về real-time data?\u003c\/h2\u003e\n\n\u003cp\u003eClaude Code's \"catastrophic hallucination với 2026 dates\" trong Task 2 không phải là isolated incident — đây là structural limitation của language models và cách chúng handle time.\u003c\/p\u003e\n\n\u003cp\u003eLLMs được trained trên data đến một cutoff point. Sau cutoff, chúng không có real knowledge về những gì đã xảy ra. Khi asked về recent events, model có 3 options:\u003c\/p\u003e\n\u003col\u003e\n  \u003cli\u003eAcknowledge không biết và từ chối (safest)\u003c\/li\u003e\n  \u003cli\u003eUse reasoning để infer what might have happened (acceptable)\u003c\/li\u003e\n  \u003cli\u003eGenerate plausible-sounding but fabricated information (dangerous)\u003c\/li\u003e\n\u003c\/ol\u003e\n\n\u003cp\u003eClaude Code trong test đó chose option 3 cho some 2026 dates — điều này thực ra là một known failure mode cần watch carefully.\u003c\/p\u003e\n\n\u003cp\u003eAnthropic đang address điều này với web search integration và Connectors, nhưng cho AI news app specifically cần real-time data, cần explicit web access tools để work reliably.\u003c\/p\u003e\n\n\u003ch2\u003eManus AI: Surprise underdog với chi phí cực thấp\u003c\/h2\u003e\n\n\u003cp\u003eManus AI xếp cuối trong cả 2 tasks nhưng có một distinction đáng chú ý: \u003cstrong\u003e$0.56 cho Task 1, $0.47 cho Task 2\u003c\/strong\u003e.\u003c\/p\u003e\n\n\u003cp\u003eĐây là pricing dramatically lower hơn alternatives. Với low-stakes, simple automation tasks, Manus AI có thể là rational choice:\u003c\/p\u003e\n\u003cul\u003e\n  \u003cli\u003eSimple web scraping\u003c\/li\u003e\n  \u003cli\u003eBasic document formatting\u003c\/li\u003e\n  \u003cli\u003eRoutine email drafts\u003c\/li\u003e\n  \u003cli\u003eSimple research summaries (accuracy không critical)\u003c\/li\u003e\n\u003c\/ul\u003e\n\n\u003cp\u003eNhưng cho tasks yêu cầu accuracy, completeness, hoặc judgment: cost advantage không justify quality trade-offs.\u003c\/p\u003e\n\n\u003ch2\u003eLesson cho AI tool selection: Matching tool với task\u003c\/h2\u003e\n\n\u003cp\u003eTest này provide clear decision framework:\u003c\/p\u003e\n\n\u003ctable\u003e\n  \u003cthead\u003e\n    \u003ctr\u003e\n      \u003cth\u003eTask type\u003c\/th\u003e\n      \u003cth\u003eBest tool\u003c\/th\u003e\n      \u003cth\u003eLý do\u003c\/th\u003e\n    \u003c\/tr\u003e\n  \u003c\/thead\u003e\n  \u003ctbody\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eCurrent events research\u003c\/td\u003e\n      \u003ctd\u003ePerplexity Computer\u003c\/td\u003e\n      \u003ctd\u003eReal-time web access + verification\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eCode và technical work\u003c\/td\u003e\n      \u003ctd\u003eClaude Code\u003c\/td\u003e\n      \u003ctd\u003eBest technical reasoning, visual output\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eWorkflow automation\u003c\/td\u003e\n      \u003ctd\u003eClaude Cowork\u003c\/td\u003e\n      \u003ctd\u003eBest UX, Connectors integration\u003c\/td\u003e\n    \u003c\/tr\u003e\n    \u003ctr\u003e\n      \u003ctd\u003eSimple, low-stakes tasks\u003c\/td\u003e\n      \u003ctd\u003eManus AI\u003c\/td\u003e\n      \u003ctd\u003eCheapest per-task cost\u003c\/td\u003e\n    \u003c\/tr\u003e\n  \u003c\/tbody\u003e\n\u003c\/table\u003e\n\n\u003cp\u003eĐể deep dive vào Claude Code capabilities, \u003ca href=\"\/en\/products\/autonomous-coding-agent-ai-tu-viet-code-tu-spec\"\u003eautonomous coding agent với Claude\u003c\/a\u003e cho thấy potential đầy đủ. Với Claude Cowork cho automation workflows, \u003ca href=\"\/en\/products\/claude-cho-automation-tich-hop-zapier-make-va-n8n\"\u003eClaude automation với Zapier\/Make\/n8n\u003c\/a\u003e là starting point tốt. Và để hiểu Perplexity's real-time data advantage trong context, \u003ca href=\"\/en\/products\/claude-code-vs-github-copilot-vs-cursor-dau-la-ide-ai-tot-nhat\"\u003eAI tools comparison\u003c\/a\u003e cung cấp broader competitive landscape.\u003c\/p\u003e\n\n\u003chr\u003e\n\u003ch2\u003eNguồn tham khảo\u003c\/h2\u003e\n\u003cul\u003e\n  \u003cli\u003e\n\u003ca href=\"https:\/\/aiblewmymind.substack.com\/p\/perplexity-computer-vs-claude-code-cowork-manus-comparison\" target=\"_blank\"\u003eAiBlewMyMind — Perplexity Computer vs Claude Code vs Cowork vs Manus\u003c\/a\u003e (Kai, 23\/03\/2026)\u003c\/li\u003e\n  \u003cli\u003eLLM Council evaluation methodology\u003c\/li\u003e\n\u003c\/ul\u003e\n","brand":"Minh Tuấn","offers":[{"title":"Default Title","offer_id":47725810057428,"sku":null,"price":0.0,"currency_code":"VND","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0821\/0264\/9044\/files\/perplexity-computer-vs-claude-code-vs-cowork-vs-manus-test-th_c-t_-4-ai-agents-tren-cung-tasks.jpg?v=1774574171","url":"https:\/\/claude.vn\/en\/products\/perplexity-computer-vs-claude-code-vs-cowork-vs-manus-test-th%e1%bb%b1c-t%e1%ba%bf-4-ai-agents-tren-cung-tasks","provider":"CLAUDE.VN","version":"1.0","type":"link"}