Năng lực và giới hạn của AI hôm nay

Nền tảng kỹ thuậtCơ bản25 phút

Tưởng tượng công ty bạn vừa tuyển một người tên Aldous (viết tắt: AI). Đặc điểm:

Bạn sẽ học được
  • Liệt kê năng lực chính của AI hôm nay — biết nên giao gì
  • Nhận diện giới hạn cốt lõi — biết khi nào cần con người, khi nào cần tool bổ sung
  • Áp dụng "complementary strengths" — phối hợp human + AI tối ưu thay vì thay thế
  • Cập nhật mental model định kỳ vì landscape thay đổi nhanh
  • Tạo "decision card" cá nhân: khi nào dùng AI, khi nào không

Năng lực — AI làm gì tốt?

1. Versatility ngôn ngữ — "Thợ đa năng"

Cùng một model có thể:

Không cần "switch tool". Vài năm trước, mỗi task cần software riêng. Bây giờ, cùng một LLM xử lý hết.

2. Contextual awareness — "Nhớ trong cuộc trò chuyện"

Trong 1 conversation:

Lưu ý: Bộ nhớ chỉ trong context window. Conversation kéo dài quá → đầu chat bị quên.

3. Tool use — "Tay chân thật"

Model hiện đại có thể:

Đây là hệ quả của "đợt sóng 2" trong Bài 5.2 — AI có tay chân.

4. Pattern recognition ở scale lớn

AI có thể đọc 200 review, 500 ticket support, 80 paper → tìm pattern, theme, anomaly. Việc nếu bạn làm sẽ tốn ngày → AI làm trong phút.

Ứng dụng:

5. Few-shot learning — "Học nhanh từ ví dụ"

Cho model 2-3 ví dụ về output bạn muốn → nó pattern-match cho task tương tự.

6. Chain-of-thought reasoning (model mới)

Model thế hệ mới (Claude với extended thinking, GPT-5, o-series) có thể "nghĩ từng bước" trước khi answer. Phù hợp:

  • Viết email với tone của bạn
  • Tóm tắt báo cáo dài
  • Dịch giữa nhiều ngôn ngữ
  • Giải thích quantum physics
  • Viết tutorial cooking
  • Brainstorm ý tưởng bài thơ
  • Đề cập "deadline dự án" lúc đầu, hỏi "khi nào tôi cần xong?" cuối — model nhớ
  • Reference back: "như mày nói lúc nãy..." — model hiểu
  • Customer feedback analysis
  • Literature review
  • Code review pattern (security issues)
  • Trend detection trong data
  • Math problem
  • Logic puzzle
  • Multi-step planning
  • Code debug
ToolViệc cụ thể
Web searchThông tin sau knowledge cutoff
Code executionTính toán, phân tích data
File create/editExcel, PowerPoint, PDF
Image genTạo hình từ description
VisionĐọc/phân tích hình bạn upload
MCP integrationsSlack, Gmail, Notion, Asana, Salesforce...
┌─────────────────────────────────────────────────────────┐
│                                                         │
│                    LLM HÔM NAY                          │
│                                                         │
│   📧 Email      📊 Report      🌐 Translation           │
│   ✍️  Writing    📚 Summary     💡 Brainstorm           │
│   🎓 Teaching   💻 Code         📝 Docs                 │
│   🎨 Creative   🔍 Research     🤝 Negotiation help     │
│                                                         │
│         ALL FROM SINGLE INTERFACE                       │
│                                                         │
└─────────────────────────────────────────────────────────┘
Bạn cung cấp:
- Ví dụ 1: input X → output Y
- Ví dụ 2: input X' → output Y'
- Ví dụ 3: input X'' → output Y''

Model áp dụng pattern cho:
- Input X''' → output Y''' (theo style bạn dạy)

Giới hạn — AI làm gì tệ (hoặc nguy hiểm)?

1. Knowledge cutoff — "Đi tu trên núi"

Model không biết gì sau training cutoff. Hỏi sự kiện gần đây → bịa hoặc thừa nhận không biết.

Ví dụ vấn đề:

Giải pháp: Web search tool, hoặc upload data mới làm context.

2. Hallucination — "Nói chắc nhưng sai"

LLM tạo response qua statistical pattern, không phải retrieval. Khi gap kiến thức → bịa với confidence cao.

Ví dụ thường gặp:

Giải pháp:

3. Context window — "Bộ nhớ giới hạn"

Conversation rất dài hoặc data rất lớn → vượt window → quên.

Hệ quả:

Giải pháp:

4. Non-determinism — "Mỗi lần khác"

Cùng prompt → response khác → không reproducible.

Vấn đề:

Giải pháp:

5. Complex reasoning — "Toán-logic-tài chính"

Lịch sử LLM yếu ở:

Tin tốt: Model "reasoning" mới (o3, Claude extended thinking) đang tiến bộ nhanh. Nhưng:

Giải pháp:

6. Specific data sources — "Brilliant colleague không có database"

Model brilliant nhưng không truy cập:

Analogy: "Như có đồng nghiệp thiên tài nhưng không access internal database — họ chỉ giúp được trong phạm vi họ thấy."

Giải pháp:

7. Bias inherent từ training data

Training data từ Internet → model thừa hưởng bias của Internet:

Hệ quả:

Giải pháp:

8. Real-time / live data

Model không tự update real-time. Không biết:

Giải pháp: Tool integration. Model không "có" data, nhưng có thể "fetch" qua tool.

  • "Earnings của công ty A quý vừa rồi?" → model không biết
  • "Luật mới ban hành tháng trước?" → bịa hoặc rỗng
  • Bịa citation paper
  • Bịa quote của người nổi tiếng
  • Bịa case law
  • Bịa số thống kê
  • Bịa URL
  • Cross-check fact với source độc lập
  • Dùng tool search để ground vào reality
  • Skeptical với mọi specific number/citation
  • Conversation kéo dài tuần → đầu chat bị quên
  • Document 1000 trang → có thể truncate
  • Multi-file project → không thấy được mối liên hệ xa
  • Summarize-and-restart cho conversation dài
  • Filter document trước upload
  • Dùng model context lớn (Claude 4 1M, Gemini 2M)
  • Audit trail khó (lần này đúng, lần sau sai)
  • Production system cần consistency
  • Test khó (output luôn khác)
  • Set temperature = 0 cho task cần consistency
  • Document version model đang dùng
  • Test với nhiều seed để hiểu variance
  • Math nhiều bước
  • Logic puzzle phức tạp
  • Reasoning ngầm cần inference
  • Vẫn fail ở một số edge case
  • Đắt hơn (compute nhiều)
  • Chậm hơn (vài giây đến phút)
  • Cho model dùng code execution cho math
  • Break complex problem thành sub-step
  • Verify với calculator/tool độc lập
  • Database công ty bạn
  • Repository code internal
  • Email cá nhân
  • Tool chuyên ngành (Bloomberg Terminal, Westlaw...)
  • Tool integration (MCP, custom connectors)
  • Upload relevant data thủ công
  • Build retrieval system (RAG)
  • Ngôn ngữ chính (English) tốt hơn
  • Văn hóa Western tốt hơn
  • Demographic representation lệch
  • Recent data over-represented
  • Output cho non-English có thể kém hơn
  • Recommendation có thể có cultural bias
  • Group nhỏ/marginalized có thể bị stereotype
  • Conscious về bias khi áp dụng cross-cultural
  • Dùng language native của target audience để evaluate
  • Diligence statement có thể flag bias considerations
  • Stock price hiện tại
  • Weather hôm nay
  • News breaking
  • Status hệ thống live

Bảng so sánh — AI vs. Human (nơi mỗi bên thắng)

Insight quan trọng: Bảng này không phải "AI tốt hơn / kém hơn". Nó là complementary strengths — bạn dùng AI cho cột trái, human cho cột phải, kết hợp cho output không bên nào tự làm được.

Tiêu chíAI thắngHuman thắng
Tốc độ✅ Phản hồi giây❌ Phút đến giờ
Scale✅ Xử lý 1000 doc parallel❌ Sequential
Pattern detection✅ Cross-source big data❌ Limited bandwidth
Recall thông tin✅ Internet-scale knowledge❌ Forget, biased recall
Context window❌ Limited (1M token max)✅ Lifetime memory (kiểu khác)
Critical judgment❌ Easily fooled✅ Skeptical thinking
Sáng tạo unique⚠️ Generic-ish✅ Truly novel ideas
Empathy thật❌ Mimic, không feel✅ Genuine connection
Đạo đức⚠️ Trained guardrail✅ Internal values
Domain expertise sâu⚠️ Wide but shallow✅ Deep specialty
Real-time data❌ Cutoff✅ Live awareness
Reproducibility❌ Non-deterministic✅ Consistent (gần)
Cost cận biên✅ Cents per query❌ Hourly rate

Khái niệm chìa khóa: Complementary strengths

Nguyên tắc thực dụng:

Đây là cốt lõi Augmentation (Bài 5.2). Cả khóa này dạy cách thực thi nguyên tắc này.

  • AI làm phần "broad and fast" — research, draft, analyze pattern
  • Human làm phần "deep and judgment" — strategy, ethics, final call
  • Cả hai cộng tác phần "iterate" — refine, improve
┌────────────────────────────────────────────────────────┐
│                                                        │
│              KẾT HỢP TỐI ƯU                            │
│                                                        │
│         HUMAN                    AI                    │
│         ─────                    ──                    │
│    Critical thinking         Speed                     │
│    Judgment                  Scale                     │
│    Creativity (true)         Pattern recognition       │
│    Ethical oversight         Information processing    │
│    Empathy                   Cross-domain knowledge    │
│    Domain expertise          Tool execution            │
│         │                        │                     │
│         └──────────┬─────────────┘                     │
│                    ▼                                   │
│           OUTPUT TỐT HƠN                               │
│           CẢ HAI BÊN TỰ LÀM                            │
│                                                        │
└────────────────────────────────────────────────────────┘

Ví dụ theo ngành — Áp dụng năng lực/giới hạn

💼 Investment Analyst — NBIM case

NBIM (Norwegian Sovereign Wealth Fund) có 9000 portfolio company.

AI thắng:

Human thắng:

Kết quả: "Analysts spend less time on tedious manual work, more on relationships and understanding business models." — Nick Linden, Anthropic Financial Services Lead

📊 Product Manager — Maggie case

AI thắng:

Human thắng:

⚖️ Legal Counsel

AI thắng:

Human thắng:

🏥 Pharma Researcher — AbbVie case

AI thắng (Genesis tool):

AI thắng (Gaia tool):

Human thắng:

  • Read all 10-K filing parallel
  • Extract financial highlights, risk factors
  • Compare quarterly performance across companies
  • Build dashboard with MCP integration
  • Investment thesis
  • Sector judgment
  • Ethical screening (ESG)
  • Final buy/sell decision
  • Pull email + calendar + task → daily brief
  • Literature review for proposal (45 min vs. half day)
  • Convert PRD to Asana task
  • Strategic priority cho team
  • Product vision
  • Stakeholder relationship
  • Compare contract vs. template
  • Surface clauses khác biệt
  • Summarize positions
  • Legal judgment trên nuance
  • Risk acceptance decision
  • Client communication
  • Court representation
  • Sales call planning
  • Drug data synthesis
  • Customer history aggregation
  • Draft NDA, PSUR documents
  • 40-60% efficiency
  • Drug discovery hypothesis
  • Patient safety judgment
  • Regulatory strategy
  • Clinical trial design (ultimate decision)

Anti-patterns

❌ "AI sẽ giỏi hơn nhân tôi sớm thôi, không cần học cộng tác"

Sai: Ngay cả khi AI giỏi hơn human ở task cụ thể, trách nhiệm vẫn là human. Diligence không thể delegate.

Đúng: Học cộng tác là kỹ năng meta — không lỗi thời.

❌ "AI có thể làm mọi thứ → giao mọi thứ"

Sai: Có những thứ AI làm được nhưng không nên giao (ethics, empathy với khách hàng đau buồn, decision với consequence lớn).

Đúng: Delegation là về "nên hay không", không phải "có thể hay không".

❌ "AI yếu math nên không bao giờ dùng cho number"

Sai: Model mới + code execution tool đã rất tốt math. Bạn missed opportunity.

Đúng: Test định kỳ — capability AI tăng nhanh.

❌ "Tin AI hoàn toàn vì output trông professional"

Sai: Output well-written ≠ output đúng. Hallucination thường rất fluent.

Đúng: Discernment standard — đặc biệt với fact, citation, number.

Mẹo nâng cao

💡 Mẹo 1: Maintain "AI capability radar"

Mỗi quý, dành 1 giờ:

Đây là cách stay current không cần đọc paper.

💡 Mẹo 2: Build "decision card" cá nhân

Tạo cheat sheet:

Update card khi học được điều mới.

💡 Mẹo 3: Học từ "AI failure" của mình

Khi AI fail, đừng frustrated. Note:

Mỗi failure là 1 data point cho mental model.

  • Test 5-10 task mới với AI mạnh nhất bạn dùng
  • Note: cái gì AI bây giờ làm được mà 6 tháng trước không?
  • Cái gì AI vẫn fail?
  • "Khi gặp X type task → AI tốt"
  • "Khi gặp Y type task → human tốt hơn"
  • "Khi gặp Z type task → mix với pattern A"
  • Loại task gì
  • Sai như thế nào
  • Pattern nào để tránh trong tương lai

Áp dụng ngay

Bài tập 1: Tạo "Capability Map" cá nhân (15 phút)

Liệt kê 10 task bạn làm thường xuyên trong công việc/cuộc sống. Phân loại:

Insight:

Bài tập 2: Test giới hạn AI bạn dùng (15 phút)

Thử các task sau với Claude:

Note kết quả. Đây là baseline reality check của tool bạn dùng.

Bài tập 3: Reflection (5 phút)

  • Task confidence ≥ 4 → safe to delegate (Automation/Augmentation)
  • Task confidence 2-3 → AI hỗ trợ một phần
  • Task confidence ≤ 1 → human-only hoặc cần tool đặc biệt
  • Knowledge cutoff: "What's the most recent major event in [your industry]?"
  • Hallucination check: "Cite 3 academic papers about [niche topic]" — verify mỗi citation có thật
  • Math: "If I have 17 customers, each pays $X different amount, what's the median and mean?"
  • Long context: Upload 1 doc dài, hỏi về câu cuối
  • Tool availability: "Can you search the web?" "Can you create files?"
  • Hiểu năng lực/giới hạn của AI thay đổi cách bạn nghĩ về dùng AI thế nào?
  • Có loại task nào bạn từng tránh AI vì cho rằng nó không làm được, mà thực ra giờ làm được?
  • Có loại task nào bạn đã giao AI nhưng bây giờ realize không nên?
TaskAI confidence (1-5)Human cầnPattern
Reply email khách hàng__Tone, judgmentAugmentation
Tóm tắt meeting__VerifyAutomation
Phân tích report__InsightAugmentation
Quyết định budget__Stakeholder contextHuman-only
...__......

Tóm tắt bài học

🎯 Năng lực chính: versatility ngôn ngữ, contextual awareness, tool use, pattern recognition, few-shot, chain-of-thought reasoning

🎯 Giới hạn cốt lõi: knowledge cutoff, hallucination, context window limit, non-determinism, complex reasoning, no real-time data, no internal data, bias inherent

🎯 Complementary strengths là nguyên tắc cốt lõi — phối hợp human (judgment, creativity, ethics) + AI (speed, scale, breadth)

🎯 Capability changing fast — review mental model hàng quý, không assume "AI yếu cái này mãi"

🎯 Output well-written ≠ output đúng — Discernment luôn cần thiết, đặc biệt với fact/citation/number

Tài liệu tham khảo
  • What do people use AI models for — Anthropic — Data-driven view of real use cases
  • How AbbVie accelerates drug discovery — Genesis & Gaia in pharma
  • How Claude is transforming financial services — NBIM, BCI cases
Nội dung này có hữu ích không?