Năng lực và giới hạn của AI hôm nay — AI Fluency: Khung & Nền tảng

Tưởng tượng công ty bạn vừa tuyển một người tên Aldous (viết tắt: AI). Đặc điểm:

Bạn sẽ học được

Liệt kê năng lực chính của AI hôm nay — biết nên giao gì
Nhận diện giới hạn cốt lõi — biết khi nào cần con người, khi nào cần tool bổ sung
Áp dụng "complementary strengths" — phối hợp human + AI tối ưu thay vì thay thế
Cập nhật mental model định kỳ vì landscape thay đổi nhanh
Tạo "decision card" cá nhân: khi nào dùng AI, khi nào không

Năng lực — AI làm gì tốt?

1. Versatility ngôn ngữ — "Thợ đa năng"

Cùng một model có thể:

Không cần "switch tool". Vài năm trước, mỗi task cần software riêng. Bây giờ, cùng một LLM xử lý hết.

2. Contextual awareness — "Nhớ trong cuộc trò chuyện"

Trong 1 conversation:

Lưu ý: Bộ nhớ chỉ trong context window. Conversation kéo dài quá → đầu chat bị quên.

3. Tool use — "Tay chân thật"

Model hiện đại có thể:

Đây là hệ quả của "đợt sóng 2" trong Bài 5.2 — AI có tay chân.

4. Pattern recognition ở scale lớn

AI có thể đọc 200 review, 500 ticket support, 80 paper → tìm pattern, theme, anomaly. Việc nếu bạn làm sẽ tốn ngày → AI làm trong phút.

Ứng dụng:

5. Few-shot learning — "Học nhanh từ ví dụ"

Cho model 2-3 ví dụ về output bạn muốn → nó pattern-match cho task tương tự.

6. Chain-of-thought reasoning (model mới)

Model thế hệ mới (Claude với extended thinking, GPT-5, o-series) có thể "nghĩ từng bước" trước khi answer. Phù hợp:

Viết email với tone của bạn
Tóm tắt báo cáo dài
Dịch giữa nhiều ngôn ngữ
Giải thích quantum physics
Viết tutorial cooking
Brainstorm ý tưởng bài thơ
Đề cập "deadline dự án" lúc đầu, hỏi "khi nào tôi cần xong?" cuối — model nhớ
Reference back: "như mày nói lúc nãy..." — model hiểu
Customer feedback analysis
Literature review
Code review pattern (security issues)
Trend detection trong data
Math problem
Logic puzzle
Multi-step planning
Code debug

Tool	Việc cụ thể
Web search	Thông tin sau knowledge cutoff
Code execution	Tính toán, phân tích data
File create/edit	Excel, PowerPoint, PDF
Image gen	Tạo hình từ description
Vision	Đọc/phân tích hình bạn upload
MCP integrations	Slack, Gmail, Notion, Asana, Salesforce...

┌─────────────────────────────────────────────────────────┐
│                                                         │
│                    LLM HÔM NAY                          │
│                                                         │
│   📧 Email      📊 Report      🌐 Translation           │
│   ✍️  Writing    📚 Summary     💡 Brainstorm           │
│   🎓 Teaching   💻 Code         📝 Docs                 │
│   🎨 Creative   🔍 Research     🤝 Negotiation help     │
│                                                         │
│         ALL FROM SINGLE INTERFACE                       │
│                                                         │
└─────────────────────────────────────────────────────────┘

Bạn cung cấp:
- Ví dụ 1: input X → output Y
- Ví dụ 2: input X' → output Y'
- Ví dụ 3: input X'' → output Y''

Model áp dụng pattern cho:
- Input X''' → output Y''' (theo style bạn dạy)

Giới hạn — AI làm gì tệ (hoặc nguy hiểm)?

1. Knowledge cutoff — "Đi tu trên núi"

Model không biết gì sau training cutoff. Hỏi sự kiện gần đây → bịa hoặc thừa nhận không biết.

Ví dụ vấn đề:

Giải pháp: Web search tool, hoặc upload data mới làm context.

2. Hallucination — "Nói chắc nhưng sai"

LLM tạo response qua statistical pattern, không phải retrieval. Khi gap kiến thức → bịa với confidence cao.

Ví dụ thường gặp:

Giải pháp:

3. Context window — "Bộ nhớ giới hạn"

Conversation rất dài hoặc data rất lớn → vượt window → quên.

Hệ quả:

Giải pháp:

4. Non-determinism — "Mỗi lần khác"

Cùng prompt → response khác → không reproducible.

Vấn đề:

Giải pháp:

5. Complex reasoning — "Toán-logic-tài chính"

Lịch sử LLM yếu ở:

Tin tốt: Model "reasoning" mới (o3, Claude extended thinking) đang tiến bộ nhanh. Nhưng:

Giải pháp:

6. Specific data sources — "Brilliant colleague không có database"

Model brilliant nhưng không truy cập:

Analogy: "Như có đồng nghiệp thiên tài nhưng không access internal database — họ chỉ giúp được trong phạm vi họ thấy."

Giải pháp:

7. Bias inherent từ training data

Training data từ Internet → model thừa hưởng bias của Internet:

Hệ quả:

Giải pháp:

8. Real-time / live data

Model không tự update real-time. Không biết:

Giải pháp: Tool integration. Model không "có" data, nhưng có thể "fetch" qua tool.

"Earnings của công ty A quý vừa rồi?" → model không biết
"Luật mới ban hành tháng trước?" → bịa hoặc rỗng
Bịa citation paper
Bịa quote của người nổi tiếng
Bịa case law
Bịa số thống kê
Bịa URL
Cross-check fact với source độc lập
Dùng tool search để ground vào reality
Skeptical với mọi specific number/citation
Conversation kéo dài tuần → đầu chat bị quên
Document 1000 trang → có thể truncate
Multi-file project → không thấy được mối liên hệ xa
Summarize-and-restart cho conversation dài
Filter document trước upload
Dùng model context lớn (Claude 4 1M, Gemini 2M)
Audit trail khó (lần này đúng, lần sau sai)
Production system cần consistency
Test khó (output luôn khác)
Set temperature = 0 cho task cần consistency
Document version model đang dùng
Test với nhiều seed để hiểu variance
Math nhiều bước
Logic puzzle phức tạp
Reasoning ngầm cần inference
Vẫn fail ở một số edge case
Đắt hơn (compute nhiều)
Chậm hơn (vài giây đến phút)
Cho model dùng code execution cho math
Break complex problem thành sub-step
Verify với calculator/tool độc lập
Database công ty bạn
Repository code internal
Email cá nhân
Tool chuyên ngành (Bloomberg Terminal, Westlaw...)
Tool integration (MCP, custom connectors)
Upload relevant data thủ công
Build retrieval system (RAG)
Ngôn ngữ chính (English) tốt hơn
Văn hóa Western tốt hơn
Demographic representation lệch
Recent data over-represented
Output cho non-English có thể kém hơn
Recommendation có thể có cultural bias
Group nhỏ/marginalized có thể bị stereotype
Conscious về bias khi áp dụng cross-cultural
Dùng language native của target audience để evaluate
Diligence statement có thể flag bias considerations
Stock price hiện tại
Weather hôm nay
News breaking
Status hệ thống live

Bảng so sánh — AI vs. Human (nơi mỗi bên thắng)

Insight quan trọng: Bảng này không phải "AI tốt hơn / kém hơn". Nó là complementary strengths — bạn dùng AI cho cột trái, human cho cột phải, kết hợp cho output không bên nào tự làm được.

Tiêu chí	AI thắng	Human thắng
Tốc độ	✅ Phản hồi giây	❌ Phút đến giờ
Scale	✅ Xử lý 1000 doc parallel	❌ Sequential
Pattern detection	✅ Cross-source big data	❌ Limited bandwidth
Recall thông tin	✅ Internet-scale knowledge	❌ Forget, biased recall
Context window	❌ Limited (1M token max)	✅ Lifetime memory (kiểu khác)
Critical judgment	❌ Easily fooled	✅ Skeptical thinking
Sáng tạo unique	⚠️ Generic-ish	✅ Truly novel ideas
Empathy thật	❌ Mimic, không feel	✅ Genuine connection
Đạo đức	⚠️ Trained guardrail	✅ Internal values
Domain expertise sâu	⚠️ Wide but shallow	✅ Deep specialty
Real-time data	❌ Cutoff	✅ Live awareness
Reproducibility	❌ Non-deterministic	✅ Consistent (gần)
Cost cận biên	✅ Cents per query	❌ Hourly rate

Khái niệm chìa khóa: Complementary strengths

Nguyên tắc thực dụng:

Đây là cốt lõi Augmentation (Bài 5.2). Cả khóa này dạy cách thực thi nguyên tắc này.

AI làm phần "broad and fast" — research, draft, analyze pattern
Human làm phần "deep and judgment" — strategy, ethics, final call
Cả hai cộng tác phần "iterate" — refine, improve

┌────────────────────────────────────────────────────────┐
│                                                        │
│              KẾT HỢP TỐI ƯU                            │
│                                                        │
│         HUMAN                    AI                    │
│         ─────                    ──                    │
│    Critical thinking         Speed                     │
│    Judgment                  Scale                     │
│    Creativity (true)         Pattern recognition       │
│    Ethical oversight         Information processing    │
│    Empathy                   Cross-domain knowledge    │
│    Domain expertise          Tool execution            │
│         │                        │                     │
│         └──────────┬─────────────┘                     │
│                    ▼                                   │
│           OUTPUT TỐT HƠN                               │
│           CẢ HAI BÊN TỰ LÀM                            │
│                                                        │
└────────────────────────────────────────────────────────┘

Ví dụ theo ngành — Áp dụng năng lực/giới hạn

💼 Investment Analyst — NBIM case

NBIM (Norwegian Sovereign Wealth Fund) có 9000 portfolio company.

AI thắng:

Human thắng:

Kết quả: "Analysts spend less time on tedious manual work, more on relationships and understanding business models." — Nick Linden, Anthropic Financial Services Lead

📊 Product Manager — Maggie case

AI thắng:

Human thắng:

⚖️ Legal Counsel

AI thắng:

Human thắng:

🏥 Pharma Researcher — AbbVie case

AI thắng (Genesis tool):

AI thắng (Gaia tool):

Human thắng:

Read all 10-K filing parallel
Extract financial highlights, risk factors
Compare quarterly performance across companies
Build dashboard with MCP integration
Investment thesis
Sector judgment
Ethical screening (ESG)
Final buy/sell decision
Pull email + calendar + task → daily brief
Literature review for proposal (45 min vs. half day)
Convert PRD to Asana task
Strategic priority cho team
Product vision
Stakeholder relationship
Compare contract vs. template
Surface clauses khác biệt
Summarize positions
Legal judgment trên nuance
Risk acceptance decision
Client communication
Court representation
Sales call planning
Drug data synthesis
Customer history aggregation
Draft NDA, PSUR documents
40-60% efficiency
Drug discovery hypothesis
Patient safety judgment
Regulatory strategy
Clinical trial design (ultimate decision)

Anti-patterns

❌ "AI sẽ giỏi hơn nhân tôi sớm thôi, không cần học cộng tác"

Sai: Ngay cả khi AI giỏi hơn human ở task cụ thể, trách nhiệm vẫn là human. Diligence không thể delegate.

Đúng: Học cộng tác là kỹ năng meta — không lỗi thời.

❌ "AI có thể làm mọi thứ → giao mọi thứ"

Sai: Có những thứ AI làm được nhưng không nên giao (ethics, empathy với khách hàng đau buồn, decision với consequence lớn).

Đúng: Delegation là về "nên hay không", không phải "có thể hay không".

❌ "AI yếu math nên không bao giờ dùng cho number"

Sai: Model mới + code execution tool đã rất tốt math. Bạn missed opportunity.

Đúng: Test định kỳ — capability AI tăng nhanh.

❌ "Tin AI hoàn toàn vì output trông professional"

Sai: Output well-written ≠ output đúng. Hallucination thường rất fluent.

Đúng: Discernment standard — đặc biệt với fact, citation, number.

Mẹo nâng cao

💡 Mẹo 1: Maintain "AI capability radar"

Mỗi quý, dành 1 giờ:

Đây là cách stay current không cần đọc paper.

💡 Mẹo 2: Build "decision card" cá nhân

Tạo cheat sheet:

Update card khi học được điều mới.

💡 Mẹo 3: Học từ "AI failure" của mình

Khi AI fail, đừng frustrated. Note:

Mỗi failure là 1 data point cho mental model.

Test 5-10 task mới với AI mạnh nhất bạn dùng
Note: cái gì AI bây giờ làm được mà 6 tháng trước không?
Cái gì AI vẫn fail?
"Khi gặp X type task → AI tốt"
"Khi gặp Y type task → human tốt hơn"
"Khi gặp Z type task → mix với pattern A"
Loại task gì
Sai như thế nào
Pattern nào để tránh trong tương lai

Áp dụng ngay

Bài tập 1: Tạo "Capability Map" cá nhân (15 phút)

Liệt kê 10 task bạn làm thường xuyên trong công việc/cuộc sống. Phân loại:

Insight:

Bài tập 2: Test giới hạn AI bạn dùng (15 phút)

Thử các task sau với Claude:

Note kết quả. Đây là baseline reality check của tool bạn dùng.

Bài tập 3: Reflection (5 phút)

Task confidence ≥ 4 → safe to delegate (Automation/Augmentation)
Task confidence 2-3 → AI hỗ trợ một phần
Task confidence ≤ 1 → human-only hoặc cần tool đặc biệt
Knowledge cutoff: "What's the most recent major event in [your industry]?"
Hallucination check: "Cite 3 academic papers about [niche topic]" — verify mỗi citation có thật
Math: "If I have 17 customers, each pays $X different amount, what's the median and mean?"
Long context: Upload 1 doc dài, hỏi về câu cuối
Tool availability: "Can you search the web?" "Can you create files?"
Hiểu năng lực/giới hạn của AI thay đổi cách bạn nghĩ về dùng AI thế nào?
Có loại task nào bạn từng tránh AI vì cho rằng nó không làm được, mà thực ra giờ làm được?
Có loại task nào bạn đã giao AI nhưng bây giờ realize không nên?

Task	AI confidence (1-5)	Human cần	Pattern
Reply email khách hàng	__	Tone, judgment	Augmentation
Tóm tắt meeting	__	Verify	Automation
Phân tích report	__	Insight	Augmentation
Quyết định budget	__	Stakeholder context	Human-only
...	__	...	...

Tóm tắt bài học

🎯 Năng lực chính: versatility ngôn ngữ, contextual awareness, tool use, pattern recognition, few-shot, chain-of-thought reasoning

🎯 Giới hạn cốt lõi: knowledge cutoff, hallucination, context window limit, non-determinism, complex reasoning, no real-time data, no internal data, bias inherent

🎯 Complementary strengths là nguyên tắc cốt lõi — phối hợp human (judgment, creativity, ethics) + AI (speed, scale, breadth)

🎯 Capability changing fast — review mental model hàng quý, không assume "AI yếu cái này mãi"

🎯 Output well-written ≠ output đúng — Discernment luôn cần thiết, đặc biệt với fact/citation/number

Tài liệu tham khảo

What do people use AI models for — Anthropic — Data-driven view of real use cases
How AbbVie accelerates drug discovery — Genesis & Gaia in pharma
How Claude is transforming financial services — NBIM, BCI cases

Nội dung này có hữu ích không?