Hãy dừng lại 30 giây và nghĩ về hôm nay — kể từ lúc bạn mở mắt đến giờ, bạn đã chạm vào bao nhiêu "AI"?
- Phân biệt generative AI với các loại AI phân loại/dự đoán mà bạn gặp hàng ngày
- Hiểu rằng các thuộc tính của generative AI tồn tại trên một continuum từ năng lực sang giới hạn
- Xem trước 4 thuộc tính cốt lõi sẽ đào sâu trong các bài sau: Next Token Prediction, Knowledge, Working Memory, Steerability
- Giải thích khái niệm "calibrated trust" (niềm tin được hiệu chỉnh) và tại sao nó khác với "trust / distrust wholesale"
Phân loại AI: 2 họ lớn
Họ 1: Classification / Prediction AI (AI phân loại & dự đoán)
Đây là AI sort, rank, classify, predict — loại bạn gặp hàng ngày mà không nhận ra.
Đặc điểm:
Họ 2: Generative AI (AI tạo sinh)
Đây là loại AI sinh ra nội dung chưa từng tồn tại — văn bản, hình ảnh, code, nhạc, video.
Đặc điểm:
Bảng so sánh nhanh
- Output rời rạc hoặc hữu hạn (spam/không spam, 5 video gợi ý, 1 ETA)
- Không sinh nội dung mới — chỉ quyết định từ tập hợp có sẵn
- Chạy ngầm, bạn hiếm khi tương tác trực tiếp
- Output mở — không giới hạn cấu trúc, độ dài, nội dung
- Sinh ra cái chưa tồn tại trong training data (dù dựa trên pattern đã học)
- Tương tác trực tiếp qua prompt — đây là lý do nó "nổi" sau ChatGPT (2022)
| Tiêu chí | Classification AI | Generative AI |
|---|---|---|
| Output | Rời rạc, hữu hạn | Mở, sinh mới |
| Ví dụ | Spam filter, Face ID, recommendation | Claude, ChatGPT, DALL-E, GitHub Copilot |
| Tương tác | Chạy ngầm | Qua prompt |
| Kiểu lỗi | Phân loại nhầm (1 email) | Bịa ra nội dung nghe như thật |
| Đánh giá | Accuracy, precision, recall | Chủ quan: có dùng được không? |
| Khóa này dạy | ❌ | ✅ |
┌──────────────────────────────────────────────────────┐ │ INPUT OUTPUT │ │ ───── ────── │ │ "Viết cho tôi 1 email..." → [AI] → email mới 200 từ │ │ "Tóm tắt báo cáo này" → [AI] → tóm tắt mới │ │ "Dịch đoạn này sang VI" → [AI] → văn bản Việt mới │ │ "Vẽ 1 con mèo đi giày" → [AI] → hình ảnh chưa có │ │ "Debug code này cho tôi" → [AI] → sửa + giải thích │ └──────────────────────────────────────────────────────┘
Sinh ra từ đâu: Hai giai đoạn huấn luyện
Generative AI được xây qua hai giai đoạn (sẽ đào sâu ở Bài 17.2):
Một khoảnh khắc eureka: nếu bạn hỏi một model chưa được fine-tune câu "Thủ đô của Pháp là gì?", nó sẽ không trả lời "Paris". Nó sẽ hoàn thành tài liệu — có thể sinh thêm vài câu hỏi trắc nghiệm nữa, hoặc một đoạn sách giáo khoa địa lý. Vì đó là cái thống kê tiếp theo sẽ xuất hiện trong văn bản như thế. Nó không "hiểu" bạn đang hỏi — nó dự đoán.
Điều đó được thay đổi bởi fine-tuning. Bạn sẽ thấy ở Bài 17.2 rằng mọi hành vi kỳ lạ của AI — sycophancy (xu nịnh), verbosity (nói dài), over-caution (quá cẩn trọng) — đều để lại dấu vân tay từ một trong hai giai đoạn này.
┌──────────────────────────────────────────────────────┐ │ │ │ Stage 1: PRETRAINING │ │ ───────────────────── │ │ Model đọc một khối lượng khổng lồ văn bản │ │ (website, sách, code, Wikipedia, diễn đàn...) │ │ và học **một thứ duy nhất**: │ │ "Cho đoạn văn bản đến đây, từ tiếp theo là gì?" │ │ │ │ Kết quả: một "document completer" khổng lồ — │ │ hoàn thành được mọi loại văn bản nhưng │ │ **không có khái niệm "giúp đỡ bạn"**. │ │ │ │ ↓ │ │ │ │ Stage 2: FINE-TUNING │ │ ──────────────────── │ │ Document completer được huấn luyện thêm │ │ trên các ví dụ "hành vi tốt của trợ lý" và │ │ reward signals từ đánh giá của con người. │ │ │ │ Kết quả: một trợ lý — coi input của bạn như │ │ một **yêu cầu** cần đáp ứng, trả lời hữu ích, │ │ từ chối yêu cầu gây hại. │ │ │ └──────────────────────────────────────────────────────┘
Generative AI ở cốt lõi là một hệ thống dự đoán
Đây là câu tinh tế nhất bạn cần ghi nhớ khi bước vào 4 bài kế tiếp:
Điểm mạnh và điểm yếu đến từ cùng một cơ chế. Nếu bạn hiểu điều này, bạn sẽ không ngạc nhiên khi:
Không phải lỗi "bất thường". Đó là cơ chế hoạt động ra như vậy.
- AI tóm tắt báo cáo quý III của Tesla rất trôi chảy (well-worn pattern) nhưng khi bạn hỏi về doanh thu Q3 2025 của một công ty startup bạn đang đầu tư, nó bịa ra số.
- AI viết email chuyên nghiệp cực tốt nhưng không thể nhân chính xác hai số có 7 chữ số (cần tool).
- AI hiểu hướng dẫn "viết như một nhà báo hoài nghi" rất sắc nhưng thỉnh thoảng rút lại quan điểm khi bạn phản biện nhẹ.
4 thuộc tính: Xem trước
Khóa học sẽ đào sâu 4 thuộc tính. Mỗi cái là một continuum — không phải "có" hay "không có" mà là "mạnh ở đâu, yếu ở đâu". Càng dịch về phía "Limitation", bạn càng phải verify + cung cấp context + chèn checkpoint.
🔮 Next Token Prediction — Câu trả lời từ đâu ra?
Model không tra cứu. Nó viết cái gì thống kê sẽ xuất hiện tiếp theo, từng fragment một. Điều này giải thích cả fluency lẫn hallucination. → Bài 17.3
🌐 Knowledge — AI thực sự biết gì?
Broad but uneven. Kiến thức đóng băng ở training cutoff (ngày cuối model được huấn luyện). Mọi thứ sau đó "không có". → Bài 17.5
🧠 Working Memory — AI đang chú ý gì?
Có giới hạn cứng (context window). Khác 3 thuộc tính còn lại — thuộc tính này có cliff, không phải gradient: hoạt động tốt cho đến khi không hoạt động, và bạn không luôn nhận được cảnh báo. → Bài 17.7
🎚️ Steerability — Bạn kiểm soát được đến đâu?
Model rất directable — nhưng có khoảng cách giữa điều bạn gõ và điều bạn muốn. Fine-tuning dạy model theo instruction qua pattern-matching, không phải qua understanding thực sự. → Bài 17.9
Capability ◄──────────────────────────────► Limitation
Instruction ngắn, cụ thể, Long reasoning chains,
kiểm chứng được abstract asks ("be insightful"),
("đáp dạng bảng", "dưới 100 từ") precision tasksCalibrated trust: Cái duy nhất bạn cần mang theo khóa này
Mục tiêu không phải "tin AI" hay "không tin AI". Mục tiêu là định vị task của bạn trên mỗi continuum:
Dựa vào vị trí, bạn điều chỉnh thói quen:
- Task này có ở well-worn territory không? (NTP capability zone?)
- Chủ đề này recent hay stable? (Knowledge zone?)
- Context có comfortably fit trong window không? (Working Memory zone?)
- Instruction có concrete + verifiable không, hay abstract + long-chain? (Steerability zone?)
┌──────────────────────────────────────────────────────┐ │ │ │ NẾU task rơi ở CAPABILITY ZONE → dùng như bình │ │ thường, verify nhẹ │ │ │ │ NẾU task rơi ở LIMITATION ZONE → thêm: │ │ - Verify nhiều hơn (với Knowledge + NTP) │ │ - Cung cấp context (với Working Memory) │ │ - Chèn checkpoint (với Steerability) │ │ - Hoặc chuyển sang tool khác / tự làm │ │ │ └──────────────────────────────────────────────────────┘
Ví dụ theo ngành: 5 task ở 5 vị trí khác nhau trên continuum
💼 Sales Manager — Viết email "xin lỗi" theo template công ty
Vị trí: NTP capability zone (well-worn) + Steerability capability zone (ngắn, cụ thể)
Dùng bình thường, verify nhẹ:
💰 Finance Analyst — Kiểm tra số liệu doanh thu Q3 2025 của một startup Việt Nam
Vị trí: Knowledge limitation zone (niche, local, có thể post-cutoff) + NTP limitation zone (specificity)
Cần extra care:
🔍 Research Analyst — Tìm 3 paper gần đây về "cognitive bias in algorithmic trading"
Vị trí: NTP limitation (specificity) × Knowledge limitation (niche + recent)
Cần hai lớp kiểm chứng:
⚖️ Legal Counsel — Review 50-page contract
Vị trí: Working Memory limitation (doc dài) + Steerability (cần precision)
Cần strategy context engineering:
🎓 Teacher — Giải thích khái niệm quang hợp cho học sinh lớp 6
Vị trí: Knowledge capability zone + NTP capability zone
Giao nguyên đi:
Thấy chưa? Cùng một AI, cùng một model, nhưng cách dùng phải thay đổi theo vị trí của task.
- Giao cho Claude/ChatGPT draft
- Verify 30 giây: giọng điệu có phù hợp chuẩn công ty không?
- Kết quả: 20 phút → 5 phút
- KHÔNG tin số AI đưa ra
- BẬT web search / cung cấp report thật
- Verify từng con số
- Failure nếu không làm vậy: có thể bị bịa con số với giọng tự tin
- Bắt buộc bật tool/search mode
- Verify từng paper trên Google Scholar
- Failure nếu không làm vậy: 2/3 citation bịa, tất cả nghe như thật
- Chunk contract thành 5 passes
- Đặt instruction quan trọng ở đầu + cuối
- Failure nếu bỏ instruction ở trang 11: "lost in the middle"
- Topic mainstream, không đổi, frequent
- AI giải thích tự nhiên, đa phong cách
- Failure risk thấp — verify spot-check là đủ
Anti-patterns — Những hiểu lầm cần tránh
❌ Anti-pattern 1: "AI đã giỏi, mình không cần biết nó hoạt động thế nào"
Tại sao sai: Khi AI giỏi, bạn có thể xài bản năng. Khi AI hỏng, bạn không biết fix kiểu gì. Hiểu cơ chế = biết cách fix.
Cách đúng: Đầu tư 6-8 giờ khóa này = tiết kiệm hàng trăm giờ sau này khi AI output chỗ nào cần verify chỗ nào không.
❌ Anti-pattern 2: "AI luôn đúng" hoặc "AI luôn sai"
Tại sao sai: Cả hai cực đều dẫn đến ra quyết định kém.
Cách đúng: Calibrated trust — định vị task, set habits.
❌ Anti-pattern 3: "Coi chatbot và photo tagger là cùng một thứ"
Tại sao sai: Rất nhiều người (kể cả trong các công ty lớn) triển khai "AI" mà không phân biệt. Kết quả: kỳ vọng sai, tích hợp sai kiến trúc, thất vọng sai chỗ.
Cách đúng: Classification AI ≠ Generative AI. Generative AI không đáng tin hơn dù "xịn hơn" — nó xử lý loại bài toán khác.
❌ Anti-pattern 4: "Dùng AI = chỉ prompt giỏi"
Tại sao sai: Prompt chỉ là một phần (Description trong 4D). Nếu bạn không hiểu Knowledge gap của model, prompt giỏi đến đâu cũng bịa.
Cách đúng: Prompt-engineering + context-engineering + hiểu về 4 thuộc tính = đầy đủ công cụ.
- "AI luôn đúng" → tin một citation bịa, bị sếp nói "sao không check?"
- "AI luôn sai" → không xài AI cho task well-worn, mất 3 giờ làm thủ công
Áp dụng ngay
Bài tập 1: Generative or Not? (~15 phút)
Lý do: Bạn vừa học rằng generative AI khác biệt căn bản với loại AI lọc spam + gợi ý video. Bây giờ áp dụng sự phân biệt này vào chính trải nghiệm của mình.
Bước 1: Liệt kê 5 tính năng AI bạn đã tương tác trong tuần này. Mở rộng phạm vi:
Bước 2: Với mỗi cái, ghi câu trả lời của bạn:
Bước 3: Gửi danh sách cho Claude / ChatGPT và yêu cầu kiểm tra:
Bước 4: Quay lại danh sách task của Bài 17.0. Với mỗi task, tag một câu hỏi thuộc tính cảm thấy liên quan nhất:
Bài tập 2 (optional): Tìm classification AI "đội lốt" generative
Có những sản phẩm marketing rất khéo gọi mình là "AI-powered" nhưng thực ra chỉ là classification. Ngược lại, có những tool tự nhận mình là "simple" mà thực ra đang dùng generative AI ngầm.
Pick 2 app/tool bạn dùng hàng ngày và đào sâu xem bản chất chúng là gì. Hữu ích để rèn cảm quan.
- autocomplete điện thoại
- photo tagging
- spam filter
- chatbot trả lời
- translate tự động
- product recommendations
- voice assistant (Siri, Alexa...)
- autocomplete code (GitHub Copilot)
- 🔮 Câu trả lời từ đâu ra? (Next Token Prediction)
- 🌐 AI biết gì? (Knowledge)
- 🧠 AI đang chú ý gì? (Working Memory)
- 🎚️ Mình kiểm soát đến đâu? (Steerability)
| Tính năng | Generative hay Classification? |
|---|---|
| 1. ... | |
| 2. ... | |
| 3. ... | |
| 4. ... | |
| 5. ... |
Suy ngẫm bài học
- Sự phân biệt generative vs classification có làm bạn nghĩ lại về bất kỳ công cụ nào bạn đang xài không?
- Nhìn lại cách bạn đã tag danh sách task: có task nào cảm thấy thuộc về nhiều hơn 1 thuộc tính không? (Gợi ý: hầu hết đều vậy — đó là lý do Bài 17.11 nói về "collision".)
Tóm tắt bài học
🎯 Generative AI ≠ Classification AI — loại thứ nhất sinh ra nội dung mới, loại thứ hai phân loại nội dung có sẵn. Khóa học này chỉ nói về loại thứ nhất.
🎯 AI không đồng đều năng lực — mạnh và yếu ở 4 trục có thể dự đoán được: Next Token Prediction, Knowledge, Working Memory, Steerability.
🎯 Mỗi thuộc tính là một continuum — điểm mạnh và điểm yếu đến từ cùng một cơ chế. Fluency và hallucination là hai mặt của một đồng xu.
🎯 Calibrated trust = định vị task trên continuum rồi điều chỉnh habits, không phải trao/rút niềm tin toàn bộ.
🎯 Pretraining + Fine-tuning = hai giai đoạn sinh ra tính cách của AI (đào sâu ở Bài 17.2).
- Anthropic — AI Fluency: Framework & Foundations, Lesson 3A — Giới thiệu sâu hơn về generative AI và transformer (2017)
- Anthropic — Scaling Laws Research — Tại sao model lớn hơn → khả năng emerge tự nhiên
- Bài 17.0 — Roadmap khóa học & 4D companion