Bạn đã dùng Claude được vài ngày. Có những lần response rất đúng ý — bạn cảm giác "wow, AI hiểu mình".
- Nhận diện 5 common challenges khi dùng Claude và áp dụng kỹ thuật fix nhanh
- Giải thích AI Fluency và biết nơi học sâu hơn
- Áp dụng 4D Framework vào công việc cụ thể của mình
- Thiết lập delegation-diligence loop để test Claude trên task riêng
- Chạy lightweight evals để build confidence có căn cứ vào AI
5 common challenges và cách fix
Dưới đây là bảng cheat-sheet các lỗi phổ biến. In ra dán bàn hoặc bookmark.
Ví dụ fix: từ generic → specific
Prompt generic:
Response: Một email chung chung về delay, tông generic corporate.
Prompt specific:
Response: Usable draft, match situation của bạn, bạn chỉ cần tweak 10-20% trước khi gửi.
Công thức fix generic:
- Add audience specificity ("enterprise client" thay vì "client")
- Add history / context ("second delay" thay vì không mention)
- Add constraints ("150 words", "professional but apologetic")
- Add structure requirements ("brief apology + root cause + timeline + call offer")
| Triệu chứng | Nguyên nhân thật | Fix |
|---|---|---|
| Response quá generic | Prompt không đủ context về situation cụ thể | Thêm detail về audience, role, constraints. Xem ví dụ bên dưới. |
| Response quá dài / quá ngắn | Claude đang đoán độ dài | Explicit: "200 từ", "3 bullets", "max 1 trang", "comprehensive analysis — length không quan trọng" |
| Claude không theo format mong muốn | Hiểu what nhưng không hiểu how | Show example format hoặc describe cấu trúc: "Use bullet points với bold headers cho mỗi section" |
| Confident-sounding nhưng sai | Hallucination — đặc biệt với facts cụ thể, niche topics, citations | Verify high-stakes facts. Ask Claude cite sources, state confidence level. Enable web search cho current info. |
| Tông không đúng | Claude default helpful-professional, có thể không match | Describe tông bằng plain language: "conversational", "authoritative formal", "empathetic". Attach example text nếu có. |
Iteration Mindset — Shift quan trọng nhất
Đây là shift mindset quan trọng nhất khi dùng AI, và cũng là shift khó nhất.
Tại sao khó?
Chúng ta đã quen Google mindset: type query → expect perfect result → nếu không có, blame yourself (query sai) hoặc blame tool.
Với AI, mindset đúng là conversation mindset: open with best attempt → observe response → adjust → refine → converge.
3 nguyên tắc Iteration
1. First drafts as starting points
Coi response đầu tiên như một draft từ junior colleague:
2. Specific feedback
So sánh:
3. Know when to start fresh
Conversation đi chệch quá xa → sometimes faster to start a new chat với prompt đã refined, thay vì cố redirect. 3 dấu hiệu restart:
Pro tip: Trước khi restart, hỏi Claude: "Summarize key context từ chat này thành 5 bullets để tôi paste vào chat mới."
- Có structure rồi → bạn không phải start from scratch
- Có thể có điểm chưa ưng → feedback cụ thể
- Có thể có fact cần verify → check trước khi ship
- 80% của value nằm ở response đầu. 20% còn lại come từ iteration.
- Đã đi > 15 messages và response bắt đầu lặp
- Topic đã shift đáng kể (bắt đầu marketing, giờ đang coding)
- Bạn muốn "fresh take" không bias bởi conversation
| Feedback yếu | Feedback mạnh |
|---|---|
| "Make it shorter" | "Cut the first two paragraphs; make the conclusion more action-oriented" |
| "Better tone" | "Replace corporate jargon like 'synergy' và 'leverage'. Write như senior consultant explaining to a client — authoritative nhưng approachable" |
| "More details" | "Expand section 3 (competitive analysis) to 200 words với 3 specific competitors mentioned" |
| "Fix it" | "The pricing number in paragraph 2 is wrong. Should be $4.99/month, not $3.99. Update và explain implications cho margin calc" |
AI Fluency — và tại sao nó quan trọng
AI Fluency là năng lực cộng tác hiệu quả với AI — không chỉ "biết bấm nút nào", mà là phát triển judgment để dùng AI tốt qua các tình huống khác nhau.
4D Framework — Đào sâu
Đã introduce ở Bài 02. Giờ ta đào sâu từng D với tình huống thực tế.
1. Delegation — Giao gì cho AI?
Không phải task nào cũng nên giao AI. Framework quyết định:
Phù hợp giao AI:
Không nên giao AI:
Pro tip: List 10 task trong tuần. Với mỗi task, hỏi: Nếu senior ai đó ở team giúp tôi làm 60% task này, tôi sẽ OK không? Nếu yes → candidate để giao AI.
2. Description — Giao thế nào?
Đây là công thức C-T-R ở Bài 02. Recap:
Advanced: thêm examples (show style bạn muốn), thêm counter-examples (cái bạn không muốn).
3. Discernment — Đánh giá output thế nào?
Không phải Claude said → Claude right. Checklist đánh giá:
Accuracy — có đúng fact không?
Appropriateness — có phù hợp context không?
Completeness — có miss gì?
Consistency — có self-consistent không?
4. Diligence — Trách nhiệm cuối cùng
Đây là phần không delegable. Dù AI làm 95% task, bạn vẫn chịu trách nhiệm cho output được ship.
Rules:
- Có pattern, có template
- Output kiểm tra được (so với ground truth)
- Cost của sai thấp (không ship thẳng cho khách hàng)
- Bạn muốn AI làm — không phải chỉ để tiết kiệm thời gian mà còn để improve quality
- Judgment call có stakes cao (hiring, firing, strategic decisions)
- Task cần privileged context AI không có
- Trust với stakeholders quan trọng (AI làm, nhưng người phải chịu trách nhiệm + review kỹ)
- Context (bạn là ai, muốn gì)
- Task (cụ thể động từ)
- Rules (tone, format, constraints)
- Con số / ngày / tên — cross-check với source đáng tin
- Citations — click vào, verify link work và nội dung khớp
- Claims — "X causes Y" có được prove hay chỉ correlation?
- Tông có match audience?
- Depth có đúng level (quá basic/quá advanced)?
- Cultural fit — có điều gì weird với context Việt Nam / industry bạn?
- Có cover tất cả angles đã prompt không?
- Có nhắc đến caveats / limitations không?
- Có edge cases nào Claude chưa nghĩ đến?
- Số ở section 1 và section 4 có khớp không?
- Tông / terminology có nhất quán không?
- Có chỗ nào contradict chính nó?
- Transparency: Nếu content được AI-assisted, tùy context, disclose. (Ví dụ: academic, legal — mandatory. Marketing internal — optional.)
- Accountability: Ship với tên bạn = bạn own mọi consequence.
- Ethics: Claude harmless by design, nhưng use case có thể vẫn problematic (surveillance, manipulation, bias). Bạn là người gatekeep.
┌────────────────────────────────────────────────────────┐ │ 4D FRAMEWORK │ │ │ │ WHAT (giao gì) HOW (giao thế nào) │ │ ┌───────────────┐ ┌──────────────────┐ │ │ │ DELEGATION │ ───▶ │ DESCRIPTION │ │ │ │ │ │ │ │ │ │ Quyết định │ │ Giao tiếp rõ │ │ │ │ human vs AI │ │ với AI (C-T-R) │ │ │ └───────────────┘ └──────────────────┘ │ │ ▲ │ │ │ │ ▼ │ │ ┌───────────────┐ ┌──────────────────┐ │ │ │ DILIGENCE │ ◀─── │ DISCERNMENT │ │ │ │ │ │ │ │ │ │ Trách nhiệm │ │ Đánh giá │ │ │ │ cuối cùng │ │ output │ │ │ │ của người │ │ │ │ │ └───────────────┘ └──────────────────┘ │ │ │ │ LOOP: lặp lại cho đến khi có confidence │ └────────────────────────────────────────────────────────┘
Delegation-Diligence Loop — Build confidence có căn cứ
Câu hỏi mà mọi người đặt sau tuần đầu dùng Claude: "Tôi biết Claude trả lời tốt nhiều task. Nhưng với task cụ thể của tôi, sao tôi biết nó đáng tin?"
Đây là câu hỏi đúng. Và câu trả lời không phải "cứ tin" hay "đừng tin" — mà là một loop có hệ thống gọi là Delegation-Diligence Loop.
Case study: Rio — Program Director tại Valley Veterans Services
Rio làm quarterly analysis về program attendance vs. employment outcomes. Mỗi quý, anh tốn hàng giờ:
Anh muốn delegate cho AI. Nhưng anh cảnh giác — data sạch là quan trọng, sai là affect decision thực tế cho chương trình.
Rio's loop — 6 bước
Bước 1: Identify specific task
Rio chọn 1 task cụ thể: phân tích attendance vs. outcomes cho Q2. Không generic như "AI phân tích data cho tôi".
Bước 2: Find past data với ground truth
Rio lấy Q1 data — anh đã làm manual, biết kết quả đúng. Đây là test case — có "đáp án" để so.
Bước 3: Prompt AI tái tạo kết quả
Rio prompt:
Bước 4: Check output vs. ground truth
AI return summary. Rio không assume đúng. Anh compare:
Bước 5: Refine description
Rio update prompt: "Pay special attention to program type — housing-only vs. job-only vs. combined housing+job."
Lần này AI catch được nuance. Rio note lại cho future: "Với quarterly analysis, luôn phải prompt Claude consider program type explicit."
Bước 6: Test harder question
Rio push thêm: "Also look at this based on khi participants enrolled."
AI response — nhưng Rio observe AI không có enrollment data. Rio note: "Next quarter cần include enrollment dates trong data upload."
Kết quả loop
Rio học được:
Delegation-Diligence Loop:
Điều quan trọng: 2 outcomes đều giá trị
Khi bạn không đủ kiến thức để spot gaps?
Không phải ai cũng là data-savvy như Rio. Nếu bạn không đủ chuyên môn để biết AI output có đúng không:
- Tính attendance rates
- Track monthly changes
- Determine correlation giữa attendance và job placement
- ✅ AI đúng: correlation attendance vs. job placement
- ❌ AI miss: critical insight về combined housing + job placement program
- ✅ AI tốt cho analysis anh đã làm manual (validated!)
- ✅ AI cần specific context (program type) để không miss insights
- ✅ AI cần right data (enrollment dates) cho cohort analysis
- ✅ Anh tin tưởng có căn cứ dùng AI cho Q2 data
- Outcome A: Sau vài iterations, AI reproduce được kết quả bạn → bạn đã có validated approach để dùng trên data mới. Diligence tiếp tục trên mỗi output, nhưng bạn work từ confidence chứ không phải guesswork.
- Outcome B: Sau iterations, AI không reproduce được → bạn học được rằng task này không nên delegate. Đây cũng là kết quả giá trị — tránh sai lầm đắt đỏ later.
- Bring the question to AI first — ask AI help brainstorm solution trước khi implement. "Explain approach của bạn step-by-step, tôi muốn hiểu logic trước khi apply."
- Ask for explanations liên tục — "Why did you choose X formula?", "What assumption did you make here?"
- Start small — test với subset data bạn có thể verify (ví dụ, data của 1 tuần thay vì cả quý)
┌─────────────────────────────────────────┐ │ │ │ 1. Identify specific task │ │ (không generic) │ │ │ │ 2. Find past data với ground truth │ │ (có "đáp án") │ │ │ │ 3. AI attempts reproduce │ │ (initial prompt) │ │ │ │ 4. Compare vs. ground truth │ │ (honest check) │ │ │ │ 5. Refine description │ │ (note gaps cho future) │ │ │ │ 6. Test edge cases / harder │ │ (push limit) │ │ │ │ ──▶ Loop back to step 3 hoặc STOP │ │ (khi đã confident hoặc when │ │ concluded task NOT delegable) │ │ │ └─────────────────────────────────────────┘
Evals — Test hệ thống cho workflows của bạn
Eval (viết tắt evaluation) là cách test Claude có hệ thống trên task lặp. Không cần infrastructure phức tạp — approach đơn giản vẫn đủ hiệu quả.
Tại sao eval matter?
Công việc của bạn unique. Claude có thể:
Eval giúp bạn biết chính xác Claude làm tốt gì, chưa tốt gì với task cụ thể của bạn.
Lightweight eval approach — 4 bước
Bước 1: Gather examples
Thu 5-10 examples của task bạn làm regularly:
Đây là golden set — "đáp án" reference.
Bước 2: Create test prompts
Viết prompts mà nếu Claude chạy, Claude sẽ produce similar outputs. Include context bạn naturally có khi làm task (attached files, project info, past conversations).
Bước 3: Compare outputs
Run prompt → compare Claude output với golden example. Self-assess:
Tip: Rate mỗi output theo 3 metric (1-5 scale):
Bước 4: Refine approach
Dựa vào patterns quan sát:
Eval ví dụ cụ thể: weekly status report
Golden examples (Bước 1)
Bạn lưu 5 status update gần nhất bạn viết tự tay. Mỗi cái có structure: Done this week / In progress / Blockers / Next week.
Test prompt (Bước 2)
Compare (Bước 3)
Run trên data thật Q4 week 10. So với status update Q4 week 10 bạn đã viết.
Observations:
Refine (Bước 4)
Update prompt với: "Style reference: upload sample file status-update-examples.md (5 examples). Match style đó — concise, action-focused, không corporate adjectives."
Chạy lại → quality tăng đáng kể.
Lesson: Eval không phải once-off. Mỗi 1-2 tháng, re-eval với new examples để check Claude vẫn aligned với standards mới của bạn (standards thay đổi theo thời gian).
- Excel ở viết marketing copy nhưng cần guidance cho technical docs
- Tốt ở summary general nhưng miss nuance trong domain của bạn
- Right cho first draft nhưng không đủ cho ship thẳng
- Emails bạn đã viết
- Reports bạn đã produce
- Analyses bạn đã deliver
- Outputs đã shipped và nhận feedback
- Có capture key information không?
- Tone / style có phù hợp không?
- Thiếu gì? Cần improve chỗ nào?
- Accuracy (fact, numbers)
- Structure (organization, format)
- Voice (tone, style match)
- Đâu là consistent gap → adjust prompt template
- Có cần thêm examples trong prompt để Claude match style?
- Có task Claude không nên do → flag cho human review
- ✅ Accuracy tốt (tasks match)
- ⚠️ Structure OK nhưng Claude verbose hơn bạn
- ❌ Voice chưa match — Claude ship "delivered comprehensive analysis" trong khi bạn hay viết "shipped analysis"
Tôi là [role]. Viết weekly status update cho team.
Source:
- Completed tasks trong Asana (check file asana-week-X.csv)
- Slack DMs key decisions
- Calendar tuần qua
Format: 4 sections — Done / In Progress / Blockers / Next week.
Tông: direct, factual, không corporate fluff.
Length: 300-400 words.Ví dụ theo ngành — Eval template
📊 Data Analyst
Task: Weekly anomaly detection trên sales data
Golden set: 5 past weekly reports với anomalies đã confirmed
Eval prompt:
Rate: Recall (caught all real anomalies?) + Precision (false positive rate?)
📣 Content Marketer
Task: Convert blog post thành LinkedIn article
Golden set: 5 pairs (blog → LinkedIn) đã published
Eval prompt:
Rate: Hook quality, insight clarity, CTA effectiveness (compare to past performance)
💰 Finance Analyst
Task: Monthly expense reconciliation
Golden set: 3 past reconciliations (manual) có flagged discrepancies ground truth
Eval prompt:
Rate: Match rate accuracy vs. manual, false flag rate
🎓 Teacher
Task: Generate lesson plan từ topic
Golden set: 5 lesson plans bạn hài lòng
Eval prompt:
Rate: Pedagogical soundness, age-appropriate language, exercise quality
Anti-patterns khi iterate và eval
❌ Fix symptom thay vì root cause
Biểu hiện: Response generic → add "hãy cụ thể hơn". Vẫn generic → add "thật cụ thể nhé". Loop vô tận.
Tại sao sai: "Hãy cụ thể hơn" không actionable. Claude không biết cụ thể về gì.
Cách đúng: Diagnose — missing context gì? Add chính xác missing piece: "Tôi target audience SMB, không enterprise", "Industry của tôi là healthcare, không generic tech".
❌ Over-iterate trên một response
Biểu hiện: 20 follow-ups để polish 1 email.
Tại sao sai: Diminishing return. Sau 5 iterations, bạn fine-tune 5% mỗi lần. Faster just rewrite bằng tay 10%.
Cách đúng: 3-5 iterations max. Nếu vẫn không ưng → đây là signal prompt gốc sai → restart với prompt mới đã revise.
❌ Eval 1 lần rồi forget
Biểu hiện: Test Claude week 1, OK, dùng mãi 6 tháng không retest.
Tại sao sai: Standards của bạn + company có thể thay đổi. Claude models có update. Workflows drift.
Cách đúng: Schedule quarterly re-eval cho workflows quan trọng. Note: Claude update notes thường trên changelog.
❌ Confuse subjective feedback với accuracy issue
Biểu hiện: "Response Claude không đúng" = "tôi không thích style này".
Tại sao sai: Hai thứ khác nhau. Accuracy là fact đúng/sai. Style là preference.
Cách đúng: Khi không hài lòng, hỏi: "Accuracy hay style?" Nếu accuracy → verify + flag cụ thể. Nếu style → update prompt với example.
❌ Skip diligence vì "Claude trust được"
Biểu hiện: Sau vài tuần, bạn quen → bắt đầu copy-paste thẳng output.
Tại sao sai: Trust chưa bao giờ là 100%. Một hallucination nghiêm trọng trong high-stakes content có thể wipe out weeks of time saved.
Cách đúng: Maintain default skepticism cho high-stakes output. Diligence ratio tỷ lệ với stakes: internal memo = 20% review time, client deliverable = 100% review.
Áp dụng ngay
Bài tập 1: Troubleshoot một "stuck conversation" (15 phút)
Mở chat cũ nhất bạn từng có response không ưng. Diagnose:
Sửa prompt, submit lại. Ghi lại: lần này output improve bao nhiêu %?
Bài tập 2: Setup delegation-diligence loop cho 1 task (20 phút)
Pick 1 task lặp của bạn (từ danh sách Bài 01).
Bước 1: Find 1 instance bạn đã làm manual, có ground truth.
Bước 2: Write prompt để Claude reproduce.
Bước 3: Chạy → compare với ground truth. Note gaps:
Bước 4: Refine prompt based on gaps.
Bước 5: Chạy lần 2 → compare lại.
Bước 6: Kết luận — delegate? Delegate with adjustments? Not delegate?
- Cái gì Claude làm đúng?
- Cái gì miss / sai?
- Pattern nào bạn phải explicit hơn?
| Symptom | Root cause có thể | Fix tôi sẽ thử |
|---|---|---|
| Response quá generic | Không đủ context specific | |
| Wrong tone | Không specify tone / thiếu example | |
| Wrong length | Không cụ thể "X từ" / "Y bullets" | |
| Wrong format | Cần example format hoặc structure explicit | |
| Sai fact | Hallucination — cần verify / web search |
Tóm tắt bài học
🎯 5 common challenges có pattern fix rõ — generic response, length off, wrong format, hallucination, tone mismatch. Troubleshoot theo root cause, đừng fix symptom.
🎯 4D Framework là mental model — Delegation (giao gì) + Description (giao thế nào) + Discernment (đánh giá output) + Diligence (trách nhiệm). Cả 4 phải có, không chỉ Description.
🎯 Iteration mindset thay cho one-shot mindset — prompt đầu = draft từ junior colleague, feedback specific, know when to restart.
🎯 Delegation-Diligence Loop — build confidence có căn cứ — test Claude với past data có ground truth. Validate before trust.
🎯 Lightweight evals > no evals — 5-10 examples đủ để phát hiện systemic gaps. Schedule quarterly re-eval cho workflows quan trọng.
🎯 Diligence không delegate được — dù AI làm 95%, bạn own 100% responsibility cho output được ship. Transparency + accountability luôn là của người.
- AI Fluency course (free, 11 bài) — deep dive 4D Framework
- AI Fluency for Nonprofits — Rio's case study ở lesson 12
- Anthropic research on evaluations — nếu muốn đào sâu eval methodology