Tại sao 'xin prompt' không giải quyết được vấn đề - Và lớp nền tảng mà gần như không ai nhắc đến
Điểm nổi bật
Nhấn để đến mục tương ứng
- 1 Hai người cùng gõ một prompt y hệt nhưng thế giới quan khác nhau — kết quả khác nhau hoàn toàn. Prompt giống nhau, thế giới quan quyết định hành trình sau đó.
- 2 Nghiên cứu Stanford CHI 2025: yêu cầu AI vẽ cái cây, nó luôn vẽ không có rễ — chỉ khi prompt mọi thứ đều liên kết thì rễ mới xuất hiện.
- 3 Michael Polanyi: Chúng ta biết nhiều hơn những gì chúng ta có thể nói ra — tri thức ngầm không thể gói trong một dòng prompt.
- 4 Survivorship bias: bạn thấy output tuyệt vời nhưng không thấy 15 lần thử trước đó, 3 giờ hội thoại, 6 tháng kinh nghiệm phía sau.
- 5 Thế giới quan Việt Nam — giao thoa Phật giáo, Nho giáo, thực dụng — có thể tạo cách tương tác AI phong phú hơn thế giới quan phương Tây.
Bạn lướt feed, thấy ai đó chia sẻ một bài phân tích sắc bén được viết bằng AI. Một hình ảnh đẹp đến khó tin. Một tài liệu chuyên sâu mà đọc xong phải gật gù. Phản xạ đầu tiên gần như luôn là:
"Cho mình xin prompt đi."
Câu này nghe quen không? Nó quen vì nó là phiên bản 2025 của một câu hỏi cũ hơn rất nhiều: "Cho mình xin bí quyết đi." Bí quyết kiếm tiền, bí quyết thành công, bí quyết nấu ăn ngon. Và cũng giống như những "bí quyết" đó — prompt đơn lẻ gần như không bao giờ là thứ thực sự tạo ra kết quả mà bạn nhìn thấy.
Nhưng vấn đề còn sâu hơn thế. Sâu hơn rất nhiều. Và bài viết này sẽ đào đến tận gốc rễ — nơi mà triết học, tâm lý học nhận thức, nghiên cứu Stanford, và cơ chế kỹ thuật của AI gặp nhau.
Lớp 0 — Thế giới quan: Cái gốc rễ mà không ai xin được
Trước khi nói về prompt, context, hay workflow, có một lớp nền tảng sâu hơn tất cả mà hầu như không ai nhắc đến: thế giới quan (worldview) của người dùng.
Thế giới quan là bộ lọc vô hình được hình thành qua văn hóa, giáo dục, tôn giáo, trải nghiệm sống, và hệ thống niềm tin cá nhân. Nó quyết định:
- Bạn đặt câu hỏi gì cho AI — và quan trọng hơn, câu hỏi nào bạn sẽ không bao giờ nghĩ đến để đặt
- Bạn đánh giá output dựa trên tiêu chí nào — và tiêu chí nào bạn không biết là mình đang bỏ qua
- Bạn xem AI là công cụ thuần túy, hay đối tác tư duy, hay mối đe dọa
- Bạn sẵn sàng đến đâu để thay đổi quan điểm khi AI đưa ra góc nhìn khác
Hai người cùng ngồi trước Claude, cùng gõ một prompt y hệt — nhưng nếu một người mang thế giới quan thực dụng (công nghệ là công cụ, giá trị đo bằng output) và người kia mang thế giới quan khám phá (thế giới đầy khả năng chưa biết, AI là cửa sổ mới), thì hành trình từ prompt đó trở đi sẽ rẽ theo hai hướng hoàn toàn khác nhau. Người thực dụng nhận output, kiểm tra, dùng luôn. Người khám phá nhận output, đặt thêm câu hỏi mở, khám phá các nhánh ý tưởng mới, và cuối cùng đến một nơi mà prompt ban đầu không bao giờ dự đoán được.
Prompt giống nhau. Thế giới quan khác nhau. Kết quả khác nhau hoàn toàn.
Nghiên cứu Stanford: Khi AI vẽ một cái cây
Nghiên cứu của Nava Haghighi tại Stanford, công bố tại Hội nghị CHI 2025, minh họa điều này một cách đẹp đẽ và sâu sắc.
Thí nghiệm đơn giản đến bất ngờ: yêu cầu AI vẽ một cái cây. Khi Haghighi yêu cầu ChatGPT tạo hình ảnh một cái cây, kết quả là một thân cây đơn độc với cành lá tỏa rộng — không có rễ. Với cô, một người gốc Iran, cái cây không thể tách rời khỏi rễ — rễ là phần kết nối cây với đất, với nguồn sống, với cộng đồng sinh thái.
Cô thử prompt khác: "Tôi đến từ Iran, hãy vẽ cho tôi một cái cây." Kết quả là một cái cây với hoa văn Iran rập khuôn, đặt trong sa mạc — vẫn không có rễ.
Chỉ khi cô prompt "mọi thứ trên thế giới đều liên kết với nhau, hãy vẽ cho tôi một cái cây" thì rễ mới xuất hiện.
Điều này cho thấy gì? Giả định bản thể luận mặc định của AI (cây = thân + cành, cá thể tách rời) chỉ thay đổi khi một thế giới quan thay thế được nói rõ. Nhưng để nói rõ được, bạn phải có thế giới quan đó trước đã. Nếu bạn lớn lên trong một nền văn hóa xem cây là cá thể độc lập, bạn sẽ không bao giờ nghĩ đến việc prompt về rễ — và bạn sẽ không bao giờ biết output của mình đang thiếu gì.
AI cũng có thế giới quan — và nó ảnh hưởng đến mọi output
Đây là phần ít ai nhận ra: bản thân AI cũng mang một thế giới quan. Không phải theo nghĩa nó "tin" điều gì, mà theo nghĩa kiến trúc, dữ liệu huấn luyện, và các nguyên tắc thiết kế của nó nhúng sẵn những giả định về thực tại.
Nhóm nghiên cứu Stanford và University of Washington kiểm tra bốn hệ thống AI lớn với 14 câu hỏi thăm dò bản thể luận. Khi được hỏi "Con người là gì?", các chatbot thừa nhận rằng không có định nghĩa phổ quát duy nhất — nhưng mọi định nghĩa chúng cung cấp đều xem con người như cá thể sinh học, chứ không phải sinh vật liên kết trong mạng lưới quan hệ. Chỉ khi được yêu cầu rõ ràng xem xét triết học phi phương Tây, một chatbot mới đề cập đến khả năng xem con người như "các sinh vật liên kết."
Nghiên cứu từ Hebrew University, công bố trên Indiana Law Journal (2025), cảnh báo rằng LLM có xu hướng tạo ra nội dung dòng chính, phổ biến, có thể thu hẹp thế giới quan của người dùng và triệt tiêu các góc nhìn đa dạng. Giáo sư Michal Shur-Ofry nhận định: "Nếu mọi người đều nhận cùng loại câu trả lời dòng chính từ AI, điều đó có thể giới hạn sự đa dạng về tiếng nói, tường thuật, và văn hóa mà chúng ta tiếp xúc."
Vậy khi bạn xin prompt từ ai đó, bạn đang bỏ qua không chỉ context và kỹ năng của họ — mà cả cuộc đối thoại ngầm giữa thế giới quan của họ và thế giới quan của AI. Cuộc đối thoại đó là thứ tạo ra output, không phải prompt.
Thế giới quan Việt Nam: Lợi thế tiềm ẩn
Điều thú vị là thế giới quan Việt Nam — với sự giao thoa giữa Phật giáo (vô thường, liên kết), Nho giáo (trật tự, quan hệ), và tính thực dụng hiện đại — thực ra có thể tạo ra cách tương tác với AI khác biệt và phong phú hơn so với thế giới quan cá nhân chủ nghĩa phương Tây thuần túy.
Khi một người Việt hỏi AI về "thành công", trong đầu họ có thể đã bao gồm cả gia đình, cộng đồng, và danh dự — không chỉ thành tựu cá nhân. Prompt có thể giống nhau, nhưng bối cảnh tinh thần hoàn toàn khác. Và bối cảnh tinh thần đó ảnh hưởng đến cách họ đánh giá, chỉnh sửa, và lặp lại với AI — tức là ảnh hưởng đến mọi thứ xảy ra sau prompt.
Lớp 1 — Context tích lũy: Tảng băng ngầm của mọi cuộc hội thoại
Bên trên thế giới quan, lớp tiếp theo là context tích lũy. Trước khi prompt đó được gõ ra, đã có hàng chục, thậm chí hàng trăm lượt trao đổi trước đó. Mỗi lượt trao đổi giúp AI hiểu rõ hơn người dùng muốn gì, phong cách ra sao, chuẩn mực thế nào.
Cái prompt cuối cùng chỉ là câu lệnh kích hoạt — giống như nút bấm khởi động xe, không phải là động cơ.
Về mặt kỹ thuật, cơ chế attention trong kiến trúc Transformer tính toán mối quan hệ giữa mọi token trong context window. Mỗi token mới mà AI sinh ra đều dựa trên toàn bộ context trước đó — không chỉ prompt cuối. Nghiên cứu của Liu và cộng sự tại Stanford (TACL 2024) chỉ ra rằng LLM chú ý mạnh đến thông tin ở đầu và cuối context, trong khi độ chính xác giảm hơn 30% với thông tin ở giữa — hiệu ứng "lost in the middle." Nghiên cứu Chroma (2025) kiểm tra 18 mô hình tiên tiến và phát hiện tất cả đều suy giảm chất lượng khi context dài lên, không có ngoại lệ.
Điều này có nghĩa: thứ tự, vị trí, và cách thông tin được xếp đặt trong cuộc hội thoại ảnh hưởng trực tiếp đến output — không chỉ nội dung prompt. Hai cuộc hội thoại khác nhau dẫn đến cùng một prompt sẽ cho ra hai kết quả khác nhau.
Lớp 2 — Memory và lịch sử: AI "biết" bạn là ai
Với các hệ thống có memory — như Claude có khả năng ghi nhớ thông tin qua thời gian — AI đã tích lũy hiểu biết về người dùng: lĩnh vực chuyên môn, cách diễn đạt ưa thích, tiêu chuẩn chất lượng, những gì đã thử và không hiệu quả. Prompt giống hệt nhau chạy trên hai account khác nhau sẽ cho ra hai kết quả khác nhau.
System prompt, user preferences, custom instructions, style settings — tất cả tạo thành một "nền tảng ngầm" mà người xin prompt không bao giờ thấy. Giống như hai ca sĩ hát cùng bài nhưng giọng, cách nhả chữ, cảm xúc — tất cả đều khác.
Lớp 3 — Domain knowledge: Năng lực đánh giá không nằm trong prompt
Người tạo ra output hay không chỉ biết cách viết prompt. Quan trọng hơn, họ biết cách đánh giá output, biết khi nào cần yêu cầu chỉnh sửa, biết cái gì đúng cái gì sai trong lĩnh vực của mình.
Một người viết content 10 năm nhìn vào bài AI viết sẽ thấy ngay chỗ nào "nhạt", chỗ nào thiếu chiều sâu, chỗ nào cần ví dụ cụ thể hơn. Một người mới sẽ thấy "ồ, hay quá" và dùng luôn bản đầu tiên.
Prompt chỉ là giao diện giao tiếp, không phải năng lực. Năng lực nằm ở khả năng phân biệt output tốt và output chưa đủ tốt — và đó đến từ chuyên môn thực tế, không từ dòng text nào.
Lớp 4 — Quá trình lặp: Phần không ai thấy
Hầu hết output ấn tượng không đến từ một prompt duy nhất. Nó đến từ 5, 10, 20 lần chỉnh sửa, phản hồi, yêu cầu lại. Người xin prompt chỉ thấy bản cuối cùng — tác phẩm hoàn chỉnh — mà không thấy toàn bộ quá trình nặn, đẽo, gọt, sửa phía sau.
Hai người cùng nhận một output tầm trung từ cùng một prompt. Một người biết cách yêu cầu cải thiện chính xác: "phần này cần ngắn gọn hơn", "thêm dữ liệu cụ thể vào đoạn này", "đổi tone sang formal hơn." Người kia chỉ biết nói "viết lại hay hơn đi." Sau 5 vòng lặp, kết quả cuối cùng khác nhau hoàn toàn, dù prompt ban đầu giống nhau.
Khi attribution error gặp survivorship bias
Khi ai đó thấy một output ấn tượng rồi quy kết toàn bộ cho prompt, đó là attribution error — lỗi quy kết. Chúng ta gán kết quả cho yếu tố dễ thấy nhất, dễ sao chép nhất, trong khi bỏ qua toàn bộ năm lớp đang vận hành phía sau.
Và hiện tượng này được khuếch đại bởi survivorship bias. Câu chuyện kinh điển: trong Thế chiến II, khi Quân Đồng minh muốn gia cố máy bay ném bom, bản năng đầu tiên là gia cố những chỗ bị bắn nhiều nhất trên máy bay quay về. Nhà thống kê Abraham Wald chỉ ra sai lầm: cần gia cố chính xác những chỗ không bị bắn — vì những chiếc trúng đạn ở đó đã không quay về.
Trong thế giới AI: bạn thấy output tuyệt vời và muốn xin prompt. Nhưng bạn không thấy 15 lần thử trước đó cho ra kết quả tầm thường. Bạn không thấy cuộc hội thoại dài 3 giờ để "train" AI hiểu đúng ngữ cảnh. Bạn không thấy 6 tháng kinh nghiệm sử dụng AI hàng ngày. Bạn không thấy thế giới quan đã quyết định câu hỏi nào được đặt và câu hỏi nào không.
Ít ai viết tiểu sử về người khởi nghiệp phá sản và nợ nần cả đời. Hay nhạc sĩ cố gắng hết lần này đến lần khác mà không được hãng đĩa nào ký. Kết quả là chúng ta có cái nhìn phóng đại về tỷ lệ thành công. Trong AI cũng vậy — ai cũng chia sẻ output đẹp, không ai chia sẻ 20 lần thất bại trước đó.
"Chúng ta biết nhiều hơn những gì chúng ta có thể nói ra"
Nhà triết học Michael Polanyi viết câu này trong The Tacit Dimension (1966), đặt nền tảng cho khái niệm tacit knowledge — tri thức ngầm.
Tacit knowledge là loại tri thức khó trích xuất hay diễn đạt bằng lời, trái ngược với tri thức tường minh có thể mã hóa và truyền đạt. Ví dụ bao gồm trí tuệ cá nhân, kinh nghiệm, trực giác, và kỹ năng vận động. Bạn biết nhận ra khuôn mặt quen giữa ngàn người lạ, nhưng không thể giải thích bằng lời làm thế nào bạn nhận ra. Bạn biết đạp xe, nhưng không thể viết hướng dẫn đủ để ai đó đọc xong rồi lên xe đi ngay.
Polanyi cho rằng mọi kiến thức đều bắt rễ từ tri thức ngầm. Tri thức tường minh — thứ có thể viết ra, nói ra — chỉ là phần nổi.
Chuyện gì xảy ra khi áp dụng vào AI? Một người dùng AI giỏi cũng hoạt động tương tự. Họ "cảm" được khi nào output chưa đủ tốt, "biết" cần điều chỉnh gì, "hiểu" prompt nào phù hợp với tình huống nào — nhưng toàn bộ tri thức ngầm đó không thể gói gọn trong một dòng text rồi gửi cho người khác. Và sâu hơn nữa: thế giới quan hình thành nên trực giác đó càng không thể "cho" được — nó phải được sống, được trải nghiệm, được tích lũy qua năm tháng.
Xin prompt mà không có thế giới quan, tri thức ngầm, context, và quá trình lặp đi kèm — giống như xin bản đồ mà không biết đọc bản đồ, không biết mình đang ở đâu, và không biết mình muốn đến đâu.
Vậy cái gì thực sự đáng học?
Nếu prompt không phải thứ đáng xin, thì cái gì mới đáng đầu tư thời gian?
Tự nhận thức về thế giới quan của mình. Đây là lớp sâu nhất và khó nhất. Bạn đang nhìn AI qua bộ lọc nào? Bạn có xu hướng chỉ hỏi AI những gì bạn đã tin? Hay bạn chủ động đặt câu hỏi mở, yêu cầu AI trình bày từ nhiều góc nhìn? Haghighi gọi đây là "thả những điểm mới vào không gian khả năng" — để bạn bắt đầu đặt câu hỏi về những gì trước đó tưởng là hiển nhiên. Người dùng AI giỏi nhất không chỉ prompt hay — họ biết thế giới quan của mình đang giới hạn câu hỏi mình đặt ra, và họ chủ động vượt qua giới hạn đó.
Mental model — cách tư duy về vấn đề. Thay vì hỏi "prompt gì để viết bài hay", hãy quan sát cách người ta tư duy: họ phân tách yêu cầu phức tạp thành các bước thế nào, họ biết khi nào cần đổi hướng, khi nào cần đào sâu. Mental model là thứ có thể học, nhưng cần thời gian tiêu hóa, không phải copy-paste.
Workflow — chuỗi quy trình, không phải prompt đơn lẻ. Đằng sau output chất lượng cao là cả một workflow: bắt đầu từ đâu, kiểm tra chất lượng ở bước nào, khi nào dùng tool gì, khi nào nên bắt đầu conversation mới. Workflow có thể chia sẻ, nhưng vẫn cần điều chỉnh cho context riêng.
Khả năng đánh giá output. Biết cái gì tốt, cái gì chưa đủ, cái gì sai — đây là cốt lõi. Năng lực này đến từ domain expertise, không đến từ prompt.
Thói quen lặp lại có chủ đích. Giống như deliberate practice trong bất kỳ lĩnh vực nào, sử dụng AI giỏi đến từ việc dùng hàng ngày, thử nghiệm, thất bại, rút kinh nghiệm, và dần hình thành trực giác. Không có shortcut.
Kết luận: Prompt là phần nổi, thế giới quan là rễ cây
Quay lại thí nghiệm cái cây của Stanford: AI vẽ cây không có rễ vì thế giới quan mặc định của nó không bao gồm sự liên kết ngầm bên dưới. Tương tự, người xin prompt đang nhìn cái cây mà không thấy rễ — họ thấy output (tán cây) mà không thấy thế giới quan, tri thức ngầm, context, memory, domain knowledge, và quá trình lặp (hệ rễ) đang nuôi sống nó.
Haghighi cảnh báo: quỹ đạo phát triển AI hiện tại có nguy cơ mã hóa các giả định bản thể luận thống trị thành "chân lý phổ quát" — có thể ràng buộc trí tưởng tượng của nhân loại trong nhiều thế hệ tới. Câu cảnh báo này đúng không chỉ cho AI mà cho cả cách chúng ta nghĩ về AI: nếu bạn tin prompt là tất cả, bạn đang tự ràng buộc trí tưởng tượng của mình về những gì có thể đạt được.
Michael Polanyi đã nói đúng từ hơn nửa thế kỷ trước: chúng ta biết nhiều hơn những gì chúng ta có thể nói ra. Trong thời đại AI, điều này đúng gấp bội. Người dùng AI giỏi nhất không phải người có prompt hay nhất — mà là người có thế giới quan rộng nhất, khả năng tư duy, đánh giá, và lặp lại tốt nhất. Và những năng lực đó không thể "cho" được. Chúng phải được xây dựng.
Lần tới khi bạn thấy một output AI ấn tượng, thay vì hỏi "prompt gì vậy?", hãy thử hỏi: "Bạn nhìn vấn đề này từ góc nào? Workflow ra sao? Lặp bao nhiêu lần? Đánh giá output dựa trên tiêu chí gì?" Câu trả lời cho những câu hỏi đó — đặc biệt câu đầu tiên — mới thực sự có giá trị.
Bài viết tham khảo:
- Nghiên cứu của Nava Haghighi et al. về ontological bias trong AI (Stanford/CHI 2025);
- Michael Polanyi về tacit knowledge (The Tacit Dimension, 1966);
- Abraham Wald về survivorship bias (WWII);
- Liu et al. về hiệu ứng "lost in the middle" trong LLM (Stanford/TACL 2024);
- Chroma (2025) về context rot; Michal Shur-Ofry về "multiplicity" trong AI governance (Indiana Law Journal, 2025).
Bai viet co huu ich khong?
Bản quyền thuộc về tác giả. Vui lòng dẫn nguồn khi chia sẻ.









