Cơ bảnTài nguyên

Từ điển A-Z thuật ngữ Claude & AI

Minh TuấnCTO, Transform GroupTheo dõi

26/03/2026 0 15 0 15 phút đọc

Nghe bài viết

00:00

Giới thiệu

Thế giới AI đang phát triển với tốc độ chóng mặt, kéo theo hàng loạt thuật ngữ kỹ thuật mới xuất hiện mỗi tuần. Từ điển này tổng hợp hơn 50 thuật ngữ quan trọng nhất mà bất kỳ ai làm việc với Claude và AI cần biết — được giải thích bằng tiếng Việt đơn giản, kèm ví dụ thực tế.

Từ điển được tổ chức theo thứ tự chữ cái (A-Z), bao gồm cả thuật ngữ tiếng Anh và tiếng Việt. Mỗi mục gồm: tên thuật ngữ, định nghĩa ngắn gọn, và giải thích ngữ cảnh sử dụng.

A

API (Application Programming Interface)

Giao diện lập trình cho phép các phần mềm giao tiếp với nhau. Claude API cho phép developer tích hợp khả năng của Claude vào ứng dụng của họ, thay vì chỉ dùng qua giao diện chat.

Ví dụ: Một ứng dụng customer support tích hợp Claude API để tự động trả lời email khách hàng.

Artifacts

Tính năng của Claude.ai cho phép Claude tạo ra các nội dung độc lập như code, document, HTML page, SVG, hay Mermaid diagram trong một cửa sổ riêng — thay vì nằm trong luồng chat. Artifacts có thể được chỉnh sửa trực tiếp và preview ngay lập tức.

Attention Mechanism (Cơ chế Chú ý)

Kỹ thuật cốt lõi trong kiến trúc Transformer cho phép model AI "chú ý" đến các phần khác nhau của input khi tạo output. Đây là lý do Claude có thể hiểu mối quan hệ giữa các từ và câu cách nhau nhiều đoạn trong văn bản dài.

B

Batch Processing (Xử lý Hàng loạt)

Khả năng gửi nhiều request đến Claude API cùng lúc, thay vì từng cái một. Anthropic cung cấp Batch API cho phép xử lý hàng nghìn prompt trong một lần gọi với chi phí thấp hơn, phù hợp cho các tác vụ như phân loại dữ liệu, tóm tắt hàng loạt văn bản.

Benchmark (Bài kiểm tra tiêu chuẩn)

Tập hợp các bài test chuẩn hóa để đánh giá và so sánh hiệu năng của các AI model. Các benchmark phổ biến gồm: MMLU (kiến thức đa lĩnh vực), HumanEval (lập trình), MATH (toán học), GSM8K (toán lớp 8).

C

Claude Code

Công cụ AI coding agent của Anthropic chạy trong terminal, cho phép developer sử dụng Claude trực tiếp trong môi trường lập trình. Claude Code có thể đọc, viết, chạy file, tương tác với git, và thực hiện các tác vụ phát triển phần mềm phức tạp.

CLAUDE.md

File cấu hình đặc biệt mà Claude Code đọc để hiểu ngữ cảnh dự án, quy tắc làm việc, và hướng dẫn cụ thể cho từng codebase. Tương tự như README nhưng dành riêng cho AI assistant.

Constitutional AI (AI Hiến pháp)

Phương pháp huấn luyện AI của Anthropic trong đó model được dạy để tự đánh giá và cải thiện response dựa trên một tập hợp các nguyên tắc (constitution). Đây là nền tảng giúp Claude an toàn và hữu ích hơn.

Context Window (Cửa sổ Ngữ cảnh)

Lượng text tối đa mà một LLM có thể "nhìn thấy" và xử lý trong một lần. Claude Sonnet 4 và Claude Opus 4 có context window 200,000 token — tương đương khoảng 150,000 từ tiếng Anh, hay một cuốn sách dày. Thông tin nằm ngoài context window sẽ bị "quên".

Chain of Thought (Chuỗi Suy nghĩ)

Kỹ thuật prompt yêu cầu model AI suy nghĩ từng bước trước khi đưa ra câu trả lời cuối cùng. Giúp tăng đáng kể độ chính xác với các bài toán đòi hỏi lý luận nhiều bước.

D

Distillation (Chắt lọc Kiến thức)

Kỹ thuật tạo ra model nhỏ hơn bằng cách "học" từ output của model lớn hơn. Model nhỏ (student) được huấn luyện để bắt chước hành vi của model lớn (teacher), giúp giảm chi phí mà vẫn giữ được phần lớn hiệu năng.

Dropout

Kỹ thuật regularization trong training neural network: tắt ngẫu nhiên một số neuron trong quá trình huấn luyện để tránh overfitting và tăng khả năng tổng quát hóa của model.

E

Embedding (Nhúng vector)

Biểu diễn text (từ, câu, đoạn) dưới dạng vector số trong không gian nhiều chiều. Text có nghĩa tương đồng sẽ có vector gần nhau. Embedding là nền tảng cho tìm kiếm ngữ nghĩa, RAG, và nhiều ứng dụng AI khác.

Ví dụ: "Chó" và "Mèo" sẽ có embedding gần nhau vì đều là thú cưng.

Extended Thinking (Tư duy Mở rộng)

Tính năng của Claude Opus 4 và Claude Sonnet 4 cho phép model "suy nghĩ" sâu hơn trước khi trả lời, dành thêm tài nguyên tính toán để giải quyết các vấn đề phức tạp. Quá trình suy nghĩ này có thể hiển thị cho người dùng xem. Claude Haiku 3.5 không hỗ trợ tính năng này.

F

Few-shot Learning (Học từ Ví dụ)

Kỹ năng của LLM học cách thực hiện một tác vụ chỉ từ một vài ví dụ được cung cấp trong prompt, không cần fine-tuning. Trái với zero-shot (không có ví dụ) và one-shot (một ví dụ).

Fine-tuning (Tinh chỉnh)

Quá trình huấn luyện thêm một model AI đã có trên dữ liệu chuyên biệt để cải thiện hiệu năng trong một lĩnh vực cụ thể. Anthropic cung cấp fine-tuning API cho một số model Claude. Khác với prompting — fine-tuning thay đổi trọng số của model.

Function Calling / Tool Use

Xem Tool Use bên dưới.

G

Guardrails (Rào cản An toàn)

Các biện pháp kỹ thuật và chính sách được áp dụng để ngăn AI tạo ra nội dung có hại, không phù hợp, hoặc vi phạm đạo đức. Claude có nhiều lớp guardrails được xây dựng từ quá trình Constitutional AI và RLHF.

Grounding (Neo chặt vào thực tế)

Kỹ thuật cung cấp thông tin thực tế bên ngoài (documents, database, web search) cho model để câu trả lời dựa trên dữ liệu thật thay vì chỉ dựa vào kiến thức được huấn luyện. Liên quan chặt chẽ với RAG.

H

Hallucination (Ảo giác AI)

Hiện tượng AI tạo ra thông tin không có thật nhưng nghe có vẻ tự tin và hợp lý. Claude được thiết kế để giảm thiểu hallucination và thừa nhận khi không chắc chắn, thay vì bịa đặt.

Ví dụ: AI bịa ra tên tác giả sách, ngày tháng lịch sử, hoặc citation không tồn tại.

Haiku

Tên model Claude nhẹ nhất và nhanh nhất trong dòng sản phẩm hiện tại. Claude Haiku 3.5 được tối ưu cho tốc độ và chi phí thấp, phù hợp cho các tác vụ đơn giản, volume cao, hoặc ứng dụng cần latency thấp.

HumanFeedback / RLHF

Xem RLHF bên dưới.

I

Inference (Suy luận / Chạy model)

Quá trình sử dụng một model đã được huấn luyện để tạo ra output từ input mới. Mỗi lần bạn hỏi Claude một câu hỏi, Claude đang thực hiện inference. Khác với training — inference không thay đổi trọng số model.

In-context Learning (Học trong Ngữ cảnh)

Khả năng của LLM thích nghi với tác vụ mới chỉ dựa trên thông tin trong prompt, không cần cập nhật trọng số. Đây là một trong những điểm mạnh nổi bật của các model lớn như Claude.

J

JSON Mode

Chế độ đầu ra buộc Claude trả về dữ liệu theo định dạng JSON hợp lệ. Rất hữu ích khi tích hợp Claude vào ứng dụng cần parse dữ liệu có cấu trúc. Có thể kết hợp với việc định nghĩa JSON schema.

K

Knowledge Cutoff (Ngày cắt kiến thức)

Thời điểm cuối cùng mà dữ liệu huấn luyện của model được thu thập. Sau ngày này, model không biết về các sự kiện mới. Ví dụ: Claude Opus 4 và Claude Sonnet 4 có knowledge cutoff vào đầu năm 2025.

KV Cache (Key-Value Cache)

Kỹ thuật tối ưu giúp tái sử dụng kết quả tính toán từ phần đầu của prompt (thường là system prompt) cho nhiều request khác nhau, giảm latency và chi phí. Anthropic cung cấp prompt caching trong API.

L

Latency (Độ trễ)

Thời gian từ khi gửi request đến khi nhận được response đầu tiên. Trong AI chat, thường đo bằng TTFT (Time To First Token). Claude Haiku 3.5 có latency thấp nhất trong dòng Claude hiện tại.

LLM (Large Language Model — Mô hình Ngôn ngữ Lớn)

Loại model AI được huấn luyện trên lượng lớn text để hiểu và tạo ra ngôn ngữ tự nhiên. Claude, GPT-4, Gemini, Llama đều là LLM. Kích thước được đo bằng số tham số (parameters), từ hàng tỷ đến hàng nghìn tỷ.

M

MCP (Model Context Protocol)

Giao thức mã nguồn mở do Anthropic phát triển, cho phép AI model kết nối với các công cụ và nguồn dữ liệu bên ngoài theo cách chuẩn hóa. MCP định nghĩa cách Claude "nói chuyện" với database, API, file system, hay bất kỳ service nào.

Memory (Bộ nhớ)

Trong Claude.ai, Memory là tính năng cho phép Claude ghi nhớ thông tin về người dùng qua nhiều cuộc trò chuyện khác nhau — như sở thích, công việc, phong cách giao tiếp. Khác với context window, Memory tồn tại lâu dài.

Multimodal (Đa phương thức)

Khả năng của AI xử lý nhiều loại dữ liệu khác nhau: text, hình ảnh, âm thanh, video, code. Claude Opus 4, Claude Sonnet 4 và Claude Haiku 3.5 là multimodal model — có thể đọc và phân tích cả text lẫn hình ảnh.

O

Opus

Tên model Claude mạnh nhất và thông minh nhất trong dòng sản phẩm. Claude Opus 4 được thiết kế cho các tác vụ đòi hỏi suy luận sâu, độ chính xác cao, và hỗ trợ Extended Thinking.

Overfitting (Học vẹt)

Hiện tượng model "học thuộc lòng" dữ liệu huấn luyện nhưng không tổng quát hóa tốt trên dữ liệu mới. Trái nghĩa: underfitting (model chưa học đủ). Regularization và dropout là các kỹ thuật giảm overfitting.

P

Parameters (Tham số)

Các giá trị số học trong neural network được điều chỉnh trong quá trình training. Số parameters thường được dùng để đo "kích thước" của model: GPT-3 có 175 tỷ parameters, các model lớn hơn có đến hàng nghìn tỷ.

Prompt

Đầu vào văn bản mà bạn gửi cho AI model để nhận câu trả lời. Trong hệ thống API của Claude, có hai loại prompt chính: system prompt (cấu hình tổng thể) và human message (câu hỏi từng lần).

Projects (Dự án)

Tính năng trong Claude.ai cho phép tổ chức nhiều cuộc trò chuyện liên quan vào một không gian làm việc chung, chia sẻ system prompt, file, và context chung. Ideal cho các dự án dài hơi hay workflow lặp lại.

Prompt Injection (Tấn công Chèn Prompt)

Loại tấn công bảo mật trong đó kẻ tấn công chèn các lệnh độc hại vào dữ liệu mà AI đọc, nhằm thao túng hành vi của AI. Ví dụ: nhúng "Ignore previous instructions" vào nội dung website mà AI agent đọc.

R

RAG (Retrieval Augmented Generation)

Kỹ thuật kết hợp tìm kiếm thông tin (retrieval) với khả năng tạo văn bản của LLM (generation). Thay vì chỉ dựa vào kiến thức được huấn luyện, model truy vấn một knowledge base bên ngoài để lấy thông tin liên quan trước khi trả lời — giúp tăng độ chính xác và tính cập nhật.

RLHF (Reinforcement Learning from Human Feedback)

Phương pháp huấn luyện AI sử dụng phản hồi từ người đánh giá để cải thiện chất lượng output. Người đánh giá so sánh các câu trả lời và chọn cái tốt hơn, dữ liệu này được dùng để train một reward model, sau đó dùng reinforcement learning để tối ưu LLM. Claude sử dụng biến thể gọi là RLAIF.

S

Sonnet

Dòng model Claude cân bằng giữa hiệu năng và chi phí. Claude Sonnet 4 là lựa chọn mặc định cho hầu hết use cases — đủ thông minh cho tác vụ phức tạp, đủ nhanh và đủ rẻ cho production.

Streaming (Phát trực tiếp)

Kỹ thuật gửi token về cho người dùng ngay khi được tạo ra, thay vì chờ toàn bộ response hoàn thành. Giúp trải nghiệm chat cảm giác nhanh hơn và phản hồi tốt hơn. Tất cả interface chat của Claude đều dùng streaming.

System Prompt

Phần đầu của conversation được sử dụng để thiết lập bối cảnh, nhân cách, và quy tắc ứng xử cho AI trong suốt cuộc trò chuyện. System prompt không hiển thị cho người dùng cuối nhưng ảnh hưởng đến mọi câu trả lời của Claude.

Styles (Phong cách)

Tính năng trong Claude.ai cho phép tùy chỉnh phong cách phản hồi của Claude — từ giọng điệu, cấu trúc, đến mức độ chi tiết. Người dùng có thể tạo custom styles phù hợp với nhu cầu cụ thể.

T

Temperature (Nhiệt độ)

Tham số kiểm soát mức độ "sáng tạo" hay "ngẫu nhiên" trong output của AI. Temperature = 0 cho kết quả deterministic nhất (luôn chọn token có xác suất cao nhất). Temperature cao hơn (0.5-1.0) cho output đa dạng hơn. Claude thường dùng temperature ~ 1 cho creative tasks.

Token

Đơn vị cơ bản mà LLM xử lý văn bản. Một token thường tương đương 3/4 từ tiếng Anh, hoặc 1-2 ký tự tiếng Việt/Trung/Nhật. Ví dụ: "Hello world" = 2 tokens. Chi phí API Claude được tính theo số tokens input và output.

Tool Use (Sử dụng Công cụ)

Khả năng của Claude gọi các hàm/API bên ngoài để lấy thông tin hoặc thực hiện hành động. Ví dụ: Claude có thể được cấp "tool" để tra cứu thời tiết, tìm kiếm web, truy vấn database, hay gửi email. Còn gọi là Function Calling.

Transformer

Kiến trúc neural network được Google giới thiệu năm 2017 ("Attention is All You Need"), nền tảng của hầu hết các LLM hiện đại bao gồm Claude, GPT, Gemini. Transformer sử dụng attention mechanism để xử lý input song song thay vì tuần tự.

U

Ultrathink

Chế độ Extended Thinking của Claude với budget token suy nghĩ rất cao (lên đến 100,000 thinking tokens với Claude Opus 4 và Claude Sonnet 4). Dùng cho các bài toán cực kỳ khó đòi hỏi suy luận sâu nhiều bước: toán học phức tạp, lập trình khó, phân tích chiến lược.

Underfitting

Model chưa học đủ từ dữ liệu huấn luyện, dẫn đến hiệu năng kém cả trên training data lẫn test data. Thường do model quá đơn giản, training quá ít, hoặc learning rate không phù hợp.

V

Vision (Thị giác AI)

Khả năng của Claude phân tích và hiểu nội dung hình ảnh. Claude có thể đọc text trong ảnh (OCR), mô tả hình ảnh, phân tích biểu đồ, nhận dạng đối tượng, và hiểu meme hay infographic.

Vector Database

Cơ sở dữ liệu được tối ưu để lưu trữ và tìm kiếm embedding vectors. Cần thiết cho RAG — lưu embeddings của documents để tìm nhanh những đoạn liên quan nhất đến query của người dùng. Ví dụ: Pinecone, Weaviate, Chroma, pgvector.

W

Weight (Trọng số)

Các tham số số học trong neural network được tối ưu trong quá trình training. "Weights của model" = toàn bộ kiến thức và khả năng của model được mã hóa dưới dạng số. Fine-tuning thay đổi weights, còn prompting thì không.

Workflow Automation (Tự động hóa Quy trình)

Sử dụng AI agent (như Claude với Tool Use) để thực hiện chuỗi tác vụ tự động mà không cần can thiệp thủ công. Ví dụ: Claude tự động đọc email → phân loại → soạn thảo reply → gửi đi.

X

XML Tags trong Prompt

Cách sử dụng thẻ XML-style (<context>, <task>, <example>) để cấu trúc hóa prompt phức tạp. Claude được huấn luyện để nhận diện và xử lý XML tags, giúp phân tách rõ ràng các phần khác nhau của prompt.

Z

Zero-shot Learning (Học không cần Ví dụ)

Khả năng của LLM thực hiện tác vụ chưa từng thấy ví dụ cụ thể trong prompt. Chỉ cần mô tả tác vụ bằng ngôn ngữ tự nhiên, model có thể thực hiện dựa trên kiến thức chung đã được huấn luyện.

Ví dụ: "Dịch câu sau sang tiếng Nhật" — Claude làm được ngay không cần ví dụ mẫu.

Z-score

Trong ngữ cảnh AI/ML, Z-score normalization là kỹ thuật chuẩn hóa dữ liệu để các features có phân phối chuẩn (mean=0, std=1), giúp training model ổn định hơn.

Thuật ngữ bổ sung quan trọng

Thuật ngữ tiếng Anh	Giải thích nhanh
Agentic AI	AI có khả năng tự chủ thực hiện chuỗi hành động để đạt mục tiêu
Alignment	Đảm bảo AI hành động theo ý muốn và giá trị của con người
Anthropic	Công ty AI an toàn tạo ra Claude, thành lập 2021 bởi Dario Amodei
Artifact	Sản phẩm output độc lập của Claude (code, doc, diagram) trong Claude.ai
Baseline	Kết quả tham chiếu để so sánh cải thiện trong ML
BLEU Score	Metric đánh giá chất lượng dịch máy
Completion	Output text mà model tạo ra từ prompt
CUDA	Framework tính toán GPU của NVIDIA, nền tảng để train và run LLM
Deployment	Đưa model vào môi trường production để phục vụ người dùng thực
End-to-end	Pipeline AI xử lý từ raw input đến final output mà không cần bước trung gian
Epoch	Một lần duyệt qua toàn bộ training data trong quá trình huấn luyện
Foundation Model	Model lớn được huấn luyện trên dữ liệu đa dạng, dùng làm base cho fine-tuning
Generative AI	AI có khả năng tạo ra nội dung mới (text, image, code, audio)
GPU	Card đồ họa — hardware chủ yếu dùng để train và run AI model
Inference Cost	Chi phí để chạy model tạo ra một response
Instruct Model	Model được fine-tune để làm theo hướng dẫn (instruction-following)
Jailbreak	Kỹ thuật cố tình vượt qua guardrails của AI để tạo nội dung bị cấm
Llama	Dòng model mã nguồn mở của Meta AI, cạnh tranh với Claude và GPT
Multihead Attention	Cơ chế attention song song trong Transformer, cho phép model chú ý nhiều khía cạnh cùng lúc
Neural Network	Hệ thống tính toán lấy cảm hứng từ não người, nền tảng của AI hiện đại
Perplexity	Metric đo độ không chắc chắn của model khi dự đoán text tiếp theo
Quantization	Kỹ thuật giảm kích thước model bằng cách giảm độ chính xác số học
Reinforcement Learning	Phương pháp học qua thử-sai với phần thưởng và hình phạt
Safety	Đảm bảo AI không gây hại, trung thực, và hoạt động an toàn
Throughput	Số tokens mà model có thể xử lý trong một giây
Tokenizer	Công cụ chuyển đổi text thành tokens để model xử lý
TPU	Tensor Processing Unit — chip chuyên dụng của Google để chạy AI

Kết luận

Từ điển này sẽ được cập nhật thường xuyên khi có thuật ngữ mới xuất hiện. Nếu bạn gặp thuật ngữ nào chưa được giải thích, hãy để lại bình luận và chúng tôi sẽ bổ sung.

Việc hiểu rõ các thuật ngữ không chỉ giúp bạn đọc tài liệu kỹ thuật dễ hơn mà còn giúp bạn viết prompt chính xác hơn — vì bạn có thể dùng đúng thuật ngữ để Claude hiểu chính xác yêu cầu của mình.

Bai viet co huu ich khong?

Writer cho nền tảng kiến thức Claude AI cho người Việt. Software engineer với hơn 20 năm kinh nghiệm, đam mê AI và chia sẻ kiến thức công nghệ.

5 bài viết · 16K lượt đọc

Bình luận (2)

Đăng nhập để bình luận...

Đăng nhập để bình luận

Đang tải bình luận...

Gợi ý cho bạn

Tương lai của AI Agents — Dự đoán 2026-2027