Token là đơn vị tiền tệ — đo trước khi tối ưu

Tích hợp & APIMẹo 109/1601 phút đọc

Mỗi request trả phí theo token vào + token ra. Log hai con số này từ ngày đầu: mọi quyết định tối ưu (cache, rút prompt, đổi model) cần số liệu, không cần cảm giác.

Áp dụng thế nào

Thêm một dòng log usage.input_tokens/output_tokens mỗi call. Cuối tuần nhìn phân bố: 80% chi phí thường nằm ở 20% loại request — tối ưu đúng chỗ đó trước.

Đúc kết từ khóa họcBuilding with the Claude API · Bài 6.4 — Vòng đời một request — Từ client đến Claude và ngược lại

Học sâu hơnXem lộ trình Tích hợp & API

Bài viết liên quanKết nối Claude với công cụ của bạn qua MCP

Mẹo khác

Bắt đầu với Claude

Câu hỏi đa nguồn: bật Research mode

Bảo mật thông tin. Hủy đăng ký bất cứ lúc nào. Chính sách bảo mật

Mẹo khác

Upload file thay vì dán tường chữ

Sửa prompt gốc thay vì chat tiếp vô tận

Hỏi Claude cách hỏi Claude

Mở đầu bằng động từ + đầu ra cụ thể

Chọn đúng cửa: Chat, Cowork hay Code

Câu hỏi đa nguồn: bật Research mode

Đăng ký nhận bản tin