Chi phí API tỉ lệ với số token vào và ra. Hiểu điều này, bạn có nhiều cách tối ưu mà không hy sinh chất lượng.
Bạn sẽ học được
- Hiểu token vào và token ra
- Cắt ngữ cảnh thừa
- Chọn model theo đúng nhu cầu
Bạn cần gì
- Một ứng dụng đang gọi API
- Quyền xem báo cáo sử dụng
Giới hạn đầu ra
Đặt max_tokens hợp lý và yêu cầu câu trả lời ngắn gọn khi không cần dài. Đầu ra ngắn vừa rẻ vừa nhanh.
Đừng gửi ngữ cảnh thừa
Chỉ đưa vào phần ngữ cảnh thật sự cần. Lịch sử hội thoại quá dài là nguồn lãng phí token phổ biến nhất.
Chọn đúng model
Dùng model nhẹ cho việc đơn giản, model mạnh cho việc khó. Không phải yêu cầu nào cũng cần model đắt nhất.
Nội dung này có hữu ích không?
Kiểm tra kiến thức
Củng cố những gì bạn vừa học
3 câu trắc nghiệm · đạt từ 70% · câu hỏi và đáp án xáo trộn mỗi lần.