Giới hạn độ dài đầu ra để vừa tiết kiệm chi phí vừa tăng tốc phản hồi khi bạn không cần câu trả lời dài.
Cần một nhãn phân loại ngắn? Đặt max_tokens=20. Bạn tiết kiệm chi phí và loại bỏ phần giải thích dài dòng không cần thiết.