Chưa có dữ liệu thật để test? Model nhỏ sinh hàng chục ca thử đa dạng (kèm ca khó, ca biên) trong vài phút — bộ khung eval có ngay từ trước khi ra mắt.
"Sinh 30 email khách hàng đa dạng để test bộ phân loại: khiếu nại, hỏi giá, spam, đa ngôn ngữ, mơ hồ khó xếp loại — kèm nhãn đúng cho từng email."