Vấn đề "suy nghĩ nhóm" của các LLM: Từ bẫy của số 7 đến giải pháp Flint
Các mô hình ngôn ngữ lớn bị kẹt trong một "khe sâu nhận thức" làm cho chúng trở nên quá dự đoán được. Startup Springboards vừa giới thiệu Flint—một LLM được huấn luyện để tạo ra đa dạng câu trả lời hơn cho những câu hỏi mở.

Khi LLM trở thành máy trả lời có sẵn
Hãy thử một thí nghiệm nhỏ: mở bất kỳ chatbot nào—Claude, ChatGPT hay Gemini—rồi hỏi "Cho tôi một con số ngẫu nhiên từ 1 đến 10". Nhiều khả năng bạn sẽ nhận được câu trả lời "7". Mặc dù điều này không xảy ra 100% lần, nhưng nó xuất hiện đủ thường xuyên để gợi ý một vấn đề sâu sắc hơn: các mô hình ngôn ngữ lớn hiện nay đang bị mắc kẹt trong một mẫu lặp lại.
Sự thật đó nghe có vẻ nhưng lại tiểm ẩn một vấn đề lớn với AI. Thay vì "thực sự" ngẫu nhiên, các LLM phát sinh từ những kết hợp tố tối ưu nhất dựa trên dữ liệu huấn luyện. Điều này khiến chúng trở nên dự đoán được hơn, sáng tạo kém hơn so với những gì người dùng kỳ vọng—một hiện tượng được gọi là "nhóm tư duy" (groupthink) của AI.
Khi nào sự đồng nhất trở thành vấn đề?
Với những tác vụ kỹ thuật như lập trình hoặc tìm kiếm thông tin, tính dự đoán được này có thể chấp nhận được. Nhưng khi bạn cần sáng tạo—như brainstorm ý tưởng hoặc lên kế hoạch cho kỳ nghỉ—chính những câu trả lời "an toàn nhất" lại trở thành vấn đề. Bạn không cần LLM nhắc lại những lựa chọn hiển nhiên; bạn cần sự đa dạng ý tưởng.
Vấn đề này xuất phát từ cách các LLM được huấn luyện. Chúng được tối ưu hóa để dự đoán token tiếp theo có khả năng nhất trong chuỗi—một quá trình tự nhiên hội tụ về những lựa chọn "chung" nhất. Kết quả là một AI có khả năng "an toàn" nhưng ngây thơ.
Flint: Giải pháp từ nhà khởi nghiệp Úc
Startup Springboards (có trụ sở ở Úc) vừa công bố Flint, một mô hình ngôn ngữ được thiết kế đặc biệt để phá vỡ mẫu này. Flint được huấn luyện sao cho nó tạo ra một loạt các câu trả lời đa dạng hơn cho những câu hỏi mở như "Tôi nên đi đâu ở châu Âu?" thay vì tập trung vào những lựa chọn phổ biến.
Cách tiếp cận này nhắm tới một nhóm người dùng cụ thể: những ai sử dụng AI để suy nghĩ sáng tạo, không chỉ để lấy câu trả lời "đúng nhất". Mặc dù vẫn còn sớm để đánh giá tác động thực tế, ý tưởng này phản ánh một xu hướng lớn hơn: nhu cầu các LLM không chỉ chính xác, mà còn linh hoạt và có khả năng tạo ra nội dung không thể dự đoán.
Những tin AI nóng khác tuần này
Mô hình AI Trung Quốc bắt kịp ông lớn: GLM-5.2, một mô hình từ Trung Quốc, đang thu hút khách hàng phương Tây nhờ kết hợp hiệu suất mạnh với giá cả thấp. Điều này cho thấy cuộc chạy đua AI đã không còn là trò chơi của riêng những công ty Mỹ lớn.
Anthropic's Fable 5 quay lại: Sau khi bị ngừng dịch vụ do lệnh cấm xuất khẩu từ chính quyền Mỹ, Fable 5 đã được khôi phục. Tuy nhiên, những truy vấn tiềm ẩn rủi ro bảo mật có thể được chuyển hướng tới các mô hình kém mạnh mẽ hơn.
Meta xây dựng đ帝國đám mây riêng: Gã khổng lồ công nghệ đang khám phá cách kiếm tiền từ cơ sở hạ tầng AI của mình, bao gồm bán quyền truy cập vào các mô hình được lưu trữ trên hạ tầng của Meta hoặc bán sức mạnh tính toán "thô" trực tiếp.
Cuộc đua Sao Hỏa: Mỹ vs Trung Quốc: Trong khi NASA đang vật lộn để tài trợ dự án mang các mẫu đá hứa hẹn trở về Trình độ, Trung Quốc đang tăng tốc độ phát triển phiên bản riêng của nhiệm vụ này. Mỹ có nguy cơ mất lợi thế trong cuộc tìm kiếm sinh sống ngoài Trái Đất.