Flint của Springboards: Model AI thoát khỏi "tư duy đám đông" đang giữ chân các LLM
Startup Úc Springboards vừa ra mắt Flint, một mô hình ngôn ngữ được thiết kế để khắc phục vấn đề "tư duy đám đông" — hiện tượng khiến ChatGPT, Claude, Gemini và các LLM khác cho ra những câu trả lời quá giống nhau và thiếu sáng tạo.
Khi các LLM bị mắc kẹt trong cùng một khuôn mẫu
Có một trò chơi đơn giản bạn có thể thử: hỏi ChatGPT, Claude hoặc Gemini "Cho tôi một số ngẫu nhiên từ 1 đến 10". Bạn sẽ nhận được số 7 — hầu như mỗi lần. Yêu cầu lần thứ hai ("Một số khác"), kết quả thường là 3 hoặc 4. Lần thứ ba sẽ là 8 hay 9. Điều này không phải trò ảo thuật, mà là dấu hiệu của một vấn đề mà các nhà phát triển AI đang nỗ lực giải quyết: hầu hết các mô hình ngôn ngữ lớn hiện tại bị mắc kẹt trong một khuôn mẫu suy nghĩ chung rất giống nhau.
Pip Bingemann, Giám đốc điều hành của startup Úc Springboards, đã phát hiện ra tình trạng này khi phân tích sâu các mô hình hiện nay. "Hầu hết các mô hình ngôn ngữ đang chống lại sự bịp bợm (hallucination). Chúng tôi lại chào đón nó," Bingemann nói. Công ty của ông vừa giới thiệu Flint — một mô hình AI được huấn luyện đặc biệt để đưa ra các phản hồi đa dạng hơn khi trả lời những câu hỏi mở.
Những ví dụ cụ thể phơi bày sự đơn điệu
Vấn đề này không chỉ xuất hiện ở các con số. Khi Bingemann hỏi ChatGPT và Claude tên một loại ô tô, ông đã dự đoán chính xác: Toyota hoặc Honda. Flint lại trả lời Ford F-150. "Có rất nhiều thông tin bị mất mát không được phục vụ từ những mô hình này," ông giải thích. "Chúng có khả năng nói Buick hay Tesla như nhau, nhưng chúng không nói — chúng bị thành kiến."
Ví dụ khác còn rõ ràng hơn. Khi yêu cầu tạo slogan cho campaign giày chạy New Balance, cả Claude và ChatGPT đều trả về "Run your way." Flint lại cho kết quả: "Built to last, run to win." Mặc dù không phải tinh tế, nhưng ít nhất nó mang tính khác biệt.
Vấn đề này được chứng minh rõ ràng qua nghiên cứu học thuật. Vào tháng 11 năm ngoái, một nhóm nghiên cứu công bố bài báo "Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)" — tác phẩm thắng giải Best Paper tại hội nghị NeurIPS lớn. Khi nhóm này hỏi 25 mô hình AI khác nhau, mỗi cái 50 lần, để viết một phép ẩu dụ về thời gian, hầu như toàn bộ 1.250 phản hồi đều là phiên bản của "Time is a river" hoặc "Time is a weaver."
Hiện tượng lặp lại này xuất hiện khắp nơi. Kieran Browne, đồng sáng lập và Giám đốc Công nghệ tại Springboards, nhận xét: "Hầu hết mọi người không nhận ra mức độ mà họ đang nhận được thứ y hệt mọi người khác." Khi yêu cầu "Tên ban nhạc của bạn là gì?", các mô hình ưa chuộng những từ "glass", "neon", "velvet" hoặc "static". ChatGPT tạo ra 56 tên, với "Glass Harbor" ở đầu danh sách, kèm theo "Static Empire" và "Velvet Echo". Thậm chí "Sofa Astronauts" — cái tên mà ChatGPT đề xuất — là tên của một ban nhạc thực tế đã tồn tại.
Nguyên nhân sâu hơn và những nỗ lực giải quyết
Các nhà nghiên cứu suy đoán rằng hiện tượng này xuất phát từ cách hầu hết các LLM được huấn luyện: sử dụng những phương pháp tương tự trên dữ liệu tương tự để thực hiện những tác vụ tương tự. OpenAI giải thích rằng việc huấn luyện các mô hình để đưa ra những câu trả lời đáng tin cậy có thể dẫn chúng hội tụ quanh những phản hồi quen thuộc và có xác suất cao.
Springboards đã khám phá ra rằng điều chỉnh "temperature" (độ ngẫu nhiên) — một cách điều chỉnh phổ biến — không phải là giải pháp toàn diện. Tăng temperature quá cao có thể khiến các mô hình trở nên mất đi tính logic, thậm chí chuyển giữa tiếng Anh và code trong cùng một câu. Công ty đã xây dựng Flint dựa trên Qwen 3 — một mô hình open-source từ Alibaba — với các kỹ thuật tinh chỉnh độc quyền để chỉ tăng ngẫu nhiên ở những vị trí cụ thể, chứ không ở toàn bộ mô hình.
Tiềm năng ứng dụng trong thực tiễn
Zoe Scaman, người sáng lập Bodacious và Giám đốc Chiến lược tại 77X (nền tảng marketing được thành lập bởi cầu thủ Luka Dončić của LA Lakers), đã thử nghiệm Flint. Bà nhận thấy: "Tôi thấy nó thực sự hữu ích khi muốn đi theo những hướng hoàn toàn khác." Trong một bài test MBA cổ điển — "Làm thế nào để tái phát minh một công ty tài chính cho thế hệ trẻ?" — ba mô hình chính đều theo cùng một con đường: "dạy hiểu biết tài chính một cách vui vẻ", trong khi Flint đề xuất rằng bản thân khái niệm tích lũy của cải nên được đổi tên lại. Mặc dù Flint vẫn là nguyên mẫu với những hạn chế, khái niệm này mở ra tiềm năng thực sự cho sáng tạo trong quảng cáo, tiếp thị và ra quyết định chiến lược.