AI RACE— Cuộc đua AI
Mô hình ngôn ngữ

NousCoder-14B: Mô hình code mã nguồn mở đối đầu Claude Code

Nous Research công bố NousCoder-14B, mô hình lập trình mã nguồn mở đạt hiệu suất 67.87% trên bộ tiêu chuẩn LiveCodeBench, được huấn luyện trong 4 ngày. Đặc biệt, Nous công khai toàn bộ infrastructure training, chứ không chỉ trọng số mô hình.

19:02 18/06/2026
Mô hình ngôn ngữ

Đối thủ mã nguồn mở xuất hiện giữa "cơn bão" Claude Code

Tháng đầu năm, ngành công nghệ AI bị "cuốn" bởi Claude Code từ Anthropic — công cụ lập trình agentic mà các developer liên tục chia sẻ video, bài viết ca tụng khả năng. Đúng lúc này, Nous Research (startup AI backed by quỹ crypto Paradigm) tung ra NousCoder-14B — mô hình lập trình cạnh tranh đạt hiệu suất ngang hoặc vượt qua nhiều hệ thống lớn hơn.

Điểm bất ngờ: mô hình được huấn luyện chỉ trong 4 ngày với 48 GPU B200 của Nvidia. Con số này phản ánh tốc độ tiến bộ của AI coding tools đang tăng tích, và cuộc cạnh tranh để kiểm soát ngành đang ngày càng khốc liệt.

Kết quả cụ thể: 67.87% accuracy, tăng 7.08 điểm

NousCoder-14B đạt tỉ lệ chính xác 67.87% trên LiveCodeBench v6 — bộ tiêu chuẩn kiểm định trên các bài lập trình thi đấu công bố từ 8/2024 đến 5/2025. Đây là bước tiến 7.08 điểm phần trăm so với mô hình nền tảng Qwen3-14B của Alibaba.

Joe Li, nhà nghiên cứu tại Nous Research và cựu lập trình viên thi đấu, đã so sánh tiến bộ này với xếp hạng Codeforces. Anh phát hiện mô hình tương đương bước tiến từ rating 1600-1750 lên 2100-2200 — cần gần 2 năm để Li tự mình vượt qua khi còn trẻ. Mô hình làm được trong 4 ngày. Tuy nhiên, Li chỉ ra chi tiết quan trọng: trong 2 năm đó anh giải 1.000 bài, mô hình cần 24.000 — con người vẫn hiệu quả hơn nhiều.

Công bố toàn bộ "công thức" training

Điểm độc lạ của NousCoder-14B là **minh bạch triệt để**. Nous không chỉ công bố trọng số mô hình mà còn toàn bộ môi trường reinforcement learning, bộ tiêu chuẩn, hệ thống huấn luyện dựa trên framework Atropos. Bất kỳ nhà nghiên cứu nào có đủ tài nguyên tính toán đều có thể tái tạo hoặc mở rộng công việc này.

Huấn luyện dùng kỹ thuật DAPO (Dynamic Sampling Policy Optimization): mô hình tạo mã, chạy test, nhận tín hiệu nhị phân (đúng/sai). Chi tiết tối ưu hoá là loại bỏ những bài mà mô hình giải toàn bộ hoặc không giải được tí nào — chúng không cung cấp tín hiệu học tập hữu ích.

Cảnh báo: Dữ liệu sắp cạn kiệt

Báo cáo của Li tiết lộ lo ngại lớn: bộ dữ liệu huấn luyện đã bao hàm "phần lớn các bài tập lập trình thi đấu chất lượng cao có sẵn". Tổng số bài toán trên Internet xấp xỉ cùng độ lớn với 24.000 bài dùng để training.

Điều này gợi ý một thách thức tương lai: huấn luyện AI coding model sẽ ngày càng phụ thuộc vào dữ liệu tổng hợp thay vì dữ liệu thực tế.

NousCoder-14B: Mô hình code mã nguồn mở đối đầu Claude Code · AI Race