Từ AGI đến Distillation: Bảng thuật ngữ AI mà người Việt nên biết
TechCrunch công bố bảng glossary chi tiết về các thuật ngữ chuyên ngành AI đang thống trị các cuộc họp, pitch, và podcast của giới công nghệ — từ AGI, AI agent, cho đến deep learning và diffusion.
Thế giới AI nói một ngôn ngữ mà không phải ai cũng hiểu
Trí tuệ nhân tạo đang viết lại toàn bộ thế giới, nhưng cùng lúc đó, nó còn "phát minh" ra một ngôn ngữ hoàn toàn mới để mô tả cách nó làm điều đó. Nếu bạn từng tham dự bất kỳ cuộc họp product, pitch, hay panel nào trong thời gian gần đây, chắc chắn bạn đã nghe các nhân vật giáo dục nói vài ba về LLM, RAG, RLHF và tá tưởng những thuật ngữ khác mà đôi khi còn khiến những người thông minh trong ngành công nghệ cũng cảm thấy... chưa có tự tin. TechCrunch vừa công bố một bảng glossary chi tiết để "cứu rỗi" tình cảnh đó — một bộ định nghĩa bằng tiếng Anh dễ hiểu về các thuật ngữ AI mà bạn sẽ thực sự gặp, dù bạn là một người đang xây dựng những sản phẩm AI, đầu tư vào chúng, hay chỉ đơn giản là cố gắng theo kịp bằng cách đọc TechCrunch hoặc nghe các podcast liên quan.
Từng bước khám phá 9 thuật ngữ AI cơ bản và quan trọng nhất
TechCrunch xác định rằng bảng glossary này là một "tài liệu sống" — sẽ được cập nhật thường xuyên khi ngành AI phát triển. Trong phiên bản hiện tại, họ giải thích chi tiết về AGI (Artificial General Intelligence) — một khái niệm khá mơ hồ, nhưng nói chung nó chỉ AI có năng lực hơn con người trung bình ở nhiều, thậm chí hầu hết các tác vụ. CEO OpenAI Sam Altman từng miêu tả AGI là "tương đương một con người bình thường mà bạn có thể thuê làm đồng nghiệp", trong khi lược đồ chiến lược của OpenAI định nghĩa nó là "các hệ thống tự trị cao độ vượt trội con người ở hầu hết công việc có giá trị kinh tế". Thú vị thay, Google DeepMind hiểu khác một chút — họ xem AGI là "AI có khả năng ít nhất bằng con người ở hầu hết các tác vụ nhận thức". Các chuyên gia AI hàng đầu cũng còn... bối rối với định nghĩa này.
Tiếp theo là AI agent — một công cụ sử dụng công nghệ AI để thực hiện một loạt tác vụ thay bạn, vượt xa những gì một chatbot AI cơ bản có thể làm, chẳng hạn như nộp báo cáo chi phí, đặt vé hoặc bàn tại nhà hàng, hoặc thậm chí viết và bảo trì mã lệnh. Bảng glossary cũng giải thích API endpoints — hãy tưởng tượng chúng như những "nút bấm" trên mặt sau của một phần mềm mà các chương trình khác có thể ấn để làm nó thực hiện việc gì đó. Lập trình viên dùng các giao diện này để xây dựng tích hợp — chẳng hạn cho phép một ứng dụng kéo dữ liệu từ ứng dụng khác, hoặc cho AI agent kiểm soát trực tiếp các dịch vụ của bên thứ ba mà không cần con người thao tác từng bước.
Chain of thought là một khái niệm khác được nhấn mạnh mạnh. Nếu bạn hỏi một câu hỏi đơn giản, bộ não con người có thể trả lời mà hầu như không suy nghĩ — như hỏi con vật nào cao hơn, hươu cao cổ hay mèo? Nhưng trong nhiều trường hợp khác, bạn cần giấy và bút để tìm ra câu trả lời đúng vì có những bước trung gian. Chẳng hạn như nếu một nông dân có gà và bò, và chúng có tổng cộng 40 cái đầu và 120 cái chân, bạn có thể cần viết một phương trình đơn giản để tìm ra câu trả lời (20 gà và 20 bò). Trong bối cảnh AI, chain-of-thought reasoning cho các mô hình ngôn ngữ lớn có nghĩa là chia một bài toán thành các bước trung gian nhỏ hơn để cải thiện chất lượng kết quả cuối cùng.
Coding agents là một khái niệm cụ thể hơn AI agent, ám chỉ một chương trình có thể thực hiện các hành động độc lập, từng bước một, để hoàn thành một mục tiêu. Compute (năng lực xử lý) nói chung chỉ sức mạnh tính toán sinh thái mà cho phép các mô hình AI hoạt động — loại xử lý này thúc đẩy toàn bộ ngành AI, cấp cho nó khả năng huấn luyện và triển khai những mô hình mạnh mẽ của nó. Deep learning là một tập hợp con của machine learning tự cải thiện, trong đó các thuật toán AI được thiết kế với cấu trúc mạng nơ-ron nhân tạo đa lớp (ANN), cho phép chúng thiết lập mối liên hệ phức tạp hơn. Diffusion là công nghệ nằm ở trung tâm của nhiều mô hình AI sinh tạo ảnh, âm nhạc, và văn bản. Distillation là một kỹ thuật để trích xuất kiến thức từ một mô hình AI lớn bằng cách dùng mô hình "giáo viên-học sinh".
Một ngành đang phát triển nhanh chóng với thuật ngữ mới liên tục
Bảng glossary này phản ánh tốc độ tiến hóa của ngành AI. Điều thú vị là các công ty và phòng lab khác nhau thường có cách hiểu một chút khác nhau về cùng một khái niệm. OpenAI, Google DeepMind, và các công ty khác đưa ra những định nghĩa riêng của họ về AGI, cho thấy rằng thậm chí ngành còn chưa có sự đồng thuận hoàn toàn. TechCrunch thừa nhận rằng đây là một "tài liệu sống", sẽ được cập nhật liên tục khi trường ngang AI tiến triển — cũng giống như các hệ thống AI mà nó mô tả. Cơ sở hạ tầng để triển khai các khả năng được hình dung của AI agent vẫn còn đang được xây dựng, và vẫn còn rất nhiều phần chuyển động trong không gian mới nổi này. Tuy nhiên, khái niệm cơ bản chỉ ra rằng đó là một hệ thống tự trị có thể kéo trên nhiều hệ thống AI để thực hiện các tác vụ gồm nhiều bước.
Tại sao người Việt cần nắm rõ những thuật ngữ này
Đối với lập trình viên, nhà đầu tư, và những người đang cố gắng theo kịp cuộc cách mạng AI, việc hiểu rõ các thuật ngữ này không phải là tùy chọn mà là cần thiết. Nếu bạn muốn đánh giá một mô hình AI mới được phát hành, bạn cần biết nó dùng deep learning hay diffusion, nó có phải coding agent hay chỉ là chatbot đơn giản. Nếu bạn là nhà đầu tư, hiểu các thuật ngữ giúp bạn không bị lầm tưởng hoặc lợi dụng bởi những marketing hype. Và nếu bạn chỉ là một độc giả TechCrunch muốn theo kịp, bảng glossary này sẽ cứu bạn khỏi cảm giác "ngu dữ" khi nghe các chuyên gia nói chuyện. Đó là lý do tại sao bảng từ vựng này từ TechCrunch xuất hiện vào đúng lúc — ngành AI đang bùng nổ, và những ai muốn hiểu hoặc tham gia vào cuộc cách mạng này cần nói cùng một ngôn ngữ.