AI RACE— Cuộc đua AI
Robot & Tự động hóa

Robot AI Thông Minh: Dùng LLM Điều Khiển Động Cơ Bước Từng Bước

Hướng dẫn thực tế lập trình robot bằng AI: từ chọn board (Raspberry Pi, ESP32, Arduino) đến tích hợp LLM (Claude API, GPT) để robot hiểu lệnh tự nhiên và điều khiển servo/động cơ tự động.

21:10 04/07/2026
Robot & Tự động hóa

Mở đầu: Tại sao kết hợp LLM với robot?

Trong năm 2025-2026, xu hướng làm robot thông minh không phải là tìm chip mạnh nhất, mà là kết hợp chip tính toán (Raspberry Pi, Jetson Nano) với LLM để robot hiểu ý định con người. Thay vì viết hàng trăm if-else, bạn chỉ cần nói "nhặt cái ly từ bàn lên" và robot sẽ xác định, lên kế hoạch, rồi điều khiển servo/motor thực hiện.

Bước 1: Chọn phần cứng đúng

Board tính toán

Raspberry Pi 4B (4-8GB RAM) — khuyên dùng cho dự án đầu tiên. Giá ~$55-75. Có thể chạy Ollama (LLaMA 7B local), hoặc gọi API Claude/GPT qua mạng. Yêu cầu: 64-bit Raspberry Pi OS Bookworm (phiên bản 32-bit không chạy được thư viện AI). Cần quạt hoặc heatsink khi chạy LLM inference, nhiệt độ dễ vượt 70°C.

ESP32 — chip siêu rẻ (~$8-15), dùng khi robot cần nhỏ gọn. Chạy MicroPython, có WiFi/Bluetooth. Tuy nhiên không đủ sức chạy LLM cục bộ, chỉ gọi API. Phù hợp cho robot nhỏ, IoT edge devices.

Arduino Uno — dùng làm "bộ não vận động" (motor controller) kết hợp với Raspberry Pi. Arduino xử lý PWM, sensor, servo; Raspberry Pi xử lý AI. Giá ~$25-30.

Jetson Nano 2GB (~$49 khi còn stock) — nếu cần GPU NVIDIA local, tuy nhiên hiếm thấy hàng mới năm 2026.

Kiến nghị: Bắt đầu bằng Raspberry Pi 4 (8GB) + Arduino Uno + Servo SG90. Tổng chi phí phần cứng: $110-150.

Động cơ và servo

Servo SG90 (180°) — rẻ nhất (~$3-5), dùng cho robot cánh tay nhỏ, quay đầu. Điều khiển bằng PWM 50Hz (pulse: 1-2ms).

Servo MG996R (full rotation) — mạnh hơn, xoay 360°, giá ~$10-15. Tải trọng cao hơn.

Motor DC + PID controller — nếu cần tốc độ biến thiên, dùng motor + encoder feedback. Phức tạp hơn servo.

Hiwonder TonyPi Pro (~$200-300 komplete kit) — board Raspberry Pi 5 tích hợp sẵn 6 servo thông minh (intelligent bus servo), camera HD, IMU. Chỉ cần code, không cần hàn/dây. Dành cho ai muốn "vào tay" nhanh.

Bước 2: Tích hợp LLM để xử lý lệnh tự nhiên

Lựa chọn model

Claude 3.5 Haiku (qua Claude API) — giá rẻ: $1 input / $5 output per 1M tokens. Đủ smart cho hầu hết task robot, latency ~1-2 giây.

GPT-5.2 (OpenAI) — $1.75 input / $14 output per 1M. Mạnh hơn nhưng đắt hơn.

Ollama + LLaMA 2 7B (chạy local trên Raspberry Pi) — miễn phí, không cần mạng, nhưng chậm (~5-10s per request trên Pi 4). Phù hợp nếu muốn privacy hoặc offline.

Ví dụ flow: từ lệnh tự nhiên đến điều khiển servo

`` User: "Tay robot mở rộng ra" ↓ Raspberry Pi gửi đến Claude API: "Lệnh: Tay robot mở rộng ra Robot có 2 servo: shoulder (pin 17), elbow (pin 27) Output: JSON {shoulder: 90, elbow: 45}" ↓ Claude trả: {shoulder: 120, elbow: 60} ↓ Python script trên Pi → gửi PWM signal qua GPIO pin 17, 27 → Arduino/ESP32 nhận PWM, điều khiển servo → Servo xoay đến góc định ``

Bước 3: Lập trình điều khiển servo qua Python

Raspberry Pi + servo SG90

```python import RPi.GPIO as GPIO import time

GPIO.setmode(GPIO.BCM) servo_pin = 17 GPIO.setup(servo_pin, GPIO.OUT)

Tạo PWM 50Hz

pwm = GPIO.PWM(servo_pin, 50) pwm.start(0)

def set_angle(angle):

angle: 0-180

duty cycle: 2.5 - 12.5 (đơn vị %)

duty = 2.5 + (angle / 180) * 10 pwm.ChangeDutyCycle(duty) time.sleep(0.3)

set_angle(0) # 0 độ time.sleep(1) set_angle(90) # 90 độ time.sleep(1) set_angle(180) # 180 độ

pwm.stop() GPIO.cleanup() ```

ESP32 + servo (MicroPython)

```python from machine import Pin, PWM import time

servo = PWM(Pin(13), freq=50)

def set_angle(angle):

ESP32: duty 0-1023 tương ứng 0%-100%

1.5ms (90°) = 7.5% duty = 77 giá trị

duty_us = int(1500 + (angle - 90) * 11.11)

Chuyển sang 0-1023 scale (50Hz = 20000us period)

duty = int((duty_us / 20000) * 1023) servo.duty(duty)

set_angle(0) time.sleep(1) set_angle(90) time.sleep(1) set_angle(180) ```

Bước 4: Các dự án tham khảo thực tế

SamuRoid (2026, Raspberry Pi 4)

Robot 22 DOF (22 khớp), chạy ROS + multimodal LLM. Có thể đốc thị khoảng cách, nhận diện người, tương tác tự nhiên. Cost: ~$800-1200 nếu tự lắp.

Hiwonder TonyBot Ultimate Kit

Kết hợp vision (camera) + voice + LLM. Hiểu lệnh tiếng Anh/Trung, nhận diện vật thể, tự động điều khiển servo. Ưu điểm: mở hộp chỉ cần code, không cần hàn. Nhược điểm: giá ~$300-500, servo/motor không thể thay ngoài (lock-in).

Mẹo thực chiến

Tối ưu chi phí API

  • Dùng prompt caching (nếu lệnh lặp lại): giảm 90% chi phí input.
  • Batch API: nếu không cần real-time, giảm 50% tất cả token.
  • Ví dụ: 1000 yêu cầu điều khiển/ngày dùng Claude Haiku + caching = ~$0.3-0.5/ngày (thay vì $2-3).

An toàn khi test

  • Luôn giới hạn góc servo: thêm boundary check. Servo xoay quá 270° liên tục dễ hỏng.
  • Test offline đầu tiên: code điều khiển servo trước, rồi mới gắn LLM.
  • Timeout API: đặt timeout 5 giây khi gọi LLM. Nếu robot không nhận phản hồi, trở về trạng thái an toàn (servo ở 90°).

Hiệu suất

  • Nếu dùng local LLM (Ollama): chỉ phù hợp cho lệnh đơn giản. Lệnh phức (~100 token) trên Pi 4 mất 5-10 giây.
  • API remote (Claude/GPT): 1-2 giây, nhưng phụ thuộc mạng. Dự phòng 3G backup.

Lưu ý chi phí & độ khó

| Mục | Chi phí | Độ khó | |-----|--------|--------| | Cơ bản (RPi 4 + servo SG90) | $120 | Dễ (2-3 tiếng) | | Với API Claude | +$10-50/tháng | Trung bình | | Kit Hiwonder TonyPi Pro | $250-300 | Dễ (plug-n-play) | | Tự lắp humanoid 6+ DOF | $400+ | Khó |

Kết luận

Kết hợp LLM với robot không còn là khoa học viễn tưởng mà một lựa chọn thực tế, giá rẻ. Với $120-150 phần cứng cơ bản + ~$20/tháng API, bạn đã có một robot có thể hiểu lệnh tự nhiên. Bắt đầu từ servo SG90 + Raspberry Pi 4 + Claude API, test thành công, rồi nâng cấp lên 6-22 DOF. Chìa khóa là bắt đầu nhỏ, test, mở rộng dần.