Robot làm việc nhà sắp có "não AI" chạy offline nhờ Google
Mô hình Gemini thu gọn mới của Google cho phép các robot hình người học làm việc nhà nhanh hơn mà không cần kết nối mạng.
Google chính thức giới thiệu Gemini Robotics On-Device - mô hình trí tuệ nhân tạo có khả năng điều khiển robot trong môi trường thực mà không cần truy cập đám mây. Đây được xem là bước tiến lớn trong việc hiện thực hóa các robot có khả năng tự vận hành, xử lý linh hoạt và phản ứng gần như tức thì.

Không giống các phiên bản trước vốn phụ thuộc vào kết nối mạng để xử lý thông tin, Gemini On-Device tích hợp trực tiếp vào phần cứng robot, giúp AI hoạt động nội bộ mà không cần gửi dữ liệu đi xa. Với khả năng suy luận đa phương thức được kế thừa từ Gemini 2.0, mô hình mới cho phép robot hiểu ngôn ngữ tự nhiên, xử lý các tình huống mới và điều khiển chuyển động tinh vi, tất cả đều thực hiện ngay trên thiết bị.
Google cho biết các nhà phát triển đã có thể đăng ký tham gia chương trình Trusted Tester để sớm trải nghiệm. Đồng thời, một bộ SDK cũng được phát hành nhằm hỗ trợ thử nghiệm, tùy biến và tích hợp vào các nền tảng robot khác nhau.
Phản ứng nhanh, hoạt động mượt ngay cả khi mất mạng
Việc vận hành trực tiếp trên thiết bị giúp Gemini Robotics On-Device phản ứng nhanh hơn, ổn định hơn và phù hợp với các tình huống khẩn cấp hoặc môi trường không có kết nối. Mô hình này đã thể hiện khả năng học nhanh thông qua chỉ 50 đến 100 ví dụ hành động từ con người. Nhờ đó, robot có thể hoàn thiện tác vụ một cách chính xác mà không cần hàng ngàn giờ huấn luyện.

Carolina Parada, trưởng bộ phận Robotics của Google DeepMind, chia sẻ rằng mô hình mới đủ nhỏ và hiệu quả để chạy hoàn toàn trong robot vật lý. Bà gọi đây là một giải pháp lý tưởng cho những nơi "có kết nối kém hoặc cần tính độc lập cao".
Dù không mạnh bằng bản lai giữa AI cục bộ và đám mây, nhưng hiệu suất của mô hình offline này đã vượt ngoài kỳ vọng ban đầu. Theo Parada, nhóm phát triển ngạc nhiên trước khả năng suy diễn và tính thích ứng của nó trong thực tế.
Học ít, hiểu nhiều, áp dụng rộng
Gemini Robotics On-Device ban đầu được huấn luyện trên robot ALOHA của Google, nhưng đã được điều chỉnh để chạy tốt trên các nền tảng khác như robot hình người Apollo của Apptronik hay cánh tay đôi Franka FR3. Trong các thử nghiệm, robot có thể thực hiện các thao tác chi tiết như kéo khóa túi, gấp quần áo hoặc thao tác tay hai bên cùng lúc với độ trễ rất thấp.

Đây cũng là lần đầu tiên một mô hình robot từ DeepMind cho phép nhà phát triển tự tinh chỉnh. Bằng cách điều khiển robot thực hiện nhiệm vụ một vài lần, mô hình học được hành vi và sau đó có thể thực hiện lại một cách tự chủ. Việc tinh chỉnh này có thể được thực hiện trên mô phỏng (như MuJoCo) hoặc trong môi trường vật lý thực.
Bảo mật cao, vận hành tại chỗ, không cần kết nối
Khả năng xử lý toàn bộ dữ liệu ngay trên thiết bị khiến Gemini Robotics On-Device trở thành giải pháp phù hợp cho các tình huống nhạy cảm về bảo mật như chăm sóc sức khỏe, dịch vụ từ xa hoặc môi trường quân sự. Dữ liệu không bị gửi đi, giảm nguy cơ rò rỉ thông tin và đảm bảo robot hoạt động liên tục ngay cả khi bị ngắt kết nối mạng.
Parada cũng nhận xét rằng so với các kỹ thuật học tăng cường cũ vốn chậm và dễ lỗi, AI sinh (generative AI) cho phép mô hình học cách làm việc từ ít dữ liệu hơn và vẫn đảm bảo tính linh hoạt. Mô hình không chỉ lặp lại thao tác đã học, mà còn "suy ra" các tình huống tương tự dựa trên hiểu biết từ thế giới đa phương thức của Gemini.
Lưu ý về an toàn và giới hạn
Tuy sở hữu nhiều ưu điểm, phiên bản On-Device không tích hợp sẵn hệ thống suy luận an toàn ngữ nghĩa như bản kết nối đám mây. Google khuyến cáo các nhà phát triển nên chủ động xây dựng hệ thống an toàn riêng, bao gồm tích hợp API Gemini Live và liên kết với các mô-đun kiểm soát an toàn ở tầng thấp.
Hình minh họa, tạo bởi AI.
"Với phiên bản Gemini Robotics đầy đủ, hệ thống sẽ suy luận xem hành động nào là an toàn trước khi thực hiện. Nhưng với bản chạy nội bộ, điều đó cần được bổ sung từ phía nhà phát triển", Parada cho biết thêm.
Dù còn một số giới hạn, Gemini Robotics On-Device đang mở ra tương lai gần của những robot hình người thực sự thông minh, hoạt động độc lập và phản ứng tức thì trong thế giới thực, ngay cả khi không có Wi-Fi.