1/ Google DeepMind đang đưa AI vào thế giới vật lý: Gemini Robotics 1.5 biến một mô hình ngôn ngữ thành một tác nhân có thể hướng dẫn robot và làm chủ các nhiệm vụ phức tạp từng bước một. Một bước tiến lớn trong việc liên kết tư duy và hành động! Hãy phân tích nó 🧵:
2/ Robot từ lâu đã gặp khó khăn với các nhiệm vụ hàng ngày: quá cứng nhắc, quá phụ thuộc vào các lệnh chính xác, không thể thích ứng. Ngay cả một điều đơn giản như "dọn bàn" cũng khó khăn mà không có ngữ cảnh và kỹ năng lập kế hoạch.
Sundar Pichai
Sundar Pichai16 giờ trước
Các mô hình Gemini Robotics 1.5 mới sẽ giúp robot có khả năng lý luận tốt hơn, lập kế hoạch trước, sử dụng các công cụ kỹ thuật số như Tìm kiếm, và chuyển giao kiến thức từ loại robot này sang loại robot khác. Bước tiến lớn tiếp theo của chúng tôi hướng tới những robot đa năng thực sự hữu ích — bạn có thể thấy cách robot lý luận khi nó phân loại quần áo trong video dưới đây.
3/ Gemini Robotics 1.5 kết hợp ngôn ngữ, thị giác và lập kế hoạch. Nó hiểu ý định của con người, thiết kế một chuỗi hành động, giải thích lý do của mình—và sau đó chỉ đạo một con robot thực hiện. Suy nghĩ và hành động, cuối cùng được kết nối.
4/ Robot giờ đây có thể thích ứng với các tình huống thực tế: từ việc hỗ trợ trong gia đình đến quản lý logistics trong các nhà máy. Đây không chỉ là tự động hóa—mà là sự tương tác thông minh với thế giới xung quanh chúng ta.
Google DeepMind
Google DeepMind16 giờ trước
Nhiều hoạt động hàng ngày của chúng ta cần nhiều bước để hoàn thành và có thể cực kỳ khó khăn đối với robot. Hãy tưởng tượng bạn hỏi: "Dựa trên vị trí của tôi, bạn có thể phân loại những đồ vật này vào các thùng phân compost, tái chế và rác đúng không?" 🗑️ Robot phải tìm kiếm trên web để biết các hướng dẫn địa phương, xem xét các đồ vật, tìm cách phân loại chúng và sau đó hoàn thành nhiệm vụ.
10,27K