نحن نجعل الروبوتات أكثر قدرة من أي وقت مضى في العالم المادي. 🤖 Gemini Robotics 1.5 هو نظام وكيل متقدم يمكنه التفكير بشكل أفضل ، والتخطيط للمستقبل ، واستخدام الأدوات الرقمية مثل @Google Search ، والتفاعل مع البشر وغير ذلك الكثير. إليك كيفية عملها 🧵
تتطلب الكثير من أنشطتنا اليومية العديد من الخطوات لإكمالها ويمكن أن تكون صعبة للغاية بالنسبة للروبوتات. تخيل أنك تسأل: "بناء على موقعي ، هل يمكنك فرز هذه الأشياء في السماد العضوي الصحيح وإعادة التدوير وصناديق القمامة؟" 🗑️ يجب على الروبوت البحث في الويب عن إرشادات محلية ، وإلقاء نظرة على الكائنات ، ومعرفة كيفية فرزها ثم إكمال المهمة. ↓
لمعالجة هذه الطلبات ، يمكن ل Gemini Robotics 1.5 تشغيل تطبيقات وكيل جديدة من خلال نموذجين رئيسيين من الذكاء الاصطناعي يعملان معا: 🔹Gemini Robotics-ER 1.5: يعمل هذا كدماغ رفيع المستوى ، ويتفاعل مع الناس ، ويفهم بيئته ، وينسق الأدوات ، ويضع خطة مفصلة لتنفيذ المهمة. 🔹Gemini Robotics 1.5: هذا مسؤول عن التنفيذ ، وترجمة التعليمات إلى أوامر حركية دقيقة مطلوبة للروبوت للتحرك والتصرف بطريقة عامة.
Gemini Robotics-ER 1.5 هو أول نموذج تفكير محسن للمنطق المتجسد ، ويحقق أداء حديثا على المعايير الأكاديمية والداخلية. 🧠 فهمها في العالم الحقيقي يجعلها منسقا مثاليا رفيع المستوى للروبوتات. شاهد كيف يتعامل مع تنظيم مكتب مزدحم ↓
تقليديا ، تترجم نماذج VLA التعليمات مباشرة إلى حركة روبوتية. 🦾 يمكن ل Gemini Robotics 1.5 الآن التفكير قبل اتخاذ إجراء ، وتوليد تسلسل داخلي للتفكير باستخدام اللغة الطبيعية. هذا يجعل إجراءات الروبوت أكثر قابلية للتفسير ، ويفتح مهام أكثر فائدة - مثل تنظيم الغسيل حسب اللون. ↓
ماذا يحدث عندما تطلب من الروبوت "حزم حقيبة لرحلتي إلى لندن"؟ 🧳 يمكنه البحث عن الطقس ، والتفكير في ما يجب حزمه ، ومن أين تحصل عليه ، وكيفية تعبئته. في هذه العملية ، يمكن للنموذج تقسيم المهام الطويلة إلى مهام أبسط ويكون قابلا للتكيف مع التغييرات في بيئته. ↓
تأتي الروبوتات بجميع الأشكال والأحجام ، بأشكال واستشعار ودرجات مختلفة من الحرية. 💡 يمكن ل Gemini Robotics 1.5 التعلم عبر تجسيدات مختلفة ويمكنها نقل المعرفة المكتسبة من روبوت إلى آخر دون الحاجة إلى التخصص.
نحن الآن نتجاوز النماذج التي تتفاعل مع التعليمات الفردية وننشئ أنظمة يمكنها حقا معالجة المشكلات بطريقة عامة - على الطريق نحو حل الذكاء الاصطناعي العام في العالم المادي. يمكن للمطورين الآن استخدام Gemini Robotics-ER 1.5 عبر Gemini API في @GoogleAIStudio. اكتشف المزيد →
‏‎558.3‏K