كشفت جوجل ديب مايند هذا الأسبوع عن نموذج جديد للذكاء الاصطناعي، Gemini Robotics-ER 1.6، يعزز بشكل كبير قدرات الروبوتات في عمليات الفحص الصناعي. يرفع النموذج دقة الروبوت في قراءة المقاييس التناظرية من 23% إلى 98%، وفقًا لجوجل ديب مايند، مما يمثل قفزة كبيرة في إدارة المرافق الذاتية. يمكن لهذا التقدم أن يعيد تعريف كيفية مراقبة المصانع والمستودعات للمعدات الحيوية.
يمثل أحدث إصدار من جوجل ديب مايند، Gemini Robotics-ER 1.6، أكثر من مجرد ترقية هامشية؛ فهو يقدم ما تسميه الشركة "الرؤية العاملة" (agentic vision). تجمع هذه الميزة بين الاستدلال البصري والقدرة على تنفيذ التعليمات البرمجية، مما يخلق "لوحة مسودة بصرية" للروبوتات لتحليل وتفسير الصور المعقدة. هنا يبرز النموذج حقًا. حقق نموذج Gemini Robotics-ER 1.5 السابق دقة 23 بالمائة فقط في مهام قراءة الأدوات.
يصل النموذج الجديد، المزود بالرؤية العاملة، إلى 98 بالمائة، حسبما ذكرت Ars Technica في 17 أبريل. بدون الرؤية العاملة، لا يزال نموذج Gemini Robotics-ER 1.6 الأساسي يقدم معدل دقة 86 بالمائة، وهو تحسن ملحوظ عن سابقاته. يشير هذا إلى بنية أساسية قوية، حتى قبل التحسينات المتخصصة.
السوق يخبرك بشيء. استمع. تتيح هذه الدقة المتزايدة للروبوتات مثل Spot رباعي الأرجل من بوسطن ديناميكس إجراء عمليات فحص بصري للمرافق الصناعية باستقلالية أكبر.
يخضع Spot حاليًا للتجارب كـ مفتش روبوتي، يتنقل في المصانع والمستودعات، ويراقب كل شيء بدءًا من مقاييس الضغط وصولًا إلى مستويات السوائل في زجاجات الرؤية. تتطلب هذه المهام "استدلالًا بصريًا معقدًا"، وفقًا لجوجل ديب مايند، لتفسير الإبر المتعددة، وحدود الحاويات، وعلامات التدريج، والنصوص المضمنة. لطالما كانت القدرة على معالجة هذه المعلومات البصرية المتنوعة بدقة عقبة رئيسية أمام الانتشار الواسع للروبوتات في البيئات الصناعية الديناميكية وغير المنظمة.
هذا التغيير مهم. أعربت بوسطن ديناميكس، المملوكة لمجموعة هيونداي موتور، عن اهتمام كبير بنشر كل من الروبوتات رباعية الأرجل والروبوتات الشبيهة بالبشر داخل مصانعها للسيارات ومواقع صناعية أخرى. يدعم التعاون مع جوجل ديب مايند بشأن نموذج Gemini Robotics-ER 1.6 هذا الطموح بشكل مباشر.
لطالما تفوقت الروبوتات تاريخيًا في المهام المتكررة والمتخصصة للغاية ضمن بيئات محكومة، مثل خطوط التجميع. كفاءتها في هذه الأدوار لا يمكن إنكارها. ومع ذلك، ظل الطموح لعمال روبوتيين "أحرار الحركة"، قادرين على العمل في بيئات واقعية أقل قابلية للتنبؤ، مجرد طموح إلى حد كبير حتى الآن.
هذا النموذج الجديد يدفع هذا الحد. يوضح تفصيل ملموس حيوي قدمته جوجل ديب مايند فهم النموذج المحسن. في اختبار، حدد Gemini Robotics-ER 1.6 بشكل صحيح عدد المطارق، والمقصات، وفرش الدهان، والكماشات، وأدوات البستنة المتنوعة ضمن صورة مزدحمة.
نموذج Gemini Robotics-ER 1.5 الأقدم، على النقيض، واجه صعوبة. فقد فشل في عد المطارق أو فرش الدهان بدقة، وتجاهل المقصات تمامًا، وحدد خطأً عربة يد غير موجودة لأنها كانت أحد العناصر المطلوبة. يشير هذا إلى ميل منخفض لـ "الهلوسة"، وهو تحدٍ شائع في نماذج الذكاء الاصطناعي السابقة حيث تولد الأنظمة معلومات معقولة ولكنها غير صحيحة.
هذه خطوة حاسمة إلى الأمام. إلى جانب الدقة البصرية، تصف جوجل ديب مايند أيضًا Gemini Robotics-ER 1.6 بأنه "نموذج الروبوتات الأكثر أمانًا حتى الآن." تدعي الشركة أنه يمتلك "قدرة محسنة بشكل كبير على الالتزام بقيود السلامة المادية." هذا يعني أن الروبوتات يمكنها الآن اتباع تعليمات السلامة بشكل أفضل واتخاذ قرارات أكثر أمانًا عند التعامل مع المواد أو السوائل. يمكن للنموذج أيضًا إدراك خطر الإصابة البشرية بدقة أكبر في سيناريوهات مختلفة، مثل تفاعل طفل صغير مع مقبس كهربائي.
جانب السلامة هذا ليس مجرد إضافة؛ بل هو أساسي لقبول أوسع من الجمهور والصناعة. هذا هو الرقم المهم: القفزة من دقة 23% إلى 98%. تخلص من الضوضاء وستجد أن القصة أبسط مما تبدو.
هذا التقدم في الأداء يحول الحسابات الاقتصادية للأتمتة الصناعية. في السابق، كانت الحاجة إلى إشراف بشري للتحقق من قراءات الروبوت تحد من عائد الاستثمار لأنظمة الفحص الذاتي. مع دقة شبه مثالية، يمكن للشركات تقليل التدخل البشري، مما يؤدي إلى وفورات كبيرة في التكاليف التشغيلية وتحسين موثوقية البيانات.
هذا يمكن أن يسرع تبني المفتشين الروبوتيين عبر القطاعات، من الطاقة إلى التصنيع، حيث تكون المراقبة الدقيقة والمتسقة أمرًا بالغ الأهمية. بالنسبة للاقتصادات الناشئة، وخاصة تلك الموجودة في الجنوب العالمي، تقدم هذه التكنولوجيا منظورًا ذا حدين. فمن ناحية، توفر مسارًا لتحديث البنية التحتية الصناعية بسرعة وتحسين معايير السلامة دون الاستثمار الذي يستغرق عقودًا في تدريب رأس المال البشري المطلوب لأدوار الفحص المتخصصة للغاية.
يمكن للمصانع في الدول سريعة التصنيع أن تتجاوز طرق الفحص القديمة والأكثر كثافة في العمالة. من ناحية أخرى، يمكن أن تؤدي مكاسب الكفاءة إلى إزاحة شريحة من القوى العاملة المنخرطة حاليًا في هذه المهام، مما يستلزم استراتيجيات استباقية لإعادة تأهيل المهارات وخلق فرص عمل جديدة. هذا يتطلب دراسة متأنية.
تمتد الأهمية الأوسع لـ Gemini Robotics-ER 1.6 إلى ما هو أبعد من مجرد قراءة المقاييس. إنه يشير إلى نضج في قدرة الذكاء الاصطناعي على التفاعل مع العالم المادي بطريقة دقيقة. لطالما كان "الاستدلال المتجسد" (Embodied reasoning)، وهو قدرة الذكاء الاصطناعي على فهم بيئته المادية والتفاعل معها، هدفًا مقدسًا لباحثي الروبوتات. تعزز قدرة النموذج المحسنة على "الاستدلال متعدد الرؤى" (multi-view reasoning)، التي تسمح لنظام روبوتي باستخدام تدفقات كاميرا متعددة لفهم بيئي أكثر شمولاً، هذا الاتجاه بشكل أكبر.
هذا يمثل تحولًا أساسيًا. - يعزز نموذج Gemini Robotics-ER 1.6 دقة قراءة الروبوت للمقاييس من 23% إلى 98% بفضل "الرؤية العاملة". - تختبر بوسطن ديناميكس نموذج الذكاء الاصطناعي هذا في البيئات الصناعية لتمكين الروبوتات مثل Spot من إجراء عمليات فحص ذاتية. - يعزز النموذج الجديد بشكل كبير سلامة الروبوت، ويحسن الالتزام بالقيود المادية وإدراك إصابة الإنسان. - يمكن لهذا التقدم أن يسرع تبني العمال الروبوتيين "أحرار الحركة" ويعيد تشكيل التكاليف التشغيلية الصناعية عالميًا. ستتضح القيمة العملية لهذا النموذج مع اكتساب شركات الروبوتات والمؤسسات البحثية المزيد من الخبرة العملية بقدراته. ترقبوا برامج تجريبية تتوسع إلى ما بعد التجارب الأولية، خاصة في القطاعات ذات الأعباء التنظيمية العالية أو البيئات الخطرة.
ستتضمن المرحلة التالية تقييم أدائه في مجموعة أوسع من السيناريوهات الواقعية، بما في ذلك ظروف الإضاءة المتغيرة وأنواع الأدوات. علاوة على ذلك، سيراقب المراقبون التأثير الاقتصادي على أسواق العمل العالمية والوتيرة التي تندمج بها هذه الروبوتات المتطورة في القوى العاملة البشرية والروبوتية الحالية. بدأت التداعيات طويلة الأمد على الكفاءة والسلامة الصناعية للتو في الظهور.
نقاط رئيسية
— - يعزز نموذج Gemini Robotics-ER 1.6 دقة قراءة الروبوت للمقاييس من 23% إلى 98% بفضل "الرؤية العاملة".
— - تختبر بوسطن ديناميكس نموذج الذكاء الاصطناعي هذا في البيئات الصناعية لتمكين الروبوتات مثل Spot من إجراء عمليات فحص ذاتية.
— - يعزز النموذج الجديد بشكل كبير سلامة الروبوت، ويحسن الالتزام بالقيود المادية وإدراك إصابة الإنسان.
— - يمكن لهذا التقدم أن يسرع تبني العمال الروبوتيين "أحرار الحركة" ويعيد تشكيل التكاليف التشغيلية الصناعية عالميًا.
المصدر: Ars Technica
