गूगल ने उन्नत रोबोट विकसित करने के लिए नए एआई तरीके किए पेश
By : hashtagu, Last Updated : January 5, 2024 | 12:30 pm
तकनीकी दिग्गज ने वास्तविक दुनिया के रोबोट डेटा संग्रह, गति और सामान्यीकरण को बेहतर बनाने के लिए ऑटोआरटी, सारा-आरटी और आरटी-ट्रैजेक्टरी सिस्टम का अनावरण किया।
“हम रोबोटिक्स अनुसंधान में प्रगति की एक श्रृंखला की घोषणा कर रहे हैं जो हमें इस भविष्य के एक कदम करीब लाती है। गूगल डीममाइंड टीम ने एक बयान में कहा, ऑटोआरटी, एसएआरए-आरटी और आरटी-ट्रैजेक्टरी हमारे ऐतिहासिक रोबोटिक्स ट्रांसफॉर्मर पर आधारित हैं, जो रोबोटों को तेजी से निर्णय लेने और उनके वातावरण को बेहतर ढंग से समझने और नेविगेट करने में मदद करते हैं।
ऑटोआरटी बड़े फाउंडेशन मॉडल की क्षमता का उपयोग करता है जो ऐसे रोबोट बनाने के लिए महत्वपूर्ण है, जो व्यावहारिक मानव लक्ष्यों को समझ सकते हैं।
टीम ने कहा, अधिक अनुभवात्मक प्रशिक्षण डेटा एकत्र करके ऑटोआरटी वास्तविक दुनिया के लिए रोबोट को बेहतर प्रशिक्षित करने के लिए रोबोटिक सीखने में मदद कर सकता है।
ऑटोआरटी एलएलएम या विज़ुअल लैंग्वेज मॉडल (वीएलएम), और रोबोट कंट्रोल मॉडल (आरटी-1 या आरटी-2) जैसे बड़े फाउंडेशन मॉडल को जोड़कर एक सिस्टम बनाता है जो नए वातावरण में प्रशिक्षण डेटा इकट्ठा करने के लिए रोबोट तैनात कर सकता है।
टीम ने सूचित किया कि सात महीनों में व्यापक वास्तविक दुनिया के मूल्यांकन में, सिस्टम ने विभिन्न कार्यालय भवनों में एक साथ 20 रोबोट और कुल मिलाकर 52 अद्वितीय रोबोटों को सुरक्षित रूप से व्यवस्थित किया, जिसमें 6,650 अद्वितीय कार्यों में 77,000 रोबोट परीक्षणों से युक्त एक विविध डेटासेट एकत्र किया गया।
रोबोटिक्स ट्रांसफार्मर (एसएआरए-आरटी) प्रणाली के लिए सेल्फ-एडेप्टिव रोबस्ट अटेंशन रोबोटिक्स ट्रांसफार्मर (आरटी) मॉडल को अधिक कुशल संस्करणों में परिवर्तित करता है।
डीपमाइंड टीम ने कहा,“छवियों का संक्षिप्त इतिहास प्रदान किए जाने के बाद सर्वश्रेष्ठ एसएआरए-आरटी-2 मॉडल आरटी-2 मॉडल की तुलना में 10.6 प्रतिशत अधिक सटीक और 14 प्रतिशत तेज़ थे। हमारा मानना है कि यह बिना किसी गुणवत्ता हानि के कम्प्यूटेशनल सुधार प्रदान करने वाला पहला स्केलेबल ध्यान तंत्र है।”
जब टीम ने एसएआरए-आरटी को अरबों मापदंडों के साथ अत्याधुनिक आरटी-2 मॉडल में लागू किया, तो इसके परिणामस्वरूप तेजी से निर्णय लेने और रोबोटिक कार्यों की एक विस्तृत श्रृंखला पर बेहतर प्रदर्शन हुआ।
आरटी-ट्रैजेक्टरी नामक एक अन्य मॉडल स्वचालित रूप से दृश्य रूपरेखा जोड़ता है, जो प्रशिक्षण वीडियो में रोबोट गति का वर्णन करता है।
आरटी-प्रक्षेपवक्र प्रत्येक वीडियो को एक प्रशिक्षण डेटासेट में लेता है और कार्य करते समय इसे रोबोट आर्म के ग्रिपर के 2डी प्रक्षेपवक्र स्केच के साथ ओवरले करता है।
गूगल ने कहा, “आरजीबी छवियों के रूप में ये प्रक्षेपवक्र, मॉडल को निम्न-स्तरीय, व्यावहारिक दृश्य संकेत प्रदान करते हैं क्योंकि यह अपनी रोबोट-नियंत्रण नीतियों को सीखता है।”
जब प्रशिक्षण डेटा में अनदेखे 41 कार्यों पर परीक्षण किया गया, तो आरटी-ट्रेजेक्टरी द्वारा नियंत्रित एक हाथ ने मौजूदा अत्याधुनिक आरटी मॉडल के प्रदर्शन को दोगुना से अधिक कर दिया: इसने आरटी-2 के लिए 29 प्रतिशत की तुलना में 63 प्रतिशत की कार्य सफलता दर हासिल की।
टीम के अनुसार,“आरटी-प्रक्षेपवक्र वांछित कार्यों के मानव प्रदर्शनों को देखकर प्रक्षेप पथ भी बना सकता है, और यहां तक कि हाथ से तैयार किए गए रेखाचित्रों को भी स्वीकार कर सकता है। और इसे विभिन्न रोबोट प्लेटफार्मों के लिए आसानी से अनुकूलित किया जा सकता है।”