Google DeepMind ने गुरुवार को अपने गेमिंग-केंद्रित कृत्रिम बुद्धिमत्ता एजेंट की अगली पीढ़ी को पेश किया है, जिसे स्केलेबल इंस्ट्रक्शनल मल्टीवर्ल्ड एजेंट या SIMA 2 के रूप में जाना जाता है। उन्नत प्रणाली मार्च 2024 में लॉन्च किए गए पहले संस्करण पर आधारित है और तर्क, अनुकूलनशीलता और उपयोगकर्ता इंटरैक्शन में उल्लेखनीय लाभ लाती है। कंपनी का कहना है कि एजेंट लगातार सीखता है और अपने खेल से अधिक सक्षम बन जाता है।
SIMA 2 कैसे काम करता है?
इट्स में घोषणाडीपमाइंड ने इस बात पर प्रकाश डाला कि SIMA 2 अब अपने कार्यों पर विचार कर सकता है और किसी कार्य को पूरा करने के लिए आवश्यक चरणों के बारे में सोच सकता है। एजेंट Google के जेमिनी मॉडल द्वारा संचालित है और इसे मानव द्वारा जारी निर्देशों का पालन करने, जो पूछा गया है उसे समझने और स्क्रीन पर दिखाई देने वाले आभासी वातावरण के आधार पर अपनी अगली चाल की योजना बनाने के लिए डिज़ाइन किया गया है।
सिस्टम उपयोगकर्ता-परिभाषित लक्ष्य के साथ त्रि-आयामी गेम की दुनिया से दृश्य इनपुट प्राप्त करता है, जैसे “एक आश्रय बनाएं” या “लाल घर ढूंढें”। फिर यह उस लक्ष्य को छोटी-छोटी क्रियाओं के अनुक्रम में तोड़ देता है और उन्हें कीबोर्ड और माउस के समान नियंत्रणों का उपयोग करके निष्पादित करता है।
SIMA 2 क्या कर सकता है?
कंपनी के अनुसार, सबसे महत्वपूर्ण प्रगति में से एक है सिमा 2 उन खेलों में काम करने की बेहतर क्षमता जिनका पहले कभी सामना नहीं हुआ था। डीपमाइंड ने नए वातावरणों में एजेंट का परीक्षण किया, जैसे कि Minecraft का एक अनुसंधान अनुकूलन, Minedojo, और ASKA, एक वाइकिंग-थीम वाला उत्तरजीविता गेम। दोनों ही मामलों में, SIMA 2 ने पिछले संस्करण की तुलना में उच्च सफलता दर प्रदान की।
सिस्टम मल्टीमॉडल संकेतों को भी संभालता है, जिसमें स्केच, इमोजी और कई भाषाएं शामिल हैं। यह एक खेल में सीखी गई अवधारणाओं को दूसरे खेल में लागू कर सकता है। उदाहरण के लिए, सैंडबॉक्स दुनिया में खनन की समझ एक अलग अस्तित्व सेटिंग में कटाई को समझने में मदद कर सकती है।
SIMA 2 को कैसे प्रशिक्षित किया जाता है?
गूगल का कहना है कि दूसरी पीढ़ी के एजेंट मानव प्रदर्शन डेटा के मिश्रण और जेमिनी मॉडल से स्वचालित रूप से उत्पन्न एनोटेशन का उपयोग करके प्रशिक्षित किया जाता है। जब SIMA 2 एक ताज़ा वातावरण में एक नया आंदोलन या कौशल सीखता है, तो उस अनुभव को पकड़ लिया जाता है और प्रशिक्षण पाइपलाइन में वापस भेज दिया जाता है। डीपमाइंड का कहना है कि इससे मानव-लेबल वाले उदाहरणों पर निर्भरता कम हो जाती है और एजेंट को समय के साथ खुद को परिष्कृत करने की अनुमति मिलती है।
SIMA 2 की सीमाएँ क्या हैं?
प्रगति के बावजूद, सिस्टम में अभी भी उल्लेखनीय सीमाएँ हैं। पिछली बातचीत की स्मृति प्रतिबंधित है, लंबी दूरी का तर्क जिसके लिए कई चरणों की आवश्यकता होती है वह कठिन है, और रोबोटिक संयुक्त आंदोलनों के समान सटीक निम्न-स्तरीय नियंत्रण को वर्तमान ढांचे में संबोधित नहीं किया गया है।
वास्तविक दुनिया के रोबोटिक्स की ओर एक रास्ता
डीपमाइंड इस बात पर जोर देता है कि SIMA 2 का उद्देश्य गेमिंग सहायक नहीं है। इसके बजाय, कंपनी त्रि-आयामी गेम दुनिया को एआई एजेंटों के लिए एक उपयोगी परीक्षण मैदान के रूप में देखती है जो अंततः वास्तविक दुनिया के रोबोटों को नियंत्रित कर सकती है। व्यापक उद्देश्य विकास करना है सामान्य प्रयोजन मशीनें जो प्राकृतिक भाषा निर्देशों का पालन कर सकता है और जटिल भौतिक सेटिंग्स में विभिन्न प्रकार के कार्यों को संभाल सकता है, Google पर प्रकाश डालता है।



