(ब्लूमबर्ग) – चैट प्रतिक्रियाओं में कृत्रिम बुद्धिमत्ता सहायक कितने आश्वस्त लग सकते हैं, यदि आप उनसे कई पाठ वाक्यांशों वाली एक छवि बनाने के लिए कहते हैं, तो संभावना है कि परिणामी इमेजरी में कुछ टाइपो या विकृत फ़ॉन्ट होंगे।
कुछ मॉडल समय के साथ इसमें बेहतर हो गए हैं, लेकिन वे लगातार विश्वसनीय नहीं हैं – जिससे पेशेवरों के लिए डिज़ाइन टूल के रूप में उनकी क्षमता सीमित हो गई है।
गुरुवार को, अल्फाबेट इंक के Google ने एक नए छवि-उत्पादन और संपादन मॉडल की घोषणा की, जिसके बारे में उसका कहना है कि यह समस्या का समाधान करता है। यह उपभोक्ताओं और विज्ञापनदाताओं को सटीक रूप से जटिल ग्राफिक्स और आरेख तैयार करने के लिए अपने नवीनतम टूल का उपयोग करने के लिए राजी करने की उम्मीद कर रहा है।
Google ने एक ब्लॉग पोस्ट में कहा, नया इमेज मॉडल, नैनो बनाना प्रो, कई भाषाओं में अधिक सटीक और सुपाठ्य टेक्स्ट के साथ बेहतर दृश्य उत्पन्न कर सकता है। ये सुधार मंगलवार को जारी कंपनी के एआई मॉडल के नवीनतम संस्करण जेमिनी 3 द्वारा संभव हुए, जिसके बारे में कंपनी का कहना है कि यह तर्क और कोडिंग क्षमता में “भारी उछाल” का प्रतिनिधित्व करता है। इस अपडेट का निवेशकों ने गर्मजोशी से स्वागत किया, जिन्होंने बुधवार को अल्फाबेट के शेयरों को रिकॉर्ड ऊंचाई पर पहुंचा दिया।
गुरुवार की घोषणा खोज दिग्गज द्वारा अपनी एआई तकनीक का मुद्रीकरण करने के नवीनतम प्रयास का प्रतीक है। Google ने कहा कि दुनिया भर में उसके मुफ्त जेमिनी उत्पाद के उपयोगकर्ता कोटा के साथ नए नैनो बनाना प्रो मॉडल का उपयोग कर सकेंगे, जिसके बाद वे पुराने मॉडल पर वापस लौट आएंगे। सशुल्क एआई योजनाओं के सदस्यों के लिए उच्च सीमा होगी। मॉडल को कुछ लोकप्रिय डिज़ाइन टूल के साथ भी एकीकृत किया गया है, जिसमें कैनवा, फिगमा और एडोब इंक के फ़ायरफ़्लाई और फ़ोटोशॉप शामिल हैं।
Google के एक प्रवक्ता ने कहा कि नैनो बनाना प्रो मॉडल अंतिम छवि प्रस्तुत करने से पहले टेक्स्ट प्लेसमेंट, इसकी फ़ॉन्ट विशेषताओं और अन्य छवि तत्वों के साथ स्थानिक संबंध की योजना बनाने में बेहतर है। उदाहरण के लिए, प्रौद्योगिकी किसी रेसिपी के पाठ को सचित्र प्रवाह चार्ट के रूप में दोबारा तैयार करने में मदद कर सकती है, या मौसम या खेल जैसी वास्तविक समय की जानकारी की कल्पना कर सकती है, कंपनी ने ब्लॉग पोस्ट में कहा।
उन ब्रांडों के लिए जो नए विपणन अभियानों पर विचार-मंथन करते समय अपने स्वयं के डिज़ाइन को शामिल करना चाहते हैं, मॉडल उपयोगकर्ताओं से 14 संदर्भ छवियां ले सकता है और इनपुट सामग्रियों की विशेषताओं को बनाए रखते हुए उन्हें टेक्स्ट प्रॉम्प्ट में वर्णित नए परिदृश्यों में व्यवस्थित कर सकता है, कंपनी ने कहा।
उपयोगकर्ता प्रॉम्प्ट में किसी भी पसंदीदा कैमरा कोण, क्षेत्र की गहराई, रंग ग्रेडिंग और पहलू अनुपात को निर्दिष्ट करके छवि को और परिष्कृत कर सकते हैं, जैसे कि वे कैमरे से छवि कैप्चर कर रहे हों।
गुरुवार की घोषणाओं के हिस्से के रूप में, Google ने यह भी कहा कि उपयोगकर्ता जेमिनी ऐप पर एक छवि अपलोड कर सकते हैं और पूछ सकते हैं कि क्या यह Google AI द्वारा बनाई गई थी। इसमें ऑडियो और वीडियो को शामिल करने के लिए जल्द ही उस क्षमता का विस्तार करने की योजना है। Google वर्तमान में अपने AI टूल के साथ बनाए गए सभी मीडिया के लिए एक अगोचर डिजिटल वॉटरमार्क एम्बेड करता है, साथ ही फ्री या प्रो टियर उपयोगकर्ताओं द्वारा बनाई गई छवियों के लिए एक दृश्यमान वॉटरमार्क भी एम्बेड करता है। वह दृश्यमान वॉटरमार्क उन लोगों के लिए हटा दिया जाता है जो सबसे महंगे अल्ट्रा प्लान की सदस्यता लेते हैं।
इस तरह की और भी कहानियाँ उपलब्ध हैं ब्लूमबर्ग.कॉम



