OpenAI का सबसे हालिया मल्टीमॉडल AI मॉडल, GPT-4o, जारी किया गया है और इसे उपयोगकर्ताओं को बिना किसी शुल्क के दिया जाएगा। मॉडल की टेक्स्ट, ऑडियो और छवि इनपुट के किसी भी संयोजन को प्राप्त करने और टेक्स्ट, ऑडियो और छवि आउटपुट के किसी भी संयोजन का उत्पादन करने की क्षमता इसे अद्वितीय बनाती है। हालाँकि यह “बहुत तेज़ है और पाठ, ध्वनि और दृष्टि में अपनी क्षमताओं में सुधार करता है,” OpenAI का दावा है कि इसमें GPT-4 के बराबर बुद्धिमत्ता है। इसके अतिरिक्त, ओपनएआई का दावा है कि आवाज की प्रतिक्रिया के लिए लगने वाला समय मनुष्यों के बराबर है।
डेवलपर्स को एपीआई के माध्यम से जीपीटी-4ओ तक भी पहुंच प्राप्त होगी; ऐसा कहा जाता है कि यह GPT-4 टर्बो से आधी लागत और दोगुना तेज़ है। हालाँकि GPT-4o की क्षमताएँ स्वतंत्र रूप से पहुँच योग्य हैं, प्रीमियम उपयोगकर्ताओं के पास क्षमता सीमा से पाँच गुना अधिक तक पहुँच है।
ChatGPT-4o में प्रदर्शित होने वाली पहली विशेषताएँ पाठ और छवि क्षमताएँ हैं; शेष सुविधाएँ धीरे-धीरे जोड़ी जाएंगी। आने वाले हफ्तों में, OpenAI का इरादा GPT-4o की विस्तारित ऑडियो और वीडियो क्षमताओं को “एपीआई में विश्वसनीय भागीदारों के छोटे समूह” के लिए उपलब्ध कराना है।
Also Read:Delhi Police gets PCR calls: ‘Swati Maliwal speaking, I have been assaulted at CM’s residence
What can GPT-4o do?
[We’ll update this when new capabilities become available]
Text capabilities
advancements in all languages
4o के बारे में ओपनएआई का दावा है, “गैर-अंग्रेजी भाषाओं में टेक्स्ट पर महत्वपूर्ण सुधार के साथ, अंग्रेजी और कोड में टेक्स्ट पर जीपीटी -4 टर्बो प्रदर्शन को पूरा करता है।” चैटजीपीटी 50 से अधिक भाषाओं में उपलब्ध है। बताया गया है कि तेलुगु, तमिल, मराठी, उर्दू, गुजराती और तेलुगु की दक्षता में काफी सुधार हुआ है।
टेक्स्ट इनपुट के आधार पर, मॉडल कैरिकेचर और विभिन्न छवियां तैयार कर सकता है जो एक दृश्य कहानी को चित्रित करती हैं। इसमें टेक्स्ट इनपुट को वांछित टाइपोग्राफी में बदलने की क्षमता भी है।
ऑडियो दक्षता
ऐसा कहा जाता है कि GPT-4o उल्लेखनीय रूप से बेहतर ऑडियो आउटपुट प्रदान करता है। वॉइस मोड को पहले के संस्करणों में शामिल किया गया था, लेकिन यह बहुत कम था
धीमा क्योंकि आउटपुट तीन अलग-अलग मॉडलों का उपयोग करके तैयार किया गया था। यह स्वर, कई स्पीकर, पृष्ठभूमि शोर, या भावना या हँसी की अभिव्यक्ति का पता लगाने में भी असमर्थ था। यह चैटजीपीटी सहयोग में विसर्जन को महत्वपूर्ण रूप से बाधित करता है और अनुभव में बहुत अधिक विलंबता जोड़ता है। हालाँकि, GPT-40 के साथ, यह सब स्वाभाविक रूप से होता है, जैसा कि OpenAI की मुख्य प्रौद्योगिकी अधिकारी मीरा मुराती ने एक लाइव प्रस्तुति के दौरान कहा।
वेबकास्ट के दौरान, OpenAI ने स्पष्ट किया कि GPT-4o भावनाओं का पता लगा सकता है, तुरंत उत्तर दे सकता है और बाधित हो सकता है। उन्होंने यह भी दिखाया कि कैसे 4o का ऑडियो आउटपुट विभिन्न प्रकार के अभिव्यंजक स्वरों में आवाजें उत्पन्न कर सकता है। OpenAI द्वारा जारी एक वीडियो में, 4o को वास्तविक समय में बातचीत करते, आदेशों के जवाब में अपनी आवाज बदलते और वास्तविक समय में अनुवाद करते हुए दिखाया गया है। इसके अतिरिक्त, OpenAI ने ChatGPT वॉयस ऐप प्रस्तुत किया, जो कोडिंग में मदद करता है और डेस्कटॉप सॉफ़्टवेयर पर सहायक के रूप में कार्य करता है। इसने बातचीत और बैठकों का सारांश देकर ब्लॉग पोस्ट में उपयोग के मामले के उदाहरण भी प्रदान किए।
Visual capabilities
यह भी कहा जाता है कि मॉडल ने दृष्टि क्षमताओं को बढ़ाया है, जिससे उपयोगकर्ताओं के बीच वीडियो संचार सक्षम हो गया है। ओपनएआई ने वास्तविक समय में उपयोगकर्ताओं को समस्याओं को हल करने में सहायता करने की मॉडल की क्षमता का प्रदर्शन किया। इसके अतिरिक्त, कहा गया है कि 4o वस्तुओं को पहचान सकता है, उन तक जानकारी पहुंचा सकता है, या उनके साथ जुड़ सकता है। इसका उदाहरण एक वीडियो में दिया गया है जब GPT-40 वस्तुओं को पहचानता है और पाठ का तुरंत स्पेनिश में अनुवाद करता है। इसके अतिरिक्त, OpenAI ने दिखाया कि डेस्कटॉप ऐप पर 4o डेस्कटॉप ऐप पर डेटा का विश्लेषण कर सकता है।
.How safe is GPT-4o?
मुराती ने कहा, “जब सुरक्षा की बात आती है तो GPT-40 हमारे लिए नई चुनौतियाँ पेश करता है, क्योंकि हम वास्तविक समय ऑडियो, वास्तविक समय दृष्टि से निपट रहे हैं।” OpenAI ने दावा किया कि उसके तैयारी ढांचे के आधार पर मूल्यांकन के अनुसार GPT-4o साइबर सुरक्षा, रासायनिक, जैविक, रेडियोलॉजिकल और परमाणु (CBRN) जानकारी, अनुनय और मॉडल स्वायत्तता के लिए मध्यम जोखिम से ऊपर स्कोर नहीं करता है। उन्होंने स्वीकार किया कि GPT-4o की ऑडियो क्षमताएं अद्वितीय जोखिम पेश करती हैं। इस प्रकार, ऑडियो आउटपुट लॉन्च के समय पूर्व निर्धारित आवाज़ों के चयन तक सीमित होंगे।
OpenAI ने पिछले महीने में कई सुविधाएँ पेश की हैं, जिसमें ChatGPT प्लस उपयोगकर्ताओं के लिए एक ‘मेमोरी’ सुविधा भी शामिल है, जो AI मॉडल को उपयोगकर्ताओं द्वारा बातचीत के दौरान प्रदान की गई जानकारी को याद रखने की अनुमति देती है। सुविधा को वैयक्तिकरण सेटिंग्स में चालू या बंद किया जा सकता है और रिकॉर्ड की गई यादों को उसी वैयक्तिकरण सेटिंग टैब से हटाकर ‘भूल’ दिया जा सकता है। फरवरी में, कंपनी ने घोषणा की कि वे DALL·E 3 का उपयोग करके वेब पर चैटजीपीटी और अन्य ओपनएआई एपीआई सेवाओं द्वारा उत्पन्न सभी छवियों के लिए गठबंधन फॉर कंटेंट प्रोवेनेंस एंड ऑथेंटिसिटी (सी2पीए) मेटाडेटा को शामिल करके उत्पन्न सभी सिंथेटिक छवियों को वॉटरमार्क करेंगे। उपयोगकर्ताओं को इसकी अनुमति दें
जांचें कि क्या छवि कंटेंट क्रेडेंशियल वेरिफाई जैसी वेबसाइटों के माध्यम से ओपनएआई टूल का उपयोग करके बनाई गई थी। इससे पहले, जनवरी में, इसने GPT स्टोर भी लॉन्च किया था, जहाँ उपयोगकर्ता विशिष्ट उपयोग के मामलों के लिए तैयार ChatGPT के कस्टम संस्करण साझा कर सकते थे।
Read More:Zomato share price falls 6% after Q4 results. Opportunity to buy the stock?