Made in India AI Model Hanuman आयआयटी मुंबई आणि इतर सात अभियांत्रिकी संस्थांच्या नेतृत्वाखालील भारत जीपीटी समूहाने मंगळवारी एक मोठी घोषणा केली. भारत जीपीटी पुढील महिन्यात चॅट जीपीटी ला टक्कर देणारे स्वदेशी एआय मॉडलचे अनावरण करणार आहे. रिलायन्स इंडस्ट्रीज लिमिटेड यांच्या नेतृत्वात विज्ञान आणि तंत्रज्ञान विभागाच्या पाठिंब्याने आणि सीथा महालक्ष्मी हेल्थकेअर (एसएमएल) यांच्या सहकार्याने भारतीय भाषेतील एआय लँग्वेज मॉडेल हनुमान तयार करण्यात आले आहे. हे एआय मॉडेल भारतीय वापरकर्त्यांना अगदी स्वस्तात उपलब्ध होण्याची शक्यता आहे.

एआय मॉडेल ‘हनुमान’ नक्की काय आहे?

‘हनुमान’ हे लार्ज लँग्वेज मॉडेल (एलएलएम) आहे. हिंदी, तमिळ आणि मराठी सारख्या ११ भारतीय भाषांमध्ये हे मॉडेल काम करू शकेल. भविष्यात २० पेक्षा जास्त भाषांमध्ये याचा विस्तार करण्याची योजना आहे. ब्लूमबर्गच्या अहवालानुसार, भारत जीपीटी समूहाने मंगळवारी एका चित्रफितीत विविध लोक वेगवेगळ्या भाषांमध्ये एआय टूलशी संवाद साधताना दाखवले. आरोग्य सेवा, प्रशासन, आर्थिक सेवा आणि शिक्षण या चार क्षेत्रात काम करण्यासाठी एआय मॉडेल ‘हनुमान’ तयार करण्यात आले आहे.

भारत जीपीटीने दिलेल्या माहितीनुसार, हे एक मल्टीमॉडेल एआय टूल आहे. हे मॉडेल भारतीय भाषांमध्ये मजकूर, भाषण, चित्रफित यांसारख्या अनेक गोष्टी तयार करू शकेल. भारत जीपीटीने तयार केलेले विझी जीपीटी वैद्यकीय डेटाचा वापर करून आरोग्यसेवेसाठी तयार केलेले एआय मॉडेल आहे. एआय मॉडेल ‘हनुमान’ची मर्यादा १.५ अब्ज ते तब्बल ४० अब्ज पॅरामीटर्सपर्यंत आहे. एसएमएल चे संस्थापक विष्णु वर्धन यांनी ‘हनुमान’ मॉडेलमध्ये भारतीय भाषांचा डेटासेट तयार करताना आलेल्या आव्हानांबद्दल सांगितले.

भारतीय भाषेचे इतर मॉडेल आहेत का?

भारत जीपीटी व्यतिरिक्त लाइटस्पीड व्हेंचर पार्टनर्स विनोद खोसला यांसारख्या व्हेंचर कॅपिटल (व्हीसी) गुंतवणूकदारांच्या पाठिंब्याने ‘सर्वम’ आणि ‘क्रुत्रिम’ सारख्या विविध स्टार्टअप कंपन्या भारतासाठी एआय मॉडेल तयार करत आहेत, असे ब्लूमबर्गच्या अहवालात सांगण्यात आले आहे.

एलएलएम म्हणजे काय?

लार्ज लँग्वेज मॉडेल याला एलएलएम म्हणतात. मोठ्या प्रमाणात भाषेचा अभ्यास करण्यासाठी लार्ज लँग्वेज मॉडेल सखोल शिक्षण तंत्राचा वापर करते. हे मॉडेल मोठ्या प्रमाणातील मजकुरावर प्रक्रिया करून, त्याची रचना आणि अर्थ समजून घेऊन कार्य करते. एलएलएम ला शब्दांमधील अर्थ आणि संबंध ओळखण्यासाठी प्रशिक्षित केले जाते. मॉडेलला जितका जास्त प्रशिक्षण डेटा दिला जातो तितके त्याच्यासाठी फायद्याचे ठरते. मोठा मजकूर समजून घेत, एखादी गोष्ट योग्यरित्या तयार करण्यात मॉडेल अधिक सक्षम होते. प्रशिक्षण डेटा हा एक मोठा डेटासेट असतो. विकिपीडिया, ओपनवेबटेक्स्ट आणि कॉमन क्रॉल कॉर्पस यांसारख्या डेटासेटचा यात समावेश असतो. या डेटासेटमध्ये मोठ्या प्रमाणात मजकूर असल्यामुळे मॉडेल भाषा समजून घेण्यासाठी आणि तयार करण्यासाठी याचा वापर करते.

हेही वाचा : मॉरिशसमध्ये अख्खे जहाजच केले क्वारंटाईन; ३,००० हून अधिक लोक अडकले समुद्रात; नेमके प्रकरण काय?

विशेष म्हणजे एआय मॉडेल ‘हनुमान’ ग्राहकांना स्पीच टू टेक्स्टसारख्या सुविधाही देणार आहे. स्वदेशी एआय मॉडेल ‘हनुमान’ यशस्वी ठरल्यास भारतासाठी ही आणखी एक उपलब्धी असेल. भारतीय वापरकर्ते चॅट जीपीटी आणि ओपन एआयवर अवलंबून राहणार नाही. खिशाला परवडणारे आणि स्वदेशी भाषा असलेले एआय मॉडेल नक्कीच वापरकर्त्यांसाठी वरदान ठरेल.