|| हृषिकेश दत्ताराम शेर्लेकर

कृत्रिम प्रज्ञा (एआय) म्हणजे नक्की काय, याची चर्चा केली. आता त्याच्या पुढील पायऱ्या तसेच लर्निगचे विविध प्रकार याची माहितीही उद्बोधक अशीच आहे.

अध्याय दुसरा : अनुभवातून शिकण्याची क्षमता मशीन्समध्ये आणणे. एआय म्हणजे नक्की काय? याचा पहिला भाग मागील लेखात जाणून घेतला. आता यापुढे एआयच्या उर्वरित पायऱ्या बघू आणि त्यापुढे लर्निगचे विविध प्रकार.

पायरी दुसरी (मागील भागावरून चालू)- प्राण्याचे फीचर्स म्हणजे रंगसंगती (आरजीबी पिक्सेल मॅप), चेहऱ्याचा आकार, नाक व डोळ्यांमधील अंतर, जबडय़ाचा आकार, कानांचा आकार, शरीर रूपरेषा, बाह्य़ आराखडा इत्यादी फोटोंची आरजीबी संख्या हा एकच फीचर आपण सोप्या स्पष्टीकरणासाठी घेणार आहोत. गुगल, मायक्रोसॉफ्ट, आयबीएम कॉम्प्युटर व्हिजनसारखी प्री-ट्रेंड मॉडेल्स प्रतिमेतील वस्तू ओळखणे यासाठी लाखो फीचर्स गुणिले अब्जावधी उदाहरणे वापरतात, ज्याला कोन्वोलुशनल नुएरल नेटवर्क म्हणतात.

तर एक डिजिटल फोटो अनेक आरजीबी पिक्सेलनी बनलेला असतो. आपली ठिपक्यांची रांगोळी नजरेसमोर आणा. आरजीबी म्हणजे लाल, हिरवा व नील असे मूलभूत रंग. पिक्सेल म्हणजे स्क्रीनवरील सर्वात सूक्ष्म बिंदू. याला डीपीआयदेखील म्हणतात. साधा पासपोर्ट फोटो हा सहाशे बाय सहाशे पिक्सेल्सनी बनलेला असतो. फोरके टीव्हीमध्ये हीच पिक्सेल्स ३८४० बाय २१६० पर्यंत असतात. जेवढी जास्त पिक्सेल्स, ठिपके तेवढा सुस्पष्ट फोटो. प्रत्येक पिक्सेलला एक आरजीबी संख्या असते. लाल, हिरवा व नील यांचे एक विशिष्ट मिश्रण व त्याचा नंबर. जसे गर्द जांभळा = १४८.०,२११ या आरबीजी नंबर मॅट्रिक्सला एका वेक्टर नंबरमध्ये दर्शविता येते. म्हणजेच सोप्या भाषेत एका फोटोचे एका आकडय़ात, संख्येमध्ये रूपांतर करता येते. असे हजार वेळा केल्यास आपल्याकडे हजार फोटोंच्या हजार आरजीबी संख्या असतील, क्ष१ = (व्ही१, व्ही२.., व्ही१०००) आणि य = (० किंवा १) पण आहेतच प्रत्येक फोटोसाठी. या पायरीमध्ये आपण फोटोंचे रूपांतर संख्येत केले, जे संगणकाला समजू शकेल.

पायरी तिसरी – ट्रेनिंग व टेस्टिंग डेटासेट – उपलब्ध उदाहरणामधून काही भाग प्रशिक्षण संच व उरलेला चाचणी संच असा विभाजणे. जसे हजार फोटोमधील सहाशे प्रशिक्षण संच म्हणून घेऊ. चारशे चाचणीसाठी.

पायरी चौथी – मशीन लर्निग मॉडेल निर्मितीवरील प्रशिक्षण संच विविध आल्गोरिथम्स वापरून सर्वात योग्य असे फिटिंग शोधणे, संख्याशास्त्र संकल्पनेवर आधारित. सोप्या भाषेत सांगायचे तर वरील सहाशे फोटो नंबर (क्ष१) आणि (य) एका द्विमिती आलेखात मांडू. त्यावरील ठिबक्यांचे दोन गटांत वर्गीकरण झालेले दिसेल, अशा आलेखावरील ठिपक्यांच्या समूहांना, गठ्ठय़ांना सीमा केल्यास दोन कुंपणरेषा बनतील. त्यास लर्निग मॉडेल म्हणू. एक गठ्ठा असेल सिंहाच्या फोटोंचा, दुसरा इतर प्राण्यांच्या फोटोंचा.

पायरी पाचवी – मॉडेल टेस्टिंग – वरील चारशे फोटोंचा संच आपण चाचणी संच म्हणून वेगळा ठेवला होता. तोच वरील आलेखावर मांडल्यावर काही नवीन ठिपके कुंपणरेषेच्या आत पडतील, काही बाहेर. जितके जास्त आत तेवढे मॉडेल अचूक. बाहेर पडलेले सर्व नवीन ठिपके नवीन कुंपणरेषा बनवून आत घेतल्यास मॉडेल अधिकाधिक अचूक होत जाईल. चारशेपैकी जितके ठिपके चुकीच्या गठ्ठय़ात किंवा दोन्हीही गठ्ठय़ाच्या बाहेर पडले भागिले चारशे म्हणजे चुकीची टक्केवारी (एरर %). दर खेपेला ही टक्केवारी कमी करत जायची. नवीन उदाहरणे व योग्य फीचर्स वापरून. हेच एआयचे सर्वात महत्त्वाचे वैशिष्टय़ आहे. यालाच लर्न, शिकणे म्हणतात, जसे मनुष्य शिकतो तसेच.

पायरी सहावी – मॉडेल प्रत्यक्ष वापरात आणणे, नवीन नवीन डेटा संचातून मॉडेल अधिक अचूक होत असते आणि ही शिकण्याची साखळी अविरत सुरू असते, आपल्या मानवी बुद्धिमत्तेसारखी.

सर्वसाधारणपणे, बहुतेक एआय प्रोग्राम्स, प्रोजेक्ट्स वरील मार्गाने निर्माण केले जातात. यापुढे लर्निगचे विविध प्रकार बघू.

१) सुपरवाइस्ड लर्निग

वरील डेटा संचात दिलेली उदाहरणे मनुष्यबळ वापरून आधीच त्याचे विश्लेषण, वर्गीकरण केले होते. एक म्हणजे सिंह, शून्य म्हणजे इतर. प्रश्न + उत्तर = सूत्र मध्ये दोन्ही गोष्टी प्रश्न, उत्तरे जेव्हा आपण संगणकाला पुरवतो त्याला सुपरवाइस्ड लर्निग म्हणतात.

२) अन-सुपरवाइस्ड लर्निग

याच्यात डेटा संचाचे मार्किंग, विश्लेषण केलेले नसते. प्रश्न + उत्तर = सूत्र मध्ये फक्त आपण प्रश्न, माहितीच्या, उदाहरणाच्या स्वरूपात जेव्हा संगणकाला पुरवतो आणि त्या अजस्र डेटा संचाचे अनेकमिती आलेख मांडून विशिष्ट कल, नमुना किंवा विसंगती, अपवाद तो शोधतो त्याला अन-सुपरवाइस्ड लर्निग म्हणतात.

एक सुंदर उदाहरण म्हणजे हृदयरोग व डोळ्यातील बुब्बुळाच्या प्रतिमांची सांगड. गुगलने केलेल्या या प्रयोगात साध्या डोळे तपासायच्या उपकरणाने रेटिना, बुब्बुळ प्रतिमा मिळवली गेली. लाखो लोकांच्या अशा प्रतिमा घेताना, त्यांना असलेले आजार, जास्त करून हृदयरोग आहे का, घेतली जाणारी औषधे, केलेले उपचार वगैरेंची नोंद केली गेली. हा सर्व डेटा वरीलप्रमाणे अनेकमिती मॉडेलमध्ये मांडल्यावर व्यक्त झाले आगळेवेगळे पॅटर्न, कल. त्यावरून बुब्बुळाच्या व त्यातील रक्तवाहिन्यांचा विशिष्ट आकार आणि हृदयरोग असे पॅटर्न, वर्गीकरण तयार झाले – जे मनुष्याला कदापि शक्य नव्हते. कारण? अनेकमिती विश्लेषण आणि अजस्र असा माहिती संच. अशा मॉडेलमुळे आता फक्त डोळे तपासणी उपकरणावरून हृदयरोगाची प्राथमिक चाचणी शक्य झाली नाही का? तेही फक्त काही रुपयांत. गावोगावी, खेडय़ापाडय़ांत किती उपयुक्त सुविधा होईल ही, प्रत्यक्षात येईल तेव्हा. एआय फॉर ऑल – सामाजिक उपयुक्तता यालाच म्हणतात. आम्ही तंत्रज्ञ मंडळी व काही वैद्यकीय तज्ज्ञ अशा सामाजिक प्रकल्पावर काम सुरू करत आहोत – भारताला भेडसावणारा टीबी, तोंडाचा कर्करोग यांचे प्री-स्क्रीनिंग.

अन-सुपरवाइस्ड लर्निगची इतर उदाहरणे

अ) विसंगती विश्लेषण – विमानाच्या, गाडीच्या इंजिन्सची अंतिम चाचणी चालली आहे. अनेक प्रकारच्या चाचण्या आणि त्यावरून मिळालेला लाखो पंक्तीचा माहिती संच – स्पीड, तापमान, इत्यादी. अशा माहितीचे मशीन लर्निग वापरून बहुमिती विश्लेषण करू तेव्हा बहुतेक इंजिन्स आलेखावर एका समूहात, गठ्ठय़ात दिसतील; पण काही त्या समूहाच्या, गठ्ठय़ाच्या एकदम विरुद्ध दिशेला, लांबवर कुठे तरी जर असतील तर नक्कीच ती इंजिन्स सर्वसाधारण इंजिन्सपेक्षा विसंगत असणार.

ब)  समूह विश्लेषण – एका शहराच्या लोकांबद्दल औषधे, राहणीमान, वय, आजार, उपचारपद्धती, उत्पन्न आणि निवासस्थळे इत्यादी माहिती आणि मशीन लर्निगद्वारे लोकसंख्येचे समूह, ज्यावरून वैद्यकीय सेवा कुठे, कशा, किती असे नियोजन विश्लेषण.

३) रीइन्फोरस्ड लर्निग – या प्रकारात आपण फक्त प्रश्न व निवडलेल्या पर्यायांना बक्षीस किंवा शिक्षा इतकीच माहिती संगणकाला पुरवतो. याचे उत्तम उदाहरण म्हणजे बुद्धिबळ खेळ. प्रश्न म्हणजे फायनल चेक-मेट करून जिंकणे. बक्षीस म्हणजे समोरच्याची प्यादी मारणे. शिक्षा म्हणजे स्वत:चीच प्यादी मारणे. अनेक वेळा चुकत चुकत योग्य मार्ग शोधत एआय आज्ञावली शेवटी सर्वात इष्टतम चाली शोधून काढते. याचे वैशिष्टय़ म्हणजे अत्यंत किचकट कामांसाठी उपयुक्त ठरते. कारण ही आज्ञावली एआय प्रोग्रामरने न शिकविता, स्वत:हूनच उपाय शोधते. दुसरे उदाहरण, स्वयंचलित विनाचालक गाडीची आज्ञावली.

त्रिमिती व बहुमिती विश्लेषण

आपण वरील उदाहरणात क्ष१ विरुद्ध य असा द्विमिती आलेख मांडला. कारण आपण आरजीबी हे एकच फीचर घेतले. प्रत्यक्षात असे लाखो फीचर्स असू शकतात. प्रश्न २ मध्ये घराच्या किमतीचा अंदाज वर्तवणे उदाहरण घेऊन ते समजू या. इथे क्ष१, क्ष२.. क्ष२० असे २० फीचर्स आहेत आणि  य = किंमत तेव्हा २० मितींचा आलेख मांडावा लागेल. बापरे, २० मिती? आपण मनुष्य फक्त त्रिमितीपर्यंत विचार करू, मनश्चक्षूंसमोर आणू, त्यापुढे? पण संगणकाला असे काही प्रतिबंध, मर्यादा नसतात. हे एआयचे दुसरे प्रमुख वैशिष्टय़ आहे. लाखो मितींचे आलेख, आल्गोरिथम्स मशीन्स सहजच, क्षणार्धात मांडू शकतात. अर्थात अशा क्लिष्ट, वेळखाऊ, खर्चीक गणितांसाठी घरचे साधे संगणक बिलकूल कामी नाही येणार. त्यासाठी लागतात अद्ययावत क्षमतेचे सुपर-कॉम्प्युटर्स किंवा क्लाऊडवरील समांतर कॉम्प्युटिंग.

पुढील सदरात एआयचे आणखी काही प्रकार बघू.

लेखक टाटा कन्सल्टन्सी सव्‍‌र्हिसेसमध्ये साहाय्यक उपाध्यक्ष आणि सध्या अ‍ॅनालिटिक्स आणि इनसाइट्सच्या यूएसए सेंटरचे प्रमुख म्हणून कार्यरत आहेत.

hrishikesh.sherlekar@gmail.com