संहिता जोशी

‘आंब्याचा दर प्रत्येकी ७५ रु.’ ही माहिती. त्यावरून पाच आंब्यांची किंमत अंकगणित सांगेल.. पण त्याहून कमी किमतीत आंबे मिळवता येऊ शकतात, हे व्यवहारज्ञानाने कळेल! माहिती आणि हुशारी यांतला हा फरक विदा आणि तिचा ‘कृत्रिम प्रज्ञे’साठी वापर यांतही दिसतो..

आकाशात दिसणाऱ्या ताऱ्यांचे आकार जोडून आपल्या सवयीच्या वस्तू, प्राण्यांची नावं त्यांना देणं, ही बाब सगळ्या जुन्या संस्कृतींमध्ये दिसते. भारतीय लोकांनी नक्षत्रं बनवली, पाश्चात्त्यांनी राशी बनवल्या. कधी अंधारात आपल्याला अर्धवट काही दिसतं आणि त्यात आपण आकार शोधत बसतो; भुतं अशीच जन्माला येत असावीत. आपले मत्र, नातेवाईक कधी स्वतचे अनुभव आपल्याला सांगतात, तेव्हा साधारण तशाच अनुभवांशी आपण इतरांचे अनुभव ताडून घेत राहतो.

याचा विदाविज्ञानाशी (डेटा सायन्स) संबंध काय? तुकडय़ा-तुकडय़ांत दिसणाऱ्या, किंवा सांगितल्या जाणाऱ्या गोष्टींमधून आपण पॅटर्न तयार करतो; त्यावरून अनुमान काढतो. विदाविज्ञानातला सगळ्यात ग्लॅमरस भाग असतो मशीन-लर्निंग किंवा रीइनफोस्र्ड लर्निंगचा. त्यात आधीच्या अनुभवांमधून, आधीच्या निरीक्षणांमधून भाकीत केलं जातं.

मशीन-लर्निंगमध्ये जी गणितं केली जातात, तशी सोपी गणितं आपण व्यवहारातही करतो. शाळेत गणितं असतात, दोन आंब्यांचे १५० रुपये तर पाच आंब्यांचे किती होतील? व्यवहारात आपल्याला लक्षात येतं की अंकगणितामधून जे उत्तर येईल त्यापेक्षा किंचित कमी पशांत पाच आंबे येतील. पाच आंब्यांसाठी ३७५ ऐवजी कदाचित ३६० रुपयेच पुरतील. अंकगणितानं केलेलं भाकीत पूर्णपणे चुकलं असं म्हणणार का? नाही. संख्याशास्त्र (स्टॅटिस्टिक्स) वापरून हे गणित किती बरोबर होतं हे शोधता येतं.

हे गणित प्रत्यक्षात आणखी थोडं किचकट होतं. सगळे आंबे हापूसच असले तरीही काही फळं आकारानं जरा लहान असतात. काही फळांवर काळे डाग असतात. काही गिऱ्हाईक आणि दुकानदारांची ओळख असते; त्यामुळे मागच्या वेळेस खराब आंबे निघण्याची भरपाई म्हणून काही आंबे दुकानदार फुकटात देते. म्हणजे दिवसाच्या शेवटी आंब्याची सरासरी किंमत किती हे सरळ अंकगणित करून ठरवता येईल. पण प्रत्येक गिऱ्हाईकाला आंबा कितीला पडला, आपण बाजारात जाऊन खरेदी करू तेव्हा किती पैसे खर्च होतील, हे ठरवताना त्यामागे काही पॅटर्न असतात. सवयीनं ते आपल्याला समजतात.

मशीन लर्निंगही असंच काहीसं असतं. फरक एवढाच की विदा साठवायला आणि भाकितांची गणितं करायला संगणक उपलब्ध असल्यामुळे अत्यंत किचकट गणितंही करता येतात. विदाविज्ञानातला किचकट-गणिती पण रोचक प्रकार आहे कृत्रिम न्युरल नेटवर्कचा. आपले मेंदू ज्या पद्धतीनं शिकतात, आणि चेतापेशी ज्या प्रकारे संवेदना वाहून नेतात, तशाच संकल्पनेवर आधारित ही गणितं असतात, म्हणून ‘न्युरल नेटवर्क’ हे नाव.

तुम्ही फेसबुकवर वगैरे बघितलं असेल, व्यक्तीचा चेहरा दिसला की त्यांचं नाव फेसबुक बहुतेकदा बरोबर ओळखतं. ‘या माणसाला टॅग करायचं का’ विचारतं. त्यात आतली गणितं नक्की कशी चालतात, हे कोडं उलगडलेलं नाही. म्हणजे काय, तर दोन आंब्यांचे १५० रुपये म्हणजे एका आंब्याचे ७५ हे गणित आपल्याला सहज करता येतं. फक्त गणितच नाही, तर ७५ रुपयांत आणखी इतर काय गोष्टी विकत घेता येतील, हेही आपल्याला समजतं. या न्युरल नेटवर्कच्या आत जे असे आकडे असतात, त्याचा अर्थ कुणालाही नीटसा समजत नाही. अगदी या विषयात संशोधन करणाऱ्या लोकांनाही नाही. त्यामुळे जिथे फक्त भाकितं करून पुरत नाही, ही भाकितं का केली हेसुद्धा सांगावं लागतं, तिथे न्युरल नेटवर्क वापरता येत नाही.

याचं उदाहरण बघू. समजा, कुणाला घर विकत घ्यायचं आहे. त्यासाठी आधी कर्जाची सोय करायची आहे. बँक आपल्याकडे कागदपत्रं मागते; उत्पन्न-बचत किती, आपल्याकडे इतर काही स्थावर-जंगम मालमत्ता आहे का, इतर काही र्कज आहेत का, असतील तर ती र्कज फेडण्याचा आपला इतिहास काय आहे, वगैरे, वगैरे. या सगळ्या पार्श्वभूमीवर अंदाज केला जातो की किती कर्ज दिलं तर ही व्यक्ती ते दिलेल्या मुदतीत फेडू शकेल?

हे निर्णय चुकले तर महागात पडतात; कर्जबुडव्यांमुळे थेट नुकसान होतं. पण एखादीची कर्ज फेडण्याची क्षमता असूनही तिला कर्ज दिलं नाही तर व्यवसाय बुडतो. कदाचित ती दुसऱ्या बँकेत जाऊन कर्ज मागेल. एक गिऱ्हाईक दुरावेल. शिवाय, अनेक देशांमध्ये कर्ज का नाकारलं याचं स्पष्टीकरण द्यावं लागतं; गिऱ्हाईकांची कर्ज फेडण्याची पत सिद्ध होत असेल तर कर्ज नाकारणं बेकायदेशीर ठरतं.

कोणाला किती कर्ज द्यावं म्हणजे गिऱ्हाईक समाधानी राहील आणि कर्ज बुडणारही नाही, हे ठरवण्यासाठी विदाविज्ञानाचा भाग – मशीन लìनग – फार सोयीचा ठरतो. या मशीन लìनगमध्येही बरेच उपप्रकार आहेत; त्यांतल्या काही गणितांची स्पष्टीकरणं सहज देता येतात. म्हणजे एखाद्या गिऱ्हाईकाचा कर्जाचा अर्ज नाकारला तर का नाकारला, किंवा मागितलं तेवढं कर्ज देता येणार नाही, तर ते का, याचं स्पष्टीकरण देणं अनेक देशांत कायद्यानं बंधनकारक असतं. तिथे न्युरल नेटवर्क वापरता येणार नाही.

शिव्यांचे अर्थ मला लहानपणी माहीत नव्हते. कदाचित शिवी हा शब्दही माहीत नव्हता. पण शिव्या माहीत होत्या. हे शब्द घरी वापरले जात नाहीत, त्यामुळे आपणही वापरू नयेत; मोजकेच लोक वापरतात आणि विशिष्ट प्रसंगांमध्येच वापरतात; हे सगळं समजत होतं. यथावकाश मोठेपणी, स्पष्टपणे ‘या शब्दांचा अर्थ काय’ असं विचारता आलं. आता तर इंग्लिशच्या ब्रिटिश, अमेरिकी, ऑस्ट्रेलियन अशा बोलींमधल्या अपमानव्यंजक शब्दांचे अर्थ गुगलूनही सापडतात.

पण लहानपणी शिव्या समजल्या त्या न्युरल नेटवर्कसारख्याच  त्यांचा अर्थ नेमका माहीत नसूनही, वापर कसा करतात हे बरोबर समजलं होतं. उलट उदाहरण आकडे, पशांची किंमत समजणं शिष्टसंमत असतं, त्यामुळे अगदी बारक्या पोरापोरींनाही एका आंब्याची किंमत काय हे बरोबर समजतं.

मशीन लर्निगमध्ये निरनिराळी अल्गोरिदम आहेत. आपल्याला कोणत्या प्रश्नाचं उत्तर शोधायचं आहे, आणि त्याचा व्यावहारिक उपयोग काय, यावरून कोणतं अल्गोरिदम वापरायचं हे ठरवलं जातं. या न्युरल नेटवर्कचं सगळ्यात सोपं, जुनं आणि प्रसिद्ध उदाहरण आहे  टठकरळ  या  विदासंग्रहाचं.

पत्त्यांमधले पिनकोड वाचून ते पत्र कोणत्या पोस्ट ऑफिसात पाठवायचं हे सगळ्यात आधी ठरवलं जातं. ते काम यंत्रांना शिकवायचं असं ठरवलं, तेव्हा हा विदासंग्रह जमा केला गेला. त्यात हातानं लिहिलेल्या ० ते ९ या आकडय़ांची ६०,००० चित्रं आहेत. त्याचा एक नमुना म्हणून सोबतचं चित्र पाहा.

हातानं लिहिलेले आकडे वाचण्यासाठी इतर काही अल्गोरिदम आणि न्युरल नेटवर्क वापरलं. त्यात न्युरल नेटवर्क बाकीच्यांपेक्षा फारच भारी ठरलं, त्यातल्या चुका आता ०.२५ टक्के इतक्या कमी करण्यात आल्या आहेत.

आत्तापर्यंत हे काम माणसं हातानं करत होती. त्या जागी आता यंत्रं वापरली जात आहेत. हजारो लोकांनी करण्याच्या कामासाठी आता मोजके विदावैज्ञानिक, आयटीवाले लोक पुरतील. बेरोजगारी वाढवणारं हे तंत्रज्ञान उपयुक्त म्हणावं का?  काही प्रश्न, विचार, तंत्रज्ञान आपल्या जगण्याची पद्धतच बदलून टाकतात. अशा गोष्टींची विभागणी ‘शाप की वरदान’  प्रकारे करता येत नाही. अर्थशास्त्री या प्रश्नाचं एक उत्तर देतील. विदावैज्ञानिकांचा दृष्टिकोन निराळा असेल आणि ज्यांच्या नोकऱ्या यामुळे जातात, त्यांचा आणखी निराळा.

न्युरल नेटवर्क वापरून माणसांचा जीव वाचवला जातो. त्याबद्दल एका विदावैज्ञानिकाचा दृष्टिकोन काय ते पुढच्या काही लेखांमध्ये बघू.

लेखिका खगोलशास्त्रात पीएच.डी. आणि पोस्ट-डॉक असल्या, तरी सध्या विदावैज्ञानिक म्हणून कार्यरत आहेत.

ईमेल : 314aditi@gmail.com