20 September 2019

News Flash

पगडी आणि पगडे

संगणकाला भाषा कशी शिकवतात, या प्रश्नाचं उत्तर एकच असेल असं नाही.

(संग्रहित छायाचित्र)

संहिता जोशी

‘गुगल’सारख्या शोधयंत्रांतून हवं ते आपल्यासमोर सादर करणारा आणि अन्य संस्थळांवरूनही थोडय़ाच अधिक प्रयत्नांती माहिती देणारा संगणक हा जणू काही पगडीधारी पंडित वाटेल कुणाला.. किंवा कुणाला पगडीधारी सरदारही वाटेल.. काय वाटावं, हे तुमच्यापर्यंत विनासायास विदा पोहोचवणाऱ्यांवर कोणता पगडा आहे, यावरही अवलंबून असेल..

‘‘एवंगुणविशिष्ट प्रचलांच्या परिप्रेक्ष्यातून दृग्गोचर होणाऱ्या वस्तुस्थितीच्या पृथक्करणातून यथातथ्य आकलन अधिक संभाव्य असतं.’’ शशी थरूर मराठी शिकले तर असं काही बोलतील!

जडजंबाल भाषा सोपी, सुलभ करण्यासाठी किंवा मराठीचं मराठी भाषांतर करण्यासाठी संगणक वापरता येतात.. वापरता येतील. बोजड इंग्लिश सोपं करण्यासाठी आंतरजालावर सुविधा उपलब्ध आहेत. अशा सुविधा मराठीतही आहेत, असं सध्या सोयीसाठी गृहीत धरू.

संगणकाला भाषा कशी शिकवतात, या प्रश्नाचं उत्तर एकच असेल असं नाही. यंत्राला भाषा शिकवून पुढे काय करायचं आहे, यावर भाषा शिकणं म्हणजे काय हे अवलंबून असतं. मागच्या एका लेखात म्हटलं तसं, ‘विदा’, ‘संगणक’, ‘माहिती’ असे शब्द विदाभान या सदरातल्या लेखांमध्ये दिसतील. तर ‘सद्गुरू’, ‘धन्य’, ‘नश्वर’ असे शब्द एकात्मयोग या सदरातल्या लेखांमध्ये दिसतील. समजा संगणकाला लेख वाचून त्यांचं विषयवार वर्गीकरण करायचं असेल तर असे कळीचे शब्द आणि त्यांचे विषय असं वर्गीकरण करावं लागेल.

तुम्ही कदाचित नेटफ्लिक्सवर सिनेमे बघितले असतील; किंवा बुकगंगा, अ‍ॅमेझॉनवर काही खरेदी केली असेल. ही संस्थळं उघडली की आपल्याला काही सिनेमे, पुस्तकं, उत्पादनं सुचवली जातात. सगळ्यात जास्त खरेदी केली गेलेली पुस्तकं कोणती, याचं उत्तर शोधणं सोपं आहे. बुकगंगाकडे विक्रीसाठी असलेल्या पुस्तकांतून मुलांची पुस्तकं किंवा नेटफ्लिक्सवरचे विनोदी सिनेमे कोणते, हे शोधायचं असेल तर प्रश्न थोडा कठीण होतो. सुरुवातीला व्यवसाय छोटासाच असतो; पाच-पन्नास पुस्तकं किंवा सिनेमे असतात, तेव्हा हे सगळं हातानं करणं किंवा सोपे काही नियम वापरून वर्गीकरण करणं शक्य असतं. पण जेव्हा व्यवसाय वाढायला लागतो, तेव्हा हा आकडा मोठा होतो. हातानं वर्गीकरण करणं शक्य नसतं.

शिवाय मला जे विनोदी वाटेल ते तुम्हाला वाटेल असं नाही. लेखाच्या सुरुवातीलाच जडजंबाल वाक्य दिलं आहे. ते काहींना विनोदी वाटलं असेल; पण जे लोक अशाच भाषेत लिहितात, विचार करतात त्यांना ते विनोदी वाटलं नसेल. म्हणजे व्यक्ती तितक्या प्रकृती. तर मी बुकगंगा किंवा अ‍ॅमेझॉनवर गेले आणि तिथे सुरुवातीलाच माझ्या आवडीची पुस्तकं दिसली नाहीत तर मी दुसरीकडे पुस्तकं विकत घ्यायला जाईन. (अ‍ॅमेझॉन सुरुवातीला फक्त पुस्तकं विकणारं संस्थळ होतं; आता तिथं कोकमांपासून परकरांपर्यंत काहीही विकायला असतं.)

नेटफ्लिक्सवर साधारण १५०० मालिका आणि ४,००० सिनेमे आहेत. नेटफ्लिक्स उघडल्यावर फार तर २० सिनेमा-मालिकांची यादी आपल्याला दिसत असेल. त्यात काय दाखवायचं हे कसं ठरवतात? आपण कोणत्या मालिका-सिनेमे बघतो यावरून आपल्याला कोणत्या प्रकारात रस असेल हे ते ठरवतात. जो सिनेमा फार आवडला नाही तो आपण दोन-तीन तास खर्चून बघणार नाही. विषयानुसार या सिनेमांची वर्गवारी करून, त्यांतलं आपल्याला काय आवडेल याची जंत्री काढली जाते. हीच गोष्ट पुस्तकांची. तीच बाब उपभोग्य वस्तूंची. डाळ-तांदूळ, दूध-अंडी यांची गरज सगळ्यांनाच असते. पण उपभोग्य वस्तूंच्या बाबतीत आपल्याकडे पैसे आणि उपभोग घेण्यासाठी वेळ कमी असतात. त्यामुळे हजारो पुस्तकं किंवा सिनेमे असले तरी आपण ते सगळंच विकत घेणार नाही, किंवा बघणार नाही.

हे लिहिताना मला प्रश्न पडला, जगात पुस्तकं किती? (इंग्लिशमध्ये विचारल्यावर) गुगलनं सांगितलं, जगात एकूण जवळजवळ १३ अब्ज पुस्तकं असतील. (हे सगळेच आकडे तेवढय़ापुरते गुगलून शोधता आले.) हा प्रश्न समजण्यासाठी गुगलला इंग्लिश भाषा समजणं गरजेचं आहे. विचारलेल्या प्रश्नाचा विषय कोणता, एवढंच समजून फायदा नाही. शोधताना जो प्रश्न विचारला जातो, त्याची संगती पूर्णपणे लावण्याची गरज असते. ‘‘जगात किती पुस्तकं आहेत’’ आणि ‘‘अ‍ॅमेझॉनवर किती पुस्तकं विकतात’’ या दोन प्रश्नांमध्ये दोन शब्द सारखे आहेत, दोन वेगळे आहेत. वेगळ्या शब्दांमुळे प्रश्नाचा रोख आणि उत्तरं पूर्णपणे बदलतात.

संगणकाला भाषा शिकवतात त्याचा आणखी एक उपयोग असतो, फोटो आणि व्हिडीओंचं वर्णन करण्यासाठी. ज्यांच्या हातात फोन असतो त्या सगळ्यांना फोटो आणि व्हिडीओ तयार करता येतात. त्यातूनही संशोधकांनी विषमता दाखवून दिली होती; कपडे धुणाऱ्या व्यक्ती स्त्रिया असतात आणि खेळाडू पुरुष असतात, असा कल वर्गीकरणात होता. मुली-स्त्रिया खेळत नाहीत आणि पुरुष कपडे धूत नाहीत असं नाही. फोटो लोकांकडून गोळा केलेले असल्यामुळे समाजातली विषमता या फोटोंमध्येही उतरली होती. समजा, १०० फोटो स्वयंपाक करणाऱ्या लोकांचे आहेत; त्यांतल्या ९० फोटोंमध्ये स्त्रिया आहेत. समजा संगणकानं त्या सगळ्या फोटोंतल्या व्यक्ती स्त्रिया आहेत, असं सांगितलं, तर त्यातली अचूकता ९० टक्के असेल. पण त्यातून फार माहिती मिळत नाही. डोळे बंद करूनही तेच उत्तर देता येईल. यासाठी साधे गणिती उपाय उपलब्ध असतात. ते वापरून, गणितं सुधारल्याशिवाय योग्य उत्तरं मिळत नाहीत.

संगणकाला भाषा शिकवण्याचा एक प्रयोग म्हणून, ‘टेस्ला’चा प्रवर्तक इलॉन मस्क आणि इतर काही व्यावसायिकांनी पसा पुरवून एक संशोधन करवून घेतलं. त्यातून खोटं लेखन तयार करता येतं. दोन परिच्छेद दिल्यावर त्या संगणकीय बॉटनं खरा वाटेल असा मजकूर तयार केला. (लेखाच्या सुरुवातीचं वाक्य असंच, बनावट आहे.) आत्तापर्यंत असं लेखन वाचल्यावर ‘काही तरी गडबड आहे’ हे  माणसांना समजत होतं. या नव्या संशोधनातून त्यांनी असा मजकूर तयार केला की वाचणाऱ्या व्यक्तीला तो विषय माहीत असेल तरीही यात गडबड आहे, हे सहज समजणार नाही. आकडे चुकीचे असतील, मजकुरात तथ्य नसेलच.

त्यांनी त्यासाठी उदाहरण वापरलं ते ‘ब्रेग्झिट’च्या बातम्यांचं. हवापाण्याच्या गप्पा निराळ्या. ब्रेग्झिटचा विषय समाजाचं ध्रुवीकरण करणारा आहे. त्याबद्दल बेजबाबदार विधानं करणं, बातम्या देणं समाजाच्या हिताचं नाही. असाच विचार करून संशोधकांनी हे संशोधन सगळ्यांसमोर मांडणार नाही, असं ठरवलं. एकदा टय़ूबमधून बाहेर आलेली ही टूथपेस्ट पुन्हा आत जाईल का? एकाच वेळी वेगवेगळ्या गटांनी एकच संशोधन स्वतंत्ररीत्या केल्याची उदाहरणं आहेत. ‘खरी बातमी’ म्हणून कशावर विश्वास ठेवायचा, असा प्रश्न भविष्यात येऊ शकतो.

गेली काही वर्ष सातत्यानं अनेक विदावैज्ञानिक काम करत आहेत असा महत्त्वाचा विषय म्हणजे बातमी खोटी आहे का खरी, बातमीत मांडलेल्या गोष्टी खऱ्या आहेत का, कितपत खऱ्या आहेत हे संगणकाला शोधता आलं पाहिजे. मध्यंतरी फेसबुकनंही हा प्रयोग करून बघितला. बातमीच्या दुव्याखाली, ती बातमी खरी असेल तर तसा शिक्का उमटत होता. जगभरात जेवढय़ा बातम्या दिवसभर येत असतात, आणि त्या ज्या वेगानं पसरतात त्याचा विचार केला तर खरंखोटं करण्याचं कामही संगणकांनी करण्याशिवाय पर्याय नाही.

खऱ्याखोटय़ाच्या चाळण्यांमधूनही ‘गणपती दूध पितो’ अशा बातम्या अडकणार नाहीत. कारण समाजच विषमता, अंधश्रद्धा, जातीयता, यांत अडकला असेल तर संगणकही त्याच गोष्टी तथ्य म्हणून शिकणार. संगणकाला खरं काय आणि खोटं काय, हे सांगणारे लोक आपल्याच समाजातले विदावैज्ञानिक असतात. बहुसंख्य समाजावर ज्या धारणांचा पगडा असतो त्यांपासून विदावैज्ञानिकांना आपसूक सुटका मिळत नाही.

लेखिका खगोलशास्त्रात पीएच.डी. आणि पोस्ट-डॉक असल्या, तरी सध्या विदावैज्ञानिक म्हणून कार्यरत आहेत.

ईमेल : 314aditi@gmail.com

First Published on April 10, 2019 12:12 am

Web Title: vidabhan article by sanhita joshi 9