12 December 2019

News Flash

विडा उचलताना.

सुरुवातीला सौदी अरेबियामध्ये ऐकल्या जाणाऱ्या गाण्यांतून जवळजवळ ७० लाख गाण्यांचा अभ्यास करून विभाजक (क्लासिफायर) बनवला.

संग्रहित छायाचित्र

 

|| संहिता जोशी

विदाविज्ञान हे उपयोजित शास्त्र असल्यामुळे त्याच्या वापरातून निष्कर्ष निघतात ते समाज, राजकारण, अर्थशास्त्र यांविषयीचे.. त्यासाठी केवळ सांख्यिकी आणि प्रोग्रामिंगचं ज्ञान असून भागत नाही. आपण विदा कशासाठी वापरणार आहोत, यावरून अभ्यासपद्धती ठरते. पैजेचा विडा उचलण्यापूर्वी पैज जिंकण्याची रणनीतीही ठरवावी लागते आणि मदत कुणाकुणाची होईल हेही जोखावं लागतं, तसंच हेही..

आमच्या शहरात गेल्याच आठवडय़ात एक परिषद भरली होती; कृत्रिम प्रज्ञेच्या (ए.आय.) तंत्रज्ञानात आणि या तंत्राशी संबंधित तंत्रक्षेत्रात काय सुरू आहे, हा त्या परिषदेचा गाभा होता. त्यात एका भाषणात २०१६च्या अमेरिकी राष्ट्राध्यक्ष निवडणुकीचा विषय पुन्हा निघाला. रेडिट या पोर्टलवरची विदा- लोक काय लिहीत आहेत- वापरून एका विदावैज्ञानिकानं राष्ट्राध्यक्षपदाच्या निवडणुकीत कोण जिंकेल याचा मागोवा घ्यायला सुरुवात केली होती. त्यात काही काळ हिलरी क्लिंटन जिंकणार असं दिसत होतं; पारंपरिक सर्वेक्षणांत ती आघाडीवर होतीसुद्धा. मात्र निवडणुकीच्या आठ-दहा दिवस आधी हिलरीसंदर्भात, महत्त्वाच्या दोन घटना घडल्या; त्यानंतर ट्रम्प जिंकणार असं दिसायला लागलं. त्या दोघांमधला फरक अगदी नगण्य होता. हे भाकीत- म्हणजे ट्रम्प जिंकणार एवढंच नाही तर फार कमी फरकानं जिंकणार- योग्य ठरलं.

इथे एका गोष्टीची नोंद महत्त्वाची- ‘मला वाटतं म्हणून अमुक इसम निवडणूक जिंकणार’; किंवा ‘मला वाटतं म्हणून अमक्या पक्षाला तेवढय़ा सिटा मिळणार’ हे विदाविज्ञान किंवा कोणत्याही प्रकारचं विज्ञान नाही. त्याला (विदा) विज्ञान समजणं हे छद्मविज्ञान आहे. भाकीत करताना त्यात आकडे देणं, त्या आकडय़ांमध्ये चढउतार होतात त्यांचं स्पष्टीकरण देणं, दोन आलेखांमध्ये साधर्म्य दिसणं अपेक्षित असेल तर त्याचं कारण देणं आणि अनपेक्षित निकाल आले तर त्याचंही स्पष्टीकरण देणं, या गोष्टी वैज्ञानिक पद्धतीमध्ये केल्या जातात.

या भाषणात अशाच प्रकारचं आणखी एक उदाहरण दिलं. सुरुवातीला सौदी अरेबियामध्ये ऐकल्या जाणाऱ्या गाण्यांतून जवळजवळ ७० लाख गाण्यांचा अभ्यास करून विभाजक (क्लासिफायर) बनवला. गाण्यांची विभागणी आठ निरनिराळ्या भावनांमध्ये केली. गाणं आनंदी आहे, अस्वस्थता दर्शवतं, विरहाचं आहे, अशा भावना. एका गाण्याचं वर्णन एका भावनेमध्ये केलं. नंतर सहा वर्षांत दर आठवडय़ात सगळ्यात जास्त लोकप्रिय असणाऱ्या गाण्यांचं विदागार (डेटाबेस) वापरलं. या गाण्यांचा मूड सुरुवातीच्या विभाजकाचा वापर करून ओळखला. पुढे, या गाण्यांचा आणि ग्राहकांचा बाजारावर, अर्थव्यवस्थेवर विश्वास किती (कन्झ्युमर कॉन्फिडन्स इंडेक्स) हे ओळखण्यासाठी केला.

आणखी एका परिषदेत एक भाषण ऐकलं होतं – कृत्रिम प्रज्ञेचा एक भाग ‘ग्यान’ (जनरेटेड अ‍ॅडव्हर्सरियल नेटवर्क्‍स) वापरून जुन्या, तुटक्याफुटक्या मूर्ती, गाडगी-मडकी कशी दिसत असतील त्यांच्या प्रतिमा निर्माण करणं.

उत्तम विदावैज्ञानिक काय करू शकतात, याची ही उदाहरणं आहेत. विदा कुठून, कशी मिळवता येईल; तिची विभागणी कोणत्या प्रकारे करता येईल; आणि त्या विभागणीचा वापर रोजच्या आयुष्यात कसा करता येईल, याची ही उदाहरणं आहेत. त्यासोबत विदेचा असा वापर करता आला तर पैसेही चिकार मिळवता येतील. पशांचा उल्लेख त्या भाषणात आवर्जून झाला.

या दोन गोष्टी- निवडणुकांचे निकाल आणि ग्राहकांचा विश्वास- यांची भाकितं करण्यासाठी जी विदा वापरली, ती ठरावीक विदेतून सापडतील, असा विचार आधी या विदावैज्ञानिकांनी केला होता. हे काहीसं खगोलशास्त्रासारखंच असतं. सुरुवातीला संपूर्ण आकाशाचं सर्वेक्षण होतं; तेव्हा आकाशाच्या प्रत्येक भागाकडे थोडाथोडा वेळ दुर्बीण रोखली जाते. त्यात काही रोचक, महत्त्वाचं दिसलं तर मग आकाशाच्या त्या त्या भागांकडे दुर्बीण बराच काळ रोखली जाते.

अशा चित्रविचित्र ठिकाणची विदा गोळा करून, त्यातून उपयुक्त आणि/ किंवा व्यापारी उपयोग असणाऱ्या गोष्टी शोधता येऊ शकतात, अशा कल्पना येणं महत्त्वाचं आहे. रेडिट, फेसबुक, ट्विटर, गूगल या बडय़ा विदा-कंपन्यांकडे अशी विदा अस्तित्वात आहे. मात्र तिचा वापर करायचा तर बहुतेकदा फक्त अर्थशास्त्र, राज्यशास्त्र आणि सांख्यिकीचं आकलन असून पुरत नाही. सांगोवांगीच्या चारसहा बातम्या किंवा चर्चा नाही, तर विदा म्हणजे हजारो चर्चा किंवा गाण्यांची विदा मिळवण्यासाठी प्रोग्रॅमिंगची तपशीलवार माहिती असणंही गरजेचं आहे.

यातून विदाविज्ञान, हे नवं तंत्रज्ञान वापरून काही नवीन शिकण्याचा, करण्याचा खर्च वाढतो. एकाच व्यक्तीला ही सगळी कौशल्यं येत असतील असं नाही. याचं समांतर उदाहरण पाहा. नोबेलविजेते अभिजीत बॅनर्जी आणि एस्टर डुफ्लो यांच्या ‘पुअर इकॉनॉमिक्स’मध्ये एक उदाहरण आहे. आफ्रिकेतल्या एका देशात मतदानासाठी मतपत्रिकेवर आपल्या पसंतीच्या उमेदवाराचं नाव लिहिणं अपेक्षित होतं. देशातले अनेक मतदार अशिक्षित किंवा जेमतेम लिहू शकणारे होते. त्यांनी काही ठिकाणचं मतदान करण्यासाठी इलेक्ट्रॉनिक यंत्रं वापरली, आपल्या ईव्हीएमसारखी. कागदावर नाव लिहिण्याजागी, मतदान केल्याच्या पावतीवर उमेदवाराचं नाव वाचून खात्री करण्याचं काम मतदारांवर सोडलं. मतदानाची टक्केवारी लक्षणीयरीत्या वाढली. पात्र मतदारांसमोर मतदान करण्यासाठी जो अडथळा होता, तो कमी झाल्यावर मतदानाचा उत्साह वाढला. ती वाढलेली टक्केवारी किती, हे शोधण्यासाठी डुफ्लो, मायकल क्रेमर आणि त्यांच्या सहकाऱ्यांनी जे सांख्यिकी तंत्र वापरलं त्याला ते म्हणतात रँडमाइज्ड कंट्रोल टेस्टिंग – ठरवून केलेल्या यादृच्छिक चाचण्या. नोबेल मिळालं ते याच कारणासाठी. या पद्धतीला विदावैज्ञानिक म्हणतात, ए/बी टेस्टिंग. कोणता रंग वापरून लोक गूगलवर जास्त काळ रेंगाळतील, याच्याही चाचण्या त्यांनी केल्या. आंतरजालाचं व्यसन का लागतं, त्याचं उत्तरही याच सांख्यिकी पद्धतीमध्ये आहे.

विदा हे आजच्या काळाचं सोनं आहे. आमच्याकडे एक पिवळा बोका येतो, त्याला मी ‘सोन्या’ म्हणण्याजागी ‘डेटा’ म्हणते. पण या सोन्याचा उपयोग फक्त काही लोकांनाच करता येतो; त्याचा फायदाही मोजक्याच लोकांना होतो. विदाविज्ञान हे असं शास्त्र आहे, ज्यात फक्त सांख्यिकी आणि प्रोग्रॅमिंग एवढय़ाच विषयांचं आकलन महत्त्वाचं नाही तर इतरही अनेक विषय राजकारण, अर्थशास्त्र, मानसशास्त्र यांचाही वापर केला जातो; सुरुवातीची उदाहरणं पाहा. मात्र ज्यांना प्रोग्रॅमिंग येत नाही, ते लोक बहुतेकसे या क्षेत्रापासून लांब ठेवले जातात.

दुसरी, तंत्रज्ञानाची बाजू बघू. शरद पवारांचं नाव गूगललं तर पाऊण सेकंदात जवळजवळ साडेसत्तावीस कोटी निकाल आल्याचं गूगलनं सांगितलं. जेव्हा गूगल ट्रेंड्समध्ये शरद पवारांचं नाव शोधलं, तेव्हा सेकंदापेक्षा जास्त वेळ लागला आणि गेल्या वर्षभरात कुठून, किती शोध घेतले हे दिसलं. आंतरजालावर शोध घेण्यात गूगल आणि इतरही शोधयंत्रांनी मोठी प्रगती केली आहे. पण गूगल ट्रेंड्ससाठी जे तंत्रज्ञान वापरलं जातं, ते तेवढं प्रगत नाही. याचं एक कारण असू शकतं की गूगलला या विषयात स्पर्धा नाही. जिथे स्पर्धा निर्माण होते, तिथे कोणती का कंपनी जास्त नफा मिळवेना, तंत्रज्ञान पुढे जातं. तंत्रज्ञान पुढे जाण्यात आपला फायदा आहे.

विदाविज्ञानाचा उपयोग अत्यंत मर्यादित परिघात केला जातो. जेवढय़ा वेगवेगळ्या पाश्र्वभूमीचे लोक विदाविज्ञानात काम करायला लागतील तेवढा त्याचा आपल्याला असणारा उपयोग वाढेल. ‘केंब्रिज अ‍ॅनालिटिका’नं फेसबुकवरची विदा चोरली, आणि ती वापरून किमान ठरावीक लोकांचा लोकशाहीवरचा विश्वासच उडेल असे कारनामे केले. तसं काही पुन्हा घडणार नाही याची काहीही शाश्वती नाही. पण त्यामुळे आपली शाश्वत मूल्यांवरची श्रद्धा ढळू नये यासाठी विदाविज्ञानात आपला वाढता सहभाग असणं आवश्यक आहे.

लेखिका खगोलशास्त्रात पीएच.डी. आणि पोस्ट-डॉक असल्या, तरी सध्या विदावैज्ञानिक म्हणून कार्यरत आहेत. = ईमेल : 314aditi@gmail.com

First Published on November 20, 2019 1:32 am

Web Title: knowledge statistical programming challenge akp 94
Just Now!
X