06 December 2019

News Flash

विदा आजचं सोनं!

‘विदा’ (डेटा) हे येत्या काळातलं सोनं आहे. त्याला ‘सोन्या’ म्हणायच्या ऐवजी त्याचं नाव ‘डेटा’ असं ठेवलं आहे.

गेल्या दोन दशकांमध्ये ‘विदा विज्ञान’ (डेटा सायन्स) ही ज्ञानशाखा मोठय़ा प्रमाणात फोफावायला सुरुवात झाली.

संहिता जोशी

भाषा ही अत्यंत गुंतागुंतीची गोष्ट आहे. एकाच शब्दाचा अर्थ संदर्भानुसार बदलू शकतो. चित्रपटातलं एखादं ‘पात्र’ नदीच्या ‘पात्रा’तून घागरभर पाणी आणतं, तेव्हा ती घागर हेही ‘पात्र’ असतं. ‘पात्र’ या एकाच शब्दाचे तीन अर्थ निघतात, हे माणसांना सहज समजतं. संगणकाला ते शिकवणं सोपं नाही. अत्यंत किचकट गणितं संगणकाला शिकवणं सोपं असतं, पण भाषा विषयात माणूस पुढे आहे. निदान सध्या तरी! मात्र, त्याचवेळी संगणक प्रणालीत व्हॉट्स अ‍ॅफ, फेसबुक, ट्विटर वगैरे समाजमाध्यमांवर तुम्ही जे व्यक्त होता, किंवा गुगल सर्चचा वापर करून ज्या गोष्टी करता, ती माहिती तुमच्या नकळत साठवून, तिचं विश्लेषण करून त्या माहितीचा गैरवापर केला जाऊ शकतो, हेही ध्यानात ठेवणं तितकंच गरजेचं आहे.

आमच्या घराच्या आवारात एक बोका बऱ्याचदा येतो. ‘तो पिवळा बोका’ असं कितीदा म्हणणार? त्याचं काही नाव ठेवलं पाहिजे,’ असं मी म्हटलं. तो बोका सोनेरी-पिवळा आहे. ‘विदा’ (डेटा) हे येत्या काळातलं सोनं आहे. त्याला ‘सोन्या’ म्हणायच्या ऐवजी त्याचं नाव ‘डेटा’ असं ठेवलं आहे.

इंटरनेटवर ‘लोकसत्ता’ वाचताना तुम्हाला तुमच्या भागातल्या दुकानांच्या जाहिराती दिसतात का? किंवा जी-मेलमध्ये इंग्लिशमधलं ई-मेल उघडल्यावर साचेबद्ध प्रतिसाद सुचवले जातात का तुम्हाला- ‘Thanks for the info’; किंवा ‘Sorry, I can’t make it’ अशासारखे? विदा विज्ञान (डेटा सायन्स) या जगड्व्याळ विषयाचं हे एक उदाहरण आहे.

लोकांशी बोलताना आपण बऱ्याचदा त्यांचा प्रतिसाद काय असेल, त्यांना काय वाटेल याचा विचार करून बोलतो. अ‍ॅलन टय़ुिरग या संगणकतज्ज्ञानं एक चाचणी सुचवली. जर संवाद घडताना आपण व्यक्तीशी बोलत आहोत की संगणकाशी, हे शोधता आलं नाही तर तो संगणक- एक यंत्र ‘हुशार’ आहे. संगणक यंत्रणा व्यक्तीप्रमाणे उत्तरं देऊ शकत असेल तर ती हुशार. या चाचणीची कल्पना त्यानं मांडली १९५० मध्ये. मात्र, अशी हुशार यंत्रणा तयार झाली २१ व्या शतकात. वर्तमानपत्र वाचताना दिसणाऱ्या जाहिराती किंवा ई-मेलसाठी सुचवली जाणारी ही साचेबद्ध उत्तरं हुशार यंत्राची पायाभरणी आहे. हुशारी म्हणजे नक्की काय, यावरून बरेच शास्त्रीय आणि तात्त्विक मतभेद झडत असतात. या लेखात त्या वादामध्ये न शिरता, या माहितीचा आपल्याशी संबंध काय, वर्तमानपत्र वाचताना कोणत्या जाहिराती दिसणार हे कसं ठरवतात, याची प्राथमिक माहिती आहे.

गेल्या दोन दशकांमध्ये ‘विदा विज्ञान’ (डेटा सायन्स) ही ज्ञानशाखा मोठय़ा प्रमाणात फोफावायला सुरुवात झाली. ‘विदा विज्ञान’ या नावाची महती मात्र गेल्या पाच-सात वर्षांमधलीच. इतिहास बघायला गेलं तर अगदी दुसऱ्या महायुद्धापासून- अ‍ॅलन टय़ुिरगच्या काळापासून या विषयात संशोधन झालेलं आहे. १९८० च्या दशकात या क्षेत्रात बऱ्यापकी उलथापालथ झाली. मात्र, तेव्हा ‘विदा’ (डेटा) तयार करणारे लोक मोठय़ा प्रमाणावर नव्हते, ना त्या विदेतून उपयुक्त माहिती काढण्यासाठी पुरेशी संगणकक्षमता होती. १९९० च्या दशकात या क्षेत्रात नावाजलेलं संशोधन झालं. ते टठकरळ विदा संचाच्या (डेटा सेट) रूपात उपलब्ध आहे. ते काय आह२, तर ‘पोस्ट कोड’ जर माणसांनी वाचण्याऐवजी यंत्रांनी वाचले तर पत्रवाटपाचं काम पटापट होईल असा विचार करून हा विदा संच बनवला ्रगेला. शून्य ते नऊ आकडय़ांच्या हस्तलिखिताच्या प्रतिमा गोळा करून, त्या प्रतिमा कोणत्या आकडय़ांच्या आहेत या लेबलासकट त्या संगणकाला दिल्या. संगणकांनी रवंथ करून त्यातून हातानं लिहिलेले आकडे बऱ्यापकी योग्य प्रकारे ओळखायला सुरुवात केली. जर हातानं लिहिलेले आकडे संगणक वाचू शकतात, तर अक्षरं का नाही? संगणक तेही वाचू शकतो. गंमत पाहा, लहान मूल जेव्हा वाचायला शिकतं तेव्हा छापलेली अक्षरं असोत, हातानं लिहिलेली असोत किंवा संगणकावर उमटलेली- त्याला ते निराळं शिकवावं लागत नाही. कारण आपल्या डोळ्यांना, मेंदूला ही सगळी अक्षरं सारखीच दिसतात. दोन लोकांचं हस्ताक्षर निराळं असेल, दोन टंक (फाँट) निराळे असतील; पण तेवढा फरक मानवी मेंदू सहज समजून घेतो. संगणकावर टंकलेली अक्षरं आणि हातानं लिहिलेली अक्षरं यांत संगणकाच्या दृष्टीनं मोठा फरक असा की, हातानं लिहिलेली अक्षरं किंवा छापील कागदाची स्कॅन केलेली प्रतिमा या दोन्ही गोष्टी अक्षरांच्या प्रतिमा असतात. प्रतिमा वाचताना दोन अक्षरं निराळी आहेत, दोन शब्द निराळे आहेत, हे संगणकाला शिकवावं लागतं. मात्र, टंकन करताना दोन अक्षरं स्वतंत्ररीत्या साठवली जातात. त्यामुळे प्रतिमांचे अर्थ लावण्यासाठी संगणक प्रणालीला स्वतंत्र शिक्षण द्यावं लागतं.

तर मुद्दाम सांगण्याची गोष्ट अशी की, विदा विज्ञान किंवा कृत्रिम बुद्धिमत्ता (आर्टििफशियल इंटेलिजन्स) या विषयात पकीच्या पकी मार्क मिळाले याचा अर्थ काहीतरी चुकलं आहे. हातानं लिहिलेले सगळे आकडे बरोबर ओळखले, उत्तरं बरोबर आली असं विदा विज्ञानात घडत नाही. काही ना काही चुकतंच. ‘बऱ्यापकी योग्य प्रकारे’ विभागणी करणं विदा विज्ञानाला जमतं. याचं मुख्य कारण ही गणितं करताना काही गृहितकं धरलेली असतात. ती गृहितकं सगळ्या वेळेस बरोबर असतील असं नाही. म्हणजे ‘लोकसत्ता’ वाचताना तुम्हाला ज्या जाहिराती दिसतात, ती सगळी उत्पादनं किंवा सेवा तुम्हाला हव्या असतील असं नाही. होय. या जाहिराती सगळ्यांना दिसत असतील तरीही सगळ्यांना एकच जाहिरात दिसत नाही. तरुण मुलींना पेन्शन फंडाची जाहिरात दाखवून काय फायदा? ‘नेटफ्लिक्स’वर तुम्हाला शिफारस आली म्हणून तो ठरावीक चित्रपट तुम्हाला आवडेलच असं नाही. ही भाकितं चुकण्यामागचं एक कारण असतं- गणित सोपं करण्यासाठी धरलेली गृहितकं. दुसरं कारण असं की, तुमची आणि तुमच्या मत्रिणीची चित्रपटाची आवड बहुतांश सारखीच आहे; पण तिला भौतिकशास्त्राची आवड आहे आणि तुम्हाला इतिहासाची. हे मतभेद विदा विज्ञानाला ओळखता येतीलच असं नाही. मात्र, थुक्कापट्टी, असंबद्ध काहीही जाहिराती दाखवण्यापेक्षा गणितांमधून आलेल्या शिफारशी उपयुक्त असतात.

तुम्ही फेसबुकवर किंवा गुगल ट्रान्सलेटवर भीषण मराठी वाचलं आहे का? त्या भाषांतरासाठीही विदा विज्ञान वापरतात. त्यात चुका होण्यासाठी तिसरंच कारण असतं- अपूर्ण विदा. कोणी विचारतं, ‘ग्रेसच्या कविता गेय आहेत का?’ ‘गेय’ हा मराठी शब्द ज्यांना मराठी पुरेसं माहीत नाही त्यांना ‘गे’ या इंग्लिश शब्दासारखा वाटू शकतो. गुगल ट्रान्सलेटमध्ये भीषण मराठी दिसण्याचं कारण असंच असतं. गुगल ट्रान्सलेटच्या प्रणालीला पुरेसं मराठी शिकवलेलं नाही. भाषा ही अत्यंत गुंतागुंतीची गोष्ट आहे. एकाच शब्दाचा अर्थ संदर्भानुसार बदलू शकतो. चित्रपटातलं एखादं ‘पात्र’ नदीच्या ‘पात्रा’तून घागरभर पाणी आणतं, तेव्हा ती घागर हेही ‘पात्र’ असतं. ‘पात्र’ या एकाच शब्दाचे तीन अर्थ निघतात, हे माणसांना सहज समजतं. संगणकाला ते शिकवणं सोपं नाही. पण २७ किंवा २९ चा पाढा माणसांना शिकवण्याचा प्रयत्न करा! अत्यंत किचकट गणितं संगणकाला शिकवणं सोपं असतं, पण भाषा विषयात माणूस पुढे आहे. निदान सध्या तरी! दोन वर्षांचं मूल ज्या हालचाली आपसूक शिकतं- रांगणं, चालणं, धावणं- त्या हालचाली रोबॉटला शिकवण्यासाठी माणसांची बुद्धी पणाला लागते. आणि खवचटपणा अनेक माणसांना जमत नाही. संगणक तर त्याबाबतीत सध्या अंडय़ातच आहेत. आपण मनुष्य ज्या कृती आणि निर्णय घ्यायला शिकतो ते सगळं संगणक प्रणालीला जमलं, संगणक प्रणाली हुशार झाली, तरीही ते ती निराळ्या पद्धतीनं शिकते.

विदा विज्ञान ही एक मोठी, विस्तारित ज्ञानशाखा आहे. सांख्यिकी, संगणक विज्ञान, माहिती विज्ञान, कृत्रिम बुद्धिमत्ता, सॉफ्टवेअर अभियांत्रिकी, विदागार (डेटाबेस) व्यवस्थापन, विदेची देवाणघेवाण असे बरेच विषय या ज्ञानशाखेचा भाग आहेत. विदा वैज्ञानिक म्हणून काम करताना या सगळ्या विषयांची थोडीबहुत माहिती असणं गरजेचं असतं. हल्लीच्या काळात कुप्रसिद्ध झालेल्या (आणि आता बंद पडलेल्या) ‘केंब्रिज अ‍ॅनालिटिका’ या कंपनीनं काय केलं याचा विचार करू. आधी त्यांनी फेसबुकवर चालणारं अ‍ॅप बनवलं. ज्या लोकांनी त्या अ‍ॅपला स्वतची माहिती गोळा करण्याची परवानगी दिली, त्यांची माहिती त्या अ‍ॅपनं गोळा केली. त्याच्या जोडीला या लोकांच्या मित्रयादीतल्या लोकांची माहितीसुद्धा अ‍ॅपनं गोळा केली. (यादीतल्या लोकांच्या परवानगीशिवाय त्यांची माहिती गोळा केल्यामुळे ‘केंब्रिज अ‍ॅनालिटिका’ गोत्यात आली.) हे अ‍ॅप लिहिण्यासाठी सॉफ्टवेर तंत्रज्ञानाची गरज असते. यातून गोळा केलेली विदा साठवायला विदागार (डेटाबेस) बनवावं लागतं. त्यापुढचा भाग असतो तो विदा निवडण्याचा. विचार करा, एकाच पिशवीतून भेंडी, तांदूळ, काबुली चणे, बांगडा आणि भाजलेले शेंगदाणे आणले तर खाण्याआधी ते सगळं वेगळं करावं लागेल. भेंडी खाण्याआधी तिची भाजी करावी लागेल. विदेचंही तसंच असतं. गोळा केलेल्या गोष्टींमधलं आपल्यासाठी उपयुक्त काय आणि ती कशी वापरायची, हे शोधावं लागतं. त्यापुढे येतो तो भाग मशीन लìनगचा. त्यातून मिळालेले निकाल सजवून वाढण्यासाठी पुन्हा गरज पडते सॉफ्टवेरची.

तर विदा विज्ञान कुठे कुठे? विदा आहे जिथे तिथे! विदा (डेटा) म्हणजे नक्की काय? ड्रायव्हर नसलेल्या स्वयंचलित गाडय़ा, फेसबुकवर ओळखीचे लोक कोण हे सुचवणं, गुगलवर ‘mon amour’ या शब्दप्रयोगाचं भाषांतर शोधणं, ‘उबर’ किंवा ‘ओला’वर टॅक्सी मागवणं, ‘लोकसत्ता’च्या संकेतस्थळावरच्या जाहिराती दिसणं, या सगळ्यामागे विदा विज्ञान आहे.

विदा विज्ञानातला सगळ्यात ग्लॅमरस भाग मशीन लìनगचा. (याला मोजके, पण अत्यंत उपयुक्त अपवादही आहेत.) त्यात निरनिराळ्या प्रकारची अल्गोरिदम असतात. त्या सगळ्यांमधलं साम्य म्हणजे समोर असलेल्या माहितीतून पॅटर्न शोधायचे. रस्त्यावर समोर लाल दिवा आला की गाडी थांबवायची. तो लाल दिवा समोरच्या गाडीचा, स्कूटरचा असेल किंवा सिग्नलचा! ही झाली एक वैशिष्टय़संगती, पॅटर्न. या स्वयंचलित गाडय़ांवर कॅमेरे असतात, ते त्या स्वयंचलित प्रणालीचे डोळे. त्यातून मुळात संदेश आलेला वाचायचा, मग तो लाल दिवा आहे असा त्याचा अर्थ लावायचा, मग लाल दिवा म्हणजे थांबायचं अशी आज्ञा द्यायची, हा त्या प्रणालीचा मेंदू किंवा मशीन लìनगचा भाग. पुढे काही यंत्रं गाडी थांबवतात. समोर गाडीचा लाल दिवा असेल तर तो नाहीसा झाला की आपणही पुढे जायचं, ही निराळी आज्ञावली. सिग्नलचा लाल दिवा असेल तर तो हिरवा झाला की निघायचं, ही निराळी आज्ञावली.

विदा विज्ञानात जशा निरनिराळ्या तांत्रिक बाजू आहेत, तशाच वेगवेगळ्या गणिती बाजूही आहेत. स्वयंचलित गाडय़ांच्या प्रणालीचं गणित निराळं. ती प्रणाली आपल्या मज्जासंस्थेवर आधारित आहे. त्यांत वापरलं जाणारं एक प्रकारचं अल्गोरिदम ‘न्यूरल नेटवर्क’ हे नाव कदाचित तुमच्या ओळखीचं असेल. हातानं लिहिलेले आकडे किंवा अक्षरं वाचणं; स्वयंचलित गाडी चालवणं; वेगवेगळ्या प्रतिमांचं वर्गीकरण करणं; अशा गोष्टींसाठी न्यूरल नेटवर्क वापरली जातात. आपल्याला ज्या प्रकारानं गोष्टींचं आकलन होतं, तसंच ते या कृत्रिम न्यूरल नेटवर्कना समजतं असं मात्र नाही. मला शिव्यांचे अर्थ जसे समजतील तशी काहीशी ही प्रक्रिया असते. माझ्यासारख्या शहरी, मध्यमवर्गीय मुलीच्या कानांवर फार तर काही शिव्या पडतात. हे शब्द वाईट आहेत, घरी वापरले जात नाहीत, हे मला समजतं. पण या शब्दांचे अर्थ कोणाला विचारायची चोरी असते. लोक ज्या संदर्भात असे शब्द वापरतात ते समजतं. शब्दकोश वगरे गोष्टी फार उशिरा आयुष्यात येतात. तोवर ‘भावना पोहोचतात.’ न्यूरल नेटवर्क वेगवेगळ्या गोष्टींचा अर्थ कसा लावतं, याचं आकलन आजवर कोणालाही पूर्णपणे झालेलं नाही. पण त्याची उपयुक्तता अजिबात कमी होत नाही.

विदा विज्ञानातला आणखी एक प्रकार जो आंतरजालावर वावरणाऱ्या लोकांच्या परिचयाचा असतो, ते म्हणजे आपले मत्र सुचवणं. फेसबुक मला शाळेतले, माझ्या वर्गातले बरेच ओळखीचे लोक दाखवत, ‘तुम्हाला हे लोक माहीत असतील’ असं म्हणतं. आपण ही माहिती ज्या प्रकारे समजून घेतो तसं फेसबुकला समजत नाही. म्हणजे आम्ही सगळे लोक एकाच शाळेत, एकाच वर्गात होतो, हे फेसबुकला माहीत नसेलही. कोणी शाळेचं नावही फेसबुकवर लावलं नसेल. कोणाची कोणाशी ओळख आहे, याचे आलेख पडद्याआड बनवले जातात. या ६० लोकांच्या आपसांत एवढय़ा ओळखी आहेत की या लोकांचा एकमेकांशी संबंध असणार, हे त्या प्रणालीला समजतं. मग फेसबुक मला ‘स्र्ीस्र्’ी ८४ ें८ ‘ल्ल६’मध्ये माझ्या वर्गातले लोक दाखवतं.

हल्ली दिवस ‘फेक न्यूज’बद्दल बोलण्याचे आहेत. फेसबुकवर, व्हॉट्सअ‍ॅप विद्यापीठात मिळणाऱ्या बातम्या खऱ्या का खोटय़ा हे शोधण्याची गरज अनेकांना वाटते. जर फेसबुकनंच आपल्याला हे सांगितलं तर..? त्यांचं सगळं म्हणणं खरं असेलच असं नाही. मात्र, ‘डुकराच्या पोटी मानवी मूल जन्माला आलं’ असल्या बातम्या खोटय़ा असल्याचं सांगायला माणसाला फार कष्ट पडत नाहीत. संगणक प्रणालींना हे शिकवावं लागतं. भाषा शिकवावी लागते. वेगवेगळ्या प्रकारच्या लोकांच्या भाषेत विविधता असते, हे शिकवावं लागतं. मी प्रमाण मराठी वापरते. मी सहसा ‘जाकीट’ असा शब्द वापरणार नाही, ‘जॅकेट’ म्हणेन. मराठीच्या अनेक बोली आहेत. वय-शिक्षण-जात अशा विविध पाश्र्वभूमीमुळे बोलीभाषा बदलते, संदर्भ बदलतात. हे सगळं संगणक प्रणालीला शिकवावं लागतं. पण एकदा ते शिकवलं की बातमीत तथ्य असण्याची शक्यता खूप जास्त आहे, का अगदीच कमी आहे, यासारखी भाकितं प्रणाली करू शकते.

संगणकाला भाषा नीट शिकवली नाही तर काय होतं, हे गुगल ट्रान्सलेट वापरणाऱ्या लोकांना चांगलंच माहीत असेल. सोबत दिलेली प्रतिमा पाहा. मी लिहिलेल्या ओळी मराठीत आहेत, हे गुगलला बरोबर ओळखता आलं. मात्र, इंग्लिश भाषांतर.. असोच.

आपण इंटरनेटवर काय खरेदी करतो, किंवा नेटफ्लिक्सवर कोणत्या चित्रपटांची प्रशंसा करतो, यावरून भाकितं करता येतात. समजा, मी नामदेव ढसाळांच्या कवितांचं पुस्तक विकत घेतलं तर कदाचित मला दया पवारांच्या आत्मकथनातही रस असेल.. अशा शिफारशी करता येतात. पुस्तकं, सिनेमांमधलं साधम्र्य शोधायचं आणि व्यक्तींच्या आवडीनिवडींवरून माणसांचे गट तयार करायचे. आणि मग त्यातून ज्यांना नामदेव ढसाळ वाचायचे आहेत त्यांना दया पवार, ऊर्मिला पवार, बेबीताई कांबळे यांची पुस्तकं सुचवायची. ही पुस्तकं वाचणारे काही लोक निरनिराळे दिवाळी अंकही वाचत असतील. काही लोक दिवाळी अंकांच्या फंदात पडणार नाहीत. त्यांची विभागणी तशा गटांमध्ये करायची. नेटफ्लिक्सवर शाहरुख खानच्या चित्रपटांना तुम्ही सतत नावं ठेवत असाल तर त्याचे चित्रपट तुम्हाला सुचवले जाण्याची शक्यता कमी. या संगणक प्रणालींना शाहरुख खान कोण, काय, काहीही माहीत नसतं. तरीही माणसांना काय काय गोष्टी आवडतात याचे पॅटर्न त्यांना समजतात.

थोडक्यात सांगायचं तर विदा विज्ञानाचा मोठा भाग पॅटर्न शोधण्याचा असतो. आपल्या अनेक व्यवहारांमध्ये पॅटर्न असतो. दिवाळी आली म्हणजे बरीच खरेदी होते. गृहोपयोगी वस्तू, कपडे, पुस्तकं, इलेक्ट्रॉनिक्स वस्तू.. बऱ्याच गोष्टी. सणासुदीला लोक जरा जास्त खरेदी करतात, हे दर महिन्याचे आकडे बघूनही दिसेल. मग विदा विज्ञान यापेक्षा निराळं कसं? तर नवा फूड प्रोसेसर विकत घेणाऱ्यांना त्याबरोबर ज्यूसर स्वस्तात मिळेल अशी ऑफर द्यायची. ढसाळांचं साहित्य विकत घेणाऱ्यांना ज्यूसरची ऑफर द्यायची नाही. कारण या जाहिराती दाखवायला फार कमी ‘रियर इस्टेट’ उपलब्ध असते. दुकानदारही हेच करतात. मिक्सरबरोबर ‘ग्राइंडर हवा आहे का?’ याची चौकशी करतात. ऑनलाइन खरेदी करताना संगणक यंत्रणा हेच काम करते. ढसाळांचं साहित्य विकत घेणाऱ्यांना पुलंचं साहित्यही न दाखवता आंबेडकर किंवा दया पवारांचं साहित्य हवं आहे का, हे विचारणं अधिक फायदेशीर ठरतं.

तुम्ही शाळेत शिक्षिका आहात किंवा बँकेत कॅशियर आहात आणि तंत्रज्ञान क्षेत्राशी तुमचा अर्थाअर्थी काहीही संपर्क, संबंध नाही. मग हे तपशील माहीत नसले तरी काय फरक पडतो? एवीतेवी फूड प्रोसेसर विकत घेणार होताच; त्याबरोबर घेतला एक ज्यूसर विकत. ज्यूसरचा उपयोग होतोय हा आणखी एक फायदा. आपल्याला एखादी वस्तू हवीच आहे हे माहीत असेल तर काहीच अडचण नाही.

मध्ये मी फेसबुकवर जीमेलबद्दल तक्रार वाचली. जीमेल आपली ई-मेल वाचतं म्हणून! तर आता फेसबुकलाही या लोकांनी आपल्या भावना आणि विचार काय, ते सांगितलेलं आहे. याचा संबंध तुमच्या प्रायव्हसी सेटिंग्सशी नाही. फेसबुकवर तुम्ही जे काही लिहिता ते सगळ्यांना दाखवत नसालही, पण फेसबुकपासून ते लपून राहत नाही. फेसबुकनं साधारण गेल्या वर्षभरात त्यांच्याकडे गोळा होणाऱ्या विदेच्या खाजगीपणाची काळजी घ्यायला सुरुवात झालेली आहे. ‘केंब्रिज अ‍ॅनालिटिका’बद्दल माहिती प्रसिद्ध व्हायला सुरुवात झाली तेव्हा काही लोकांचं म्हणणं होतं, तुमच्या ३० फेसबुक पोस्ट्स वाचल्या की तुमच्या पार्टनरला तुमच्याबद्दल जेवढं माहीत नसेल तेवढं त्यांना समजतं. १०० पोस्ट्स वाचल्या की तुम्हाला स्वत:बद्दल जे काही माहीत असतं त्यापेक्षा जास्त त्यांना समजतं. त्याचं कारण आपल्यातले किती लोक मानसशास्त्र शिकलेले असतात? आणि मानसशास्त्र शिकलेले लोकही किती लोकांशी तपशिलात बोलू शकणार? फेसबुकवर काय लिहिलं जातं ते कोणी विदा वैज्ञानिकांनी गोळा केलं, आणि मानसशास्त्रज्ञांच्या मदतीनं त्यांतले पॅटर्न शोधून काढले तर त्यांना दोन्ही अडचणी सहज पार करता येतात.

व्यक्तिश: तुम्हाला त्याचा काही त्रास होईल असं नाही. पण आपल्या खाजगीपणावर कधी आणि कसा हल्ला होतो हे आपल्याला समजतही नाही. माझा फोन आता जुना झालाय. फार त्रास होत नाही, पण आता झाली अडीच र्वष. बदलायला हरकत नाही. डेटा सायंटिस्टना नवाकोरा, फडफडीत आयफोन घेण्याएवढे पसे मिळतात. आहे तो फोन जरा जास्त चालवता यावा, म्हणून मी थोडं गुगल सर्च करते. गुगलला समजतं की मला नवीन फोन घेण्यात रस असू शकेल. मी टठकरळ विदेची प्रतिमा शोधण्यासाठी गुगल सर्च करते तेव्हा मला सहज एखाद्या कोपऱ्यात फोनची जाहिरात दिसते.

तुम्ही कधी पजा लावता का? जेव्हा आपण पज जिंकणार याची आपल्याला खात्री असते तेव्हा आपण पजेची बोली सहज वाढवतो. फोनच्या जाहिरातीवर मी क्लिक करते तेव्हा गुगलला व फोन विकणाऱ्या कंपन्यांना समजतं, की मी फोन विकत घेण्याची शक्यता बरीच जास्त आहे. मी दुसऱ्या दिवशी कामाला जाते. काम करताना काहीतरी अडतं. मी कामाची गोष्ट गूगल सर्च करते तेव्हा मला फोनच्या जाहिराती दिसतात. येत्या आठवडय़ात नवा फोन विकत घेतला तर भरभक्कम सवलत मिळणार, नाही तर ‘जगातली सगळ्यात मोठ्ठी सवलत मला मिळणार नाही,’ असं ती जाहिरात मला सतत आठवडाभर सांगत राहते. मी त्या जाहिरातीकडे दुर्लक्ष करून कामाला लागते. मी जाहिरातीकडे दुर्लक्ष केलं हेसुद्धा गुगल व जाहिरात कंपन्यांना समजतं. मग ते कदाचित मला कमी जाहिराती दाखवतील; किंवा माझ्याबद्दल निराळा निष्कर्ष काढतील. ग्राहक नक्की काय काय करतात, दुकानासोबत त्यांचा प्रवास कसा होतो, त्यावरून त्यांना नक्की काय ऑफर्स द्यायच्या हे ठरवणं, असं माझ्या कामाचं थोडक्यात वर्णन करता येईल.

हा लेख आणि माझं नाव वाचूनही काही गोष्टी तुम्हाला समजल्या असतील. मराठी बोलणारी, ‘संहिता’ असं नाव असणारी ही स्त्री बहुधा पन्नाशीच्या पुढची नसणार आणि लेख लिहितेय म्हणजे विशी पार केलेली असणार. पण माझी सामाजिक पाश्र्वभूमी माहीत नसूनही माझ्याबद्दल बरीच माहिती गुगलकडे आहे. आपण काय गुगल करतो, कोणते पत्ते शोधतो, कुठे खायला जातो, या गोष्टी आपण जाहीर केल्या तर गुगल, फेसबुक आणि अशा अनेक कंपन्यांपासून त्या लपून राहत नाहीत. आपल्यासारख्या असंख्य माणसांची माहिती गोळा करून आपल्या अनेक खाजगी गोष्टी समजतात. भारतात राहणाऱ्या विशीच्या तरुणींना फेसबुकवर किंवा ‘लोकसत्ता’च्या पानावर

‘फेअर अँड लव्हली’च्या जाहिराती दिसतील, कारण त्यांना पेन्शन फंडाच्या जाहिराती दाखवणं व्यर्थ आहे. तर तरुणांना ‘व्हे प्रोटीन’च्या. सध्या हे असं घडतंय, किंवा नजीकच्या भविष्यात हे असंच घडणार आहे. मला हे अगदी पक्कं ठाऊक आहे. कारण हेच माझं काम आहे. मात्र गुगलनं माझ्याबद्दल काढलेले काही निष्कर्ष साफ चुकीचे आहेत. मी मुद्दाम त्या संबंधित गोष्टी गुगल सर्च करते. माझी छोटीशी गंमत!

सेल्स आणि मार्केटिंगवाले लोक मला म्हणतील, हाच तर मार्केटिंगचा प्राथमिक नियम आहे. जे लोक आपल्या वस्तू, सेवा विकत घेणार नाहीत त्यांच्यावर वेळ फुकट घालवू नका. वेळेचीही किंमत असते. जे लोक वस्तू एवीतेवी विकत घेणारच आहेत त्यांना थोडी सवलत दिली, थोडं त्या दिशेला ढकललं, तर काय बिघडलं?

भारतात मोठय़ा प्रमाणावर इंटरनेटचा प्रसार झाला तो २००० सालाच्या पुढे. गुगल आलं, आपल्याला नक्की कशात रस आहे, हे गुगलला समजतं. अनेकांचे ई-मेल पत्ते गुगलचे असतात, माझाही आहे. आंतरजालावर शोधाशोध करण्यासाठी आज तरी गुगलला समर्थ पर्याय नाही. आपण किती लोकांशी, कोणत्या लोकांशी, काय प्रकारे बोलतो, हे आपली ई-मेल वाचून गुगलला समजतं. आपली ई-मेलं गूगल वाचतं याबद्दल फेसबुकवर संताप व्यक्त झालेला वाचला. मात्र, आपला संताप आपण स्वत: होऊनच फेसबुकला कळवतो.

तर गेल्या दशकात गुगल, फेसबुक, ट्विटर आले. सुखदु:खाच्या बातम्या, ऑफिसात झालेला संताप, ट्रेनमध्ये घडलेल्या गोष्टी, सत्ताधारी पक्षाच्या धोरणांबद्दल आपली मतं या सगळ्या गोष्टी आपण फेसबुकला सांगतो. पुरेशा लोकांची माहिती गोळा केली की आपण कोणाला कोणत्या शिव्या देतो, कशी भाषा वापरतो यावरून आपलं वय, जात, पाश्र्वभूमी या गोष्टी सहज शोधता येतात. माझं नाव, आडनाव, लेख वाचून फार तर वय आणि जातीचा अंदाज तुम्हाला येईल. त्यापेक्षा कितीतरी जास्त माहिती गुगल, फेसबुककडे आहे. फेसबुकवर आपण कोणाच्या पोस्ट्स लाइक करतो, कोणाच्या पोस्ट्स शेअर करतो, कोणाला ब्लॉक करतो, ते लोक काय लिहितात, यावरून आपलं मित्रमंडळ काय व कसं आहे हे सहज समजतं. ते फक्त समजल्यामुळे तसा फार फरक पडू नये. पण मुंग्यांनी मेरू पर्वत चढला तर? आज मुंग्या आहेत, उद्या त्या हत्तीएवढय़ा मोठय़ा झाल्या तर? त्या होत आहेतच. आपण त्यांना मोठं करत आहोत.

आपल्याला ज्या गोष्टी ऐकाव्याशा वाटतात, त्या खोटय़ा वाटत असतील तरीही आपण विश्वास ठेवतो. आपल्या नावडत्या राजकीय पक्षानं काही घोळ घातलाय अशी बातमी आली की खरं-खोटं न पाहता आपण ते मान्य करतो. मग फेसबुक-ट्विटरवर होणाऱ्या विनोदी हाणामाऱ्या हल्ली वर्तमानपत्रांतूनही छापून येतात. आपल्यासारख्याच सामान्य लोकांशी आपण चवीचवीनं पंगा घेतो. एखादी बनावट बातमी- ‘डुकरानं मानवी बाळाला जन्म दिला’ ही तद्दन खोटी माहिती मोठय़ा प्रमाणावर लोकांनी पसरवली तर ती फेसबुकच्या प्रणालीला खरी वाटू शकते. आपली राजकीय मतं काय आहेत, हे फेसबुक, ट्विटरला समजलं आहे. ‘भक्त’ किंवा ‘द्वेष्टे’ ही नावं आपण दिलेली. ती फेसबुकच्या प्रणालीला तशीच समजतात असं नाही. मात्र, कोण लोक एकमेकांशी सतत भांडतात, हे फेसबुकच्या संगणक प्रणालीला समजतं.

या समाजमाध्यमांचा मला दुस्वास आहे असं समजू नका. समाजमाध्यमांवर वेळ मिळेल तितपत मी वावरते. तिथे बरंच चांगलं काही वाचायला मिळतं. करमणूक होते. आणि तिथल्या ओळखींमधूनच ‘लोकसत्ता’च्या संपादकांना माझ्याबद्दल समजलं. माझे जवळचे काही मित्रमत्रिणी मला समाजमाध्यमांमुळेच सापडले आहेत. एवढं सगळं माहीत असूनही मला याबद्दल थोडी शंका वाटते. आपण किती आणि काय लिहितो, यावर कोणीतरी लक्ष ठेवून आहे. लहान मुलांना कोणी एकटं फिरू देत नाही, तसं आंतरजालावर आपल्याला खाजगीपणा नाही. अजिबात नाही. आपण तिथे काय लिहितो, स्वत:बद्दल काय माहिती जाहीर करतो, याकडे आपलं कितपत लक्ष असतं?

यंत्रांनी पृथ्वीचा ताबा घेतला, यंत्रांनी आपल्या विचारांचा पूर्णतया ताबा घेतला, असं कधी घडेलसं मला वाटत नाही. यंत्रं माणसांचं ऐकतात. तुमच्या-माझ्यासारखीच माणसं. ज्यांना मतं आहेत. माणसांना गणित आणि सॉफ्टवेअर येतं, आणि ज्यांच्यात काही दोषही आहेत. या माणसांना आवडनिवड आहे. या माणसांनी गोळा केलेल्या विदेवर मानवी मर्यादाही आहेत. उगाच का भीषण गुगल भाषांतरं दिसतात!

त्याचा परिणाम कसा होतो? काही कॅमेऱ्यांमध्ये सोय असते की फोटो काढताना माणसांचे डोळे बंद झाले तर कॅमेरा पुन्हा फोटो काढतो. चिनी आणि इतर पौर्वात्य लोकांचे डोळे बारीक असतात. या लोकांचे फोटो काढणं अशा कॅमेऱ्यांना जमत नव्हतं. कारण त्यांनी जमा केलेली बहुतांश विदा गोऱ्या लोकांची होती आणि पौर्वात्य लोकांचे डोळे उघडे असलेले या कॅमेऱ्यांना समजत नव्हतं. कॅमेरे वर्णद्वेष्टे नव्हते. कदाचित ती प्रणाली विकसित करणारे लोकही वर्णद्वेष्टे नव्हते. फेसबुकवर फोटो प्रकाशित केले की फेसबुक त्यातले चेहरे टॅग करण्याबद्दल विचारतं. अशा एका प्रणालीनं कृष्णवर्णीय लोकांचं वर्णन ‘गोरिला’ असं केलं. आपल्याकडे अ‍ॅट्रोसिटीशी तुलना करता येईल इतपत अक्षम्य आहे हा प्रकार. याचं कारण अपूर्ण विदा! नोकरी शोधणाऱ्या संस्थळांनी (वेबसाइट्स) स्त्रियांना कमी पगाराच्या नोकऱ्या दाखवणं हे नेहमीचं आहे. मुळात स्त्रियांना पगार कमी मिळतो, त्यात त्यांना संधीही असमान दिसत असतील तर तो दुप्पट अन्याय होतो. अर्धवट शिक्षणातून होणारे दुष्परिणाम विदा विज्ञानाच्या बाबतीत अधिक परिणामकारक असतात. एका माणसापेक्षा एका संगणक प्रणालीचा परिणाम अधिक लोकांवर होतो.

खैरलांजीची बातमी आपल्याला दिसलीच नाही तर? मॉब िलचिंगच्या बातम्या आपल्यापासून दडवून ठेवल्या तर? आज अशाच प्रकारे फेसबुक-ट्विटरवर बातम्या पसरतात. आपली राजकीय विचारधारा एकदा गुगल, फेसबुक, ट्विटरला समजली की त्यापलीकडचं काही आपल्यापर्यंत पोहोचणं कठीणच असतं. मोदीभक्तांना वाटतं मोदीच थोर! इतर काही विचार त्यांच्यापर्यंत पोहोचतच नाहीत. मोजकं काही पोहोचलं तर हे लोक त्या गोष्टी मोडीत काढतात. तसंच मोदीद्वेष्टय़ांचं असंच एक निराळं जग तयार झालेलं आहे; तेही आपल्या कोषाबाहेरचं काही लक्षात घेत नाहीत. आपण आपल्यासारख्याच माणसांना शत्रू बनवतो. मनुष्य म्हणून आपल्या स्वभावातल्या उणिवा झाकण्याऐवजी तंत्रज्ञान आणि त्यातून फायदा काढणारे लोक स्वतच्या फायद्यासाठी त्या वापरून घेतात.

बातम्या वाचण्यासोबतच त्यावर दोन-तीन निरनिराळ्या विचारधारेच्या विवेकी लोकांची मतं वाचण्याची सोयही वृत्तपत्रांमध्ये असते. फेसबुकवर लिहून मलाही मजा येते. पण आपण जे लिहीत आहोत ते खोटंनाटं नाही, कोणाला उपद्रव देण्यासाठी लिहिलेलं नाही आणि ‘दुरितांचे तिमिर जावो’ असा विचार करून लिहिता येतं. माणसांना नावं ठेवण्यापेक्षा विचार आणि कृतींची चिकित्सा करणं शक्य असतं. ते नाही तर मांजरांचे व्हिडीओ जालावर आहेत.

आपण आपल्या पशांच्या बाबतीत अत्यंत जागरूक असतो. छापील किमतीपेक्षा दोन रुपये जास्त लावले तर आपण देणार नाही. येत्या काळाचं चलन आहे आपली विदा. आपलं नाव, वय, जात, िलग एवढय़ाच गोष्टी नव्हे, तर आपण कुठे, काय खातो, कोणते कपडे विकत घेतो, चित्रपट, पुस्तकं, वृत्तपत्रं, राजकीय पक्ष यांबद्दल आपली आवड काय आहे, आपण कोणती स्कूटर किंवा कार चालवतो, ही सगळीच माहिती जमा करता येते. पशांचं मोल आपल्याला समजतं, पण आपल्या विदेचं समजतं का? आपल्या स्वतंत्र विचारांचं मोल आपल्याला आहे का? आंतरजाल न वापरण्याचा पर्याय आपल्याला आजच्या जगात नाही. मात्र, आपली माहिती वाचून कोणी आपल्या विचारस्वातंत्र्यावर कब्जा करणं शक्य आहे; ही गोष्ट समजणं महत्त्वाचं आहे.

त्यासाठी हा लेख वाचणं पुरेसं नाही. हा विषय नवा आणि किचकट आहे. फेसबुक, फ्लिपकार्टवर खरेदी हे सगळंच नवं आहे. आणि मराठीत या विषयावर फार माहिती उपलब्ध नाही. माहिती आहे म्हणून ती वाचून त्यावर विचार केला जातो असंही नाही.

स्वत:च्या विचारस्वातंत्र्यावर प्रेम आहे म्हणून मी मला अत्यंत नावडते असणारे विषय मुद्दामच गुगलते. ती फक्त गंमत नसते..

First Published on May 20, 2019 1:07 am

Web Title: data science
Just Now!
X