17 September 2019

News Flash

आडातली विषमता पोहऱ्यात

विदाविज्ञान (डेटा सायन्स) हा विषय गेल्या काही वर्षांतच मोठा झाला आहे. गेल्या दशकात ते सगळं संख्याशास्त्रात मोजलं जात असे.

(संग्रहित छायाचित्र)

संहिता जोशी

आपल्या समाजात, मनात आणि पर्यायानं भाषेत, वर्तनात, लेखनात ही असमानता असते. संगणकाला भाषा शिकवताना जे साहित्य वापरलं गेलं- भाषेची जी विदा तयार झाली- त्यात मुळातच असमानता आहे.

एका मित्रानं कोडं घातलं- एक मुलगा आणि त्याच्या वडलांचा भीषण अपघात होतो. मुलावर शस्त्रक्रिया करणं गरजेचं असतं. डॉक्टर मुलाकडे बघून म्हणतात, ‘‘माझ्या मुलावर मी शस्त्रक्रिया करू शकणार नाही!’ हे कसं शक्य आहे?

विदाविज्ञान (डेटा सायन्स) हा विषय गेल्या काही वर्षांतच मोठा झाला आहे. गेल्या दशकात ते सगळं संख्याशास्त्रात मोजलं जात असे. गेल्या दशकात ऑर्कुट, मायस्पेस, फेसबुक, ट्विटर अशी समाजमाध्यमं आली; ऑर्कुट, मायस्पेस बंदही पडले. ‘आमच्या काळी आम्ही लोकांना ईमेल करायचो!’ हल्ली त्याची जागा व्हॉट्सअ‍ॅप, वगरेंनी घेतली आहे. या सगळ्या समाजमाध्यमांमध्ये शब्द-भाषा वापरणं, हा भाग समान आहे.

अत्यंत व्यक्तिगत आणि गोपनीय समजल्या जाणाऱ्या ईमेलपासून आणि जाहीररीत्या लिहिलेल्या फेसबुक/ट्विटर पोस्ट्सपर्यंत, सगळ्या गोष्टी त्या-त्या सेवादात्यांच्या विदागारांमध्ये (डेटाबेस) साठवल्या जातात. बहुतांश माणसांना भाषा जशी सहज शिकता येते, तसं संगणकाचं नाही. याउलट २७ किंवा २९चा पाढा संगणक सहज म्हणू शकतो.

मग एवढे कष्ट घेऊन संगणकाला भाषा का शिकवायची? कधी कामं कंटाळवाणी असतात, तेच-तेच काम करताना माणसांकडून चुका होऊ शकतात आणि महत्त्वाचं म्हणजे एखादं काम मोठय़ा प्रमाणावर करायचं असेल तर ते यंत्राकडून करवून घेणं सोपं आणि स्वस्त असू शकतं.

सकाळी उठल्यावर मला फेसबुक दाखवतं, चार नवीन फ्रेंडरिक्वेस्ट आलेल्या आहेत. फेसबुकचे सव्वादोन अब्जपेक्षा जास्त वापरकत्रे आहेत; संपूर्ण जगात, तिनापैकी एक माणूस. एवढय़ा सगळ्या लोकांना किती फ्रेंडरिक्वेस्ट आल्या, हे हातानं मोजणं अशक्य आहे. यांतले अनेक लोक दिवसाकाठी काही-ना-काही फेसबुकवर लिहीत असतात. समजा यांतले एक टक्का लोक वर्षांतला एक दिवस विषारी, जहरी आणि फेसबुकच्या वावर-वापराच्या नियमांत बसणार नाही असं काही लिहितात. म्हणजे किती पोस्ट्स होतील? तर वर्षांला सव्वादोन कोटी पोस्ट्स; सरासरी दिवसाला साठ हजारांपेक्षा जास्त पोस्ट्स काढून टाकाव्या लागतील.

हे लोक लिहिताना फेसबुकला सांगत नाहीत की, या पोस्टमध्ये फेसबुकच्या नियमांचं उल्लंघन केलेलं आहे. म्हणजे फेसबुकला दिवसाकाठी येणारी सगळी पोस्ट्स वाचावी लागतील आणि त्यातली जर काही नियमबाह्य असतील तर काढावी लागतील. हे सगळं हातानं करणं परवडणारं नाही. म्हणून संगणकाला भाषा शिकवाव्या लागतात. संगणकाला फक्त इंग्लिश भाषा येत असेल, आणि मी मराठीत नियमबाह्य काही लिहिलं तर ते संगणकाला समजणारच नाही.

मराठी भाषेत आक्षेपार्ह मजकूर काय असेल, हे जसं फेसबुक ठरवतं तसं मराठी भाषा बोलणारे लोकही ठरवतात. भडभुंजा म्हणजे कुरमुरे भाजणारा. हा शब्द माहीत नसेल तर मराठी समजणाऱ्यांना ती शिवी वाटेल, नाही का? याउलट, ठरावीक जातिवाचक शब्दांचा उच्चार मराठी शिव्यांसारखा होत नाही; पण सामाजिक संदर्भामुळे ते शब्द अपमानास्पद ठरतात. आक्षेपार्ह आणि नियमबाह्य यांतही फरक असतो. ते तपशील नंतर कधी तरी.

संगणकानं भाषा शिकण्याचं रोजचं एक उदाहरण म्हणजे ईमेलची वर्गवारी. एके काळी बऱ्याच लोकांना नायजेरियातल्या श्रीमंत काका-मामा मरण्याची ईमेलं येत असत. तो लोकांना गंडवण्याचा प्रकार होता. हल्ली असली ईमेलं येत नाहीत; हल्ली ‘फेक न्यूज’ येतात. ती ईमेलं बंद होण्याचं कारण म्हणजे या सगळ्या गुन्हेगारांना पकडलं, शिक्षा झाली असं अजिबात नाही. सेवादाते आपली ईमेलं वाचतात आणि अशी चुकार (स्पॅम) ईमेलं आपल्यापर्यंत पोहोचू देत नाहीत. अशी ईमेलं थेट कचऱ्यात पाठवली जातात. म्हणजे बिचाऱ्या(!) चोरांनी मोठय़ा कष्टानं आपल्याला काका-मामा मेल्याची ईमेलं लिहून ती आपल्याला मिळालीच नाहीत, तर त्यांचा व्यवसाय कसा चालणार! उलटपक्षी, आता चुकार ईमेलं येत नाहीत म्हणून आपण ईमेल सेवांबद्दल समाधानी राहतो.

गुगल, बिंग किंवा तत्सम शोधसेवांनाही आपण जे प्रश्न विचारतो त्याच्याशी संबंधित गोष्टी पुरवायच्या असतात. सुरुवातीला आंतरजालावर फार माहिती उपलब्ध नव्हती; मोजक्या विषयांबद्दल मोजके लोक लिहीत होते. आता तसं नाही. प्रतिष्ठित वर्तमानपत्रं, आस्थापनांपासून सामान्य लोकांचे ब्लॉग्ज, संस्थळं असतात. त्यावर वेगवेगळ्या प्रकारची माहिती असते. घरी जागेवर ठेवलेल्या वस्तू जशा सहज सापडतात, तसं आंतरजालावर असलेल्या माहितीचं, शब्दांचं योग्य वर्गीकरण करून ठेवलं की वापरणाऱ्यांना चांगला अनुभव मिळतो; त्यातून या सेवा अधिक लोकप्रिय होतात.

अशी अनेक उदाहरणं देता येतील. आंतरजालावर लेखन जेवढं जास्त तेवढी अधिक विदा (डेटा) उपलब्ध होते. भाषा, शब्द, सामाजिक संदर्भ म्हणून आणि त्यात आक्षेपार्ह/ नियमबाह्य काय, उपयुक्त काय, लोकांना काय आवडतं अशा सगळ्याच प्रकारची विदा.

भाषेच्या बाबतीत, संगणकाला भाषा शिकवली की शब्दांचे आलेख काढता येतात. सोबत दिलेलं चित्र पाहा. पहिल्या आलेखात शब्दांचे िलगभाव आहेत (स्त्री : पुरुष :: राणी : राजा). दुसऱ्या उदाहरणात क्रियापदांचे दोन काळ आहेत (जेवा : जेवले :: बसा : बसले). दोन्ही उदाहरणांपैकी कोणत्याही उदाहरणातले तीन शब्द दिले तर चौथा ओळखणं शक्य आहे. संगणक अशा प्रकारच्या आलेखांमधून भाषा शिकतात. त्यातून संगणकाला नाती सहज समजली. आणखी एक सोपं उदाहरण म्हणजे

आई : बहीण :: वडील : भाऊ.

माझ्या मित्रानं विचारलेल्या कोडय़ाचं उत्तर होतं, त्या मुलाची आई डॉक्टर असते. आपल्या मनात, त्यामुळे भाषेत, अभिव्यक्तीमध्ये अनेक सामाजिक संदर्भ असतात. हे संदर्भ मुळातच अन्याय्य असले तर भाषेत विषमता उतरते. मुलाचं लग्न होतं आणि ‘मुलगी कोणाकडे दिली’ जाते. डॉक्टर, वकील, लेखक, इंजिनीअर, वैज्ञानिक असे व्यावसायिक पुरुष असल्याचं आपसूक समजलं जातं. या व्यवसायांपेक्षा कमी पगार किंवा कमी दर्जा असणारे काही व्यवसाय स्त्रियांचे मानले जातात; नर्स, प्राथमिक शिक्षिका या व्यवसायांमध्ये स्त्रियांची बहुसंख्या असते.

संगणकानं भाषा शिकण्याची वर दिलेली उदाहरणं भाषा आणि सामाजिक बाबतीत तटस्थ आहेत. यंत्रांना इंग्लिश भाषा शिकवली तेव्हा त्यातून सामाजिक विषमता उघडी पडली. त्यांची काही प्रसिद्ध उदाहरणं म्हणजे- वडील : डॉक्टर :: आई 😕 याचं उत्तर आलं नर्स. वडील : प्रोग्रॅमर :: आई 😕 याचं उत्तर आलं, हाऊसवाइफ.

संगणकाला लिंगभाव, त्यांतली असमानता, त्याचे सामाजिक संदर्भ या गोष्टी स्वतंत्ररीत्या शिकवण्याची आवश्यकता नव्हती. आपल्या समाजात, मनात आणि पर्यायानं भाषेत, वर्तनात, लेखनात ही असमानता असते. संगणकाला भाषा शिकवताना जे साहित्य वापरलं गेलं त्यात मुळातच असमानता आहे.

सत्तावीसचा पाढा पाठ करण्याची गरज आता उरलेली नाही; स्वस्त कॅलक्युलेटर, आणि स्मार्टफोन्स सहज उपलब्ध आहेत. फोनवर ‘सत्तावीस सक किती’ याचं उत्तर मिळतं आणि त्यावर बेलाशक विश्वास टाकता येतो. मात्र पुरुष डॉक्टर असतात आणि स्त्रिया नर्स असतात किंवा नोकरी-व्यवसाय करतच नाहीत, अशी उत्तरं त्रिकालाबाधित सत्य मानावीत का?

विदावैज्ञानिकांचं एक काम असतं, ते विदेतून असे विषमतेचे संदेश दिसले तर त्याचा योग्य अर्थ लावणं. तसं केलं नाही तर हे विष पुढे जातं आणि मोठय़ा प्रमाणावर पसरतं. विदेचा कल विषमता वाढवणारा असेल तर त्याला योग्य संदर्भचौकट लावणं ही विदावैज्ञानिकांची जबाबदारी आहे.

लेखिका खगोलशास्त्रात पीएच.डी. आणि पोस्ट-डॉक असल्या, तरी सध्या विदावैज्ञानिक म्हणून कार्यरत आहेत.

ईमेल : 314aditi@gmail.com

First Published on April 3, 2019 12:14 am

Web Title: vidabhan article by sanhita joshi 8