संगणकावर अथवा मोबाइलवर मजकूर टंकलेखित करीत असताना शुद्धलेखनाच्या चुका आपोआप दुरुस्त केल्या जातात. व्याकरणाच्या चुका अधोरेखित केल्या जातात. एक शब्द लिहिला की पुढचा संभाव्य शब्द आपोआप पटलावर दृश्यमान होतो. या अनुभवातून जाताना असे वाटते की जणू ही यंत्रे आपल्याहूनही अधिक भाषातज्ज्ञ आहेत. पण हे खरोखर सत्य आहे का? या प्रश्नाचे उत्तर अर्थातच नाही असे आहे. नैसर्गिक भाषा प्रक्रियेची तंत्रे वापरून यंत्रांनी भाषा शिक्षणात आजवर खूप प्रगती केली असली तरी अजूनही भाषेची अनेक अंगे समजून घेणे यंत्रांना जमलेले नाही. यंत्राच्या भाषा शिक्षणाचा मार्ग इतका खडतर का आहे हे थोडक्यात पाहूया.

मुळात नैसर्गिक भाषा या नियमांच्या चौकटीत बंदिस्त आणि अविचल नसतात. भाषेला व्याकरणाच्या नियमांची एक चौकट असली तरी व्याकरणाच्या नियमांना अनेकदा अपवाद असतात. कोसाकोसावर बोलीभाषा बदलतात. काळानुसार काही शब्द भाषेतून वजा होतात वा नवे शब्द भाषेत सामील होतात. संदर्भानुसार अर्थ बदलतो. उपरोध, उपमा, उत्प्रेक्षा, प्रतीके, रूपके हे अर्थालंकार भाषेला समृद्ध करत असले तरी त्यामुळे भाषा समजण्यास जटिल होते व यंत्रांना ती समजणे अधिकाधिक कठीण होत जाते.

Rural Medical Center, transfer a organization from old to new generation, daughter in law, mother in law,
सांधा बदलताना : हस्तांतरण..
Loksatta kutuhal Artificial Intelligence in Cyber crime
कुतूहल: सायबर गुन्ह्यांतील कृत्रिम बुद्धिमत्ता
ICMR slammed Covaxin side effects study Banaras Hindu University
कोवॅक्सिनच्या सुरक्षिततेबाबत प्रश्न विचारणारे संशोधन ICMR ने का धुडकावून लावले?
Google Generative Search AI Features in Marathi
Googleच्या जेमिनी-AI सह करता येईल ‘जेवणाचे प्लॅनिंग, व्हिडीओवरून शोध’! काय आहेत भन्नाट फीचर्स, पाहा
first woman director of IIT Madras
IIT, MIT मधून पदवी ते पीएचडी शिक्षण पूर्ण करणाऱ्या आयआयटी मद्रासच्या पहिल्या महिला डायरेक्टर कोण? पाहा
How To Divide Work in 24 Hours To Stay Away From Diabetes
२००० लोकांच्या निरीक्षणातून तज्ज्ञांनी मांडलं आजार टाळण्याचं सूत्र; २४ तासांचे व कामाचे विभाजन कसं करावं, पाहा वेळापत्रक
cow cuddling US cow to human bird flu transmission America
“गाईंना मिठी मारु नका”; अमेरिकेत का देण्यात आले आहेत असे आदेश?
how scam callers find numbers
स्कॅम कॉल करणाऱ्यांना तुमचा नंबर कसा मिळतो? स्वतःच्या सुरक्षेसाठी ‘ही’ माहिती जाणून घ्या…

भाषेतील संदिग्धता हा यंत्र शिक्षणात फार मोठा अडसर ठरतो. मराठी भाषेतील उदाहरण द्यायचे झाले तर ‘‘नमस्कार कर.’’ ‘‘कर हा करी धरीला.’’, ‘‘ उत्पन्नावर कर भरावा लागतो.’’ या तीनही वाक्यांत कर हा शब्द वेगळ्या अर्थांनी आला आहे. असे बहुअर्थी शब्द नैसर्गिक भाषा प्रक्रियेला अडथळे निर्माण करतात.

भाषेचे असंख्य पैलू आणि बदलती रूपे समजण्यासाठी यंत्रांना प्रचंड प्रमाणात विदा (डेटा) पुरवावा लागतो. या विदाच्या आधारेच भाषा प्रक्रियेची प्रारूपे स्वयंशिक्षित होतात. कधीकधी हा विदा अपुरा, एकांगी, कलुषित, विस्कळीत असू शकतो आणि अशा विदावरून शिक्षण घेणारी प्रारूपे चुकीचे निष्कर्ष कढतात. विदा मिळवताना गोपनीयतेचे व नैतिकतेचे नियम पाळणेसुद्धा गरजेचे असते.

ही प्रारूपे स्वतंत्रपणे काम करत नाहीत तर त्यासाठी लागणारा प्रचंड मोठा विदा साठवण्याची व अपेक्षित वेगाने विश्लेषण करण्याची क्षमता यंत्रात असावी लागते जे अर्थातच खर्चीक असते. अशा अडचणींमुळे प्रमाणिकृत आणि नि:संदिग्ध असा भाषेचा भाग समजून घेणे यंत्रांनी साध्य केले असले तरी त्यांचे भाषाशिक्षण पूर्णत्वास पोहोचण्याचा पल्ला अद्याप दूरच आहे.

प्रा.माणिक टेंबे, मराठी विज्ञान परिषद