संगणकावर अथवा मोबाइलवर मजकूर टंकलेखित करीत असताना शुद्धलेखनाच्या चुका आपोआप दुरुस्त केल्या जातात. व्याकरणाच्या चुका अधोरेखित केल्या जातात. एक शब्द लिहिला की पुढचा संभाव्य शब्द आपोआप पटलावर दृश्यमान होतो. या अनुभवातून जाताना असे वाटते की जणू ही यंत्रे आपल्याहूनही अधिक भाषातज्ज्ञ आहेत. पण हे खरोखर सत्य आहे का? या प्रश्नाचे उत्तर अर्थातच नाही असे आहे. नैसर्गिक भाषा प्रक्रियेची तंत्रे वापरून यंत्रांनी भाषा शिक्षणात आजवर खूप प्रगती केली असली तरी अजूनही भाषेची अनेक अंगे समजून घेणे यंत्रांना जमलेले नाही. यंत्राच्या भाषा शिक्षणाचा मार्ग इतका खडतर का आहे हे थोडक्यात पाहूया.

मुळात नैसर्गिक भाषा या नियमांच्या चौकटीत बंदिस्त आणि अविचल नसतात. भाषेला व्याकरणाच्या नियमांची एक चौकट असली तरी व्याकरणाच्या नियमांना अनेकदा अपवाद असतात. कोसाकोसावर बोलीभाषा बदलतात. काळानुसार काही शब्द भाषेतून वजा होतात वा नवे शब्द भाषेत सामील होतात. संदर्भानुसार अर्थ बदलतो. उपरोध, उपमा, उत्प्रेक्षा, प्रतीके, रूपके हे अर्थालंकार भाषेला समृद्ध करत असले तरी त्यामुळे भाषा समजण्यास जटिल होते व यंत्रांना ती समजणे अधिकाधिक कठीण होत जाते.

What happens to your body when you have sex every day
रोज सेक्स केल्याने शरीर, मन व नात्यात काय बदल होतात? थट्टा, मस्करी न करता डॉक्टरांनी दिलेली ही माहिती वाचा
What happens to the body if you have potatoes daily
तुम्हाला बटाटा भजी, फ्रेंच फ्राईज खायला आवडतात का? रोज बटाटा खाल्ल्यास शरीरावर काय परिणाम होतो? तज्ज्ञांकडून जाणून घ्या…
Early Signs Of Oral Cancer
तोंडाच्या कर्करोगाची लक्षणे असतात ‘हे’ ८ लहानसे बदल; दात घासताना ‘असा’ करा तपास; ‘या’ अवयवांना सुद्धा होतात वेदना
health special, dementia patients, treatment dementia patients, treatment type of dementia patients, Psychiatrist, Neurologist, Donepezil, Rivastigmine, Galantamine, Memantine, behavioural interventions, Cognitive training, cognitive rehabilitation, Cognitive stimulation therapy,
Health Special: डिमेन्शियाच्या रुग्णांवर कसे व किती प्रकारचे उपचार केले जातात?
meditation, Kanyakumari rock memorial, prime minister narendra modi
मोदींच्या नव्या ध्यानमग्न छायाचित्राच्या प्रतीक्षेत…
Rural Medical Center, transfer a organization from old to new generation, daughter in law, mother in law,
सांधा बदलताना : हस्तांतरण..
Can Palm Oil Really Reduce Cholesterol Benefits of Palm Oil
पाम तेल म्हणजे कचरा नाही, ICMR ने मान्य केले पाम ऑइलचे फायदे; आरोग्यतज्ज्ञांनी सांगितली वापराची योग्य पद्धत
Loksatta kutuhal Artificial Intelligence in Cyber crime
कुतूहल: सायबर गुन्ह्यांतील कृत्रिम बुद्धिमत्ता

भाषेतील संदिग्धता हा यंत्र शिक्षणात फार मोठा अडसर ठरतो. मराठी भाषेतील उदाहरण द्यायचे झाले तर ‘‘नमस्कार कर.’’ ‘‘कर हा करी धरीला.’’, ‘‘ उत्पन्नावर कर भरावा लागतो.’’ या तीनही वाक्यांत कर हा शब्द वेगळ्या अर्थांनी आला आहे. असे बहुअर्थी शब्द नैसर्गिक भाषा प्रक्रियेला अडथळे निर्माण करतात.

भाषेचे असंख्य पैलू आणि बदलती रूपे समजण्यासाठी यंत्रांना प्रचंड प्रमाणात विदा (डेटा) पुरवावा लागतो. या विदाच्या आधारेच भाषा प्रक्रियेची प्रारूपे स्वयंशिक्षित होतात. कधीकधी हा विदा अपुरा, एकांगी, कलुषित, विस्कळीत असू शकतो आणि अशा विदावरून शिक्षण घेणारी प्रारूपे चुकीचे निष्कर्ष कढतात. विदा मिळवताना गोपनीयतेचे व नैतिकतेचे नियम पाळणेसुद्धा गरजेचे असते.

ही प्रारूपे स्वतंत्रपणे काम करत नाहीत तर त्यासाठी लागणारा प्रचंड मोठा विदा साठवण्याची व अपेक्षित वेगाने विश्लेषण करण्याची क्षमता यंत्रात असावी लागते जे अर्थातच खर्चीक असते. अशा अडचणींमुळे प्रमाणिकृत आणि नि:संदिग्ध असा भाषेचा भाग समजून घेणे यंत्रांनी साध्य केले असले तरी त्यांचे भाषाशिक्षण पूर्णत्वास पोहोचण्याचा पल्ला अद्याप दूरच आहे.

प्रा.माणिक टेंबे, मराठी विज्ञान परिषद