मध्यंतरी काही दिवस कॅनडात होतो. थंडीचे दिवस. आदले दोन दिवस बर्फ पडत होता पण आज मात्र लख्ख ऊन पडले होते. विचार केला फिरायला जाऊ या. म्हणून गूगलला तोंडी विचारले की ‘‘हे गूगल, बाहेरचे तापमान काय आहे?’’ गूगलने सांगितले उणे पंचवीस अंश सेल्सिअस. अर्थात आमचे फिरणे रद्द झाले हे सांगणे नलगे. मुद्दा असा की चतुर भ्रमणध्वनीला हात न लावता, संगणकाची मदत न घेता किंवा वर्तमानपत्र न उघडता मला बाहेरचे तापमान एका प्रश्नात आणि क्षणार्धात कळले.

ही किमया ‘संभाषण आकलन (स्पीच रेकग्निशन)’ या तंत्रज्ञानाची. येत्या चार लेखांमध्ये आपण या तंत्रज्ञानाची थोडक्यात ओळख करून घेणार आहोत. याची पुस्तकी व्याख्या म्हणजे ‘मौखिक म्हणजे भाषेचे किंवा शब्दांचे रूपांतर लिखित भाषेत किंवा शब्दांमध्ये करणारे तंत्रज्ञान’. पण आजच्या बुद्धिमान यंत्रणा त्याच्या पलीकडे जाऊन मौखिक आदेशाचे मजकुरात रूपांतर करून त्यानुसार कार्य करून मोकळया होतात. मुळात संगणक विज्ञान (कॉम्प्युटर सायन्स) आणि संगणकीय भाषाविज्ञान (कॉम्प्युटेशनल लिंग्विस्टिक्स) या ज्ञानशाखांमधील हे एक अभ्यासक्षेत्र आता कृत्रिम बुद्धिमत्तेच्या कुशीत जोमात वाढत आहे.

हेही वाचा >>> कुतूहल: कृत्रिम बुद्धिमत्तेचं सामर्थ्य

कृत्रिम बुद्धिमत्ता क्षितिजावर येण्याआधीच या क्षेत्रात संशोधनाला आणि कामाला सुरुवात झाली होती. १९५२ मध्ये बेल लॅबोरेटरीजने बोललेले एक अक्षर ओळखणारी ‘ऑड्री’ नावाची यंत्रणा निर्माण केली होती. त्याच्यापुढे जाऊन १९६२ साली आयबीएम कंपनीने १६ शब्द ओळखण्याची क्षमता असलेली ‘शूबॉक्स’ नावाची यंत्रणा निर्माण केली होती. पण या यंत्रणा एक एक शब्द ओळखायच्या आणि प्रत्येक शब्दानंतर थांबायच्या. भारतीय वंशाच्या राज रेड्डी या संशोधकाने बुद्धिबळ खेळण्यासाठी लागणारे आदेश समजणारी यंत्रणा निर्माण केली होती.

अमेरिकेच्या दार्पा (डीएआरपीए) या इंटरनेट सेवा देणाऱ्या पहिल्या संस्थेने एक संशोधन कार्यक्रम राबवला; त्यात आयबीएम, बीबीएन, कार्नेजी मेलन तसेच स्टॅनफर्ड रिसर्च इन्स्टिटय़ूटसारख्या दिग्गज संस्थांनी भाग घेतला आणि ‘हार्पी’ नावाची १००० शब्द ओळखणारी यंत्रणा निर्माण केली. यानंतर मात्र संभाषण आकलनाची गाडी सुसाट सुटली. १९९०च्या सुमारास अनेक अनुलेखन (डिक्टेशन) यंत्रणा बाजारात आल्या. तसेच याच सुमाराला इंटरअ‍ॅक्टिव्ह व्हॉइस रेकग्निशन सिस्टम ही यंत्रणा बेल लॅबोरेटरीजने बाजारात आणली. आता तर कृत्रिम बुद्धिमत्तेच्या साहाय्याने निर्माण झालेल्या गूगल असिस्टंट, सिरी, अलेक्सा अशा अनेक प्रगत संभाषण आकलन यंत्रणा उपलब्ध झाल्या आहेत.

– शशिकांत धारणे 

मराठी विज्ञान परिषद

ईमेल : office@mavipa.org

संकेतस्थळ : www.mavipa.org