मध्यंतरी काही दिवस कॅनडात होतो. थंडीचे दिवस. आदले दोन दिवस बर्फ पडत होता पण आज मात्र लख्ख ऊन पडले होते. विचार केला फिरायला जाऊ या. म्हणून गूगलला तोंडी विचारले की ‘‘हे गूगल, बाहेरचे तापमान काय आहे?’’ गूगलने सांगितले उणे पंचवीस अंश सेल्सिअस. अर्थात आमचे फिरणे रद्द झाले हे सांगणे नलगे. मुद्दा असा की चतुर भ्रमणध्वनीला हात न लावता, संगणकाची मदत न घेता किंवा वर्तमानपत्र न उघडता मला बाहेरचे तापमान एका प्रश्नात आणि क्षणार्धात कळले.

ही किमया ‘संभाषण आकलन (स्पीच रेकग्निशन)’ या तंत्रज्ञानाची. येत्या चार लेखांमध्ये आपण या तंत्रज्ञानाची थोडक्यात ओळख करून घेणार आहोत. याची पुस्तकी व्याख्या म्हणजे ‘मौखिक म्हणजे भाषेचे किंवा शब्दांचे रूपांतर लिखित भाषेत किंवा शब्दांमध्ये करणारे तंत्रज्ञान’. पण आजच्या बुद्धिमान यंत्रणा त्याच्या पलीकडे जाऊन मौखिक आदेशाचे मजकुरात रूपांतर करून त्यानुसार कार्य करून मोकळया होतात. मुळात संगणक विज्ञान (कॉम्प्युटर सायन्स) आणि संगणकीय भाषाविज्ञान (कॉम्प्युटेशनल लिंग्विस्टिक्स) या ज्ञानशाखांमधील हे एक अभ्यासक्षेत्र आता कृत्रिम बुद्धिमत्तेच्या कुशीत जोमात वाढत आहे.

The conservation role of women
स्त्रियांची जतनसंवर्धक भूमिका
light
विश्लेषण: डोळे दिपवणारी रोषणाई प्रदूषणकारक आहे का ?
Analysis on Environmental Component in Gazetted Civil Services Joint Pre Examination and State Services Pre Examination
Mpsc मंत्र: पर्यावरण घटक
Robert Dennard
चिप-चरित्र : ‘मेमरी चिप’ क्षेत्राची पायाभरणी

हेही वाचा >>> कुतूहल: कृत्रिम बुद्धिमत्तेचं सामर्थ्य

कृत्रिम बुद्धिमत्ता क्षितिजावर येण्याआधीच या क्षेत्रात संशोधनाला आणि कामाला सुरुवात झाली होती. १९५२ मध्ये बेल लॅबोरेटरीजने बोललेले एक अक्षर ओळखणारी ‘ऑड्री’ नावाची यंत्रणा निर्माण केली होती. त्याच्यापुढे जाऊन १९६२ साली आयबीएम कंपनीने १६ शब्द ओळखण्याची क्षमता असलेली ‘शूबॉक्स’ नावाची यंत्रणा निर्माण केली होती. पण या यंत्रणा एक एक शब्द ओळखायच्या आणि प्रत्येक शब्दानंतर थांबायच्या. भारतीय वंशाच्या राज रेड्डी या संशोधकाने बुद्धिबळ खेळण्यासाठी लागणारे आदेश समजणारी यंत्रणा निर्माण केली होती.

अमेरिकेच्या दार्पा (डीएआरपीए) या इंटरनेट सेवा देणाऱ्या पहिल्या संस्थेने एक संशोधन कार्यक्रम राबवला; त्यात आयबीएम, बीबीएन, कार्नेजी मेलन तसेच स्टॅनफर्ड रिसर्च इन्स्टिटय़ूटसारख्या दिग्गज संस्थांनी भाग घेतला आणि ‘हार्पी’ नावाची १००० शब्द ओळखणारी यंत्रणा निर्माण केली. यानंतर मात्र संभाषण आकलनाची गाडी सुसाट सुटली. १९९०च्या सुमारास अनेक अनुलेखन (डिक्टेशन) यंत्रणा बाजारात आल्या. तसेच याच सुमाराला इंटरअ‍ॅक्टिव्ह व्हॉइस रेकग्निशन सिस्टम ही यंत्रणा बेल लॅबोरेटरीजने बाजारात आणली. आता तर कृत्रिम बुद्धिमत्तेच्या साहाय्याने निर्माण झालेल्या गूगल असिस्टंट, सिरी, अलेक्सा अशा अनेक प्रगत संभाषण आकलन यंत्रणा उपलब्ध झाल्या आहेत.

– शशिकांत धारणे 

मराठी विज्ञान परिषद

ईमेल : office@mavipa.org

संकेतस्थळ : www.mavipa.org