आपण संभाषण आकलनाचे फायदे पाहिले आणि जाता जाता संभाषण संश्लेषणाकडे (सिंथेसिस) एक ओझरता कटाक्षही टाकला. संभाषण संश्लेषण हे संभाषण आकलनाच्या बरोबर उलटे आहे. संश्लेषणात लिखित मजकुराचे (टेक्स्ट) रूपांतर संभाषणात केले जाते. शिवाय बोलण्यासाठी केलेल्या ओठांच्या हालचाली कॅमेऱ्याच्या साहाय्याने टिपून त्यांचे रूपांतर प्रत्यक्ष बोलण्यात करण्याच्या प्रक्रियेलाही संभाषण संश्लेषण म्हणतात.

संश्लेषणात लिखित मजकुरातील शब्दांचे विश्लेषण करून त्यातून शब्द, चिन्हे, अंक, लघुरूपे इत्यादींचे प्रमाणित शब्दांमध्ये रूपांतर केले जाते. याला प्रमाणीकरण म्हणतात. या प्रमाणित मजकुराचे रूपांतर मग आवाजाच्या घटकांमध्ये म्हणजे स्वनिममध्ये केले जाते. या आवाजी रूपांतरावर मग उच्चारणाची शैली, स्वरमान (पिच), गती इत्यादी संस्कार करून (स्वनीय विश्लेषण आणि गणमात्रा विश्लेषण) मग हा आवाज संश्लेषकामधून (सिंथेसायझर) विशिष्ट ध्वनितरंगांच्या रूपात बाहेर येतो.

constitution
संविधानभान: ‘मी’च्या वेलांटीचा सुटो सुटो फास!
vasai, virar, palghar, lok sabha election 2024, Hitendra Thakur
सर्व पक्षांनी मलाच पाठिंबा द्यावा, हितेंद्र ठाकूर यांची चित्रफित प्रसारित
conceit of painter whose exhibition made critics take the term Ambedkari art seriously
हे विचार, हे जगणं दृश्यात आणलं पाहिजे…
peter higgs
अन्वयार्थ: ‘देव कणा’मागचा द्रष्टा!

याचा इतिहासही खूप जुना आहे. अकराव्या-बाराव्या शतकातील नोंदी जरी सोडून दिल्या, तरी १७७९ मध्ये क्राटझेनस्टीन या जर्मन-डॅनिश शास्त्रज्ञाने बनवलेला, इंग्रजीतील ए, ई, आय, ओ, यू हे पाच स्वर निर्माण करणारा संश्लेषक, आद्य मानायला हवा. १९५०च्या दशकाच्या शेवटी संगणकाच्या साहाय्याने काम करणारे संश्लेषक येऊ लागले होते. १९६१मध्ये जॉन केली या शास्त्रज्ञाने आयबीएम-७०४ संगणक वापरून संश्लेषकावर संगीतासहित गाणे तयार केले होते, ते महान विज्ञानकथा लेखक आर्थर सी क्लार्क यांना एवढे आवडले की त्याचा उपयोग त्यांनी आपल्या ‘अ स्पेस ओडेसी’ या विज्ञान कादंबरीत केला.

कृत्रिम बुद्धिमत्तेच्या उदयानंतर आकलनाप्रमाणेच या क्षेत्रातही मोठय़ा प्रमाणावर संशोधनाला चालना मिळाली. आवाजाच्या संश्लेषणासाठी वापरल्या जाणाऱ्या अनेक तंत्रांमध्ये डीप न्युरल नेटवर्क (डीएनएन), रिकरंट न्युरल नेटवर्क (आरएनएन) आणि कॉन्व्होल्यूशनल न्युरल नेटवर्क (सीएनएन) ही तंत्रे वापरणाऱ्या सखोल-अध्ययन (डीप लर्निग) या तंत्राचा समावेश झाला. यामुळे संश्लेषकाला प्रशिक्षण देण्याबरोबरच हव्या त्या आवाजात आणि शैलीमध्ये ध्वनी-संश्लेषण करणे सहज शक्य झाले.

संभाषण संश्लेषणाचा अनेक ठिकाणी उपयोग होतो. त्याच्या वापराचे सर्वात प्रसिद्ध उदाहरण म्हणजे महान वैज्ञानिक प्रा. स्टीफन हॉकिंग यांचा संभाषण संश्लेषक. बाह्य जगाशी त्यांचा बोलका संपर्क याच्या मार्फतच असे. अशा अनेक अपंग व्यक्तींना याचा उपयोग करून संगणकावरील किंवा छापील मजकूर ऐकता येतो आणि संपर्क प्रस्थापित करता येतो. कार्टून चित्रपटांमध्ये विविध पात्रांचे विविध आवाज बहुतांश वेळा या संश्लेषकाच्या साहाय्याने निर्माण केले जातात.

– शशिकांत धारणे, मराठी विज्ञान परिषद