24 May 2019

News Flash

प्रतिभा आणि प्रतिमा

न्यूरल नेटवर्क किंवा डीप लìनग या नावांनी वापरलं जाणारं विदाविज्ञानातलं (डेटा सायन्स) अल्गोरिदम फार प्रसिद्ध आहे.

(संग्रहित छायाचित्र)

संहिता जोशी

शरीरातल्या गाठीच्या स्कॅनवरून ती गाठ जीवघेणी आहे का, हे ठरवण्यासाठी आता तज्ज्ञ, अनुभवी डॉक्टरचा वेळ जात नाही; ते काम आता विदाविज्ञान आणि कृत्रिम प्रज्ञा यामुळे होतं आहे आणि वैद्यकी आणखी प्रगत होण्याची सोय झाली आहे..

न्यूरल नेटवर्क किंवा डीप लìनग या नावांनी वापरलं जाणारं विदाविज्ञानातलं (डेटा सायन्स) अल्गोरिदम फार प्रसिद्ध आहे. कृत्रिम प्रज्ञा (आर्टिफिशियल इंटलिजन्स) म्हणजे (कृत्रिम) न्यूरल नेटवर्कच्या खाली काही चालणारच नाही, असं मत असणारेही अनेक विदावैज्ञानिक आहेत. हे नक्की असतं काय? किंवा ग्लॅमर असणाऱ्या विषयातही या विशिष्ट पद्धतीला आणखी जास्त वलय का आहे? या अल्गोरिदमांमध्येही उच्चनीचता का बाळगली जाते?

गेल्या लेखात आपण आंब्यांचं उदाहरण बघितलं. दोन आंब्यांचे १५० रुपये होतात, तर पाच आंब्यांचे किती? अंकगणित करून उत्तर येईल ३७५, पण कदाचित पाच आंबे थोडे स्वस्तात मिळतील. तरीही आंब्यांची संख्या जशी वाढत जाईल, तिच्या (जवळजवळ) समप्रमाणात आंब्याची किंमत वाढतच जाईल. याउलट दुसरं उदाहरण म्हणजे ‘हो’-की-‘नाही’, अशी उत्तरं असणारे प्रश्न. दारासमोर उभा असलेला रिक्षावाला आपल्याला जायचं आहे तिथे येईल का? उद्या पाऊस पडेल, फक्त ढगाळ असेल का स्वच्छ ऊन पडेल? ही उत्तरं विदेच्या समप्रमाणात बदलत नाहीत.

इतर काही अल्गोरिदमसारखीच न्यूरल नेटवर्काचीही खासियत अशी की दिलेल्या आकडय़ांच्या, विदेच्या (डेटा) समप्रमाणात उत्तर बदलणार नसेल, तरीही अचूक भाकितं करण्याची क्षमता असते. त्यामागचं गणित आणि ती का चालतात, याचा विचार करणं या लेखमालेच्या कक्षेबाहेरचं आहे. पण या ‘हो’-की-‘नाही’ प्रश्नांची काही उदाहरणं आणि त्यात न्यूरल नेटवर्क कसं वापरलं जातं, हे बघू.

गेल्या लेखात असं एक उदाहरण होतं, ० ते ९ या आकडय़ांच्या प्रतिमांचा अभ्यास करून, हे आकडे कोणते आहेत ते ओळखणं. ‘मिन्स्ट’ (एमएनआयएसटी) या विदासंग्रहात ६०००० प्रतिमा आहेत. त्यातल्या ५०००० वापरून संगणकाला कोणती प्रतिमा कोणत्या आकडय़ाची आहे हे शिकवलं. ० ते ९ हे आकडे म्हणजे शब्दश: ‘हो’-की-‘नाही’ असा प्रश्न नाही; पण तो थोडा बदलून विचारला जातो. उदाहरणार्थ, ही प्रतिमा ० या आकडय़ाची आहे का नाही? असं सगळ्या आकडय़ांबद्दल विचारून मग निर्णय घेतला जातो. म्हणजे एकाऐवजी ९ वेळा ‘हो’-की-‘नाही’ असा प्रश्न विचारून भाकितं केली जातात.

विदाविज्ञान शिकवायला सुरुवात करताना अनेकांना सहज समजेल असं उदाहरण वापरतात. शरीरात असलेल्या गाठींच्या प्रतिमा संगणकाला दाखवल्या जातात; त्यासोबत ही गाठ जीवघेणी, कर्करोगाची आहे का नाही, हे सांगितलं जातं. न्यूरल नेटवर्क त्या प्रतिमांचा अभ्यास करतात; आणि डॉक्टरकीचं काहीही ज्ञान नसणारं, प्रचंड आकडेमोडीची क्षमता बाळगणारं हे कृत्रिम जाळं नव्या रुग्णांच्या गाठींच्या प्रतिमा बघून ती गाठ जीवघेणी आहे का नाही हे सांगू शकतं. ‘हो’-की-‘नाही’, एवढाच प्रश्न.

त्यातही गुंतागुंत असतेच. स्तनांच्या कर्करोगाच्या प्रतिमा ओळखणाऱ्या नेटवर्कला फुप्फुसांच्या कर्करोगाच्या प्रतिमा दाखवल्या जात नाहीत. तशी गरजही नसते; या प्रतिमा गोळा केल्या जातात तेव्हा त्या फुप्फुसांच्या आहेत का स्तनांच्या हे माहीत असतं. शिवाय संगणक आहे, प्रचंड प्रमाणात प्रतिमांचा साठा आहे म्हणून सगळी उत्तरं १०० टक्के बरोबर येतात असं नाही. कर्करोगाच्या बाबतीत चुका होणारच असतील, तर अधिक काळजी घेतलेली बरी. एखाद्या प्रतिमेबद्दल शंका असेल, कर्करोग आहे का नाही, तर त्या व्यक्तीला पुढची तपासणी करायला पाठवलेलं बरं. ‘होऊ दे खर्च’, पण कर्करोगाचं निदान वेळेत होऊन व्यक्तीचा जीव वाचणं महत्त्वाचं असतं.

गेल्या काही वर्षांपर्यंत हे काम फक्त डॉक्टर करत होते. वेळेत तपासण्या होऊन अनेक लोकांचा जीव वाचत होताच. वर्षांनुवर्ष प्रॅक्टिसचा अनुभव असणाऱ्या डॉक्टरला कर्करोगाबद्दल अधिक समजतं की आकडेमोड करणारी मोठाली सॉफ्टवेअर लिहिणारीला? प्रश्न साधा वाटला तरी त्याचं उत्तर गुंतागुंतीचं आहे.

डॉक्टरलाच वैद्यकातलं अधिक समजतं; तिनं या विषयाचा अभ्यास अनेक वर्ष केलेला असतो. तरीही गेल्या काही वर्षांत, अनेक लोकांच्या आकडेमोड, प्रयोगांतून तयार झालेली न्यूरल नेटवर्क, कर्करोगाच्या निदानाच्या बाबतीत मानवी मेंदूपेक्षा सरस झाली आहेत. याचं एक कारण, मानवी मेंदू ज्या प्रकारे आकारांचा अर्थ लावतो, त्यापेक्षा न्यूरल नेटवर्क वेगळ्या पद्धतीनं (त्याकडे) ‘बघतात’. आपण बघताना वस्तू, प्राणी, मनुष्य यांचा संपूर्ण आकार बघतो. अनेक प्रकारची न्यूरल नेटवर्क आकारांच्या कडा, टोकं, बाह्य़रेखा बघून वस्तू काय आहे, हे ठरवतात. दुसरं कारण, संगणकाची प्रतिमा, विदा साठवण्याची आणि त्यातून निष्कर्ष काढण्याची क्षमता आता मनुष्याच्या डोळे-डोक्यापेक्षा वाढली आहे; निदान या बाबतीत तरी. शरीरातल्या गाठीच्या स्कॅनवरून ती गाठ जीवघेणी आहे का, हे ठरवण्याचं काम आता वैद्यकाचं उरलेलं नाही; वैद्यकी आणखी प्रगत होण्याची सोय झाली आहे. जसं कॅमेरे तयार झाले तशी हुबेहूब चित्रं काढण्याची आवश्यकता राहिली नाही आणि चित्रकला पुढच्या पायरीवर पोहोचली तसं.

डॉक्टरसाठी सहायक तयार होत आहे. गणित आणि संगणकशास्त्रातल्या प्रगतीमुळे मानवी डोळ्यांना जे दिसत किंवा उमगत नव्हते, ते प्राथमिक अवस्थेतले कर्करोग न्यूरल नेटवर्कला दिसायला लागले आहेत. डॉक्टरची गरज संपली नाही, तर डॉक्टरच्या कामाचं स्वरूप बदललं. कर्करोगानं रुग्णाचा जीव जाऊ नये, यासाठी आणखी प्रयत्न करण्यासाठी डॉक्टरला आणखी थोडा अवसर मिळायला लागला. जेव्हा लशी उपलब्ध नव्हत्या, तेव्हा पोलिओ, देवी अशा रोगांमुळे मुलं-माणसं पटापटा मरायची. लशी येण्यापूर्वी लोक हृदयरोग, कर्करोगानं मरण्याचं प्रमाण फारच कमी होतं; कारण हे रोग होण्याआधीच बरेच लोक मरून जायचे. (काही आठवडय़ांपूर्वी वॉल्डच्या सिद्धांताचा उल्लेख केला होता, तोच हा टिकून राहणाऱ्यांकडे असलेला कल.)

विदाविज्ञानाचे उपयोग अनेक क्षेत्रांत होतात. प्रतिमांचा अर्थ लावण्याचं काम जिथे चालतं, तिथे अनेक ठिकाणी कृत्रिम न्यूरल नेटवर्क हजारो प्रतिमा बघण्याचं कंटाळवाणं काम करू शकतात. पोटापाण्याची सोय झाल्यावर बुद्धिमान मनुष्यप्राण्यांना कंटाळा भेडसावत राहतो. आपल्या बुद्धीला, क्षमतेला चालना न देणारं काम करण्याचा कंटाळा येतो. कर्करोगाचं प्राथमिक निदान करण्यात कृत्रिम न्यूरल नेटवर्क अनुभवी डॉक्टरांच्या पुढे जातील, याची कल्पनाही कोणी केली नव्हती(?). हातानं लिहिलेले आकडे वाचणारी आणि कर्करोग शोधणारी न्यूरल नेटवर्क तपशिलात वेगळी असतात, पण त्यामागचं गणित एकच असतं.

ते गणित समजलं की न्यूरल नेटवर्क कशी चालतात ते समजतं. पण ती चालतात, हे समजत नाही. पाच आंब्यांपेक्षा दोन आंब्यांचे पैसे कमी होतील, कारण उत्पादन, प्रवास, साठवणी असे सगळेच खर्च समप्रमाणात वाढतात; तसं न्यूरल नेटवर्काचं गणित आपसूक समजत नाही. मानवी डोळ्यांना ज्या गाठी एकसारख्या वाटतील, त्यातही न्यूरल नेटवर्क अचूक फरक करू शकतात. त्यातल्या मधल्या पायऱ्यांमध्ये ज्या प्रतिमा दिसतात त्यावरून काहीही बोध होत नाही. अशी काही गणितं असतात, जिथे अचूक उत्तर येणं महत्त्वाचं असतं आणि मधल्या पायऱ्यांचं स्पष्टीकरण मिळालं नाही तरी भागतं.

मात्र जेव्हा न्यूरल नेटवर्क कृष्णवर्णीय व्यक्तींच्या चेहऱ्यांचं वर्गीकरण गोरिला असं करतात किंवा चिनी-कोरियन लोकांच्या फोटोंमध्ये डोळे बंद असल्याचं सांगतात, तेव्हा त्यात आणखी तपासाची आवश्यकता निर्माण होते. त्याबद्दल पुढच्या भागांत.

लेखिका खगोलशास्त्रात पीएच.डी. आणि पोस्ट-डॉक असल्या, तरी सध्या विदावैज्ञानिक म्हणून कार्यरत आहेत.

ईमेल : 314aditi@gmail.com

First Published on May 8, 2019 12:11 am

Web Title: vidabhan article by sanhita joshi 13