माणूस ज्या पद्धतीने विचार करतो त्या पद्धतीने विचार करून ‘अल्फागो’ने ‘गो’सारख्या किचकट खेळात जगज्जेत्या मानवी खेळाडूवर मात केली. इतकंच नव्हे तर त्या खेळात ‘गो’च्या चार हजार वर्षांच्या इतिहासात तोवर न खेळली गेलेली खेळी खेळून कृत्रिम बुद्धिमत्तेच्या सर्जनशीलतेचे उत्तम उदाहरणही दिले.

आर्काइव्हमधील सर्व बातम्या मोफत वाचण्यासाठी कृपया रजिस्टर करा

२०१७च्या मे महिन्यात ‘अल्फागो’च्या त्यापुढच्या ‘मास्टर’ आवृत्तीने को जिये या जागतिक क्रमवारीत पहिल्या क्रमांकावर असलेल्या ‘गो’ खेळाडूचा तीन सामन्यांच्या मालिकेत ३-० असा सपशेल पराभव केला आणि ‘डीप माइंड’ने ‘अल्फागो’ची निवृत्ती जाहीर केली.

२०१७ सालीच ‘अल्फागो झिरो’ ही अल्फागोची नवी आवृत्ती जगासमोर आली. ‘अल्फागो झिरो’ला शिकवताना कोणतीही मानवी विदा वापरली गेली नव्हती. गूगलच्या सुपर संगणकाच्या मदतीने स्वत:शीच खेळून तो ‘गो’ खेळात कोणत्याही मनुष्यप्राण्यापेक्षा तरबेज झाला. तीन दिवसांच्या सखोल शिक्षणानंतर तो ‘अल्फागो’च्या ली सिडोलला धूळ चारणाऱ्या आवृत्तीबरोबर शंभर सामने खेळला आणि सर्वच्या सर्व सामने जिंकला. एकवीस दिवसांच्या सखोल शिक्षणानंतर तो ‘अल्फागो’च्या ‘मास्टर’ आवृत्तीच्या दर्जाला पोहोचला आणि ४० दिवसांच्या सखोल शिक्षणानंतर ‘अल्फागो’च्या आजवरच्या सर्व आवृत्त्यांपेक्षा श्रेष्ठ बनला.

हेही वाचा >>> कुतूहल : गो मॅन गो

‘अल्फागो झिरो’च्या अल्गोरिदमचा वापर करून ‘अल्फाझिरो’ नावाची प्रणाली बनवली गेली आहे, जी केवळ ‘गो’च नाही तर बुद्धिबळही उत्तमपणे खेळू शकते.

डिसेंबर २०१७मध्ये, ‘अल्फाझिरो’ ‘स्टॉकफिश ८’ या बुद्धिबळ खेळणाऱ्या प्रणालीशी खेळला. ही प्रणाली तेव्हा तेव्हा बुद्धिबळ खेळणाऱ्या प्रणालीत सर्वोत्तम समजली जात होती. या दोन्ही प्रणालींच्या हार्डवेअर आणि सॉफ्टवेअरमध्ये मोठा फरक होता.

‘अल्फाझिरो’ला एकूण नऊ तास स्वत:शीच खेळून प्रशिक्षण देण्यात आले आणि अवघ्या चार तासांच्या प्रशिक्षणानंतर तो ‘स्टॉकफिश’च्या पातळीवर पोहोचला. ‘अल्फाझिरो’ने ‘स्टॉकफिश’विरुद्ध प्रत्येकी १०० सामन्यांच्या १२ स्पर्धांत भाग घेतला, ज्यात अल्फाझिरो २९० वेळा जिंकला, २४ वेळा हरला आणि ८८६ वेळा सामने अनिर्णीत राहिले. ‘अल्फाझिरो’चा हा निर्विवाद विजय अत्यंत महत्त्वाचा होता. कारण ही न्यूरल नेटवर्कच्या माध्यमातून मिळवलेल्या कृत्रिम बुद्धिमत्तेची इतर पद्धतीने मिळवलेल्या बुद्धिमत्तेवर मात होती. या सामन्यांत ‘स्टॉकफिश’ प्रत्येक सेकंदाला सात कोटी परिस्थितींचा विचार करत होता तर ‘अल्फाझिरो’ अतियोग्य अशा फक्त ८० हजार परिस्थितींचा. हे केवळ न्यूरल नेटवर्कच्या माध्यमातून मिळवलेल्या कृत्रिम बुद्धिमत्तेमुळे शक्य झाले होते. यानंतर स्टॉकफिशच्या पुढील आवृत्तीतही न्यूरल नेटवर्कचा वापर करून त्याला अधिक सबळ करण्यात आले.

मराठीतील सर्व नवनीत बातम्या वाचा. मराठी ताज्या बातम्या (Latest Marathi News) वाचण्यासाठी डाउनलोड करा लोकसत्ताचं Marathi News App.
Web Title: Loksatta kutuhal artificial intelligence program for alphazero game zws