|| अमृतांशू नेरुरकर

बिग डेटा आणि या अस्ताव्यस्त पसरलेल्या माहितीच्या संचाला साठवून त्यातून हवी तितकीच माहिती कार्यक्षमतेने शोधून काढण्याचे काम करणाऱ्या प्रणाली या डिजिटल परिवर्तनाचा पाया आहे.  तसेच बिटकॉइन या अंकात्मक चलनामुळे चर्चेत असलेल्या ब्लॉकचेन या तंत्रज्ञानाच्या मुळाशी ओपन सोर्स व्यवस्थेचीच तत्त्वं आहेत..

गेले जवळपास एक दशक केवळ माहिती तंत्रज्ञान क्षेत्रातच नाही तर एकंदरीतच सगळ्या उद्योग गजगतात डिजिटल परिवर्तन (ट्रान्सफॉर्मेशन) हा एक परवलीचा शब्द बनला आहे. क्लाऊड कॉम्पुटिंग, बिग डेटा, कृत्रिम बुद्धिमत्ता (आर्टिफिशिअल इंटेलिजन्स), मशीन लर्निग, इंटरनेट ऑफ थिंग्स, ब्लॉकचेन अशा विविध संकल्पनांच्या तांत्रिक बाजू, तसेच अंमलबजावणीच्या दृष्टिकोनातून त्यांच्या व्यवस्थापकीय बाजूंचा सतत ऊहापोह केला जात असतो. या संकल्पनांचा आढावा घेणं हा काही या लेखमालेचा उद्देश नसला तरी या नव्या तंत्रज्ञानाच्या मुळाशी असलेल्या ओपन सोर्स तत्त्वांचं विश्लेषण करणं इथे अप्रस्तुत ठरणार नाही. केवळ उद्योगजगतातच नव्हे तर आपल्या सर्वाच्याच दैनंदिन आयुष्यात आमूलाग्र बदल घडविण्याची क्षमता असलेल्या डिजिटल परिवर्तन तंत्रज्ञानात (विशेषत: आज सर्वाधिक चर्चिल्या जाणाऱ्या बिग डेटा आणि ब्लॉकचेन तंत्रज्ञानामध्ये) ओपन सोर्सची असलेली महत्त्वाची भूमिका अभ्यासणं उद्बोधक ठरेल.

बिग डेटा आणि या अस्ताव्यस्त पसरलेल्या अवाढव्य माहितीच्या संचाला साठवून त्यातून योग्य वेळेला हवी तितकीच माहिती कार्यक्षमतेने शोधून काढण्याचे काम करणाऱ्या प्रणाली या डिजिटल परिवर्तनाचा पाया आहेत असं म्हणणं वावगं ठरणार नाही. संगणक आणि इलेक्ट्रॉनिक्स क्षेत्राच्या उगमापासून संगणकाच्या किंवा सव्‍‌र्हरच्या हार्ड डिस्कवर माहिती साठवली जात आहे. आपण वैयक्तिक स्तरावर वापरत असलेल्या (उदा. ऑफिस प्रणाली) किंवा व्यावसायिक स्तरावर वापरल्या जाणाऱ्या (उदा. ईआरपी) प्रणालीदेखील त्या हाताळत असलेली सर्व प्रकारची माहिती डेटाबेसमध्ये साठवत असतात. मग या प्रणाली साठवत असलेला डेटा आणि बिग डेटा यात नेमका फरक काय आहे?

तांत्रिकदृष्टय़ा विविध स्वरूपाचे फरक जरी करता येऊ  शकले, तरीही ढोबळमानाने बिग डेटा आणि एखाद्या व्यावसायिक किंवा वैयक्तिक वापराच्या प्रणालीने साठवलेल्या डेटामध्ये दोन मूलभूत फरक आहेत. एक म्हणजे बिग डेटा नावाप्रमाणेच अतिप्रचंड आकाराचा असतो, कारण त्यात दिवसागणिक (किंवा अगदी मिनिटागणिक) वाढ होत असते. आपण फेसबुक, ट्विटर, व्हॉट्सअ‍ॅपसारख्या समाजमाध्यमांवर व्यक्त केलेले विचार किंवा प्रसृत केलेली सगळ्या प्रकारची माहिती, गुगलवर माहिती शोधण्यासाठी वापरलेले शब्द किंवा संज्ञा, तसेच अमेझॉन, उबर, गुगल मॅप्ससारख्या विविध अ‍ॅप्समध्ये आपल्याकडून देवाणघेवाण होत असलेली माहिती बिग डेटामध्ये मोडते. त्यामुळेच बिग डेटामध्ये प्रत्येक क्षणी विविध स्वरूपाच्या (टेक्स्ट मजकूर, प्रतिमा, दृक्श्राव्य माहिती वगैरे) माहितीची भर पडत असते. याच कारणामुळे असलेला दुसरा फरक म्हणजे बिग डेटाला वेगवेगळ्या टेबल्समध्ये पंक्ती आणि स्तंभांच्या (रोज आणि कॉलम्स) स्वरूपात एका ठरावीक साच्यात साठवून ठेवता येत नाही. माहितीचा हा भस्मासुर साठवण्यासाठी तसेच त्यावर प्रक्रिया करण्यासाठी वेगळं तंत्रज्ञान वापरण्याची गरज त्यामुळे निर्माण होते.

खरं सांगायचं तर बिग डेटा तंत्रज्ञानाचं मूळ विसाव्या शतकाच्या अखेरीस डग कटिंग या निष्णात अभियंत्याने सुरू केलेल्या ‘ल्युसिन’ व ‘नच’ या दोन ओपन सोर्स प्रकल्पांत सापडते. या प्रकल्पांतर्गत कटिंग आपल्या माईक काफरेला या साथीदारासोबत इंटरनेटवरील अस्ताव्यस्त पसरलेल्या माहितीचा शोध घेणं सोपं जावं यासाठी अल्गोरिदम लिहिण्याचं काम करत होता. त्यासाठी त्यांनी इंटरनेटवर उपलब्ध असलेल्या प्रत्येक संकेतस्थळाला, ते इतर संकेतस्थळांशी कशा प्रकारे जोडलं गेलं आहे त्यानुसार त्यांचे संबंध तपासण्यास व त्यांना अनुक्रमांक देण्यास (ज्याला संगणकीय भाषेत अनुक्रमे क्रॉलिंग व इंडेक्सिंग असं म्हटलं जातं) सुरुवात केली. इंटरनेटवर उपलब्ध असलेल्या प्रत्येक संकेतस्थळाचं व त्याला इतर संकेतस्थळांशी जोडणाऱ्या प्रत्येक साखळीचं इंडेक्सिंग करणं हे वेळकाढू काम तर होतंच, पण यातून एक फार मोठा माहितीचा साठा तयार होत होता, जो साठवायला उपलब्ध डेटाबेस तंत्रज्ञान अपुरं पडत होतं.

गुगलने आपल्या शोध इंजिनासाठी लिहिलेल्या ‘पेजरँक’ आणि ‘मॅप-रिडय़ुस’ अल्गोरिदमचा वापर करून त्यांनी अशा अनेक स्वरूपात अस्तित्वात असलेल्या व सतत वाढत जाणाऱ्या माहितीला अनेक समूहांमध्ये विकेंद्रीकरण करून साठवण्याचं तंत्रज्ञान विकसित करण्याचा चंग बांधला आणि त्यासाठी ‘हडूप’ नावाच्या ओपन सोर्स प्रकल्पाची २००६मध्ये पायाभरणी केली. आज बऱ्याच बिग डेटा प्रकल्पांत हडूप तंत्रज्ञानाचा सर्रास वापर होत असला, तरीही ज्या वेळेला या प्रणालीची पहिली आवृत्ती वितरित झाली तेव्हा बिग डेटा ही संज्ञाच अस्तित्वात आली नव्हती.

बिग डेटा कार्यक्षमपणे साठवण्यासाठी, त्यावर प्रक्रिया करून योग्य ती माहिती मिळवण्यासाठी, तसेच उपलब्ध माहितीवरून अचूक भाकीत वर्तवण्यासाठी वापरण्यात येणाऱ्या हडूपच्या बरोबरीने ‘पिग’, ‘हाइव्ह’, ‘फिनिक्स’, ‘स्पार्क’, ‘स्टॉर्म’ अशा विविध बिग डेटा प्रणाली आज ओपन सोर्स स्वरूपातच उपलब्ध आहेत. विशेष म्हणजे बिग डेटा हाताळण्यासाठी उपयोगात येणाऱ्या जवळपास प्रत्येक प्रणालीचं व्यवस्थापन हे जगाला पहिला ओपन सोर्स वेब सव्‍‌र्हर देणाऱ्या अपाची सॉफ्टवेअर फाउंडेशनकडून होतं. बिग डेटा तंत्रज्ञानाने आज मुख्य धारेत प्रवेश केला आहे आणि त्याचा वापर विविध उद्योगक्षेत्रांत ग्राहकांच्या वर्तणुकीबद्दल, त्याच्या प्राधान्यक्रमांबद्दल तसेच कंपनीच्या भविष्यातल्या कामगिरीचे भाकीत वर्तवण्यासाठी नियमितपणे करण्यात येत आहे.

बिग डेटाप्रमाणेच सध्या बिटकॉइन या अंकात्मक चलनामुळे चर्चेत असलेल्या ब्लॉकचेन या तंत्रज्ञानाच्या मुळाशी ओपन सोर्स व्यवस्थेचीच तत्त्वं आहेत. ब्लॉकचेन हे एक मुक्त व विकेंद्रीकृत स्वरूपात उपलब्ध असलेल्या खतावणीचे (लेजर) व्यवस्थापन करण्याचे तंत्रज्ञान आहे. ब्लॉकचेन पद्धतीने केलेल्या प्रत्येक व्यवहाराची नोंद या लेजरमध्ये  होत असते. या लेजरची एक प्रत यातल्या व्यवहारात सहभागी होणाऱ्या प्रत्येक व्यक्तीकडे असते व त्यात अगदी सुरुवातीपासून पार पडलेल्या प्रत्येक व्यवहाराचे सगळे तपशील पारदर्शकपणे त्यात सहभागी होणाऱ्या प्रत्येक व्यक्ती किंवा संस्थेला उपलब्ध होतात.

प्रत्येक सहभागी व्यक्तीकडे उपलब्ध असलेल्या व सदैव अद्ययावत स्थितीत राहणाऱ्या या ओपन लेजरमुळे, यात होणाऱ्या व्यवहारांना एका मध्यवर्ती तटस्थ संस्थेने प्रमाणित करण्याची काहीच गरज उरत नाही. आज आपण बँकेबरोबर करणाऱ्या सर्व व्यवहारांना भारताची मध्यवर्ती रिझव्‍‌र्ह बँक प्रमाणित करते किंवा रोख्यांच्या खरेदी विक्रीच्या व्यवहारांना स्टॉक एक्स्चेंज प्रमाणित करते. ब्लॉकचेन पद्धतीचे व्यवहार मात्र कोणत्याही वित्तसंस्था किंवा सरकारी नियंत्रणांच्या संपूर्णपणे बाहेर राहू शकतात.

ब्लॉकचेन तंत्रज्ञान आणि त्यावर आधारलेल्या बिटकॉइन या संख्यात्मक चलनव्यवस्थेचा उदय २००८ साली झाला. त्या वर्षी या दोन्हीचा प्रणेता असलेल्या सातोशी नाकामोटो या जपानी व्यक्तीचा (खरं तर ही एक व्यक्ती आहे की समूह तसेच हीच तिची खरी ओळख आहे का याबद्दल अजूनही संभ्रम आणि मतभेद आहेत) ब्लॉकचेन तंत्रज्ञान व बिटकॉइनची संकल्पना स्पष्ट करणारा ‘पीअर टू पीअर इलेक्ट्रॉनिक कॅश सिस्टम’ हा लेख प्रसिद्ध झाला. त्याचबरोबर त्याने बिटकॉइनच्या आज्ञावलीची प्रत मुक्त स्वरूपात इंटरनेटवर उपलब्ध करून दिली आणि एका समांतरपणे चालणाऱ्या मुक्त अर्थव्यवस्थेची सुरुवात झाली.

प्रत्यक्ष कोणत्याही देशाचे पाठबळ नसले आणि कसल्याही नियंत्रणाच्या अभावामुळे गुन्हेगारी, ड्रग्ज माफिया व आतंकवादी संघटना या व्यवस्थेचा गैरफायदा घेऊ  शकण्याची भीती असली, तरीही आज रोखीचे तसेच फ्युचर्सचे व्यवहार यात होऊ  लागले आहेत. युरोप, अमेरिकेतील अनेक बाजारपेठांनी या चलनाला मान्यताही देण्यास सुरुवात केली आहे. ब्लॉकचेन व बिटकॉइनच्या या लोकप्रियतेमागे त्याच्या मुक्त स्वरूपात उपलब्ध असलेल्या पारदर्शक आणि सुरक्षित तंत्रज्ञानाचा फार मोठा वाटा आहे. असो. एकविसाव्या शतकात जसा डिजिटल तंत्रज्ञानाचा प्रसार सर्वसामान्य जनतेत जोमाने व्हायला लागला, तसा याच डिजिटल तंत्रज्ञानाचा वापर करून लोकाभिमुख, पारदर्शक शासन राबवण्याची मागणी जोर धरू लागली. शासन स्तरावर झालेल्या विविध ‘ओपन गव्हर्नमेंट’ संदर्भातल्या प्रयोगांचा आढावा आपण पुढील लेखात घेऊ.

amrutaunshu@gmail.com

लेखक माहिती व तंत्रज्ञान क्षेत्रातील तज्ज्ञ आहेत.