|| हृषिकेश दत्ताराम शेर्लेकर

डेटा अ‍ॅनालिटिक्स किंवा विदा-विश्लेषण हा आजच्या काळातील ‘निर्णय-प्रक्रिये’चा अविभाज्य भाग ठरतो आहे..

indias first hydrogen powered ferry
विश्लेषण : पंतप्रधान मोदींकडून हायड्रोजन इंधनावर चालणाऱ्या देशातील पहिल्या बोटीचे उदघाटन, काय आहेत वैशिष्ट्ये? जाणून घ्या…
mpsc exam preparation guidance mpsc exam preparation tips
MPSC मंत्र : भूगोल मूलभूत अभ्यास
Bitcoin Halving
बिटकॉइन हॉल्व्हिंग म्हणजे काय आणि क्रिप्टोसाठी त्याचा अर्थ काय?
Experts also demand that the regulatory framework of Finetech needs to be reconsidered to reduce the pressure of regulations eco news
‘फिनेटक’च्या नियामक चौकटीचा पुनर्विचार आवश्यक; नियमावलीची जाचकता कमी करण्याचीही तज्ज्ञांची मागणी

डिजिटल तंत्रज्ञानातील एक महत्त्वाचा खांब म्हणजे ‘अ‍ॅनालिटिक्स’ (विश्लेषण)! यालाच बरेचदा ‘बिझनेस अ‍ॅनालिटिक्स’, ‘अ‍ॅनालिटिक्स अ‍ॅण्ड इनसाइट्स’, ‘डेटा अ‍ॅनालिटिक्स’देखील संबोधले जाते. आजच्या लेखापासून अ‍ॅनालिटिक्सच्या विश्वात..

जगातील बहुतेक माणसे आणि उद्योगसुद्धा निर्णय घेतेवेळी फक्त पूर्वानुभव, अंदाज आणि ‘आतला आवाज’ किंवा अंत:स्फूर्ती यांचा वापर करतात. साहजिकच ते कधी कधी नशीबवान ठरतात, तर बरेचदा चूक! त्याऐवजी ‘डेटा अ‍ॅनालिटिक्स’चा वापर केला, तर चुका कमी होऊ शकतात. या विषयाची महती आणि व्याप्ती लक्षात येण्यासाठी सर्वप्रथम डेटा व अ‍ॅनालिटिक्सबद्दल काही दिग्गजांची गाजलेली सुंदर वक्तव्ये पाहू :

(१) पीटर सोंदरगार्ड म्हणतो, ‘डेटा इज द न्यू ऑइल अ‍ॅण्ड अ‍ॅनालिटिक्स इज द इंजिन.’  सर्वोत्तम उत्पन्नाचे साधन म्हणून विसाव्या शतकातील खनिज तेलाची जागा एकविसाव्या शतकात डेटाने हिसकावून घेतली आहे आणि डेटा (विदा)- विश्लेषण हे त्या इंधनातून शक्ती निर्माण करणारे इंजिन आहे. ज्याच्याकडे सर्वाधिक डेटा (आणि तो कसा वापरायचा याचे ज्ञान) तो सर्वात सधन. सर्वोत्तम उदाहरण गूगल, फेसबुक.

(२) ‘टाटा समूहा’चे अध्यक्ष म्हणाले होते, ‘तुमच्या उद्योगांची अंतर्गत प्रक्रिया परिपक्वता (प्रोसेस-मॅच्युरिटी) एव्हाना तुम्ही कधीच सुरळीत केलेली असावी आणि आता पुढची वाटचाल तुमच्या उद्योगांची डेटा-मॅच्युरिटी- म्हणजेच उपलब्ध विदेचा योग्य प्रकारे वापर करून त्याआधारे महसूल, गुणवत्ता व ग्राहक-समाधान आणि एकंदरीत उद्योगाचे मूल्य वाढवणे अशी असेल. त्यासाठी हवा मूलभूत, उपलब्ध आणि क्षणोक्षणी बदलूनही विश्लेषण होऊ शकणारा (रीअल-टाइम) डेटा.’

(३) एडवर्ड्स डेमिंग म्हणतात, ‘इन गॉड वी ट्रस्ट, ऑल अदर्स मस्ट ब्रिंग डेटा.’ देवावर विश्वास आहे आमचा, पण मनुष्याने कुठलीही गोष्ट सिद्ध करण्यासाठी विदा (माहिती) आणायलाच हवी.

(४) संगणकयुगाच्या आधी डीन श्लिक्टर म्हणाले होते, ‘कुठल्याही गोष्टीच्या अगदी खोलवर मुळापर्यंत गेल्यास तुम्हाला त्यातील ‘गणित’ नक्कीच सापडेल.’

(५) अमेरिकी शैक्षणिक तज्ज्ञ थॉमस डॅव्हेनपोर्ट म्हणतात, ‘प्रत्येक उद्योगाचे पुढे जाऊन शेवटी ‘डेटावर आधारित’ उद्योगामध्ये परिवर्तन होईल, इतर गुंडाळले जातील.’

(६) अमेरिकेतील ‘एमआयटी’च्या डिजिटल अर्थव्यवस्था पुढाकाराचे प्रमुख अँड्रय़ू मॅक्अ‍ॅफी म्हणतात, ‘हे जगच एक मोठा बिग डेटा कोड आहे.’

(७) संगणकविज्ञान कथालेखक डॅनिएल मोरान म्हणतात, ‘डेटा माहितीशिवाय असू शकतो, पण डेटाशिवाय माहिती (ज्ञान) असूच शकत नाही.’

(८) आणि शेवटी भगवद्गीता : ‘ज्ञानाचे दान हे यज्ञ, त्याग वा आहुती तसेच कुठल्याही इतर दानापेक्षा सरस ठरते.’

‘डेटा’ या शब्दाला आज ‘संगणकीय विदा’ हा अर्थ आहे. रोजच्या जीवनात आपण कल्पनादेखील केली नसेल, इतका डेटा आपण प्रत्येक जण स्वत: वापरतोय, नवीन बनवतो व इतरांना पाठवतो; पण ‘डिलीट’ मात्र काहीच करत नाही!

(अ) फक्त गेल्या दोन वर्षांत अख्ख्या जगातील ९० टक्के डेटा तुम्ही-आम्ही (लोकांनीच) निर्माण केला. पैकी ८० टक्के डेटा हा पारंपरिक संगणक प्रणालीला उपयोगाचा नाही (म्हणजे तो ध्वनिमुद्रण, दृक्मुद्रण, छायाचित्रे, नैसर्गिक भाषेतील लेखन किंवा मजकूर या स्वरूपात आहे), असे मायक्रोसॉफ्टने केलेल्या संशोधनात आढळले.

(आ) एका दिवसात आपण जगात २.५ क्विन्टिलियन बाइट्स डेटा बनवतो, म्हणजे २.५ गुणिले एकावर अठरा शून्ये!

(इ) गूगलवर सहजच ‘वन इंटरनेट मिनिट’ असे सर्च करून बघा.. अवघ्या साठ सेकंदांत काय काय घडते, याबद्दल माहिती मिळेल.

(ई) एक एमबी डेटा साठवण्यासाठी १९८० मध्ये तीन ते चार कोटी रुपये लागत, हल्ली काही पैसे! विदासाठवण (डेटा स्टोरेज) जवळपास मोफतच झाले आहे. तोच डेटा वापरायला टेलिकॉमचा खर्चदेखील (मोबाइल डेटा-पॅक, वायफाय इत्यादी) आपल्या देशात अवघा पाच रुपये प्रति दिवस प्रति जीबीपर्यंत आला आहे. डेटानिर्मितीचे तर विचारूच नका; प्रत्येकाकडे संगणक व स्मार्टफोन जोडीला मोफत इंटरनेट व समाजमाध्यमे आणि आता वस्तुजाल वा ‘आयओटी’ उपकरणे. थोडक्यात, डेटाचा महापूर येतो आहे अशी स्थिती.

(उ) ‘अवरवर्ल्डइनडेटा.ऑर्ग’ या संकेतस्थळावर, जगातील उपयुक्त गोष्टींबद्दल मोफत डेटा उपलब्ध केला आहे. या संकेतस्थळाचा आजवरचा पसारा २,७४६ आलेख, २९७ विषय इतका आहे.

आता मुख्य विषयाकडे वळू या.. डेटा-अ‍ॅनालिटिक्स सर्वाना सहजच समजावे म्हणून एक रोजचेच उदाहरण घेऊ या. आमच्या शेजारचे कुलकर्णी काका उवाच, ‘‘अरे, काय सांगू बाबा, काही केल्या वजन काय कमी होत नाहीये रे माझे. बरेच प्रयत्न करून झाले, पण हा वजनकाटा एका किलोनेदेखील मागे जाईल तर नशीब! कोण कोण काय काय सांगेल ते सगळे उपाय करून झाले, पण सगळं मुसळ केरातच..’’

इथे काकांना समस्या भेडसावते आहे वजन वाढल्याची आणि निर्णय घ्यायचा आहे वजन कसे कमी करता येईल, याचा. परंतु त्यांच्याकडे कुठलाच मूलभूत डेटा, माहिती, ज्ञान नाही (त्यांच्या वजनाशिवाय अर्थात) आणि कदाचित म्हणूनच त्यांना योग्य मार्ग/यश मिळत नसणार.

समजा, त्यांनी वजन कमी करण्यासाठी कुठला कुठला डेटा लागेल, त्याचा अभ्यास केला आणि स्वत:चाच पूर्व-इतिहास एका आलेखात मांडला.. म्हणजे मागील १०-१५ वर्षांतील वजनातील चढ-उतार, प्रत्येक वर्षांतली छायाचित्रे, वजन, सवयी, खाणे-पिणे (किती/ कसे/ केव्हा), व्यायाम (हो/ नाही/ किती), रक्तचाचण्यांचे अहवाल, मानसिक परिस्थिती, इत्यादी.. तर त्यांना स्वत:लाच किती तरी कल, संदर्भ समजू शकतील; नाही का? अशा माहिती मांडण्याला ‘डिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स’ म्हणू शकू आणि त्यातून मिळणाऱ्या कल, संदर्भाना ‘इनसाइट्स’! रूढार्थाने ‘वर्णनपर’ असे भाषांतर असलेला ‘डिस्क्रिप्टिव्ह’ शब्द इथे वापरात येतो, कारण विश्लेषण फक्त भूतकाळापर्यंत सीमित आहे म्हणून.

समजा, काकांनी त्यापुढे असेच, पण मोठे आलेख त्यांच्या वयोगटाच्या आणखी १०० लोकांचे (समान वय, काही समान व्यवसाय, काही समान कौटुंबिक मुळं, काही समान सवयी, आजार.. आणि वजन!) डेटा मिसळून बनविले; तर आपण स्वत: कुठे आहोत आणि एकंदर सरासरी, सर्वोत्तम शक्यता, सर्वात वाईट परिस्थिती असले सगळे कल (पॅटर्न) हे सारे काकांना मिळू शकतील. यालाच ‘क्लस्टिरग अ‍ॅनालिटिक्स’ म्हणतात.

आता त्यांनी हाच डेटा/ आलेख वापरून पूर्वीच्या चढ-उतारांवरून भविष्यात काय घडू शकेल, याचे अंदाज मांडले (उदा. महिन्याला ठरावीक वजन कमी व्हायचे असेल, तर इतके कॅलरी, इतका व्यायाम, इ.) तर त्याला ‘प्रेडिक्टिव्ह अ‍ॅनालिटिक्स’ म्हणू शकू. इथे भविष्यातले अंदाज हा सर्वात महत्त्वाचा पैलू असतो. पण इथे जसेजसे प्रश्न क्लिष्ट होत जातात तशी उत्तरेदेखील फारच विविध- म्हणजे अनेक पर्याय दिसू लागतात आणि कुठला पर्याय निवडायचा हेच मानवी बुद्धीसाठी कठीण कार्य बनते. वरील उदाहरणात १० किलो कमी करण्यासाठी ‘१५०० कॅलरी खाणे अधिक ५०० कॅलरीचा खडतर व्यायाम’ विरुद्ध ‘१२०० कॅलरी खाणे अधिक २०० कॅलरीचा माफक व्यायाम’ असे आणखी चार-पाच पर्याय समजा मिळाले; तर काकांना यशाची खात्री देणारा सर्वोत्तम पर्याय कुठला, ते कसे ठरवावे?

त्यापुढील पायरी म्हणजे ‘प्रिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स’. इथे अ‍ॅनालिटिक्सची सांगड व्यवहारकेंद्री संशोधनाशी (ऑपरेशनल रीसर्चशी) घालून अ‍ॅनालिटिक्सद्वारे मिळवलेल्या विविध पर्यायांपैकी सर्वोत्तम पर्याय निवडला जातो. म्हणजे वरील चार-पाच पर्यायांमधून सर्वोत्तम पर्याय फक्त ‘मला वाटलं म्हणून’ किंवा ‘कोणी तरी म्हणतं म्हणून’ न निवडता गणिती शास्त्र वापरून निवडणे.

या तत्त्वांना म्हणतात ‘डेटासेंट्रिक डिसिजन मेकिंग’- म्हणजेच माहितीच्या आधारावरच निर्णय घेणे! थोडक्यात,

(क) डिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स – पूर्वी काय झाले होते?

(ख) प्रेडिक्टिव्ह अ‍ॅनालिटिक्स – पुढे काय होऊ  शकेल?

(ग) प्रिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स – कुठली क्रिया म्हणजे सर्वोत्तम निर्णय?

आता आजचा प्रश्न : तुमच्या रोजच्या दैनंदिन जीवनातील एखादा प्रश्न, अडचण किंवा इच्छा, स्वप्न.. आणि त्या विषयाबद्दल कुठला कुठला डेटा तुम्ही वापरू शकाल, त्याबद्दल कळवा.

लेखक टाटा कन्सल्टन्सी सव्‍‌र्हिसेसमध्ये साहाय्यक उपाध्यक्ष आणि सध्या अ‍ॅनालिटिक्स आणि इनसाइट्सच्या यूएसए सेंटरचे प्रमुख म्हणून कार्यरत आहेत.

hrishikesh.sherlekar@gmail.com