14 December 2019

News Flash

‘विश्लेषणा’ची ओळख..

डेटा अ‍ॅनालिटिक्स किंवा विदा-विश्लेषण हा आजच्या काळातील ‘निर्णय-प्रक्रिये’चा अविभाज्य भाग ठरतो आहे..

|| हृषिकेश दत्ताराम शेर्लेकर

डेटा अ‍ॅनालिटिक्स किंवा विदा-विश्लेषण हा आजच्या काळातील ‘निर्णय-प्रक्रिये’चा अविभाज्य भाग ठरतो आहे..

डिजिटल तंत्रज्ञानातील एक महत्त्वाचा खांब म्हणजे ‘अ‍ॅनालिटिक्स’ (विश्लेषण)! यालाच बरेचदा ‘बिझनेस अ‍ॅनालिटिक्स’, ‘अ‍ॅनालिटिक्स अ‍ॅण्ड इनसाइट्स’, ‘डेटा अ‍ॅनालिटिक्स’देखील संबोधले जाते. आजच्या लेखापासून अ‍ॅनालिटिक्सच्या विश्वात..

जगातील बहुतेक माणसे आणि उद्योगसुद्धा निर्णय घेतेवेळी फक्त पूर्वानुभव, अंदाज आणि ‘आतला आवाज’ किंवा अंत:स्फूर्ती यांचा वापर करतात. साहजिकच ते कधी कधी नशीबवान ठरतात, तर बरेचदा चूक! त्याऐवजी ‘डेटा अ‍ॅनालिटिक्स’चा वापर केला, तर चुका कमी होऊ शकतात. या विषयाची महती आणि व्याप्ती लक्षात येण्यासाठी सर्वप्रथम डेटा व अ‍ॅनालिटिक्सबद्दल काही दिग्गजांची गाजलेली सुंदर वक्तव्ये पाहू :

(१) पीटर सोंदरगार्ड म्हणतो, ‘डेटा इज द न्यू ऑइल अ‍ॅण्ड अ‍ॅनालिटिक्स इज द इंजिन.’  सर्वोत्तम उत्पन्नाचे साधन म्हणून विसाव्या शतकातील खनिज तेलाची जागा एकविसाव्या शतकात डेटाने हिसकावून घेतली आहे आणि डेटा (विदा)- विश्लेषण हे त्या इंधनातून शक्ती निर्माण करणारे इंजिन आहे. ज्याच्याकडे सर्वाधिक डेटा (आणि तो कसा वापरायचा याचे ज्ञान) तो सर्वात सधन. सर्वोत्तम उदाहरण गूगल, फेसबुक.

(२) ‘टाटा समूहा’चे अध्यक्ष म्हणाले होते, ‘तुमच्या उद्योगांची अंतर्गत प्रक्रिया परिपक्वता (प्रोसेस-मॅच्युरिटी) एव्हाना तुम्ही कधीच सुरळीत केलेली असावी आणि आता पुढची वाटचाल तुमच्या उद्योगांची डेटा-मॅच्युरिटी- म्हणजेच उपलब्ध विदेचा योग्य प्रकारे वापर करून त्याआधारे महसूल, गुणवत्ता व ग्राहक-समाधान आणि एकंदरीत उद्योगाचे मूल्य वाढवणे अशी असेल. त्यासाठी हवा मूलभूत, उपलब्ध आणि क्षणोक्षणी बदलूनही विश्लेषण होऊ शकणारा (रीअल-टाइम) डेटा.’

(३) एडवर्ड्स डेमिंग म्हणतात, ‘इन गॉड वी ट्रस्ट, ऑल अदर्स मस्ट ब्रिंग डेटा.’ देवावर विश्वास आहे आमचा, पण मनुष्याने कुठलीही गोष्ट सिद्ध करण्यासाठी विदा (माहिती) आणायलाच हवी.

(४) संगणकयुगाच्या आधी डीन श्लिक्टर म्हणाले होते, ‘कुठल्याही गोष्टीच्या अगदी खोलवर मुळापर्यंत गेल्यास तुम्हाला त्यातील ‘गणित’ नक्कीच सापडेल.’

(५) अमेरिकी शैक्षणिक तज्ज्ञ थॉमस डॅव्हेनपोर्ट म्हणतात, ‘प्रत्येक उद्योगाचे पुढे जाऊन शेवटी ‘डेटावर आधारित’ उद्योगामध्ये परिवर्तन होईल, इतर गुंडाळले जातील.’

(६) अमेरिकेतील ‘एमआयटी’च्या डिजिटल अर्थव्यवस्था पुढाकाराचे प्रमुख अँड्रय़ू मॅक्अ‍ॅफी म्हणतात, ‘हे जगच एक मोठा बिग डेटा कोड आहे.’

(७) संगणकविज्ञान कथालेखक डॅनिएल मोरान म्हणतात, ‘डेटा माहितीशिवाय असू शकतो, पण डेटाशिवाय माहिती (ज्ञान) असूच शकत नाही.’

(८) आणि शेवटी भगवद्गीता : ‘ज्ञानाचे दान हे यज्ञ, त्याग वा आहुती तसेच कुठल्याही इतर दानापेक्षा सरस ठरते.’

‘डेटा’ या शब्दाला आज ‘संगणकीय विदा’ हा अर्थ आहे. रोजच्या जीवनात आपण कल्पनादेखील केली नसेल, इतका डेटा आपण प्रत्येक जण स्वत: वापरतोय, नवीन बनवतो व इतरांना पाठवतो; पण ‘डिलीट’ मात्र काहीच करत नाही!

(अ) फक्त गेल्या दोन वर्षांत अख्ख्या जगातील ९० टक्के डेटा तुम्ही-आम्ही (लोकांनीच) निर्माण केला. पैकी ८० टक्के डेटा हा पारंपरिक संगणक प्रणालीला उपयोगाचा नाही (म्हणजे तो ध्वनिमुद्रण, दृक्मुद्रण, छायाचित्रे, नैसर्गिक भाषेतील लेखन किंवा मजकूर या स्वरूपात आहे), असे मायक्रोसॉफ्टने केलेल्या संशोधनात आढळले.

(आ) एका दिवसात आपण जगात २.५ क्विन्टिलियन बाइट्स डेटा बनवतो, म्हणजे २.५ गुणिले एकावर अठरा शून्ये!

(इ) गूगलवर सहजच ‘वन इंटरनेट मिनिट’ असे सर्च करून बघा.. अवघ्या साठ सेकंदांत काय काय घडते, याबद्दल माहिती मिळेल.

(ई) एक एमबी डेटा साठवण्यासाठी १९८० मध्ये तीन ते चार कोटी रुपये लागत, हल्ली काही पैसे! विदासाठवण (डेटा स्टोरेज) जवळपास मोफतच झाले आहे. तोच डेटा वापरायला टेलिकॉमचा खर्चदेखील (मोबाइल डेटा-पॅक, वायफाय इत्यादी) आपल्या देशात अवघा पाच रुपये प्रति दिवस प्रति जीबीपर्यंत आला आहे. डेटानिर्मितीचे तर विचारूच नका; प्रत्येकाकडे संगणक व स्मार्टफोन जोडीला मोफत इंटरनेट व समाजमाध्यमे आणि आता वस्तुजाल वा ‘आयओटी’ उपकरणे. थोडक्यात, डेटाचा महापूर येतो आहे अशी स्थिती.

(उ) ‘अवरवर्ल्डइनडेटा.ऑर्ग’ या संकेतस्थळावर, जगातील उपयुक्त गोष्टींबद्दल मोफत डेटा उपलब्ध केला आहे. या संकेतस्थळाचा आजवरचा पसारा २,७४६ आलेख, २९७ विषय इतका आहे.

आता मुख्य विषयाकडे वळू या.. डेटा-अ‍ॅनालिटिक्स सर्वाना सहजच समजावे म्हणून एक रोजचेच उदाहरण घेऊ या. आमच्या शेजारचे कुलकर्णी काका उवाच, ‘‘अरे, काय सांगू बाबा, काही केल्या वजन काय कमी होत नाहीये रे माझे. बरेच प्रयत्न करून झाले, पण हा वजनकाटा एका किलोनेदेखील मागे जाईल तर नशीब! कोण कोण काय काय सांगेल ते सगळे उपाय करून झाले, पण सगळं मुसळ केरातच..’’

इथे काकांना समस्या भेडसावते आहे वजन वाढल्याची आणि निर्णय घ्यायचा आहे वजन कसे कमी करता येईल, याचा. परंतु त्यांच्याकडे कुठलाच मूलभूत डेटा, माहिती, ज्ञान नाही (त्यांच्या वजनाशिवाय अर्थात) आणि कदाचित म्हणूनच त्यांना योग्य मार्ग/यश मिळत नसणार.

समजा, त्यांनी वजन कमी करण्यासाठी कुठला कुठला डेटा लागेल, त्याचा अभ्यास केला आणि स्वत:चाच पूर्व-इतिहास एका आलेखात मांडला.. म्हणजे मागील १०-१५ वर्षांतील वजनातील चढ-उतार, प्रत्येक वर्षांतली छायाचित्रे, वजन, सवयी, खाणे-पिणे (किती/ कसे/ केव्हा), व्यायाम (हो/ नाही/ किती), रक्तचाचण्यांचे अहवाल, मानसिक परिस्थिती, इत्यादी.. तर त्यांना स्वत:लाच किती तरी कल, संदर्भ समजू शकतील; नाही का? अशा माहिती मांडण्याला ‘डिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स’ म्हणू शकू आणि त्यातून मिळणाऱ्या कल, संदर्भाना ‘इनसाइट्स’! रूढार्थाने ‘वर्णनपर’ असे भाषांतर असलेला ‘डिस्क्रिप्टिव्ह’ शब्द इथे वापरात येतो, कारण विश्लेषण फक्त भूतकाळापर्यंत सीमित आहे म्हणून.

समजा, काकांनी त्यापुढे असेच, पण मोठे आलेख त्यांच्या वयोगटाच्या आणखी १०० लोकांचे (समान वय, काही समान व्यवसाय, काही समान कौटुंबिक मुळं, काही समान सवयी, आजार.. आणि वजन!) डेटा मिसळून बनविले; तर आपण स्वत: कुठे आहोत आणि एकंदर सरासरी, सर्वोत्तम शक्यता, सर्वात वाईट परिस्थिती असले सगळे कल (पॅटर्न) हे सारे काकांना मिळू शकतील. यालाच ‘क्लस्टिरग अ‍ॅनालिटिक्स’ म्हणतात.

आता त्यांनी हाच डेटा/ आलेख वापरून पूर्वीच्या चढ-उतारांवरून भविष्यात काय घडू शकेल, याचे अंदाज मांडले (उदा. महिन्याला ठरावीक वजन कमी व्हायचे असेल, तर इतके कॅलरी, इतका व्यायाम, इ.) तर त्याला ‘प्रेडिक्टिव्ह अ‍ॅनालिटिक्स’ म्हणू शकू. इथे भविष्यातले अंदाज हा सर्वात महत्त्वाचा पैलू असतो. पण इथे जसेजसे प्रश्न क्लिष्ट होत जातात तशी उत्तरेदेखील फारच विविध- म्हणजे अनेक पर्याय दिसू लागतात आणि कुठला पर्याय निवडायचा हेच मानवी बुद्धीसाठी कठीण कार्य बनते. वरील उदाहरणात १० किलो कमी करण्यासाठी ‘१५०० कॅलरी खाणे अधिक ५०० कॅलरीचा खडतर व्यायाम’ विरुद्ध ‘१२०० कॅलरी खाणे अधिक २०० कॅलरीचा माफक व्यायाम’ असे आणखी चार-पाच पर्याय समजा मिळाले; तर काकांना यशाची खात्री देणारा सर्वोत्तम पर्याय कुठला, ते कसे ठरवावे?

त्यापुढील पायरी म्हणजे ‘प्रिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स’. इथे अ‍ॅनालिटिक्सची सांगड व्यवहारकेंद्री संशोधनाशी (ऑपरेशनल रीसर्चशी) घालून अ‍ॅनालिटिक्सद्वारे मिळवलेल्या विविध पर्यायांपैकी सर्वोत्तम पर्याय निवडला जातो. म्हणजे वरील चार-पाच पर्यायांमधून सर्वोत्तम पर्याय फक्त ‘मला वाटलं म्हणून’ किंवा ‘कोणी तरी म्हणतं म्हणून’ न निवडता गणिती शास्त्र वापरून निवडणे.

या तत्त्वांना म्हणतात ‘डेटासेंट्रिक डिसिजन मेकिंग’- म्हणजेच माहितीच्या आधारावरच निर्णय घेणे! थोडक्यात,

(क) डिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स – पूर्वी काय झाले होते?

(ख) प्रेडिक्टिव्ह अ‍ॅनालिटिक्स – पुढे काय होऊ  शकेल?

(ग) प्रिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स – कुठली क्रिया म्हणजे सर्वोत्तम निर्णय?

आता आजचा प्रश्न : तुमच्या रोजच्या दैनंदिन जीवनातील एखादा प्रश्न, अडचण किंवा इच्छा, स्वप्न.. आणि त्या विषयाबद्दल कुठला कुठला डेटा तुम्ही वापरू शकाल, त्याबद्दल कळवा.

लेखक टाटा कन्सल्टन्सी सव्‍‌र्हिसेसमध्ये साहाय्यक उपाध्यक्ष आणि सध्या अ‍ॅनालिटिक्स आणि इनसाइट्सच्या यूएसए सेंटरचे प्रमुख म्हणून कार्यरत आहेत.

hrishikesh.sherlekar@gmail.com

First Published on July 29, 2019 12:06 am

Web Title: data analysis mpg 94
Just Now!
X