23 August 2019

News Flash

विदा-विश्लेषणाची पूर्वतयारी..

विदा-विश्लेषण किंवा डेटा अ‍ॅनालिटिक्सची ओळख करून घेण्यापूर्वी, विदा-आधारित निर्णयप्रक्रिया म्हणजे काय, ती कशासाठी हवी, हे पाहणे गरजेचे आहे. उपयोग कळल्यावर ही विश्लेषणप्रक्रिया आवश्यकच वाटेल..

|| हृषिकेश दत्ताराम शेर्लेकर

विदा-विश्लेषण किंवा डेटा अ‍ॅनालिटिक्सची ओळख करून घेण्यापूर्वी, विदा-आधारित निर्णयप्रक्रिया म्हणजे काय, ती कशासाठी हवी, हे पाहणे गरजेचे आहे. उपयोग कळल्यावर ही विश्लेषणप्रक्रिया आवश्यकच वाटेल..

विदा-विश्लेषण म्हणजेच डेटा-अ‍ॅनालिटिक्सची चर्चा आपण करत आहोत. आजच्या लेखात विदा (डेटा) वापरून निर्णय का घ्यायचे आणि कोणी, केव्हा आणि कुठल्या परिस्थितीत घ्यायचे, या मूलभूत प्रश्नाबद्दल.. विदा-केंद्रित निर्णयप्रक्रिया (डेटा सेंट्रिक डिसिजन मेकिंग) कशासाठी हवी, हे ठरवणे पहिले काम. विदा-विश्लेषण त्यानंतर.

मागील लेखात म्हटल्याप्रमाणे, कुठल्याही गोष्टीच्या अगदी खोलवर मुळापर्यंत गेल्यास तुम्हाला त्यातील ‘गणित’ नक्कीच सापडेल. हे सिद्ध करायला तुम्हा सर्वाना एक सोप्पा प्रश्न खाली देतोय.. (संदर्भ- अमेरिकी चित्रवाणीवरचा ‘लेट्स मेक अ डील’ हा १९७० च्या दशकातील लोकप्रिय कार्यक्रम, सूत्रसंचालन : मॉन्टी हॉल)

प्रश्न : तुमच्यासमोर तीन खजिन्यांनी भरलेल्या तिजोऱ्या ठेवल्या आहेत. तुम्हाला अर्थातच त्यात काय आहे याबद्दल काहीही सांगितलेले नाही. पहिल्या पायरीत तुम्हाला कुठलीही एक तिजोरी उघडायचीय. तुमच्या नशिबानुसार तुम्हाला मिळू शकेल कदाचित खजिना. इथपर्यंत ठीक आहे, खरी मेख पुढे. दुसऱ्या पायरीत प्रश्न विचारणारा सूत्रधार दुसरी तिजोरी उघडणार. आता तिसऱ्या पायरीत तुम्हाला प्रश्न असा आहे- ‘अजूनही तुम्ही तिसरी तिजोरी उघडू इच्छिता, की पहिल्यात जे मिळालेय त्यावर समाधान आहे?’ तुम्ही आत्ताच पहिली किंवा दुसरी तिजोरी निवडू शकता.. पण आत्ता निर्णय घ्यायचाय, की तिसरा दरवाजा उघडण्यात तुमचा फायदा आहे की तोटा?.. वेगवेगळ्या लोकांचे अंतर्मन सांगेल, ‘असू दे, मिळालेय ते ठीकच आहे’ किंवा एखादा म्हणेल, ‘बघू तरी नवीन काय मिळेल ते.’ वरवर अवघड वाटणारा प्रश्न गणितीशास्त्र वापरून कसा सोपा होतो, ते पुढे बघू.

खरे तर एका तिजोरीत नवीन कोऱ्या करकरीत गाडीची चावी आहे आणि दुसऱ्या दोन तिजोऱ्या फसव्या आहेत- म्हणजे त्या दोन्हीमध्ये फक्त खाण्याचे पुडे ठेवले आहेत. तिजोरी (१) – गाडी, तिजोरी (२) – बिस्किट, तिजोरी (३) – बिस्किट. सोबतच्या तक्त्यात, पहिल्या निर्णयावर ठाम राहिल्यास मिळणारा परिणाम विरुद्ध निर्णय बदलल्यास परिणाम अशा दोन्ही शक्यता दिलेल्या आहेत.

वरील उदाहरणावरून लक्षात येईल, की वरवर जरी पहिल्या निर्णयावर ठाम राहिल्यास अधिक बरे असे बहुतांश लोकांना सुरुवातीला वाटले असावे तरी गणितीशास्त्र वापरून, म्हणजेच विदा-विश्लेषण करून निर्णय घेतल्यास पहिल्या निर्णयावर ठाम राहिल्यास गाडी जिंकण्याची शक्यता ३३ टक्के तर निर्णय बदलल्यास ६७ टक्क्यांपर्यंत. पण हा अंदाज आकडेवारीचे गणित केल्याशिवाय सहजासहजी सुचणे जवळजवळ अशक्य. अर्थातच इथे फक्त तीनच पर्याय असल्यामुळे साधा कागद, पेन्सिल घेऊनदेखील आपण आकडेमोड करू शकलो. पण आयुष्यातले बरेच निर्णय घेताना अनेक पर्याय विचारात घेऊन ‘विदा-केंद्रित निर्णयप्रक्रिया’ करायची म्हटल्यास संगणक हवाच जोडीला. थोडक्यात, अ‍ॅनालिटिक्स म्हणजे, हे असेच पण अनेकपटींनी क्लिष्ट प्रश्न सोडवणे आणि आपल्याला निर्णय घ्यायला मदत मिळणे.

वरील सर्व पुराण असल्या साध्या खेळातसुद्धा विदा-विश्लेषण का गरजेचे आहे, हे दाखविण्यासाठी मांडले. मागील लेखात पाहिल्याप्रमाणे कुलकर्णी काकांच्या वजन कमी करण्याच्या प्रयासामध्ये साधे मागील दहा-पंधरा वर्षांतील आलेख- म्हणजे वजनातील चढउतार, प्रत्येक वर्षांतील छायाचित्रे, वजन, सवयी, खाणे-पिणे (किती/ कसे/ केव्हा), व्यायाम (हो/ नाही/ किती), रक्तचाचण्यांचे अहवाल, मानसिक स्थिती.. मांडायला खरोखर कितीसा वेळ, कष्ट लागेल? पण त्यामधून जे ज्ञान उपजेल त्यामुळे त्यांना स्वत:लाच किती तरी कल, संदर्भ समजू शकतील.. आणि मागे काय चुकले, कशामुळे योग्य परिणाम मिळाला, पुढे काय करायला हवे वगरे कळायचा मार्ग बऱ्यापकी स्पष्ट दिसू लागेल; नाही का? महत्त्वाचे म्हणजे एखादा आलेख मांडायला काही संगणक आज्ञावली (सॉफ्टवेअर प्रोग्राम) लिहायची गरज मुळीच नाही, फक्त कागद-पेन्सिल सामग्री वापरूनदेखील कोणीही असले काम करू शकेल.

तेव्हा विदा-विश्लेषणाचा वापर करून घेतलेले निर्णय सर्वप्रथम का घ्यायचे हे वर बघितले आणि ते सर्वानी, प्रत्येक वेळी आणि कुठल्याही परिस्थितीत घ्यावेत, असं माझं तरी मत नक्कीच आहे. नाही तर जाणकारांनी म्हटलंच आहे – ‘जगातील बहुतांश लोक (आणि उद्योग) फक्त पूर्वानुभव, अंदाज आणि आतील-आवाज वापरून निर्णय घेतात, ज्यात ते कधी कधी नशीबवान ठरतात, पण बरेचदा चूक.’

त्यातल्या त्यात ‘डिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स’ (पूर्वी काय झाले होते? असे विश्लेषण) प्रकारचे आलेख मांडणे हे सर्वाधिक सोपे. ‘प्रेडिक्टिव्ह अ‍ॅनालिटिक्स’ (पुढे काय होऊ शकेल?- याचे विश्लेषण-निर्णयन)साठी निष्णात गणिती, सांख्यिकीशास्त्र, मशीन लर्निग वगरे क्षमता असलेले तज्ज्ञ गरजेचे. त्याहूनही पुढे ‘प्रिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स’ (कुठली क्रिया म्हणजे सर्वोत्तम निर्णय?)साठी तर विदा-विश्लेषणांचे पुन्हा विश्लेषण करणाऱ्या ‘ऑपरेशनल रीसर्च’ या शाखेतले तज्ज्ञदेखील हवेत. म्हणूनच अजूनही जगातील बहुसंख्य कंपन्या सर्वसाधारणपणे डिस्क्रिप्टिव्ह अ‍ॅनालिटिक्सचाच वापर जास्त करतात आणि त्यातून मिळालेल्या विचारधाग्यांच्या किंवा ‘इनसाइट्स’च्या जोरावर पुढील मार्ग ठरवणे, आधीच्या पद्धतीत दुरुस्ती वा बदल करणे, इत्यादी निर्णय अधिकारी वर्गाकडून घेतले जातात.

कुठल्याही अ‍ॅनालिटिक्स प्रक्रियेत सर्वसाधारणपणे ज्या महत्त्वाच्या पायऱ्या पाहायला मिळतात, त्यांची थोडक्यात ओळख करून घेऊ :

(१) प्रश्न किंवा संधी (प्रॉब्लेम) – एखादा प्रश्न, अडचण किंवा इच्छा/ स्वप्न.. तसेच कंपनीचा ठराव, बाजारातील स्पर्धा, वाढीचा वेग/ गुणवत्ता/ ग्राहक-समाधान वाढवण्यासाठी प्रयत्न इत्यादी

(२) विदेचा स्रोत – वरील समस्या किंवा संधीबद्दल कुठला-कुठला डेटा, कसा कुठून मिळवायचा, किती प्रमाणात, खर्च, इत्यादी.

(३) विदेचे शुद्धीकरण – आलेला डेटा शुद्ध स्वरूपात असेलच असे मुळीच नाही; तो आधी योग्य प्रकारे पडताळून घेतला नाही, तर मग ‘कचरा टाकलात – तर कचराच मिळतो’ या म्हणीप्रमाणे विश्लेषणदेखील अगदी चुकीचे मिळायचे.

(४) विदेचे विघटन – शुद्धीकरण केलेला डेटा-सेट (विदा-संच) मग विभागायचा – ६० ते ७० टक्के विश्लेषणाच्या प्रयोगासाठी (अ‍ॅनालिटिक्स मॉडेल ट्रेनिंग-सेट), उर्वरित विदा विश्लेषण पडताळून बघण्यासाठी (अ‍ॅनालिटिक्स मॉडेल टेस्टिंग-सेट)

(५) विदेचे विश्लेषण – प्रत्यक्ष विश्लेषण करणे. (याबद्दल लेखमालेच्या पुढील भागांत सविस्तर चर्चा करू.)

(६) विश्लेषणापासून संदर्भ, कल – ‘इनसाइट्स’ मिळवणे आणि मुख्य म्हणजे कुठल्या उपयोगात आणायच्या, कुठल्या सोडून द्यायच्या, हेही ठरवणे. हे अत्यंत कठीण कार्य असून त्यासाठी व्यावसायिक अनुभव गाठीशी लागतो.

(७) निर्णय वा क्रिया – वरील निवडलेल्या ‘इनसाइट्स’वरून पुढील वाटचाल, कार्यपद्धती, योजना ठरवणे.

(८) परत चक्र सुरू – अर्थातच, हे चक्र अव्याहतपणे चालू ठेवणे गरजेचे, जेणेकरून काही काळाने परत नवीन वाटचाल, कार्यपद्धती, योजना अमलात आणून बदलाचे आणि प्रगतीचे चक्र सतत सुरू ठेवता येईल.

आजचा प्रश्न :

मागील लेखात तुम्ही तुमच्या रोजच्या दैनंदिन जीवनातील एखादा प्रश्न, अडचण किंवा इच्छा, स्वप्न.. आणि त्या विषयाबद्दल कुठला-कुठला डेटा तुम्ही वापरू शकाल त्याबद्दल कळवले, आज त्याच विदेचे (डेटाचे) साधा कागद-पेन्सिल वापरून ‘डिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स’ बनवा आणि काय काय ‘इनसाइट्स’ मिळाल्या, याबद्दल कळवा.

लेखक टाटा कन्सल्टन्सी सव्‍‌र्हिसेसमध्ये साहाय्यक उपाध्यक्ष आणि सध्या अ‍ॅनालिटिक्स आणि इनसाइट्सच्या यूएसए सेंटरचे प्रमुख म्हणून कार्यरत आहेत.

hrishikesh.sherlekar@gmail.com

First Published on August 5, 2019 12:06 am

Web Title: what is data analysis mpg 94