scorecardresearch

विश्लेषण: शोधताय की ‘सापड’ताय? सर्च इंजिनच्या अल्गोरिदमचा खेळ काय असतो?

इंटरनेटवरील सर्व सर्च इंजिने एका नियतरितीने (अल्गोरिदम) काम करत असतात

game of search engine algorithms
(फोटो सौजन्य – AP)

आसिफ बागवान

इंटरनेट हे आज जणू सर्व प्रश्नांचे उत्तर बनले आहे. प्रश्न कोणताही असो. हातात स्मार्टफोन आणि इंटरनेट कनेक्शन असेल तर मेंदूला व्यायाम न देता थेट इंटरनेटवरून त्याचा धुंडाळा घेतला जातो. इंटरनेटवरील माहितीच्या अथांग ठेव्यामुळे काहीही ‘सर्च’ केले की लगेच सापडते, हा समज इतका बलवान झाला आहे की, शेजारच्या गल्लीतील दुकान शोधण्यासाठीही आपण हजारो मैलावर असलेल्या सर्च इंजिनच्या सर्व्हरना साद घालतो. पण या शोधाचं मूल्य काय आहे, ठाऊक आहे? तुमचा खासगीपणा अर्थात ‘प्रायव्हसी’..

ते कसे?

सारा अल्गोरिदमचा खेळ…

इंटरनेटवरील सर्व सर्च इंजिने एका नियतरितीने (अल्गोरिदम) काम करत असतात. एखाद्या गोष्टीचा शोध घेत असताना हे अल्गोरिदम इंटरनेटवरील अक्राळविक्राळ माहितीचे पृथक्करण करून काही सेकंदात त्याचे परिणाम (रिझल्ट्स) तुमच्या स्क्रीनवर दर्शवत असतो. मात्र हा व्यवहार इतका साधा नसतो. आवश्यक माहितीचे पृथक्करण होत असताना हे अल्गोरिदम वापरकर्त्याच्या तपशिलातही डोकावतात आणि त्या तपशिलांची आवश्यक माहितीशी सांगड घालून अपेक्षित परिणाम काय असतील, याचे ठोकताळे बांधून समोर मांडतात. हे होत असताना सहाजिकच वापरकर्त्याच्या प्रायव्हसीचा भंग होतो. खरेतर हा खेळ खूप आधीपासूनच सुरू आहे. पण गेल्या महिन्यात डिजिटल व्यवस्थेवर देखरेख असणाऱ्या ब्रिटनमधील संस्थेने सर्च इंजिनच्या अल्गोरिदमचा सखोल अभ्यास करण्याचे जाहीर केले आणि त्यानंतर या मुद्द्याला तोंड फुटले.

अल्गोरिदम म्हणजे काय? ते कसे काम करतात?

सोप्या शब्दांत सांगायचे तर अल्गोरिदम ही कोणतेही संगणकीय कार्य पार पाडण्यासाठीची निश्चित प्रक्रिया असते. संगणकावर आकडेमोड करायची असो व एखाद्या प्रश्नाचे उत्तर शोधायचे असो, अल्गोरिदम ती प्रक्रिया सुरळीत आणि यशस्वीपणे पार पडण्याचे कार्य करते. सर्च इंजिनमध्ये अशा असंख्य अल्गोरिदमच्या माध्यमातून इंटरनेटवर उपलब्ध माहितीचा धुंडाळा घेण्याचे काम चालते. त्यासाठीच्या वेगवेगळ्या सर्च इंजिनच्या पद्धती वेगळ्या असतात. इंटरनेटवर सर्वाधिक वापरले जाणारे सर्च इंजिन म्हणजे गुगल. गुगलचे सर्च इंजिन प्रामुख्याने वेब पेजच्या विशिष्ट क्रमवारीच्या आधारे वापरकर्त्यासमोर शोधाचे परिणाम मांडते. ते करत असताना वेगवेगळ्या वेबपेजेसची छाननी करून त्यातून अपेक्षित परिणाम मिळवले जातात. पण त्यासाठी केवळ सर्च बॉक्समध्ये टाइप केलेले शब्दच विचारात घेतले जातात असे नाही तर, वापरकर्त्याच्या सर्च मागचे संभाव्य कारण, संबंध, वेबपेजची उपयुक्तता, माहिती स्रोतांची विश्वासार्हता आणि वापरकर्त्याचे लोकेशन आदी गोष्टीही विचारात घेतल्या जातात.

प्रचलित सर्च इंजिने…

गुगल हा सर्च इंजिन क्षेत्रातील बादशाह आहे. कारण जगभरातील बहुतांश वापरकर्ते सर्चसाठी गुगलचाच वापर करतात. साधे उदाहरण द्यायचे तर अमेरिकेतील एकूण इंटरनेट सर्चमध्ये गुगलवरून केलेल्या सर्चचे प्रमाण सरासरी ६० टक्क्यांहून अधिक आहे. त्याखालोखाल २५ टक्के सर्च मायक्रोसॉफ्टच्या बिंग या सर्च इंजिनच्या माध्यमातून केले जातात. त्याखेरीज अनेक कंपन्यांचे सर्च इंजिन उपलब्ध आहेत. प्रत्येक सर्च इंजिनवरील अल्गोरिदममध्ये काहीसा फरक असल्यामुळे त्यावरून मिळणारे परिणामही वेगवेगळे असू शकतात.

सर्च इजिनची मक्तेदारी

सर्च इंजिन हे एखाद्या विषयाचा शोध घेण्याचे निव्वळ माध्यम आहे, असे वाटू शकते. मात्र, प्रत्यक्षात वापरकर्त्याने नेमके काय पाहावे, वाचावे हे ठरवण्याची ताकद सर्च इंजिनांत असते. विशिष्ट माहिती परिणामांतून प्रामुख्याने वापरकर्त्यांसमोर यावी, यानुसार सर्च इंजिनांचे अल्गोरिदम बनवण्यात आलेले असते. उदाहरणार्थ तुम्ही मोबाइल हा शब्द सर्च केल्यास तुमच्या स्क्रीनवर येणाऱ्या लाखो रिझल्ट्समध्ये सुरुवातीचे परिणाम हे त्या अल्गोरिदमने वैशिष्ट्यपूर्ण पद्धतीने शोधलेले असतात. त्यामुळे कोणती माहिती वापरकर्त्यापर्यंत अधिक सहज पोहोचवायची, हे या अल्गोरिदमवरून ठरते. अल्गोरिदममध्ये फरक पडताच पुढील सर्व रिझल्टचा चेहराच बदलून जातो. अल्गोरिदममुळे सर्च इंजिन भाव खाऊन जातात.

अल्गोरिदमचे धोके

वर म्हटल्याप्रमाणे सर्च इंजिनांचे अल्गोरिदम हे तुम्ही काय शोधताय, एवढेच जाणून घेत नाहीत, तर तुम्ही कुठे सापडू शकाल, हेही हेरत असतात. युरोपीय कौन्सिलच्या एका पाहणीनुसार, वापरकर्त्यांनी विचारलेल्या सर्चचा शोध घेत असताना सर्च इंजिन वापरकर्त्यांची माहितीही गोळा करत असते. या माहितीचे विश्लेषण करून वापरकर्त्याच्या आधीच्या शोधांच्या संबंधित उत्पादनांच्या जाहिराती प्रसारित केल्या जातात. या जाहिरातींतून गुगल बक्कळ उत्पन्न मिळवते. मात्र, त्यामुळे वापरकर्त्याच्या गोपनीय माहितीशी छेडछाड करण्याचा प्रयत्न होत असतो, असे या पाहणीत आढळले आहे. त्यानंतर बाजारातील मक्तेदारीचा गैरफायदा घेत असल्याचा आरोप ठेवून युरोपीनन कमिशनने गुगलला २.४२ अब्ज डॉलरचा दंड ठोठावला. तसेच या कमिशनने डिजिटल सर्व्हिस ॲक्ट अंतर्गत सर्च अल्गोरिदमचेही नियमन करणे आवश्यक असल्याचा प्रस्ताव दिला आहे.

प्राधान्य जाहिरातींनाच?

मशिन लर्निंग आणि आर्टिफिशियल इंटिलिजन्समुळे इंटरनेटशी संबंधित सर्वच प्रणाली अधिक कार्यक्षम झाल्या आहेत. त्याला सर्च इंजिनही अपवाद नाहीत. या सर्च इंजिनचे काम इंटरनेटविश्वात विखुरली गेलेली माहिती एकत्र करून वापरकर्त्यासमोर मांडणे हे आहे. मात्र, तो काही त्यांच्या माध्यमातून मिळणाऱ्या आर्थिक उत्पन्नाचा स्रोत नाही. वापरकर्त्यांना कोणती माहिती त्यांच्या स्क्रीनवर दिसावी, हे सर्च इंजिनचे अल्गोरिदम ठरवतात. त्यात मग जाहिराती देणाऱ्या कंपन्या वा संकेतस्थळे यांना प्राधान्य दिले जाते. अर्थातच वापरकर्ते याबाबत अनभिज्ञ असतात आणि सर्च रिझल्टमध्ये प्रामुख्याने दिसणारी गोष्ट हीच प्रचलित असे मानून व्यवहार करतात. थोडक्यात सांगायचे तर, वापरकर्ते शोध घेत असतानाच त्यांच्या माहितीचा वापर कसा करता येईल, याचा शोध सर्च अल्गोरिदम घेत असतात. डिजिटल माहिती आणि प्रक्रियेवर जागतिक स्तरावरील नियंत्रण नसल्याने याला लगाम बसणे सध्या तरी कठीण आहे.

मराठीतील सर्व लोकसत्ता विश्लेषण ( Explained ) बातम्या वाचा. मराठी ताज्या बातम्या (Latest Marathi News) वाचण्यासाठी डाउनलोड करा लोकसत्ताचं Marathi News App.

Web Title: Explained game of search engine algorithms print exp 0522 abn

ताज्या बातम्या