एखादी गोष्ट आंतरजालावरून विकत घेतल्यानंतर सतत संगणकावर येणाऱ्या जाहिराती आणि आपल्या भ्रमणध्वनीवर सतत येणारे संदेश पाहून आपल्याला प्रश्न पडतो की, मला काय हवे आहे, हे या लोकांना कसे कळते? याच प्रश्नाची एक उकल पाहणार आहोत आपण या लेखामध्ये…
‘इथे जगातलं सगळं काही मिळतं’ अशी जाहिरात करणाऱ्या एका सुपरमार्केटचा मालक त्याच्याच सुपरमार्केटमध्ये फिरत होता. इतक्यात त्याला त्याचा एक नवीनच नोकरीला लागलेला विक्रेता एका गि-हाईकाशी बोलताना दिसला. तो त्या गि-हाईकाला मासेमारीसाठी लागणाऱ्या गळाचे हूक विकत होता. या नव्या विक्रेत्याची सगळ्यांनी मालकाकडे खूप तारीफ केली असल्याने, तो लपून कुतूहलाने त्याच्या विक्री-कौशल्याकडे बघायला लागला.
त्या विक्रेत्याने आधी त्या गिऱ्हाईकाला गळाचे हूक विकले. मग ते हूक उपयोगी पडतील असे मासेमारीसाठी लागणारे गळ घेणार का, असं विचारत ते गळसुदधा विकले. मग त्याने त्या गि-हाईकाला विचारलं, “साहेब, आपण या मासेमारीसाठी कुठे जाऊ इच्छिता?” त्याने उत्तर दिल्यावर, तिथे जाण्यासाठी आपल्याला उत्तम बोट लागेल, असं सांगून तो त्याला सुपर मार्केटच्या बोट विकणाच्या खात्यात घेऊन गेला. आणि त्याने त्या गिऱ्हाईकाला एक द्वीन इंजिन असलेली बोट विकली. ती विकल्यावर अत्यंत अदबीने त्याने त्या गि-हाईकाला त्याच्याकडे असलेल्या गाडीबद्दल विचारलं. “त्या गाडीतून ही बोट जाणं अशक्य आहे, पण काळजी करू नका.” असं सांगत तो त्याला ट्रक विकायच्या खात्यात घेऊन गेला; आणि त्याने त्या गिऱ्हाईकाला ती बोट मावेल असा चक्क एक छोटा ट्रकही विकला. लांबून हे सर्व पाहणारा त्या सुपरमार्केटचा मालक त्या विक्रेत्याचं विक्री-कौशल्य पाहून खूश झाला. गि-हाईक गेल्यावर त्याने त्या विक्रेत्याला मिठी मारली आणि म्हणाला, “तुझ्यासारखा विक्रेता मी आजवर पाहिला नाही. मासेमारीसाठी लागणाऱ्या गळाचे हूक विकत घ्यायला आलेल्या गिऱ्हाईकाला तू गळ, बोट आणि एक ट्रकपण विकलास! तू थोर आहेस!” लाजत लाजत तो विक्रेता मालकाला म्हणाला, “साहेब, माफ करा; पण तो गि-हाईक गळाचे हूक विकत घ्यायला आला नव्हता. त्याच्या बायकोला माहेरी पाठवण्यासाठी बसचं तिकीट कुठे बुक करतात, याचा पत्ता विचारायला तो आलेला. “ते मला माहित नाही, पण बायको माहेरी गेल्यावर शनिवार-रविवार तू काय करणार?” असं मी त्याला विचारलं आणि “मासेमारी करायला का जात नाहीस?” असं त्याला सुचवलं. “तुझी कल्पना चांगली आहे, पण माझ्याकडे त्यासाठी लागणारे गळ नाहीत.” असं तो म्हणाला तेव्हापासूनचं आमचं संभाषण तुम्ही ऐकलं असणार.” हे ऐकून त्या सुपरमार्केटच्या मालकाने त्या विक्रेत्याला साष्टांग नमस्कार घातला.
यावरून तुमच्या हे लक्षात आलं असेलच की, एखादी गोष्ट खरेदी करू इच्छिणाऱ्या व्यक्तीला त्याऐवजी किंवा त्याबरोबर दुसरी कोणती गोष्ट लागू शकते, हे ज्याला समजलं, तो या पृथ्वीतलावरचा सर्वात उत्तम विक्रेता होऊ शकतो. त्याची गरज ओळखून अदबीने उच्चारलेला ‘हे पण घेणार का?’ हा प्रश्न गि-हाईकाच्या बाजारहाट करण्यासाठी आणलेल्या पिशवीतली अजून एक वस्तू वाढवतो आणि पर्यायाने विक्रेत्याचा नफाही.
आजच्या बाजारपेठेच्या जगात तर या समजण्याला आणि ‘हे पण घेणार का?’ या प्रश्नाला अनन्यसाधारण महत्त्व प्राप्त झालंय. तुम्ही अॅमेझॉन किंवा फ्लिपकार्ट यांसारख्या एखाद्या ऑनलाइन दुकानात एखादी वस्तू शोधून बघा. त्या वस्तूच्या माहितीबरोबर आजवर ही गोष्ट शोधलेल्या इतर लोकांनी यासोबत काय-काय शोधलं, याची एक जंत्रीदेखील अत्यंत नम्रपणे आपल्या संगणकाच्या पडद्यावर दाखवली जाते. हे आधुनिक जगातल्या ऑनलाइन दुकानातले उत्तम अदृश्य विक्रेते. पण यांना हे कळतं कसं? याचं उत्तर सोप्पं आहे. अहो, यामागेही माहिती तंत्रज्ञान काम करत असतं.
या इंटरनेटवरच्या सुपरमार्केटमध्ये असंख्य लोक अनंत गोष्टी खरेदी करत असतात. या खरेदीच्या व्यवहारातून प्रचंड प्रमाणात खरेदीविषयक विदा (डेटा) जमा होते. माहिती तंत्रज्ञानाचे अभ्यासक या विदेला तिच्या प्रचंड आकारमानामुळे ‘बिग डेटा’ असं संबोधतात. या प्रचंड विदेच्या महासागरातून अर्थपूर्ण माहिती शोधण्याच्या क्रियेला ‘डेटा मायनिंग’ किंवा विदेच्या खाणीतून माहितीचं उत्खनन करणं असं म्हणतात. याच्या अनेक पद्धतींपैकी एक पद्धत म्हणजे ‘मार्केट बास्केट अॅनालिसिस’ किंवा ‘बाजारहाटाच्या पिशवीचा अभ्यास’. यातली एक पद्धत पहिल्यांदा १९९४ साली राकेश अगरवाल आणि रामकृष्णन श्रीकांत या भारतीय दुकलीने जगासमोर मांडली. या पद्धतीच्या माध्यमातून ‘हे पण घेणार का?’ हा प्रश्न इतक्या हुशारीने विचारला जाऊ शकतो की, ज्याचं उत्तर शक्यतो होकारार्थीच येईल. आणि हे करताना गिऱ्हाईकाला मात्र असं बिलकूल वाटत नाही की, हा मला नको असलेला माल माझ्या गळ्यात बांधला जातोय. याउलट, त्याला तर असं वाटतं की, या प्रश्नाच्या माध्यमातून त्याला मदतच केली जातेय. त्यामुळे बऱ्याचदा ‘हे पण घेणार का?’ या प्रश्नाचं उत्तर ‘बरं झालं आठवण केलीत’ हेच असावं, अशी या ‘बाजारहाटाच्या पिशवीच्या अभ्यासाची किमया आहे.,
हे कसं साध्य केलं जातं? इंटरनेटवरच्या सुपरमार्केटमधल्या खरेदीच्या व्यवहारातून हातात आलेला ‘बिग डेटा’चा हा अभ्यास आहे. या विदेचा अभ्यास करून बऱ्याच गोष्टींचा तर्क करता येतो. एका छोट्या उदाहरणाने आपण ही पद्धत समजून घेऊ या.
एका वेळेला एका गि-हाईकाने केलेल्या खरेदीला एक व्यवहार म्हणतात. त्यावेळी त्याने केलेल्या बिलात असलेल्या सर्व वस्तूंचा त्या व्यवहारात समावेश होतो. अशा लाखो व्यवहारांच्या विदेचा या पद्धतीत अभ्यास केला जातो. पण, उदाहरणासाठी आपण खालील सहा व्यवहारांचा विचार कसा केला जातो ते पाहू. पहिल्या व्यवहारात तीन वस्तू खरेदी करण्यात आल्या ( व१, व२, व३). याचप्रमाणे उदाहरणार्थ घेतलेल्या सहा व्यवहारांचा तक्ता खालीलप्रमाणे:
या अभ्यासा-अंती काढलेला निष्कर्ष कमीतकमी अर्ध्या, म्हणजे पन्नास टक्के व्यवहारांसाठी आधारभूत ठरावा, अशी अपेक्षा असेल, तर सदर उदाहरणात, कमीतकमी ५० टक्के आधार म्हणजे:> = ०.५ x ६ कमीतकमी आधार > = ३ व्यवहार असले पाहिजेत. या अभ्यासाचा पहिला भाग म्हणून व्यवहारातील सर्व वस्तूंसाठी त्या किती व्यवहारांचा भाग आहेत, हे मोजून त्याचा तक्ता बनवला जातो. आपल्या उदाहरणासाठी, आपण सुरुवातीला ठरवल्या प्रमाणे, कमीतकमी आधार व्यवहार असले पाहिजेत. परंतु, वस्तू व५ ही केवळ २ व्यवहारांचा हिस्सा असल्याने तिला पुढील गणनेतून काढून टाकण्यात येतं.
त्यानंतर उरलेल्या वस्तूंना घेऊन दोन वस्तूंचा वस्तुसंच बनवला जातो; आणि त्या वस्तुसंचाचा समावेश असलेल्या व्यवहारांची गणना करून, त्या वस्तुसंचांच्या गणनेचा तक्ता बनवण्यात येतो. वस्तुसंच बनवताना आधीच वगळलेल्या व५ या वस्तूला अर्थातच विचारात घेतलं जात नाही.
यातील वस्तुसंच {व१, १४} आणि {व३, व४} हे वस्तुसंच २ व्यवहारांचा हिस्सा असल्याने, म्हणजे त्यांची व्यवहार केवळ गणना ठरवलेल्या कमीतकमी आधारापेक्षाही कमी असल्याने, पुढील गणनेतून त्यांनाही वगळण्यात येतं.
त्यांनतर उरलेल्या वस्तुसंचांना घेऊन तीन वस्तूंचा वस्तुसंच बनवला जातो; आणि त्यांचा व ते असलेल्या व्यवहार गणनेचा तक्ता बनवण्यात येतो.
यातील वस्तुसंच {व१, व२, व४}, {व१, व३, व४} आणि { व२, व३, व४} या वस्तुसंचांची व्यवहार गणना ठरवलेल्या कमीतकमी आधारापेक्षाही कमी असल्याने, त्यांनाही पुढील गणनेतून काढून टाकण्यात येतं.
केवळ { व१, व२, व३} या वस्तुसंचांची व्यवहार गणना ठरवलेल्या कमीतकमी आधाराएवढी असल्याने, या पुढील गणना थांबवण्यात येते.
या अभ्यासावरून या वस्तूंच्या परस्पर संबंधांबद्दल पुढील निष्कर्ष काढता येतात:
व्यवहार गणना {व१, व२} > = व्यवहार गणना (व३} व१, व२, व३ घेणारी व्यक्ती व३ पण घेईल याची शक्यता
= व्यवहार गणना { व१, व२, व३ }/ व्यवहार गणना {व१, व२} = (३/४) x १०० = ७५% त्याचप्रमाणे, व्यवहार गणना {व१, व३} > = व्यवहार गणना { व२} व१ आणि व३ घेणारी व्यक्ती वर पण घेईल याची शक्यता
= व्यवहार गणना { व१, व२, व३ }/ व्यवहार गणना {व१, व३} = (३/३) x १०० = १००% आणि व्यवहार गणना {व२, व३ } > = व्यवहार गणना {व १ } व२ आणि व३ घेणारी व्यक्ती व१ पण घेईल याची शक्यता = व्यवहार गणना { व१, व२, व३ }/ व्यवहार गणना { व२, व३ }
केवळ गि-हाईकाला एखादी आकर्षक ऑफर देऊन भुलवणं किंवा एकत्र विकल्या जाणाऱ्या गोष्टी दुकानात एकमेकांच्या शेजारी ठेवणं, एवढ्यापुरतीच ही पद्धत वापरली जाते, असं नाही. एखादया संस्थेत प्रवेश घेणाऱ्या विद्यार्थ्यांच्या विदेचा याच पद्धतीने अभ्यास केल्यावर, नक्की कोणते विद्यार्थी संस्थेत प्रवेश घेतात, हे नेमकं कळू शकतं. रोग्यांच्या लक्षणावरून किंवा रक्त तपासण्यावरून रोगाचं निदान करायलाही ही पद्धत उपयोगाची ठरते.
अनेकांना असं वाटतं की, या बाजारहाटाच्या पिशवीच्या अभ्यासात विशेष असं काही नाही. जराशी अक्कल असलेला कोणीही हे सांगू शकतो की, टीव्ही विकत घेणारा साऊंड बारमध्ये रस दाखवणार, संगणक विकत घेणाऱ्याला अॅन्टी व्हायरस घेण्याची इच्छा असणार, आणि कॅमेरा घेणारा त्याची तिपाई घेणारच. हे माहीत करून घेण्यासाठी खास पद्धतीची गरजच काय? या संदर्भात एक अत्यंत मनोरंजक गोष्ट सांगितली जाते.
वॉलमार्टसारख्या एका मोठ्या सुपरमार्केटमधील उपलब्ध विदेवर केलेल्या बाजारहाटाच्या पिशवीच्या अभ्यासानंतर असं लक्षात आलं की, शुक्रवारी संध्याकाळी तिथं बाजारहाट करणारे बरेचसे पुरुष-ग्राहक मुलांचे डायपर आणि बियरचे कॅन्स विकत घेतात. हे कळल्यावर व्यवस्थापनाने या दोन्ही गोष्टी सुपरमार्केटमध्ये एकमेकाशेजारी ठेवल्या; आणि दोन्ही गोष्टींचा खप आणि पर्यायाने सुपरमार्केटचा नफा मोठ्या प्रमाणात वाढला. कोणी कितीही विचार केला, तरी या दोन गोष्टींमधला परस्परसंबंध कोणाच्याही लक्षात येऊ शकत नाही. काही जण म्हणतील की, शुक्रवारी, रात्री मुलाला डायपर लावल्यावर ही पुरुष मंडळी घराबाहेर जाऊन मज्जा करण्यापेक्षा घरातच बियर पिणं पसंत करत असणार. तर कोणी म्हणेल, एकदा डायपर लावला, की मुलाकडे लक्ष द्यायला नको म्हणून निवांतपणे श्रमपरिहार करायला ही मंडळी बियरचा आसरा घेत असणार. एकदा हे असं होतं, हे कळल्यावर त्याच्या कारणाबद्दल बरेच तर्क बांधता येतील, पण कोणत्याही व्यक्तीला याबद्दल पूर्वानुमान करणं अशक्यच.
खरं तर ही गोष्ट पूर्णपणे कपोलकल्पित आहे, पण महत्त्वाची आहे. मानवी डोक्यातही न येऊ शकणारी गोष्ट अशा पद्धतीच्या माध्यमातून उघडकीला येऊ शकते. म्हणूनच या पद्धतीला ‘अप्रायोरी अल्गोरिदम’ म्हणतात. कारण, या पद्धतीने काढण्यात येणाऱ्या निष्कर्षाप्रत येण्यासाठी कोणताही पूर्वानुभव असण्याची गरज नाही. केवळ उपलब्ध असलेल्या विदेचं पृथक्करण करून यात निष्कर्ष काढले जातात. बाजारहाटाच्या पिशवीच्या अभ्यासासाठी अप्रायोरी अल्गोरिदम ही काही एकमेव पद्धत नाही. पण, प्रचंड विदेच्या अभ्यासातून कामाचे निष्कर्ष काढता येतात, हे सहजतेने समजावणारी सोपी पद्धत मात्र नक्कीच आहे.
— मकरंद भोंसले
मराठी विज्ञान परिषदेच्या पत्रिका या अंकातून साभार
Leave a Reply