अतुल कहाते
आता सगळीकडे साठत असलेल्या माहितीच्या साठय़ाचा आकार विलक्षण वाढत चालला आहे. या माहितीचा वापर महत्त्वाचे निष्कर्ष काढण्यासाठी तसंच उद्योगांमध्ये वेगवेगळ्या प्रकारे करण्यासाठी केला जातो. त्या संकल्पनेला ‘बिग डेटा’ असं म्हणतात. यातला ‘बिग’ म्हणजे खरोखरच अतिविशाल, आपल्या कल्पनेपलीकडचा असतो. आधी माहितीचे साठे इतक्या मोठय़ा प्रमाणावर जमा होत नसत. त्यामुळे अशी माहिती साठवण्यासाठी ‘डेटाबेस’ नावाचं तंत्रज्ञान वापरणं शक्य असे. आता मात्र डेटाबेसेसना झेपणार नाही इतक्या प्रमाणात सातत्यानं माहिती साठत असल्यामुळे ती साठवण्यासाठी वेगळं काहीतरी केलं पाहिजे ही या ‘बिग डेटा’च्या मागची संकल्पना आहे. यातला महत्त्वाचा मुद्दा म्हणजे या साठवलेल्या माहितीचं नेमकं करायचं काय? कारण त्या माहितीच्या साठय़ातून इतके महत्त्वाचे निष्कर्ष हाती लागू शकतात की त्यावरून जगाचं भवितव्यही ठरतं! आता अनेक कंपन्या ‘बिग डेटा’चा वापर करून अर्थात ग्राहकांच्याच माहितीचा वापर करून आपल्याला अपेक्षित असलेल्या ग्राहकांना योग्य त्याच जाहिराती दाखवण्यापासून त्यांना उत्तम ग्राहक सेवा पुरवण्यार्पयत अनेक कामं करतात. उदाहरणार्थ आपण एखाद्या वेबसाइटवरून एखादी वस्तू विकत घेतली की लगेचच इतर वेबसाइट्सवर आपल्याला त्या वेबसाइटच्या किंवा आपण विकत घेतलेल्या वस्तूशी संबंधित असलेल्या वस्तूंच्या जाहिराती दिसायला लागतात. हा संबंध ‘बिग डेटा’ तंत्रज्ञानाच्या माध्यमातून जोडला जातो. म्हणजेच ठिकठिकाणी विखुरलेली आणि निरनिराळ्या प्रकारची माहिती एकत्रितरीत्या बांधणं आणि त्याच्यातून आपल्याला हवे असलेले अर्थ काढणं ही या तंत्रज्ञानाची खासियत म्हणता येईल.
हे भविष्यात महत्त्वाचे का ठरेल?
अलीकडच्या काळात ‘माहिती म्हणजेच पैसा’ असं म्हटलं जातं. म्हणजेच ज्याच्याकडे उपयुक्त माहितीचे साठे असतील तोच भविष्यात श्रीमंत होणार असा त्याचा अर्थ आहे. नुसती माहिती असून उपयोग नाही तर त्या माहितीचा वापर करून त्यातून निरनिराळ्या प्रकारच्या व्यवसायांसाठी लागणारे थेट निष्कर्ष काढणं महत्त्वाचं आहे. उदाहरणार्थ भारतासारख्या देशामध्ये आत्तार्पयतच्या हवामानाविषयीची माहिती अनेक अंगांनी गोळा करून पुढच्या वर्षी मान्सून कितपत फलदायी ठरेल यासंबंधीचे अंदाज शक्य तितक्या अचूकपणे काढू शकण्याची क्षमता ‘बिग डेटा’मध्ये आहे. किंवा शेती करत असताना नेमकं काय केल्यानं चांगलं पीक येऊ शकतं यासाठीचे आडाखे या तंत्रानं आपण बांधू शकतो. अशी असंख्य उदाहरणं आपल्याला सांगता येतील. यावरूनच आपल्या आयुष्याशी संबंधित असलेल्या जवळपास प्रत्येक क्षेत्रामध्ये या तंत्रज्ञानाचा वापर मोठय़ा प्रमाणावर होणार हे उघडच आहे. स्वाभाविकपणे या तंत्रज्ञानामधले काही पैलू माहीत असलेल्या लोकांना रोजगार मिळण्याची शक्यताही खूप जास्त आहे. माहितीचं नियोजन, पृथक्करण, विश्लेषण करणं आणि त्यातून योग्य निष्कर्षाप्रत येणं ही या तंत्रज्ञानाची वैशिष्टय़े म्हणता येतील. याचाच अर्थ यात फक्त तांत्रिकता नसून तर्कबुद्धीच्या वापराचाही यात समावेश होतो.
हे शिकण्यासाठी कोणती कौशल्यं लागतात?
‘बिग डेटा’च्या तंत्रज्ञानाच्या मुळाशी संगणकांमध्ये माहितीचे साठे तयार करणं आणि त्यांचं योग्यरीत्या नियोजन करणं या संकल्पना आहेत. अनेक ठिकाणी ‘3 महिन्यांत बिग डेटा शिका’ अशा प्रकारच्या पाटय़ा झळकत असतात. मात्र हे तंत्रज्ञान असं झटपट शिकण्यासारखं नक्कीच नाही. याचं कारण म्हणजे या तंत्रज्ञानाची गरज मुळात का भासली हे नीट समजून घेणं आधी गरजेचं आहे. त्यामुळे आपण डेटाबेस नावाचं तंत्रज्ञान वापरणार नसलो तरी त्यासंबंधीची मूलतत्त्वं समजून घेणं अत्यावश्यक आहे. म्हणजेच आधी ‘डेटाबेस मॅनेजमेंट’ हा विषय नीट समजला पाहिजे. संगणकशास्त्राशी संबंधित असलेल्या अनेक अभ्यासक्रमांमध्ये हा विषय असतोच. संगणकशास्त्राबाहेरच्या कुणाला ‘बिग डेटा’मध्ये यायचं असेल तर त्यासाठी आधी ओरॅकलसारख्या एखाद्या डेटाबेस तंत्रज्ञानाचं प्रमाणपत्र मिळवावं आणि मगच ‘बिग डेटा’कडे वळावं. ‘बिग डेटा’ तंत्रज्ञानामध्ये हडूप, मॅपरिडय़ूस, नोएस्क्यूएल, हाईव्ह, स्कूप, पॉलिबेस, प्रेस्टो, कॅसांड्रा, मॉंगोडीबी यासारखे अनेक पर्याय आहेत. या तंत्रज्ञानामध्ये आधुनिक काळानुसार माहिती कशी साठवायची आणि गरज असेल तेव्हा ती नेमकी कशी मिळवायची यासाठीच्या गोष्टी शिकवल्या जातात. त्यामधला कुठलाही पर्याय निवडला तरी हरकत नसते; पण त्याआधी डेटाबेसचं तंत्रज्ञान नीट आत्मसात करणं मात्र गरजेचं ठरतं. म्हणजेच एकूण माहिती कशी साठवायची आणि हाताळायची याचं प्राथमिक ज्ञान मिळवणं आवश्यक ठरतं. त्यानंतरच ‘बिग डेटा’ तंत्रज्ञानाकडे वळलं पाहिजे. अन्यथा प्रत्यक्ष काम करताना असंख्य प्रकारच्या अडचणी येऊ शकतात. एखादा प्रश्न नेमका कसा सोडवायचा हे समजून घेताना मूलभूत संकल्पना स्पष्ट असतील तर खूपच उपयोग होतो.
रोजगाराच्या संधी कोणत्या?
मोठमोठय़ा संस्थांपासून अनेक प्रकारची संशोधनं करणार्या कंपन्यांपर्यंत सगळीकडे ‘बिग डेटा’चं तंत्रज्ञान अवगत असलेल्या लोकांची गरज भासते. याची काही उदाहरणं घेऊया- आपल्या रिझव्र्ह बॅँकेला उपलब्ध माहितीनुसार महागाईचा नजीकच्या भविष्यातला दर, अर्थव्यवस्थेमधली मागणी, चलनपुरवठय़ाचं प्रमाण अशा असंख्य गोष्टींविषयी आखाडे बांधावे लागतात. पूर्वीच्या तसंच अलीकडच्या माहितीचं पृथक्करण करणं आणि त्यानुसार याविषयीचे अंदाज बांधणं ‘बिग डेटा’मुळे शक्य होऊ शकतं. अशाच प्रकारची गरज इतर अनेक वित्तसंस्था, बॅँका, विमा कंपन्या, वाहतूक क्षेत्र इथंही भासते. डिजिटल मार्केटिंग करणार्या कंपन्यांना निरनिराळ्या प्रकारच्या माहितीच्या साठय़ांची निर्मिती करावी लागते. अनेक राजकीय पक्षांना आणि माध्यमांशी संबंधित कंपन्यांना सातत्यानं आदळत असलेल्या माहितीमधून नेमका आपल्याला हवा असलेला निष्कर्ष काढण्याची गरज भासते. वैद्यकीय क्षेत्रामध्ये रुग्णांचं निदान करणं, वेगवेगळ्या आजारांशी संबंधित असलेल्या चाचण्या घेणं, औषधनिर्मिती करणार्या कंपन्यांना त्यांच्या संशोधनासाठी खात्रीलायक माहिती उपलब्ध करून देणं हेसुद्धा या तंत्रज्ञानाच्या आवाक्यात येतं. आपल्या दररोजच्या आयुष्यात पार्किगसाठी आपल्याला हव्या असलेल्या ठिकाणी जागा उपलब्ध आहे का इथपासून आपण ज्या ठिकाणी आहोत तिथून सगळ्यात जवळ औषधांचं दुकान कुठं आहे, हे आपल्याला सांगणारं जीपीएससुद्धा ‘बिग डेटा’चा वापर मोठय़ा प्रमाणावर करत असतं. याखेरीज भारतामध्ये गेल्या अनेक वर्षापासून कार्यरत असलेल्या सॉफ्टवेअर निर्मिती कंपन्यांनाही या तंत्रज्ञानामध्ये प्रवीण असलेल्या लोकांची गरज आहे. येत्या काळात माहितीचे साठे आणखी वेगानं वाढत जाणार असल्यामुळे बिग डाटाच्या कामाची मागणी संपण्याची भीतीही तशी कमी आहे. फार तर या तंत्रज्ञानामध्ये वापरल्या जाणार्या सॉफ्टवेअरमध्ये सुधारणा किंवा बदल होतील पण ‘बिग डेटा’ची संकल्पना मात्र टिकाऊ आहे हे नक्की!