Now Reading
निदानात्मक सांख्यिकी

निदानात्मक सांख्यिकी

Menaka Prakashan

ठोकताळे, अनुमान हा आपल्या जीवनातला अविभाज्य भाग आहे. त्यावरच आपण अनेक निर्णय घेत असतो. यालाच सांख्यिकीच्या भाषेत निदानात्मक सांख्यिकी असं म्हणतात. याची सुरवात नवव्या शतकात झाल्याचे पुरावे मिळतात आणि नंतर हे शास्त्र अधिक विकसित होत गेलं.

गायींना जर बासरीवर संगीत ऐकवलं तर त्या जास्त दूध देतात, संगीतातला अमुक एक राग आळवला तर रक्तदाब कमी व्हायला मदत होते, शाकाहारी लोकांना करोना होण्याची शक्यता मांसाहारी लोकांपेक्षा कमी असते, दिवसातून दोन वेळेस खा म्हणजे वजन कमी होईल,दर दोन तासांनी खा म्हणजे वजन कमी होईल; अशी दोन वेगवेगळ्या गोष्टींमधली सहसंबंध दर्शवणारी अनेक वाक्यं आपण ऐकत किंवा वाचत असतो. आजच्या समाज माध्यमांच्या काळात तर ह्याचं पेवच फुटलं आहे. उलटसुलट अशा या विधानांनी सामान्य माणूस गांगरून न जाईल तरच नवल.

शेतीपासून ते उद्योग जगतापर्यंत अनेक शोध लागत असतात, अनेक प्रकारचे अभ्यास होत असतात. या अभ्यासाचा, उपक्रमांचा निष्कर्ष त्या त्या क्षेत्रातल्या जाणकार व्यक्ती काढत असतात. उदाहरणार्थ, विशिष्ट प्रकारचं अन्न सेवन केल्यामुळे माणसाची प्रतिकारशक्ती वाढते, अमुक एक शिक्षण पद्धती वापरली तर विद्यार्थ्यांना त्याचा फायदा होतो, गृहिणी साक्षर असेल तर कुटुंबनियोजन अधिक परिणामकारक होतं, साखर चांगल्या प्रतिजैविकाप्रमाणे काम करते इत्यादी. या विधानांचा खरे-खोटेपणा कसा ठरवायचा? किंवा मुळात ही विधानं कशाच्या आधारावर केली जातात? ही विधानं करण्यासाठी काही आकडेमोड केलेली असते का नुसतंच गुणात्मक निरीक्षण असतं? सांख्यिकीमधल्या शास्त्रशुद्ध कसोट्या न वापरता जर असे निष्कर्ष काढलेले असतील तर ते ग्राह्य धरले जाऊ नयेत. कोणतंही विधान स्वीकारण्यासाठी सांख्यिकीचं निदानात्मक शास्त्र वापरून ते तपासून घ्यावं लागतं. हे सर्व त्या त्या क्षेत्रातली धोरणं ठरविण्यासाठी अत्यंत गरजेचं आणि उपयुक्त असतं. अभ्यासामधून आलेले हे निष्कर्ष संख्याशास्त्रीय कसोट्यांवर घासून पुसून मगच स्वीकारले जातात.

१९२० मध्ये जर्मन शास्त्रज्ञांना धूम्रपान आणि फुफ्फुसांचा कर्करोग यांच्यामध्ये काहीतरी कार्यकारणभाव असेल असं जाणवलं. त्यांनी जर्मनीमध्ये धूम्रपानविरोधी चळवळ सुरू केली. पण दुसर्‍या महायुद्धाच्या काळात ती बंद पडली. १९५० मध्ये ब्रिटिश शास्त्रज्ञांनी संशोधन करून आणि निदानात्मक सांख्यिकीचा वापर करून धूम्रपान करणार्‍यांमध्ये फुफ्फुसांचा कर्करोग होण्याची शक्यता बरीच वाढते असं सिद्ध केलं. आता तर धूम्रपान हे अनेक प्रकारच्या कर्करोगाला निमंत्रण देतं हे सिद्ध झालं आहे.

अनुमानशास्त्र (एस्टिमेशन) ही निदानात्मक सांख्यिकीची एक शाखा आहे, ज्यामध्ये संपूर्ण समुदायाच्या माहिती नसलेल्या गोष्टींबद्दल अनुमान वर्तवलं जातं. यासाठी समुदायातून यादृच्छपद्धतीनं नमुना (रँडम सँपल) घेऊन त्याचं विश्लेषण केलं जातं. नवव्या शतकात अल किंडी नावाच्या अरब गणितज्ञ, तत्त्वज्ञानं निदानात्मक सांख्यिकीचा उपयोग गुप्त संदेशांची उकल करण्यासाठी केला. माहिती असलेल्या संदेशातल्या शब्दांच्या आधारावरून त्यानं नवीन संदेशामध्ये कोणते शब्द आणि किती फ्रिक्वेन्सीने येतील याचं अनुमान बांधलं. निदानात्मक सांख्यिकीचा हा सर्वांत जुना उपयोग मानला जातो. त्यानंतर अठराव्या आणि एकोणिसाव्या शतकात या शाखेचा बराच विस्तार झाला.

१९०० साली कार्ल पिअर्सन या शास्त्रज्ञानं निदानात्मक सांख्यिकीमध्ये मोलाची भर घातली. यांच्या विल्यम गॉसेट नामक विद्यार्थ्यानं १९०८ मध्ये ‘स्टूडंट’ हे टोपण नाव धारण करून लहान आकाराच्या नमुन्यावरून सिद्धांत पडताळणीसाठी उचित अशा काही पद्धती शोधल्या. पुढील तीस वर्षांत स्टूडंट व सर रॉनल्ड फिशर यांनी सांख्यिकीच्या इतिहासात एक नवीन युगच निर्माण केलं. आज कृत्रिम बुद्धिमत्ता या विषयात वापरल्या जाणार्‍या निदानात्मक सांख्यिकीच्या एका उपशाखेचा पाया थॉमस बेज या ब्रिटिश शास्त्रज्ञानं अठराव्या शतकाच्या सुरवातीलाच घातला होता.
इ. स. १९२५ ते १९३५ च्या दरम्यान सांख्यिकीच्या दोन शाखांचा उदय झाला. फिशर यांच्या प्रेरणेनं अनुमानशास्त्र आणि इगॉन पीअर्सन व जर्झी नेमन यांच्या प्रेरणेनं निर्माण झालेल्या गृहीतकांचं परीक्षण (हायपोथेसिस टेस्टिंग) या त्या दोन शाखा होत. असं एकही क्षेत्र आता शिल्लक उरलेलं नाही, जिथं या निदानात्मक संख्याशास्त्राचा उपयोग केला जात नाही. आपल्या सर्वांना परिचित असलेला निदानात्मक सांख्यिकीचा वापर निवडणुकांचे निकाल काय लागतील, याचा वेध घेण्यासाठी ‘एक्झिट पोल’ घेऊन केला जातो. हे सर्वेक्षण जितकं निवडणुकांच्या तारखांच्या जवळ घेतलं जातं तितके त्याचे निकाल हे खर्‍या निकालाशी मिळते जुळते असतात. तसंच यामध्ये वापरलेल्या लोकांचे नमुना गट (सँपल) जितके प्रातिनिधिक असतील तितके हे अंदाज अचूक ठरतात.

आज संपूर्ण जगाला विळखा घातलेल्या कोविड महामारीनं मानवजातीच्या नाकी नऊ आणले आहेत. जागतिक आरोग्य संघटनेनं निदानात्मक सांख्यिकीचा अवलंब करून मास्क लावणं हा सर्वांत परिणामकारक प्रतिबंधक उपाय आहे असं जाहीर केलं आहे. तैवानसारख्या छोट्या परंतु दाट लोकवस्ती असलेल्या देशाला एकही दिवस लॉकडाऊनची गरज भासली नाही. याचं एक प्रमुख कारण म्हणजे तैवानी लोकांनी काटेकोरपणे मास्क वापरले. डिसेंबर २०१९ मध्ये चीनमध्ये पहिला करोनाचा रुग्ण आढळल्यानंतर जानेवारी २०२० च्या अखेरीस तैवान सरकारनं साठ लाख मास्क तयार केले आणि प्रत्येक व्यक्तीला प्रत्येक आठवड्याला दोन मास्क वापरायला दिले.

See Also

आता आणखी एक उदाहरण पाहू. समजा आपल्याला पुणेकर मास्क वापरण्याबाबत किती जागरूक आहेत म्हणजेच नेमके किती टक्के लोक मास्क लावतात या प्रश्नांचं उत्तर शोधायचं आहे. यासाठी पुणे शहरात मास्क वापरणार्‍या लोकांचं प्रमाण किती आहे हे मोजावं लागेल. ही संख्या प्रत्यक्ष मोजणं शक्य नाही. इथे आपल्याला सांख्यिकीमधल्या अनुमानशास्त्राची मदत घ्यावी लागेल. त्यासाठी आपल्याला एकाच वेळी शहरात वेगवेगळ्या ठिकाणांहून सँपल घ्यावे लागेल. समजा आपण लक्ष्मी रोडला भेट दिली आणि शंभर जणांपैकी पंचाहत्तर लोकांनी मास्क योग्य पद्धतीनं लावले आहेत असं आपल्याला आढळलं तर आपल्या नमुना पाहणीत पंचाहत्तर टक्के लोक मास्क वापरताहेत असा याचा अर्थ होईल. जर का आपलं सँपल संपूर्ण पुणे शहरासाठी प्रातिनिधिक असेल, तर हे प्रमाण संपूर्ण पुण्यासाठी मानायला हरकत नाही. म्हणजेच पुणे शहरातल्या मास्क लावणार्‍या लोकांच्या प्रमाणाशी ते मिळतंजुळतं असेल. याला सांख्यिकीमध्ये आकलक (एस्टिमेट) असं म्हणतात. अर्थातच जितकं मोठं सँपल, तितकं आकलक अधिक विश्वासार्ह. पुण्यातल्या मास्कधारकांचं प्रमाण जर ‘पी’ या अक्षरानं दर्शवलं, जे आपल्याला माहीत नाहीये, तर त्याचा अंदाज म्हणून आपण नमुन्याच्या प्रमाणाकडे बघू. नेमकं हेच सांख्यिकीच्या अनुमान पद्धतीत केलं जातं.

आता कोविड महामारीवर लस आली आहे. लसीच्या तथाकथित दुष्परिणामांबद्दल उलट-सुलट चर्चा सुरू आहेत. कोणत्याही लसीबाबत हे होतच असतं. जसे बी.सी.जी. च्या लसीकरणानंतर नव्वद ते पंच्याण्णव टक्के लोकांमध्ये लस टोचलेल्या जागी दुखणं, सूज, रॅश असे परिणाम दिसून येतात. करोनावरच्या लसीचेसुद्धा काही दुष्परिणाम दिसू शकतील. फक्त ते अवास्तव नाहीत ना हे बघावं लागेल. हे कसं ठरवायचं? समजा दोन लसींमधल्या दुष्परिणामांचा तुलनात्मक अभ्यास करायचा आहे. यासाठी गृहीतक परीक्षण या उपशाखेची मदत होते. त्यासाठी आपल्याला त्या दोन लसी दिलेले दोन वेगवेगळे यादृच्छप्रक्रियेनं निवडलेले नमुना गट घ्यावे लागतील. हे दोन्ही गट बाकी सर्व बाबतींत म्हणजे, वय, लिंग, राहणीमान, तब्येत या दृष्टीनं जेवढे सारखे असतील तितके चांगले. म्हणजे एक गट फक्त शेतकर्‍यांचा आणि दुसरा फक्त सॉफ्टवेअर इंजिनीअर्सचा असं नसावं. हे दोन गट निवडल्यानंतर एका गटातल्या व्यक्तींना अ लस आणि दुसर्‍या गटातल्या व्यक्तींना ब लस देण्यात येईल. काही दिवस या लोकांना निरीक्षणाखाली ठेवून आपण दोन्ही गटांतल्या व्यक्तींवर काय दुष्परिणाम झाले याचं प्रमाण मोजणार आहोत. समजा ‘अ’ लसीच्या गटातलं हे प्रमाण दोन टक्के आणि ‘ब’ गटासाठी अडीच टक्के आलं,तर काय निष्कर्ष काढणार? ‘अ’ लस ‘ब’ पेक्षा चांगली आहे असं आपण म्हणणार का? हा अर्धा टक्क्याचा फरक केवळ योगायोगानंसुद्धा येऊ शकतो. वेगळ्या नमुना गटांसाठी कदाचित हा फरक पाव टक्के असाही आला असता. कदाचित ‘ब’ चं प्रमाण ‘अ’ पेक्षा कमीही आलं असतं. मुळामध्ये या दोन लसींच्या दुष्परिणामामध्ये काही अर्थपूर्ण (सिग्निफिकंट)तफावत आहे, का आपल्याला दिसणारा फरक केवळ आपण नमुन्यांवरून निष्कर्ष काढतो आहोत म्हणून दृग्गोचर होतो आहे? खरं सत्य (हे म्हणजे पिवळ्या पितांबसारखं झालं) कोण सांगणार आपल्याला? तर (हायपोथेसिस टेंस्टिंग) गृहीतक परीक्षण सांगेल. काय करते संख्याशास्त्रीय कसोटी? सांख्यिकी कसोटी आपल्याला एक वस्तुनिष्ठ अशी किंमत पुरवते, ज्यायोगे आपण निदान करू शकतो. आणि निर्णय प्रक्रिया वस्तुनिष्ठ आणि निश्चित स्वरूपाची होऊ शकते. आपण असं धरू की ही कसोटी वापरून हे मूल्य ०.०४ असं मिळालं (ही किंमत बर्‍याच आकडेमोडीनंतर मिळते), त्याचा अर्थ असा, की जर त्या दोन लसींमधल्या प्रमाणामधला तुम्हाला आढळलेला नमुना गटांमधील फरक हा ०.०४ किंवा त्यापेक्षा कमी असेल तर दोन्ही लसी सारख्याच आहेत, असं समजा. याउलट जर फरक ०.०४ पेक्षा जास्त असेल तर ‘ब’ ही लस ‘अ’ पेक्षा जास्त दुष्परिणामकारक आहे असं मानायला हरकत नाही. वरील उदाहरणात आपल्याला नमुन्यावरून आढळलेला फरक ०.०५ हा ०.०४ पेक्षा जास्त होता. त्यामुळे, ब ही लस अ पेक्षा जास्त दुष्परिणामकारक आहे असं दिसतं. सांख्यिकीमधील निर्णय नमुन्यावर आधारित असल्यामुळे सांख्यिकीतज्ज्ञ या निर्णयाबरोबर एक अस्वीकरण देतात. याला महत्वता पातळी (लेव्हल ऑफ सिग्निफिकन्स) असं म्हणतात. समजा महत्वता पातळी ०.०१ अशी दिलेली असेल तर त्याचा अर्थ, ‘ब’ ही लस ‘अ’ पेक्षा घातक आहे. हा निष्कर्ष शंभरातल्या एक वेळेला चुकीचा ठरू शकतो अशी सूचना आम्ही तुम्हाला देत आहोत.
मात्र काही बाबतीत सँपलवरून अनुमान काढणं योग्य नसून संपूर्ण समुदाय अभ्यासावा लागतो. याबद्दल पुढील लेखात पाहू.

– डॉ. अमिता धर्माधिकारी
– डॉ. विद्यागौरी प्रयाग

View Comments (0)

Leave a Reply

Your email address will not be published.

© 2019 Menakaprakashan. All Rights Reserved.
Website Designed & Developed by Lets Webify

Scroll To Top
error: सूचना:सर्व हक्क कॉपीराईट कायद्यांतर्गत सुरक्षित.