सांख्यिकी या विज्ञान शाखेत विदाचे (data) संकलन, वर्गीकरण अथवा सादरीकरण, विश्लेषण आणि अर्थान्वय या चार टप्प्यांचा समावेश होतो. एखाद्या वस्तूच्या अथवा पदार्थाच्या कोणत्याही एका अथवा अनेक गुणधर्मांचे बऱ्याच वेळा निरीक्षण केल्यावर जी माहिती जमा होते तिचा अर्थ लावण्यासाठी ज्या शास्त्रात गणिती तत्त्वांचा उपयोग केला जातो त्याला संख्याशास्त्र किंवा सांख्यिकी असे संबोधले जाते. काहीवेळेस केवळ विदाला उद्देशूनही सांख्यिकी शब्द वापरला जातो. सांख्यिकीच्या वर्णनात्मक सांख्यिकी व निदानात्मक सांख्यिकी अशा दोन प्रमुख शाखा मानल्या जातात.
वर्णनात्मक सांख्यिकीमध्ये महत्त्वाची सांख्यिकीतत्त्वे वापरून सरळ आणि संक्षिप्त स्वरूपात विदाचे वर्णन केले जाते. निदानात्मक सांख्यिकीमध्ये नमुन्यावरून (sample) समष्टी (population) बद्दल निदान केले जाते किंवा काही गृहीतके वर्तवली जातात. प्रस्तुत नोंदीत वर्णनात्मक सांख्यिकीचा विचार केला आहे. वर्णनात्मक सांख्यिकी मध्ये सांख्यिकीच्या पहिल्या दोन टप्प्यांचा म्हणजे संकलन (Collection) आणि वर्गीकरण (Classification) अथवा सादरीकरण (Presentation) यांचा मुख्यत्वेकरून समावेश होतो. उदा., समजा एका शिक्षकाला प्रथम वर्ष शास्त्र वर्गातील विद्यार्थ्यांची गणितातील क्षमता आजमावयाची असेल, तर ते वर्गातील विद्यार्थ्यांच्या बारावीच्या गणितातील गुणांची आकडेवारी जमा करतील. ही झाली त्यांची कच्ची आधारसामग्री किंवा कच्चा विदा. समजा वर्गात 200 विद्यार्थी असतील, तर या लांबलचक यादीकडे बघून शिक्षकाला फारसा काही अर्थबोध होणार नाही. कारण हे फक्त माहितीचे ‘संकलन’ झाले. या विदातून अर्थपूर्ण माहिती मिळवण्यासाठी तिचे वर्गीकरण करावे लागेल. म्हणजे 40—50 मध्ये गुण मिळालेले किती विद्यार्थी आहेत? 50—60 मध्ये किती असे करत करत 90—100 मध्ये गुण मिळवणारे किती विद्यार्थी आहेत ते शोधून काढावे लागतील. याला वारंवारता वितरण (Frequency Distribution) म्हणतात. ते तक्त्याच्या स्वरूपात पुढीलप्रमाणे दाखविले जाते (तक्ता 1).
तक्ता क्र. 1 | |
अंतराळ (Interval) | विद्यार्थीसंख्या |
40-50 | 25 |
50-60 | 45 |
60-70 | 50 |
70-80 | 60 |
80-90 | 15 |
90-100 | 5 |
एकूण | 200 |
यामुळे चित्र थोडेसे स्पष्ट होते. कारण विदाचे वर्गीकरण केले गेले. यामध्ये एखाद्या विद्यार्थ्याचे गुण 50 असतील तर ते पुढील म्हणजे 50—60 या अंतराळात धरले जातात. गुण जर 60 असतील तर ते 60—70 या अंतराळात धरले जातील इत्यादी. क्वचित प्रसंगी, 40—49, 50—59, … असे सुद्धा अंतराळ लिहिले जातात. हीच माहिती आयतालेखाच्या स्वरूपात आकृतीत दाखविल्याप्रमाणे प्रदर्शित करता येते. त्यामुळे समजण्यास अधिक सोपे होते. (आ. 01)
आयतालेखात एका दृष्टीक्षेपात या प्रथम वर्षाच्या वर्गातील मुलांच्या गणितातील क्षमतेची कल्पना येण्यास मदत होते. 70—80 गुण मिळालेले विद्यार्थी या वर्गात बरेच म्हणजे 30 टक्के आहेत, 80—100 मध्ये गुण असलेले विद्यार्थी त्या मानाने कमी आहेत इ. आता समजा त्या शिक्षकाला प्रथम वर्षाच्या ‘अ’ आणि‘ब’ या दोन तुकड्यांमधील विद्यार्थ्यांच्या गणिती क्षमतेची तुलना करावयाची आहे. प्रत्येक विदामध्ये अनेक संख्या आहेत. असे असताना, दोन विदांची तुलना कशी करायची? अशा वेळेस, जर प्रत्येक विदामधून एकेक प्रातिनिधिक अशी संख्या मिळाली, तर तुलना करणे सोपे जाईल. उदा., ‘अ’ तुकडी आणि ‘ब’ तुकडी या दोन्ही वर्गातील गुणांची सरासरी जर त्या शिक्षकाला कळली तर, त्या दोन विद्यार्थी गटांच्या गणिती क्षमतेची तुलना करता येऊ शकते. अशी तुलना केल्यामुळे त्या शिक्षकाला ‘अ’ आणि ‘ब’ या वर्गांना ‘सांख्यिकी’ शिकवण्याचे वेगवेगळे धोरण ठरवण्यास मदत होईल. तुकडी ‘ब’ मधील वारंवारता आयतालेख खालीलप्रमाणे आहे (आ. 02).
दोन्ही गटांतील सांख्यिकीचे सरासरी किंवा मध्यमान काढल्यास ते तुकडी ‘अ’ साठी 65.5 तर तुकडी ‘ब’ साठी 79.25 येते. अर्थातच तुकडी ‘ब’ मधील विद्यार्थ्यांची गणिती क्षमता जास्त दिसत असल्याकारणाने सदर शिक्षक तुकडी ‘ब’ साठी ठराविक साच्याचा अभ्यासक्रम जलद गतीने पूर्ण करून त्या विद्यार्थ्यांना अद्ययावत गोष्टी शिकवू शकेल. असे नाविन्य आपल्या शिकवण्यात आणण्यास त्याला पुरेसा वाव मिळेल. हे वर्णनात्मक सांख्यिकीच्या उपयोगाचं अगदी प्राथमिक उदाहरण म्हणून देता येईल.
वर्णनात्मक सांख्यिकीचा हेतू हा असतो की, सांख्यिकीविज्ञाला (statistician) विदाची प्राथमिक कल्पना मिळावी. यामध्ये मुख्यत्वेकरून केंद्रीय प्रवृत्तीची परिमाणे (Measures of Central Tendency), अपस्करणाची परिमाणे (Measures of Dispersion), वारंवारता वितरण (Frequency Distribution) , संचयी वारंवारता (Cumulative Frequency) , शतमक (Percentiles) आणि चतुर्थक (Quartiles), असमप्रमाणता (Skewness) व ककुदता (Kurtosis) इत्यादी सांख्यिकी तंत्राच्या समुच्चयाचा आणि वृत्तालेख (Pie chart), आयतालेख (Histogram), वारंवारता बहुभूज (Frequency Polygon), स्तंभालेख (Bar diagram) इत्यादी अनेक प्रकारच्या आलेखांचा अंतर्भाव होतो. महत्त्वाचे म्हणजे, वर्णनात्मक सांख्यिकीवरून, सांख्यिकीविज्ञाला पुढील सांख्यिकी विश्लेषणाची दिशा समजते. कच्च्या विदाचे नेटकेपणाने नियोजन वर्णनात्मक सांख्यिकीमध्ये झाल्यामुळे बरेच फायदे होतात. (१) अनावश्यक तपशील टाळता येतो, (२) माहितीच्या निरनिराळ्या भागांत आढळणारे साधर्म्य व विसंगती वाचकांच्या नजरेस आणून देता येते व (३) ही मांडणी बघणारी व्यक्ती आपल्या मनात काही सोप्या तुलना करून काही विश्वासार्ह निष्कर्ष काढू शकते. वर्णनात्मक सांख्यिकीलाच संशोधनात्मक सांख्यिकी (Exploratory Statistics) असेही संबोधले जाते.
कोणत्याही माहिती संकलन विदामध्ये एकापेक्षा अधिक चलांवर (variables) निरीक्षणे केलेली असतात. अशावेळेस बहुचल वर्णनात्मक सांख्यिकी (Multivariate Descriptive Statistics) मधील तंत्रे वापरून पुढील सांख्यिकी विश्लेषणाची दिशा समजायला मदत होते. वरील उदाहरणात समजा शिक्षकाला विद्यार्थ्यांचे बुद्ध्यांक, त्यांचे इतर विषयातील गुण इत्यादी अनेक चलांबद्दलची माहिती उपलब्ध आहे. तर या माहितीचा उपयोग करून घेऊन तो आपले धोरण ठरवू शकतो. त्यासाठी काही बहुचल प्राथमिक सांख्यिकी तंत्रे वापरली जातात. उदाहरणार्थ सहसंबंध गुणांक (Correlation coefficient), साहचर्य गुणांक ( Coefficient of Association), समाश्रयण गुणांक ( Regression coefficient) इत्यादी.
संदर्भ :
- Gupta, C.; Kapoor, V. K., Fundamentals of Mathematical Statistics, New Delhi, 2014.
- कुलीज, फ्रेडरिक एल., भाषांतर, कुलकर्णी, माधवी; जोशी, मधुरा, संख्याशास्त्राची तोंडओळख, २०१७.
समीक्षक : अतुल कहाते