Measures of Central Tendency in Data Analytics | डेटा एनालिटिक्स में केन्द्रीय प्रवृत्ति के माप


Measures of Central Tendency in Data Analytics | डेटा एनालिटिक्स में केन्द्रीय प्रवृत्ति के माप

डेटा एनालिटिक्स में किसी भी dataset की प्रमुख प्रवृत्ति या केंद्र बिंदु को समझने के लिए Measures of Central Tendency (केन्द्रीय प्रवृत्ति के माप) का उपयोग किया जाता है। ये माप हमें यह बताते हैं कि डेटा के मान किस दिशा में झुकाव रखते हैं और डेटा का औसत व्यवहार कैसा है।

केंद्रीय प्रवृत्ति के तीन मुख्य माप हैं — Mean (औसत), Median (माध्यिका) और Mode (बहुलक)। इन मापों का उपयोग डेटा के distribution, symmetry और variability को समझने के लिए किया जाता है।

1️⃣ Mean (अंकगणितीय औसत)

Mean वह मान होता है जो सभी observations को जोड़ने और कुल संख्या से भाग देने पर प्राप्त होता है। इसे Arithmetic Average भी कहा जाता है।

Formula: Mean (x̄) = Σx / n

  • यह dataset के सभी मानों को ध्यान में रखता है।
  • Extreme values (outliers) का प्रभाव अधिक होता है।
  • Continuous और interval डेटा के लिए उपयुक्त।

उदाहरण:

यदि 5 छात्रों के अंक हैं: 60, 70, 80, 90, 100

Mean = (60 + 70 + 80 + 90 + 100) / 5 = 80

अर्थात औसतन प्रत्येक छात्र ने 80 अंक प्राप्त किए।

2️⃣ Median (माध्यिका)

Median वह मध्य मान है जो डेटा को दो समान भागों में विभाजित करता है। यह dataset के क्रम (order) पर निर्भर करता है।

Step:

  1. डेटा को ascending order में व्यवस्थित करें।
  2. यदि n विषम है, तो Median = (n + 1)/2वाँ मान।
  3. यदि n सम है, तो Median = (n/2वाँ + (n/2 + 1)वाँ)/2।

उदाहरण:

डेटा: 10, 15, 20, 25, 30 Median = 20

डेटा: 10, 15, 20, 25, 30, 35 Median = (20 + 25)/2 = 22.5

  • Outliers का असर कम होता है।
  • Ordinal और skewed डेटा के लिए बेहतर।

3️⃣ Mode (बहुलक)

Mode वह मान है जो dataset में सबसे अधिक बार आता है। यह सबसे सामान्य या सबसे आवृत्त मान दर्शाता है।

यह nominal या categorical डेटा के लिए उपयोगी होता है।

उदाहरण:

डेटा: 4, 5, 5, 6, 6, 6, 7 Mode = 6

कभी-कभी dataset में एक से अधिक Mode हो सकते हैं — इसे Bimodal या Multimodal कहा जाता है।

4️⃣ Mean, Median, Mode की तुलना

विशेषताMeanMedianMode
उपयोगQuantitative dataOrdered dataCategorical data
Outlier पर प्रभावअधिककमनहीं
गणनाArithmeticPositionalFrequency-based
DistributionSymmetric data में समानSkewed data में अलगMost frequent value

5️⃣ वास्तविक उपयोग (Applications)

  • बिजनेस रिपोर्टिंग में औसत बिक्री या राजस्व का अनुमान।
  • शिक्षा में छात्रों का औसत प्रदर्शन।
  • हेल्थकेयर में मरीजों के औसत स्वास्थ्य मापदंड।
  • सामाजिक विज्ञान में survey responses का विश्लेषण।

6️⃣ निष्कर्ष

Measures of Central Tendency हमें डेटा की “केंद्रीय प्रवृत्ति” समझने में मदद करते हैं। Mean, Median और Mode के सही चयन से हम skewed, outlier-heavy या categorical डेटा का बेहतर विश्लेषण कर सकते हैं। डेटा एनालिटिक्स में इन मापों का सटीक उपयोग किसी भी निष्कर्ष की विश्वसनीयता को बढ़ाता है।

Related Post