Measures of Central Tendency in Data Analytics | डेटा एनालिटिक्स में केन्द्रीय प्रवृत्ति के माप

डेटा एनालिटिक्स में किसी भी dataset की प्रमुख प्रवृत्ति या केंद्र बिंदु को समझने के लिए Measures of Central Tendency (केन्द्रीय प्रवृत्ति के माप) का उपयोग किया जाता है। ये माप हमें यह बताते हैं कि डेटा के मान किस दिशा में झुकाव रखते हैं और डेटा का औसत व्यवहार कैसा है।

केंद्रीय प्रवृत्ति के तीन मुख्य माप हैं — Mean (औसत), Median (माध्यिका) और Mode (बहुलक)। इन मापों का उपयोग डेटा के distribution, symmetry और variability को समझने के लिए किया जाता है।

1️⃣ Mean (अंकगणितीय औसत)

Mean वह मान होता है जो सभी observations को जोड़ने और कुल संख्या से भाग देने पर प्राप्त होता है। इसे Arithmetic Average भी कहा जाता है।

Formula: Mean (x̄) = Σx / n

यह dataset के सभी मानों को ध्यान में रखता है।
Extreme values (outliers) का प्रभाव अधिक होता है।
Continuous और interval डेटा के लिए उपयुक्त।

उदाहरण:

यदि 5 छात्रों के अंक हैं: 60, 70, 80, 90, 100

Mean = (60 + 70 + 80 + 90 + 100) / 5 = 80

अर्थात औसतन प्रत्येक छात्र ने 80 अंक प्राप्त किए।

2️⃣ Median (माध्यिका)

Median वह मध्य मान है जो डेटा को दो समान भागों में विभाजित करता है। यह dataset के क्रम (order) पर निर्भर करता है।

Step:

डेटा को ascending order में व्यवस्थित करें।
यदि n विषम है, तो Median = (n + 1)/2वाँ मान।
यदि n सम है, तो Median = (n/2वाँ + (n/2 + 1)वाँ)/2।

उदाहरण:

डेटा: 10, 15, 20, 25, 30 Median = 20

डेटा: 10, 15, 20, 25, 30, 35 Median = (20 + 25)/2 = 22.5

Outliers का असर कम होता है।
Ordinal और skewed डेटा के लिए बेहतर।

3️⃣ Mode (बहुलक)

Mode वह मान है जो dataset में सबसे अधिक बार आता है। यह सबसे सामान्य या सबसे आवृत्त मान दर्शाता है।

यह nominal या categorical डेटा के लिए उपयोगी होता है।

उदाहरण:

डेटा: 4, 5, 5, 6, 6, 6, 7 Mode = 6

कभी-कभी dataset में एक से अधिक Mode हो सकते हैं — इसे Bimodal या Multimodal कहा जाता है।

4️⃣ Mean, Median, Mode की तुलना

विशेषता	Mean	Median	Mode
उपयोग	Quantitative data	Ordered data	Categorical data
Outlier पर प्रभाव	अधिक	कम	नहीं
गणना	Arithmetic	Positional	Frequency-based
Distribution	Symmetric data में समान	Skewed data में अलग	Most frequent value

5️⃣ वास्तविक उपयोग (Applications)

बिजनेस रिपोर्टिंग में औसत बिक्री या राजस्व का अनुमान।
शिक्षा में छात्रों का औसत प्रदर्शन।
हेल्थकेयर में मरीजों के औसत स्वास्थ्य मापदंड।
सामाजिक विज्ञान में survey responses का विश्लेषण।

6️⃣ निष्कर्ष

Measures of Central Tendency हमें डेटा की “केंद्रीय प्रवृत्ति” समझने में मदद करते हैं। Mean, Median और Mode के सही चयन से हम skewed, outlier-heavy या categorical डेटा का बेहतर विश्लेषण कर सकते हैं। डेटा एनालिटिक्स में इन मापों का सटीक उपयोग किसी भी निष्कर्ष की विश्वसनीयता को बढ़ाता है।

Measures of Central Tendency in Data Analytics

Measures of Central Tendency describe the center or typical value of a dataset. In data analytics, they help identify where most data points lie and what represents the dataset as a whole. The three primary measures are Mean, Median, and Mode.

1️⃣ Mean (Arithmetic Average)

Mean is the sum of all observations divided by the total number of values.

Formula: Mean (x̄) = Σx / n

Considers all data points.
Highly affected by outliers.
Best for continuous, normally distributed data.

2️⃣ Median

The Median is the middle value when data is arranged in ascending order. It divides data into two equal halves.

Not affected by extreme values.
Useful for skewed or ordinal data.

Example:

Data: 10, 15, 20, 25, 30 → Median = 20 Data: 10, 15, 20, 25, 30, 35 → Median = 22.5

3️⃣ Mode

Mode is the most frequently occurring value in a dataset. It’s ideal for nominal or categorical data.

Example:

Data: 2, 3, 3, 4, 4, 4, 5 → Mode = 4

4️⃣ Comparison Table

Feature	Mean	Median	Mode
Basis	Arithmetic	Positional	Frequency
Data Type	Continuous	Ordinal	Categorical
Effect of Outliers	High	Low	None
Symmetric Data	All Equal	All Equal	All Equal

5️⃣ Applications

Business – average revenue, product performance.
Healthcare – average patient recovery rate.
Education – average student performance.
Social Science – survey analysis.

6️⃣ Conclusion

Measures of Central Tendency form the foundation of descriptive statistics. They condense large data into meaningful insights. Choosing the right measure (Mean, Median, or Mode) depends on data type and distribution — a critical step in accurate data analysis.