Spearman’s Rank Correlation Test | स्पीयरमैन रैंक सहसंबंध परीक्षण


स्पीयरमैन रैंक सहसंबंध परीक्षण (Spearman’s Rank Correlation Test)

परिचय

स्पीयरमैन रैंक सहसंबंध परीक्षण (Spearman’s Rank Correlation Test) एक अत्यंत प्रसिद्ध नॉन-पैरामीट्रिक परीक्षण है जिसका उपयोग दो चर (Variables) के बीच संबंध (Correlation) की दिशा और तीव्रता मापने के लिए किया जाता है। यह परीक्षण तब उपयोगी होता है जब डेटा सामान्य वितरण (Normal Distribution) का पालन नहीं करता या जब डेटा केवल क्रमबद्ध (Ordinal) रूप में उपलब्ध हो।

स्पीयरमैन का सहसंबंध गुणांक (Spearman’s Rank Correlation Coefficient), जिसे ρ (rho) द्वारा दर्शाया जाता है, यह मापता है कि दो चर के बीच एकसमान (Monotonic) संबंध है या नहीं। यदि एक चर बढ़ता है और दूसरा भी सामान्यतः बढ़ता है, तो सहसंबंध धनात्मक होता है; यदि एक बढ़ता है और दूसरा घटता है, तो सहसंबंध ऋणात्मक होता है।

मुख्य विशेषताएँ

  • यह एक रैंक-आधारित सहसंबंध माप है।
  • डेटा के मूल मानों की बजाय रैंकों का उपयोग किया जाता है।
  • नॉन-नॉर्मल, असंतुलित, या आउटलायर वाले डेटा के लिए उपयुक्त।
  • दोनों चर के बीच एकसमान संबंध का मूल्यांकन करता है।

परीक्षण का उद्देश्य

  • दो चरों के बीच संबंध की दिशा और शक्ति का निर्धारण।
  • डेटा के मोनोटोनिक पैटर्न (Monotonic Pattern) को पहचानना।
  • जब Pearson Correlation की शर्तें पूरी न हों।

परिकल्पना का निर्माण

  • शून्य परिकल्पना (H₀): दोनों चरों के बीच कोई संबंध नहीं है (ρ = 0)।
  • वैकल्पिक परिकल्पना (H₁): दोनों चरों के बीच महत्वपूर्ण संबंध मौजूद है (ρ ≠ 0)।

सूत्र

Spearman’s Rank Correlation Coefficient का सूत्र है:

ρ = 1 – [ (6 Σd²) / (n (n² – 1)) ]

जहाँ:

  • d = दो चरों के रैंकों के बीच का अंतर (Rank Difference)
  • n = अवलोकनों की संख्या

गणना की प्रक्रिया

  1. दोनों चरों के अवलोकनों को आरोही क्रम में रैंक दें।
  2. प्रत्येक अवलोकन के लिए रैंक का अंतर (d) निकालें।
  3. d² का मान निकालें और Σd² ज्ञात करें।
  4. ऊपर दिए गए सूत्र से ρ का मान निकालें।
  5. ρ के मान को –1 से +1 के बीच व्याख्यायित करें।

ρ की व्याख्या

ρ का मानसंबंध का प्रकार
+1पूर्ण धनात्मक सहसंबंध (Perfect Positive Correlation)
0कोई सहसंबंध नहीं (No Correlation)
–1पूर्ण ऋणात्मक सहसंबंध (Perfect Negative Correlation)

उदाहरण

मान लीजिए किसी अध्ययन में 6 छात्रों के गणित और विज्ञान के अंक इस प्रकार हैं:

छात्रगणित (X)विज्ञान (Y)
19085
28078
37582
47072
56065
65058

अब दोनों के लिए रैंक निर्धारित करें (1 = Highest):

छात्रगणित रैंक (Rₓ)विज्ञान रैंक (Rᵧ)d = Rₓ – Rᵧ
11100
223–11
33211
44400
55500
66600

Σd² = 2 अतः ρ = 1 – (6×2) / (6×(36–1)) = 1 – 12/210 = 0.943

अर्थात गणित और विज्ञान के अंकों में अत्यंत मजबूत धनात्मक सहसंबंध है।

महत्व परीक्षण (Significance Testing)

H₀: ρ = 0 को परखने के लिए T-सांख्यिकी का उपयोग किया जाता है:

t = ρ√(n–2) / √(1–ρ²)

यह t (n–2) स्वतंत्रता डिग्री के साथ Student’s t-वितरण का पालन करता है।

डेटा साइंस में उपयोग

  • मशीन लर्निंग फीचर्स के बीच सहसंबंध पहचानने के लिए।
  • रैंकिंग आधारित मॉडल जैसे Recommendation Systems में।
  • सेंटिमेंट स्कोर और रेटिंग्स के संबंध का विश्लेषण।
  • Survey Data और Ordinal स्केल विश्लेषण में।
  • असामान्य (non-linear) संबंधों की पहचान के लिए।

लाभ

  • नॉन-नॉर्मल और आउटलायर वाले डेटा पर उपयुक्त।
  • सरल गणना और व्याख्या।
  • Ordinal और Continuous दोनों डेटा पर लागू।
  • Monotonic संबंधों के लिए प्रभावी।

सीमाएँ

  • Non-monotonic संबंधों को मापने में सक्षम नहीं।
  • टाई रैंकिंग से त्रुटि की संभावना।
  • Correlation ≠ Causation — संबंध कारण नहीं दर्शाता।

निष्कर्ष

स्पीयरमैन रैंक सहसंबंध परीक्षण डेटा साइंस में उन परिस्थितियों में अत्यंत उपयोगी है जहाँ Pearson Correlation लागू नहीं होता। यह डेटा के रैंकिंग पैटर्न के आधार पर संबंधों की गहराई को मापता है, जिससे विश्लेषक और शोधकर्ता गैर-रेखीय या असमान डेटा के बीच वास्तविक संबंध पहचान सकते हैं। मशीन लर्निंग, मनोविज्ञान, और सामाजिक अनुसंधान में यह परीक्षण एक विश्वसनीय सांख्यिकीय उपकरण के रूप में व्यापक रूप से प्रयोग होता है।

Related Post