Kendall’s Rank Correlation Test | केंडल रैंक सहसंबंध परीक्षण


केंडल रैंक सहसंबंध परीक्षण (Kendall’s Rank Correlation Test)

परिचय

केंडल रैंक सहसंबंध परीक्षण (Kendall’s Rank Correlation Test), जिसे केंडल का τ (टाऊ) भी कहा जाता है, एक महत्वपूर्ण नॉन-पैरामीट्रिक परीक्षण है जो दो चरों (Variables) के बीच संबंध की दिशा और तीव्रता मापता है। यह परीक्षण विशेष रूप से तब उपयोगी होता है जब डेटा केवल रैंक (Rank) के रूप में उपलब्ध हो या जब डेटा सामान्य वितरण (Normal Distribution) का पालन न करता हो।

केंडल का τ एक सहसंबंध गुणांक है जो रैंक की तुलना करके दो चरों के बीच मोनोटोनिक (Monotonic) संबंध को मापता है। यदि दोनों चर एक ही दिशा में बढ़ते या घटते हैं तो संबंध धनात्मक होता है; यदि एक बढ़ता है और दूसरा घटता है तो संबंध ऋणात्मक होता है।

मुख्य विशेषताएँ

  • यह रैंक आधारित संबंध का माप है।
  • छोटे सैंपलों और असंतुलित डेटा के लिए उपयुक्त।
  • आउटलायर्स या चरम मानों से कम प्रभावित।
  • मोनोटोनिक लेकिन अनिवार्य रूप से रैखिक नहीं।

परीक्षण का उद्देश्य

  • दो चरों के बीच संबंध (Association) की दिशा और ताकत का मापन।
  • जब Pearson और Spearman सहसंबंध लागू न हों।
  • रैंक आधारित डेटा में पैटर्न या समानता की पहचान।

परिकल्पना का निर्माण

  • शून्य परिकल्पना (H₀): दोनों चरों के बीच कोई संबंध नहीं है (τ = 0)।
  • वैकल्पिक परिकल्पना (H₁): दोनों चरों के बीच महत्वपूर्ण संबंध मौजूद है (τ ≠ 0)।

केंडल का τ (टाऊ) का सूत्र

केंडल का τ इस प्रकार परिभाषित किया गया है:

τ = (C – D) / [½ n(n–1)]

जहाँ:

  • C = सम्मत युग्मों (Concordant Pairs) की संख्या
  • D = असम्मत युग्मों (Discordant Pairs) की संख्या
  • n = अवलोकनों की संख्या

समझने का तरीका

  • Concordant Pair: यदि X और Y दोनों में एक ही दिशा में वृद्धि होती है।
  • Discordant Pair: यदि X में वृद्धि होती है लेकिन Y में कमी या इसके विपरीत।

ρ (टाऊ) का व्याख्या

τ का मानसंबंध का प्रकार
+1पूर्ण धनात्मक सहसंबंध (Perfect Positive Correlation)
0कोई संबंध नहीं (No Correlation)
–1पूर्ण ऋणात्मक सहसंबंध (Perfect Negative Correlation)

गणना की प्रक्रिया

  1. दोनों चरों के अवलोकनों को आरोही क्रम में रैंक करें।
  2. सभी युग्मों (Pairs) के लिए जांचें कि वे Concordant हैं या Discordant।
  3. C और D की गणना करें।
  4. τ निकालें = (C – D) / [½ n(n–1)]
  5. τ का मान –1 से +1 के बीच रहेगा।

उदाहरण

मान लीजिए पाँच विद्यार्थियों के दो विषयों में अंक इस प्रकार हैं:

छात्रगणित (X)विज्ञान (Y)
18078
29088
37072
48584
56065

अब सभी युग्मों के लिए Concordant और Discordant Pair गिने जाते हैं:

  • कुल युग्म = ½ × 5 × (5–1) = 10
  • Concordant (C) = 9
  • Discordant (D) = 1

अतः τ = (9 – 1) / 10 = 0.8

इसका अर्थ है कि गणित और विज्ञान के अंकों में मजबूत धनात्मक संबंध है।

महत्व परीक्षण

τ के महत्व को जांचने के लिए Z-सांख्यिकी का उपयोग किया जा सकता है:

Z = τ √[9n(n–1)] / √[2(2n + 5)]

यदि |Z| > Zα/2, तो H₀ अस्वीकार करें।

केंडल τ बनाम स्पीयरमैन ρ

मापदंडकेंडल τस्पीयरमैन ρ
आधारConcordant और Discordant Pairsरैंक अंतर (Rank Difference)
संवेदनशीलताछोटे सैंपल पर स्थिरबड़े सैंपल पर अधिक सटीक
डेटा पर प्रभावआउटलायर्स से कम प्रभावितथोड़ा प्रभावित
प्रयोगछोटे डेटा सेट मेंबड़े डेटा सेट में

डेटा साइंस में उपयोग

  • फीचर चयन (Feature Selection) के दौरान रैंक आधारित निर्भरता पहचानने के लिए।
  • रैंकिंग एल्गोरिद्म जैसे Recommendation Systems में समानता मापने के लिए।
  • Survey डेटा में दो प्रश्नों के उत्तरों के बीच समानता की जांच।
  • Machine Learning मॉडल के फीचर्स में ऑर्डिनल पैटर्न पहचान।
  • Customer feedback या रेटिंग्स विश्लेषण।

लाभ

  • सरल और व्याख्यायोग्य।
  • डेटा के वितरण पर निर्भर नहीं।
  • Ordinal और Continuous दोनों प्रकार के डेटा पर लागू।
  • आउटलायर्स के प्रभाव से मुक्त।

सीमाएँ

  • गणना जटिल हो सकती है यदि डेटा में बहुत अधिक टाई हों।
  • केवल दो चर के बीच संबंध मापता है।
  • Non-monotonic संबंधों के लिए उपयुक्त नहीं।

निष्कर्ष

केंडल रैंक सहसंबंध परीक्षण एक अत्यंत प्रभावी नॉन-पैरामीट्रिक तकनीक है जो दो चरों के बीच संबंध की दिशा और ताकत को मापता है। यह डेटा साइंस में तब उपयोगी होता है जब पारंपरिक Pearson या Spearman विधियाँ उपयुक्त नहीं होतीं। इसका उपयोग मशीन लर्निंग, सर्वे विश्लेषण, मनोविज्ञान, और सामाजिक अनुसंधान में विश्वसनीय सांख्यिकीय निष्कर्ष प्राप्त करने के लिए किया जाता है।

Related Post