Wilcoxon Signed Rank Test | विल्कॉक्सन साइन रैंक परीक्षण


विल्कॉक्सन साइन रैंक परीक्षण (Wilcoxon Signed Rank Test)

परिचय

विल्कॉक्सन साइन रैंक परीक्षण (Wilcoxon Signed Rank Test) एक लोकप्रिय नॉन-पैरामीट्रिक परीक्षण है जो दो संबंधित नमूनों (Paired Samples) या किसी एक नमूने के माध्यक (Median) की तुलना के लिए उपयोग किया जाता है। यह परीक्षण तब उपयोगी होता है जब डेटा सामान्य वितरण का पालन नहीं करता या जब मापन केवल क्रमबद्ध (Ordinal) रूप में उपलब्ध हो।

यह परीक्षण साइन टेस्ट का उन्नत रूप है। जहाँ साइन टेस्ट केवल दिशा (+ या –) पर विचार करता है, वहीं विल्कॉक्सन परीक्षण अंतर के परिमाण (Magnitude) और दिशा दोनों पर ध्यान देता है। इससे यह परीक्षण अधिक संवेदनशील और सटीक हो जाता है।

परीक्षण का उद्देश्य

  • यह जाँचना कि क्या दो संबंधित नमूनों के बीच का माध्यक अंतर शून्य है या नहीं।
  • जब डेटा पैरामीट्रिक परीक्षण (जैसे t-test) के लिए उपयुक्त न हो।
  • जब डेटा रैंक-आधारित या नॉन-नॉर्मल हो।

परिकल्पना का निर्माण

  • शून्य परिकल्पना (H₀): माध्यक अंतर = 0 (कोई महत्वपूर्ण अंतर नहीं)।
  • वैकल्पिक परिकल्पना (H₁): माध्यक अंतर ≠ 0 (महत्वपूर्ण अंतर मौजूद)।

विल्कॉक्सन साइन रैंक परीक्षण की प्रक्रिया

  1. प्रत्येक युग्म (Pair) के बीच अंतर (Difference) निकालें: Di = X2i – X1i
  2. जिन अंतर का मान 0 है, उन्हें छोड़ दें।
  3. शेष अंतरों के परिमाण |Di| का उपयोग करें।
  4. इन परिमाणों को आरोही क्रम में व्यवस्थित करें और रैंक (Rank) प्रदान करें।
  5. प्रत्येक रैंक को उसके वास्तविक साइन (+ या –) के साथ जोड़ें।
  6. सकारात्मक रैंक का योग (T+) और नकारात्मक रैंक का योग (T) निकालें।
  7. परीक्षण सांख्यिकी (Test Statistic) T = छोटे योग का मान।

उदाहरण

मान लीजिए कि एक कंपनी ने अपने कर्मचारियों की नई ट्रेनिंग के बाद प्रदर्शन स्कोर मापा:

कर्मचारीपहले स्कोर (X₁)बाद का स्कोर (X₂)अंतर (D)|D|रैंकसाइन
16065+553+
25860+221+
35552–332
46268+664+
55755–221

अब रैंक योग:

  • T+ = 3 + 1 + 4 = 8
  • T = 2 + 1 = 3

T = छोटे योग = 3

यदि α = 0.05 और n = 5 के लिए Wilcoxon तालिका मान 0 या 2 है, तो चूंकि 3 > तालिका मान, हम H₀ को अस्वीकार नहीं करते। अर्थात ट्रेनिंग से प्रदर्शन में महत्वपूर्ण सुधार नहीं हुआ।

परीक्षण का गणितीय सिद्धांत

यदि नमूना आकार छोटा है (n ≤ 20), तो तालिका से critical values ली जाती हैं। यदि नमूना बड़ा है, तो सामान्य निकटता (Normal Approximation) का उपयोग किया जा सकता है:

Z = (T – n(n + 1)/4) / √[n(n + 1)(2n + 1)/24]

डेटा साइंस में उपयोग

  • मॉडल में सुधार से पहले और बाद के प्रदर्शन की तुलना।
  • क्लिनिकल ट्रायल में उपचार से पहले और बाद के परिणामों की जांच।
  • विभिन्न मशीन लर्निंग मॉडलों की median error तुलना।
  • ग्राहक सर्वे में परिवर्तन के प्रभाव की जांच।

लाभ

  • साधारण और विश्वसनीय।
  • नॉर्मलिटी की आवश्यकता नहीं।
  • छोटे नमूनों के लिए उपयुक्त।
  • Magnitude और direction दोनों को ध्यान में रखता है।

सीमाएँ

  • बड़े डेटा सेट्स पर गणना समय-साध्य।
  • Zero difference वाले डेटा को नज़रअंदाज़ करना पड़ता है।
  • केवल संबंधित नमूनों पर लागू।

निष्कर्ष

विल्कॉक्सन साइन रैंक परीक्षण डेटा साइंस में उन परिस्थितियों के लिए अत्यंत उपयोगी है जहाँ पारंपरिक पैरामीट्रिक परीक्षण (जैसे t-test) उपयुक्त नहीं होते। यह न केवल दिशा बल्कि अंतर की तीव्रता को भी ध्यान में रखता है, जिससे यह अधिक सटीक और मजबूत विश्लेषण प्रदान करता है। मशीन लर्निंग मॉडल मूल्यांकन, हेल्थकेयर डेटा विश्लेषण और प्रयोगात्मक शोध में इसका व्यापक उपयोग होता है।

Related Post