Sign Test in Non-Parametric Inference | नॉन-पैरामीट्रिक अनुमान में साइन परीक्षण


साइन परीक्षण (Sign Test)

परिचय

सांख्यिकी और डेटा साइंस में जब हमें दो संबंधित नमूनों या किसी माध्यक (Median) के बारे में निर्णय लेना होता है, तो साइन परीक्षण (Sign Test) का उपयोग किया जाता है। यह एक सरल और प्रभावी नॉन-पैरामीट्रिक (Non-Parametric) विधि है, जो किसी वितरण (Distribution) के रूप या मानकों पर निर्भर नहीं करती। साइन टेस्ट का मुख्य उद्देश्य यह निर्धारित करना है कि क्या किसी डेटा सेट में माध्यक (Median) किसी विशेष मान से भिन्न है या नहीं।

साइन टेस्ट केवल डेटा के दिशा-निर्देश (sign) को देखता है — अर्थात् अंतर (Difference) सकारात्मक (+) है या नकारात्मक (–)। यह परिमाण (Magnitude) पर ध्यान नहीं देता। इसलिए यह “distribution-free test” कहलाता है।

साइन परीक्षण की आवश्यकता

  • जब डेटा सामान्य वितरण (Normal Distribution) का पालन नहीं करता।
  • जब नमूना आकार छोटा हो और पैरामीट्रिक टेस्ट उपयुक्त न हो।
  • जब केवल दिशा (सकारात्मक या नकारात्मक परिवर्तन) महत्वपूर्ण हो।
  • जब हम माध्यक (Median) के बारे में परिकल्पना जाँचना चाहते हों।

परिकल्पना का निर्माण

साइन टेस्ट के लिए दो परिकल्पनाएँ होती हैं:

  • शून्य परिकल्पना (H₀): माध्यक एक निर्दिष्ट मान (m₀) के बराबर है।
  • वैकल्पिक परिकल्पना (H₁): माध्यक उस मान से भिन्न है।

H₀: Median = m₀ H₁: Median ≠ m₀

साइन टेस्ट की प्रक्रिया

  1. प्रत्येक अवलोकन और निर्दिष्ट माध्यक (m₀) के बीच अंतर निकालें।
  2. यदि अंतर सकारात्मक है, तो + चिन्ह लगाएँ; यदि नकारात्मक है, तो – चिन्ह लगाएँ।
  3. जिन अवलोकनों में अंतर = 0 है, उन्हें छोड़ दें।
  4. सकारात्मक (+) और नकारात्मक (–) चिन्हों की संख्या गिनें।
  5. कम संख्या वाले चिन्हों की संख्या को परीक्षण सांख्यिकी (Test Statistic) के रूप में लें।
  6. Binomial वितरण के आधार पर निर्णय लें।

उदाहरण

मान लीजिए किसी कंपनी ने दावा किया कि उसके कर्मचारियों की औसत उत्पादकता माध्यक 50 है। 10 कर्मचारियों के नमूने के स्कोर निम्नलिखित हैं:

48, 52, 45, 55, 47, 51, 49, 53, 46, 54

m₀ = 50 अंतर: (-, +, -, +, -, +, -, +, -, +) सकारात्मक = 5, नकारात्मक = 5 कुल = 10

यह एक संतुलित परिणाम है। इसलिए हम निष्कर्ष निकालते हैं कि माध्यक 50 से सांख्यिकीय रूप से भिन्न नहीं है।

साइन परीक्षण के प्रकार

  • 1. एक-नमूना साइन टेस्ट (One-Sample Sign Test): किसी दिए गए माध्यक की तुलना के लिए।
  • 2. युग्मित साइन टेस्ट (Paired Sign Test): दो संबंधित नमूनों के बीच अंतर की जाँच के लिए।
  • 3. द्वि-दिशीय साइन टेस्ट (Two-Sided Test): जब परिवर्तन किसी भी दिशा में हो सकता है।

परीक्षण सांख्यिकी (Test Statistic)

यदि n प्रभावी अवलोकन हैं और p = 0.5 (सकारात्मक चिन्ह की संभावना), तो परीक्षण सांख्यिकी X ~ Binomial (n, 0.5) का पालन करता है।

H₀ को अस्वीकार करें यदि:

  • दो तरफा परीक्षण में X अत्यधिक छोटा या बड़ा हो।
  • p-value < α (महत्व स्तर)।

नॉर्मल एप्रॉक्सिमेशन

यदि n बड़ा है (n > 20), तो Binomial वितरण को Normal वितरण द्वारा निकटता से प्रदर्शित किया जा सकता है:

Z = (X – n/2) / √(n/4)

डेटा साइंस में साइन टेस्ट का उपयोग

  • जब मॉडल या सिस्टम में बदलाव का प्रभाव जांचना हो।
  • मॉडल वैलिडेशन में दो संस्करणों की तुलना के लिए।
  • कस्टमर सैटिस्फैक्शन सर्वे में माध्यक रेटिंग तुलना।
  • मेडिकल ट्रायल्स में उपचार प्रभाव का निर्धारण।

लाभ

  • सरल और आसानी से लागू।
  • वितरण की मान्यता की आवश्यकता नहीं।
  • छोटे नमूनों पर भी उपयोगी।

सीमाएँ

  • डेटा के परिमाण को नज़रअंदाज़ करता है।
  • कम सांख्यिकीय शक्ति (Low Power)।
  • समान माध्यक वाले डेटा पर सीमित जानकारी।

निष्कर्ष

साइन टेस्ट एक सरल लेकिन प्रभावी नॉन-पैरामीट्रिक परीक्षण है जो डेटा की दिशा पर आधारित निर्णय लेने में सहायक होता है। यह विधि विशेष रूप से उन स्थितियों में उपयोगी है जहाँ डेटा का वितरण अज्ञात है या पारंपरिक पैरामीट्रिक परीक्षण लागू नहीं किए जा सकते। डेटा साइंस और सांख्यिकी में यह परीक्षण मॉडल तुलना और निष्कर्ष निकालने के लिए अत्यंत विश्वसनीय है।

Related Post