Procedures of Hypothesis Testing | परिकल्पना परीक्षण की प्रक्रिया


परिकल्पना परीक्षण की प्रक्रिया (Procedures of Hypothesis Testing)

परिचय

परिकल्पना परीक्षण (Hypothesis Testing) सांख्यिकी की वह विधि है जो डेटा के आधार पर किसी धारणा (Assumption) या दावे (Claim) की सत्यता को परखने के लिए उपयोग की जाती है। यह डेटा साइंस, मशीन लर्निंग, अर्थशास्त्र, चिकित्सा और सामाजिक अनुसंधान जैसे क्षेत्रों में निर्णय लेने की वैज्ञानिक प्रक्रिया का मूल आधार है।

जब हम किसी जनसंख्या (Population) के बारे में कोई अनुमान लगाते हैं, तो उसे हम “परिकल्पना” कहते हैं। यह अनुमान सही भी हो सकता है और गलत भी। इसीलिए, हम सांख्यिकीय रूप से इसे परखते हैं कि उपलब्ध डेटा इस परिकल्पना का समर्थन करता है या नहीं। यह पूरी प्रक्रिया “परिकल्पना परीक्षण की प्रक्रिया” कहलाती है।

मुख्य उद्देश्य

  • किसी अनुमान या धारणा की सत्यता को प्रमाणित या अस्वीकार करना।
  • डेटा आधारित निर्णय को अधिक विश्वसनीय बनाना।
  • त्रुटियों (Errors) की संभावना को न्यूनतम रखना।

परिकल्पना परीक्षण के चरण

परिकल्पना परीक्षण की प्रक्रिया को सामान्यतः छह चरणों में विभाजित किया जा सकता है:

चरण 1: समस्या की परिभाषा और परिकल्पना का निर्माण

सबसे पहले यह स्पष्ट किया जाता है कि क्या जाँचना है। उसके बाद दो परिकल्पनाएँ बनाई जाती हैं:

  • शून्य परिकल्पना (H₀): यह मान्यता कि कोई महत्वपूर्ण अंतर नहीं है।
  • वैकल्पिक परिकल्पना (H₁): यह मान्यता कि कोई महत्वपूर्ण अंतर है।

उदाहरण: “कंपनी का दावा है कि उसकी नई बैटरी 10 घंटे चलती है।” यहाँ H₀: μ = 10 और H₁: μ ≠ 10।

चरण 2: महत्व स्तर (Significance Level, α) का निर्धारण

महत्व स्तर यह दर्शाता है कि हम किस सीमा तक त्रुटि स्वीकार करने को तैयार हैं। सामान्यतः α = 0.05 या 0.01 लिया जाता है। इसका अर्थ है कि 5% या 1% संभावना के साथ हम गलत निर्णय स्वीकार कर सकते हैं।

चरण 3: परीक्षण सांख्यिकी (Test Statistic) का चयन

उपयुक्त सांख्यिकीय परीक्षण का चयन नमूना प्रकार और डेटा वितरण पर निर्भर करता है:

  • Z-test: जब नमूना बड़ा हो (n > 30) और σ ज्ञात हो।
  • T-test: जब नमूना छोटा हो और σ अज्ञात हो।
  • Chi-square test: जब हम वर्गीकरण डेटा (categorical data) का परीक्षण करते हैं।
  • F-test: जब दो या अधिक वैरिएंस की तुलना करनी हो।

चरण 4: डेटा संग्रह और परीक्षण सांख्यिकी की गणना

अब वास्तविक डेटा एकत्र किया जाता है और चुने गए परीक्षण के अनुसार परीक्षण सांख्यिकी की गणना की जाती है। फिर उसे संबंधित वितरण (Z, T, χ², F) से तुलना किया जाता है।

चरण 5: निर्णय नियम (Decision Rule) बनाना

निर्णय नियम के अनुसार हम यह तय करते हैं कि H₀ को अस्वीकार करना है या नहीं। यह नियम p-value या critical value के आधार पर होता है।

यदि p-value < α ⇒ H₀ अस्वीकार। यदि p-value ≥ α ⇒ H₀ स्वीकार।

चरण 6: निष्कर्ष निकालना

अंतिम चरण में, प्राप्त परिणामों के आधार पर निष्कर्ष लिखा जाता है। उदाहरण: “5% महत्व स्तर पर यह निष्कर्ष निकाला गया कि नई बैटरी का औसत समय 10 घंटे से भिन्न नहीं है।”

परीक्षण के प्रकार

  • एक तरफा परीक्षण (One-Tailed Test): जब अंतर केवल एक दिशा में जाँचा जाए।
  • दो तरफा परीक्षण (Two-Tailed Test): जब अंतर दोनों दिशाओं में जाँचा जाए।

उदाहरण

मान लीजिए कि एक कार कंपनी दावा करती है कि उसकी नई कार की औसत माइलेज 20 किमी/ली है। एक डेटा विश्लेषक 50 कारों का नमूना लेता है और औसत माइलेज 19.2 पाता है। σ ज्ञात है = 1.5। α = 0.05।

यहाँ H₀: μ = 20 और H₁: μ ≠ 20। Z = (19.2 – 20) / (1.5/√50) = -3.77 Z_table = ±1.96 चूंकि |Z| > 1.96, अतः H₀ अस्वीकार। इसका अर्थ है कि औसत माइलेज 20 से भिन्न है।

डेटा साइंस में उपयोग

  • मॉडल की सटीकता की जांच (Model Validation)
  • ए/बी टेस्टिंग में परिणामों की तुलना
  • मशीन लर्निंग एल्गोरिद्म के प्रदर्शन का परीक्षण
  • फाइनेंस और हेल्थकेयर में निर्णय सत्यापन

परिकल्पना परीक्षण की सीमाएँ

  • यह केवल सांख्यिकीय महत्व दिखाता है, व्यावहारिक महत्व नहीं।
  • छोटे नमूने पर परिणाम अविश्वसनीय हो सकते हैं।
  • p-value की गलत व्याख्या से गलत निर्णय हो सकता है।
  • धारणाएँ (Assumptions) गलत होने पर परिणाम प्रभावित होते हैं।

निष्कर्ष

परिकल्पना परीक्षण की प्रक्रिया सांख्यिकीय निर्णय लेने का सबसे व्यवस्थित तरीका है। इससे यह सुनिश्चित किया जाता है कि हमारे निष्कर्ष केवल संयोग पर आधारित न हों, बल्कि डेटा के ठोस विश्लेषण पर आधारित हों। डेटा साइंस में, यह तकनीक मॉडल वैधता और भविष्यवाणी की विश्वसनीयता सुनिश्चित करने के लिए अत्यंत आवश्यक है।

Related Post