Neyman–Pearson Lemma in Hypothesis Testing | परिकल्पना परीक्षण में नेयमन–पियर्सन प्रमेय

नेयमन–पियर्सन प्रमेय (Neyman–Pearson Lemma)

परिचय

सांख्यिकी के क्षेत्र में, परिकल्पना परीक्षण (Hypothesis Testing) एक महत्वपूर्ण तकनीक है, जो यह तय करने में मदद करती है कि किसी जनसंख्या पैरामीटर के बारे में एक धारणा सही है या नहीं। इस परीक्षण में, हमें दो परिकल्पनाओं — शून्य परिकल्पना (H₀) और वैकल्पिक परिकल्पना (H₁) — के बीच निर्णय लेना होता है। लेकिन प्रश्न यह उठता है कि इन दोनों में से सही निर्णय कैसे लिया जाए? इसी प्रश्न का उत्तर नेयमन–पियर्सन प्रमेय (Neyman–Pearson Lemma) देता है।

नेयमन–पियर्सन प्रमेय सांख्यिकीय निर्णय सिद्धांत का एक मौलिक परिणाम है जो बताता है कि किसी दिए गए महत्व स्तर (α) के लिए सबसे शक्तिशाली परीक्षण (Most Powerful Test) कैसे तैयार किया जा सकता है। यह प्रमेय 1933 में जेर्ज़ी नेयमन (Jerzy Neyman) और एगॉन पियर्सन (Egon Pearson) द्वारा प्रस्तुत किया गया था।

मुख्य अवधारणाएँ

शून्य परिकल्पना (H₀): यह धारणा कि कोई अंतर या प्रभाव नहीं है।
वैकल्पिक परिकल्पना (H₁): यह धारणा कि एक महत्वपूर्ण अंतर या प्रभाव है।
परीक्षण सांख्यिकी (Test Statistic): वह मान जो यह तय करने में मदद करता है कि H₀ को अस्वीकार करना है या नहीं।
महत्व स्तर (Significance Level, α): वह संभावना जिससे हम गलती से H₀ को अस्वीकार कर सकते हैं।
परीक्षण की शक्ति (Power of Test): H₀ को सही समय पर अस्वीकार करने की संभावना (1 – β)।

नेयमन–पियर्सन प्रमेय का कथन

यह प्रमेय कहता है कि:

यदि हमारे पास दो सरल परिकल्पनाएँ हैं — H₀: θ = θ₀ H₁: θ = θ₁ तो दिए गए महत्व स्तर α के लिए सबसे शक्तिशाली परीक्षण वह होगा जो निम्नलिखित शर्त को पूरा करता है:

Reject H₀ if (L(x | θ₁) / L(x | θ₀)) ≥ k

जहाँ L(x | θ) संभावना फलन (Likelihood Function) है, और k एक नियतांक (Constant) है जिसे इस प्रकार चुना जाता है कि परीक्षण का महत्व स्तर α हो।

सांख्यिकीय रूप से व्याख्या

Likelihood Ratio Test (LRT) इस प्रमेय की अवधारणा पर आधारित है। यह परीक्षण H₀ और H₁ के तहत डेटा की संभावना की तुलना करता है। यदि H₁ के तहत डेटा की संभावना H₀ की तुलना में काफी अधिक है, तो हम H₀ को अस्वीकार कर देते हैं।

उदाहरण द्वारा समझें

मान लीजिए कि एक जनसंख्या का औसत μ है और हम परीक्षण करना चाहते हैं:

H₀: μ = 10 H₁: μ = 12

हम एक नमूना लेते हैं और उसका औसत निकालते हैं। यदि नमूना औसत H₁ के अपेक्षित मान के अधिक निकट आता है, तो L(x | θ₁)/L(x | θ₀) का मान बड़ा होगा, और हम H₀ को अस्वीकार करेंगे।

नेयमन–पियर्सन प्रमेय के लाभ

यह परीक्षण की शक्ति को अधिकतम करता है।
यह निर्णय प्रक्रिया को गणितीय रूप से मजबूत बनाता है।
यह परिकल्पना परीक्षण के लिए एक मानक दृष्टिकोण प्रदान करता है।

व्यवहारिक उपयोग

मशीन लर्निंग में क्लासिफायर की सटीकता को मापने में।
डेटा साइंस में मॉडल तुलना और प्रदर्शन मापन में।
सिग्नल प्रोसेसिंग और फाइनेंस में अनिश्चितता के अंतर्गत निर्णय लेने में।

ग्राफिकल समझ

Likelihood Ratio Test की सहायता से प्राप्त ग्राफ दो वितरण दिखाता है — एक H₀ के लिए और दूसरा H₁ के लिए। इनके बीच की सीमा उस k मान द्वारा तय की जाती है, जो गलत निर्णय की संभावना (α) को नियंत्रित करता है।

सीमाएँ

यह केवल सरल परिकल्पनाओं (Simple Hypotheses) के लिए प्रत्यक्ष रूप से लागू होता है।
जटिल परिकल्पनाओं के लिए विस्तार की आवश्यकता होती है।
व्यवहार में k का चयन कठिन हो सकता है।

निष्कर्ष

नेयमन–पियर्सन प्रमेय परिकल्पना परीक्षण की नींव है। यह प्रमेय बताता है कि किसी भी स्थिति में सर्वोत्तम परीक्षण वह है जो H₀ और H₁ के अंतर्गत likelihood ratio को अधिकतम करता है। डेटा साइंस, मशीन लर्निंग और रिसर्च में इसका उपयोग निर्णय प्रक्रिया को वैज्ञानिक और विश्वसनीय बनाने के लिए किया जाता है।

Data Frame in R | R में डेटा फ़्रेम

R में डेटा फ़्रेम (Data Frame in R) परिचय R प्रोग...

Linear Model in R | R में रैखिक मॉडल

R में रैखिक मॉडल (Linear Model in R) परिचय R प्रोग�...

Simulation in R | R में सिमुलेशन

R में सिमुलेशन (Simulation in R) परिचय सिमुलेश...

Working with and Manipulating Data in R | R में डेटा पर कार्य करना और उसे संशोधित करना

R में डेटा पर कार्य करना और उसे संशोधित करना (Wo...

Writing Data in R | R में डेटा लिखना

R में डेटा लिखना (Writing Data in R) परिचय डेटा व�...

Neyman–Pearson Lemma in Hypothesis Testing | परिकल्पना परीक्षण में नेयमन–पियर्सन प्रमेय