Simulation in R | R में सिमुलेशन

R में सिमुलेशन (Simulation in R)

परिचय

सिमुलेशन (Simulation) एक सांख्यिकीय तकनीक है जिसका उपयोग वास्तविक दुनिया की प्रणालियों, घटनाओं या प्रक्रियाओं के व्यवहार को कंप्यूटर मॉडल के माध्यम से समझने और पुन: प्रस्तुत करने के लिए किया जाता है। R प्रोग्रामिंग में सिमुलेशन का उपयोग प्रायिकता वितरण (Probability Distributions), सांख्यिकीय परीक्षण (Statistical Tests), मोंटे कार्लो विश्लेषण (Monte Carlo Analysis) और रैंडम सैंपलिंग जैसे कार्यों में किया जाता है।

डेटा साइंस, वित्त, मशीन लर्निंग और इंजीनियरिंग क्षेत्रों में सिमुलेशन का उपयोग निर्णय लेने, जोखिम विश्लेषण, और मॉडलिंग के लिए व्यापक रूप से किया जाता है।

1️⃣ सिमुलेशन क्या है?

सिमुलेशन का अर्थ है — किसी वास्तविक प्रक्रिया का आभासी (virtual) पुनरुत्पादन ताकि उसके परिणामों को समझा जा सके। उदाहरण के लिए, सिक्का उछालने, पासा फेंकने या किसी मशीन की विफलता का अनुमान लगाने के लिए सिमुलेशन किया जा सकता है।

सिमुलेशन के उद्देश्य:

जटिल प्रणालियों का अध्ययन करना
रैंडम प्रक्रियाओं का अनुमान लगाना
जोखिम और अनिश्चितता का विश्लेषण करना
मॉडल की विश्वसनीयता का परीक्षण करना

2️⃣ R में रैंडम संख्या उत्पन्न करना

R में रैंडम संख्या उत्पन्न करने के लिए कई इनबिल्ट फ़ंक्शन्स हैं:

Function	Description
runif()	Uniform distribution से संख्याएँ
rnorm()	Normal distribution से संख्याएँ
rbinom()	Binomial distribution से संख्याएँ
rpois()	Poisson distribution से संख्याएँ
rexp()	Exponential distribution से संख्याएँ

उदाहरण:

# Uniform Distribution
runif(5, min=0, max=10)

# Normal Distribution
rnorm(5, mean=0, sd=1)

# Binomial Distribution
rbinom(5, size=10, prob=0.5)

3️⃣ मोंटे कार्लो सिमुलेशन (Monte Carlo Simulation)

मोंटे कार्लो सिमुलेशन एक सांख्यिकीय विधि है जिसमें रैंडम सैंपलिंग के माध्यम से संभावित परिणामों का अनुमान लगाया जाता है। यह विधि विशेष रूप से अनिश्चित परिस्थितियों में निर्णय लेने के लिए उपयोग की जाती है।

उदाहरण: π (पाई) का अनुमान

set.seed(100)
n <- 100000
x <- runif(n)
y <- runif(n)
inside <- (x^2 + y^2) <= 1
pi_est <- 4 * sum(inside) / n
pi_est

यह कोड यादृच्छिक बिंदुओं का उपयोग करके π का अनुमान लगाता है।

4️⃣ वितरणों पर सिमुलेशन

Normal Distribution Simulation

x <- rnorm(1000, mean=50, sd=10)
hist(x, main='Normal Distribution Simulation', col='skyblue', border='white')

Binomial Simulation

y <- rbinom(1000, size=10, prob=0.5)
hist(y, main='Binomial Simulation', col='orange', border='white')

5️⃣ पुनरावृत्ति (Reproducibility)

सिमुलेशन में हर बार अलग-अलग परिणाम आते हैं। यदि आप एक ही परिणाम दोहराना चाहते हैं तो set.seed() का उपयोग करें।

set.seed(123)
rnorm(5)

6️⃣ सिमुलेशन के लिए apply() फैमिली

sim_results <- replicate(5, mean(rnorm(100, mean=50, sd=10)))
sim_results
mean(sim_results)

7️⃣ डेटा साइंस में सिमुलेशन का उपयोग

Sampling और Bootstrapping
Predictive Model Testing
Financial Risk Assessment
Queueing Systems Analysis
Machine Learning Model Validation

8️⃣ Bootstrapping Technique

Bootstrapping में हम रैंडम सैंपलिंग का उपयोग करके बार-बार डेटा से सैंपल निकालते हैं ताकि किसी सांख्यिकीय पैरामीटर का वितरण समझा जा सके।

data <- c(12, 15, 18, 20, 25, 30)
bootstrap_means <- replicate(1000, mean(sample(data, replace=TRUE)))
hist(bootstrap_means, main='Bootstrap Distribution of Means', col='lightgreen')

9️⃣ Simulation for Risk Estimation

वित्त और निवेश में जोखिम विश्लेषण के लिए सिमुलेशन का प्रयोग किया जाता है।

set.seed(42)
returns <- rnorm(1000, mean=0.05, sd=0.2)
final_value <- 100 * exp(cumsum(returns))
plot(final_value, type='l', col='blue', main='Simulated Stock Value Over Time')

🔟 Conditional Simulation

कुछ शर्तों के आधार पर सिमुलेशन चलाया जा सकता है।

sim <- replicate(100, {
  x <- rnorm(1)
  if (x > 0) return('Profit') else return('Loss')
})
table(sim)

1️⃣1️⃣ Parallel Simulation

R में parallel पैकेज का उपयोग करके सिमुलेशन को मल्टी-कोर प्रोसेसर पर तेज़ी से चलाया जा सकता है।

library(parallel)
results <- mclapply(1:4, function(i) mean(rnorm(1000000)), mc.cores=4)
results

1️⃣2️⃣ ग्राफिकल विश्लेषण

x <- rnorm(1000)
hist(x, col='lightblue', border='white')
boxplot(x, main='Boxplot of Simulated Data')

1️⃣3️⃣ वास्तविक उपयोग उदाहरण

मान लीजिए हमें किसी व्यवसाय के संभावित लाभ का अनुमान लगाना है जिसमें बिक्री और खर्च दोनों अनिश्चित हैं।

set.seed(123)
sales <- rnorm(10000, mean=100000, sd=15000)
costs <- rnorm(10000, mean=80000, sd=10000)
profit <- sales - costs
mean(profit)
hist(profit, col='gold', main='Simulated Profit Distribution')

1️⃣4️⃣ सिमुलेशन का लाभ

जटिल समस्याओं को सरल बनाता है
वास्तविक डेटा के बिना विश्लेषण की अनुमति देता है
अनिश्चितता का पूर्वानुमान लगाता है
मॉडलिंग और पूर्वानुमान के लिए उपयोगी

1️⃣5️⃣ सिमुलेशन की सीमाएँ

अधिक गणनात्मक शक्ति की आवश्यकता होती है
परिणाम पूरी तरह रैंडम पर निर्भर करते हैं
मॉडल की सटीकता पर निर्भरता

निष्कर्ष

R में सिमुलेशन विश्लेषणात्मक निर्णय लेने, जोखिम मूल्यांकन और वैज्ञानिक मॉडलिंग के लिए एक अमूल्य उपकरण है। यह हमें वास्तविक दुनिया की जटिलताओं को सरल गणितीय मॉडल्स के माध्यम से समझने में मदद करता है। Monte Carlo Simulation, Bootstrapping और Random Sampling जैसी तकनीकें आज के डेटा वैज्ञानिकों के लिए मूलभूत कौशल हैं। सही रूप से उपयोग किए जाने पर, सिमुलेशन न केवल भविष्यवाणी करने में मदद करता है बल्कि अनिश्चित परिस्थितियों में निर्णय को भी अधिक सटीक बनाता है।