Syntax Analysis and Context-Free Grammars (CFGs) | वाक्य विश्लेषण और संदर्भ-मुक्त व्याकरण - Compiler Design Notes 2025
वाक्य विश्लेषण और संदर्भ-मुक्त व्याकरण (Syntax Analysis and Context-Free Grammars - CFGs)
Syntax Analysis कंपाइलर का दूसरा प्रमुख चरण है, जो प्रोग्राम की संरचना (structure) की जांच करता है। यह चरण यह सुनिश्चित करता है कि प्रोग्राम के वाक्य (statements) भाषा के नियमों के अनुरूप हैं। इस प्रक्रिया के लिए Context-Free Grammar (CFG) का उपयोग किया जाता है।
📘 Syntax Analysis क्या है?
Syntax Analysis का मुख्य उद्देश्य है — यह जांचना कि टोकन्स का अनुक्रम (sequence of tokens) भाषा के व्याकरण (grammar) के अनुरूप है या नहीं। यह कार्य Parser द्वारा किया जाता है जो एक Parse Tree या Syntax Tree बनाता है।
उदाहरण:
Input Code: a = b + c * d; Tokens: ID = ID + ID * ID
Parser इसे Grammar Rules के अनुसार विश्लेषित करता है और निम्नलिखित Parse Tree बनाता है:
=
/
a +
/
b *
/
c d
🧠 Syntax Analysis के उद्देश्य:
- 🔹 प्रोग्राम की संरचना की जांच करना।
- 🔹 Grammar नियमों के अनुसार parsing करना।
- 🔹 Syntax Errors का पता लगाना।
- 🔹 Syntax Tree तैयार करना जो अगली stages (Semantic Analysis) के लिए input बने।
⚙️ Syntax Analysis के प्रकार:
- Top-Down Parsing: रूट से शुरू होकर leaves तक विश्लेषण।
- Bottom-Up Parsing: Leaves से शुरू होकर रूट तक विश्लेषण।
📗 Context-Free Grammar (CFG) क्या है?
Context-Free Grammar (CFG) एक औपचारिक व्याकरण है जो किसी प्रोग्रामिंग भाषा की वाक्य संरचना को परिभाषित करता है। यह भाषा की वैध संरचनाओं को rule-based तरीके से वर्णित करता है।
CFG की परिभाषा:
CFG को चार घटकों से मिलकर परिभाषित किया जाता है:
G = (V, T, P, S)
- V: Variables (Non-terminals)
- T: Terminals (Tokens या Symbols)
- P: Production Rules
- S: Start Symbol
उदाहरण:
Arithmetic Expression के लिए एक सरल CFG:
E → E + T | T T → T * F | F F → (E) | id
यह grammar इन expressions को स्वीकार करता है:
a + b * c (a + b) * c
🧩 Parse Tree क्या है?
Parse Tree grammar के आधार पर प्रोग्राम की hierarchical structure को दर्शाता है। प्रत्येक non-terminal एक subtree को दर्शाता है और terminal symbols leaves के रूप में होते हैं।
📊 Parse Tree Example:
E
├── E
│ └── id
├── +
└── T
├── T
│ └── id
├── *
└── F
└── id
📚 Derivations in Grammar:
- Leftmost Derivation: हर चरण में सबसे बाएँ non-terminal को expand किया जाता है।
- Rightmost Derivation: हर चरण में सबसे दाएँ non-terminal को expand किया जाता है।
उदाहरण:
E → E + T → T + T → F + T → id + T → id + F → id + id
⚙️ Ambiguity in CFG:
यदि एक string के लिए एक से अधिक Parse Tree बनाए जा सकते हैं, तो grammar ambiguous कहलाता है।
उदाहरण:
E → E + E | E * E | id
“id + id * id” के लिए दो Parse Trees संभव हैं:
- + पहले evaluate हो
- * पहले evaluate हो
इस ambiguity को Operator Precedence Rules से हटाया जाता है।
📘 Syntax Errors:
- 🔹 Missing Semicolon (;)
- 🔹 Mismatched Parentheses ()
- 🔹 Unrecognized tokens
🧮 Error Recovery Techniques:
- Panic Mode: कुछ symbols को छोड़कर आगे बढ़ना।
- Phrase-Level Recovery: Missing symbol जोड़ना।
- Error Productions: Grammar में error patterns शामिल करना।
- Global Correction: न्यूनतम संशोधन द्वारा error सुधार।
🚀 आधुनिक परिप्रेक्ष्य (2025 में CFGs और Parsing):
- 🔹 LLM (Large Language Models) आधारित grammar correction।
- 🔹 AI-driven Parser Generation Tools जैसे ANTLR और PEG।
- 🔹 Incremental Parsing IDEs (VS Code, IntelliJ) में उपयोग।
📙 निष्कर्ष:
Syntax Analysis प्रोग्राम की संरचना समझने और Syntax Errors पकड़ने का सबसे महत्वपूर्ण चरण है। Context-Free Grammars Compiler के लिए एक आधारभूत नियमों का सेट प्रदान करते हैं। 2025 में, AI और ML आधारित आधुनिक Parsers इस प्रक्रिया को और भी तेज़, बुद्धिमान और सटीक बना रहे हैं।
Related Post
- Introduction of Compiler | कंपाइलर का परिचय - Working, Structure, and Importance in Compiler Design
- Major Data Structures in Compiler | कंपाइलर में उपयोग होने वाले प्रमुख डेटा स्ट्रक्चर
- Bootstrapping and Porting in Compiler Design | बूटस्ट्रैपिंग और पोर्टिंग क्या है? कार्य, चरण और उदाहरण सहित
- Compiler Structure: Analysis–Synthesis Model of Compilation | कंपाइलर की संरचना और विश्लेषण-संश्लेषण मॉडल
- Various Phases of a Compiler | कंपाइलर के विभिन्न चरण और उनका कार्य (With Diagram & Examples)
- Lexical Analysis in Compiler Design | लेक्सिकल एनालिसिस क्या है? प्रक्रिया, टोकन, बफरिंग और उदाहरण सहित
- Input Buffering in Compiler Design | इनपुट बफरिंग क्या है? डबल बफरिंग तकनीक और उदाहरण सहित
- Specification and Recognition of Tokens in Compiler Design | टोकन की स्पेसिफिकेशन और पहचान - रेगुलर एक्सप्रेशन एवं फाइनाइट ऑटोमाटा सहित
- LEX in Compiler Design | LEX टूल क्या है? संरचना, कार्यप्रणाली और उदाहरण सहित पूर्ण व्याख्या
- Syntax Analysis and Context-Free Grammars (CFGs) | वाक्य विश्लेषण और संदर्भ-मुक्त व्याकरण - Compiler Design Notes 2025
- Top-Down Parsing (Brute Force & Recursive Descent) | टॉप-डाउन पार्सिंग - सिद्धांत, एल्गोरिथ्म और उदाहरण सहित
- Grammar Transformations and Predictive Parsing | व्याकरण रूपांतरण एवं प्रेडिक्टिव पार्सिंग - Compiler Design Notes 2025
- Bottom-Up Parsing and Operator Precedence Parsing | बॉटम-अप पार्सिंग और ऑपरेटर प्रीसीडेंस पार्सिंग - Compiler Design Notes 2025
- LR Parsers (SLR, LALR, Canonical LR) | एलआर पार्सर्स - सिद्धांत, निर्माण प्रक्रिया और उदाहरण सहित
- Parser Generation | पार्सर निर्माण प्रक्रिया - Compiler Design Notes 2025 (Hindi + English)
- Syntax Directed Definitions (SDD) and Construction of Syntax Trees | सिंटैक्स निर्देशित परिभाषाएँ और सिंटैक्स वृक्ष निर्माण - Compiler Design Notes 2025
- Bottom-Up Evaluation of S-Attributed Definitions | एस-एट्रीब्यूटेड डेफिनिशन्स का बॉटम-अप मूल्यांकन - Compiler Design Notes 2025
- L-Attributed Definitions and Top-Down Translation | एल-एट्रीब्यूटेड डेफिनिशन्स और टॉप-डाउन अनुवाद - Compiler Design Notes 2025
- Bottom-Up Evaluation of Inherited Attributes | इनहेरिटेड एट्रीब्यूट्स का बॉटम-अप मूल्यांकन - Compiler Design Notes 2025
- Recursive Evaluation and Syntax Directed Definition Analysis | रिकर्सिव मूल्यांकन और सिंटैक्स निर्देशित परिभाषा विश्लेषण - Compiler Design Notes 2025
- Type System | टाइप सिस्टम क्या है?
- Specification of Simple Type Checker | सरल टाइप चेकर का विश्लेषण
- Equivalence of Expressions and Types in Compiler Design | कंपाइलर डिज़ाइन में अभिव्यक्तियों और टाइप्स की समानता
- Type Conversion in Compiler Design | कंपाइलर डिज़ाइन में टाइप रूपांतरण
- Overloading of Functions and Operations in Compiler Design | कंपाइलर डिज़ाइन में फ़ंक्शन और ऑपरेशन का ओवरलोडिंग
- Polymorphic Functions in Compiler Design | कंपाइलर डिज़ाइन में बहुरूपी फ़ंक्शन
- Storage Organization in Compiler Design | कंपाइलर डिज़ाइन में स्टोरेज संगठन
- Storage Allocation Strategies in Compiler Design | कंपाइलर डिज़ाइन में स्टोरेज आबंटन रणनीतियाँ
- Parameter Passing in Compiler Design | कंपाइलर डिज़ाइन में पैरामीटर पासिंग
- Dynamic Storage Allocation in Compiler Design | कंपाइलर डिज़ाइन में डायनेमिक स्टोरेज आबंटन
- Symbol Table in Compiler Design | कंपाइलर डिज़ाइन में सिंबल टेबल
- Intermediate Code Generation: Declarations | इंटरमीडिएट कोड जनरेशन में घोषणाएँ
- Intermediate Code Generation: Assignment Statements | इंटरमीडिएट कोड जनरेशन में असाइनमेंट स्टेटमेंट्स
- Intermediate Code Generation: Boolean Expressions | इंटरमीडिएट कोड जनरेशन में बूलियन अभिव्यक्तियाँ
- Intermediate Code Generation: Case Statements | इंटरमीडिएट कोड जनरेशन में केस स्टेटमेंट्स
- Intermediate Code Generation: Backpatching | इंटरमीडिएट कोड जनरेशन में बैकपैचिंग
- Intermediate Code Generation: Procedure Calls | इंटरमीडिएट कोड जनरेशन में प्रोसीजर कॉल्स
- Code Generation: Issues in the Design of Code Generator | कोड जनरेटर के डिज़ाइन में समस्याएँ
- Basic Blocks and Flow Graphs | बेसिक ब्लॉक्स और फ्लो ग्राफ़्स
- Register Allocation and Assignment | रजिस्टर आबंटन और असाइनमेंट
- DAG Representation of Basic Blocks | बेसिक ब्लॉक्स का DAG प्रतिनिधित्व
- Peephole Optimization | पीपहोल ऑप्टिमाइज़ेशन
- Generating Code from DAG | DAG से कोड जनरेशन
- Introduction to Code Optimization | कोड ऑप्टिमाइज़ेशन का परिचय
- Sources of Optimization of Basic Blocks | बेसिक ब्लॉक्स के ऑप्टिमाइज़ेशन के स्रोत
- Loops in Flow Graphs | फ्लो ग्राफ़्स में लूप्स
- Dead Code Elimination | डेड कोड एलिमिनेशन
- Loop Optimization | लूप ऑप्टिमाइज़ेशन
- Introduction to Global Data Flow Analysis | ग्लोबल डेटा फ्लो एनालिसिस का परिचय
- Code Improving Transformations in Compiler Design | कोड सुधार परिवर्तन की उन्नत तकनीकें
- Data Flow Analysis of Structured Flow Graph | स्ट्रक्चर्ड फ्लो ग्राफ का डेटा फ्लो विश्लेषण
- Symbolic Debugging of Optimized Code | ऑप्टिमाइज़्ड कोड का प्रतीकात्मक डीबगिंग