LEX in Compiler Design | LEX टूल क्या है? संरचना, कार्यप्रणाली और उदाहरण सहित पूर्ण व्याख्या
LEX क्या है? (LEX in Compiler Design)
LEX कंपाइलर डिजाइन में एक Lexical Analyzer Generator Tool है जिसका उपयोग स्वचालित रूप से लेक्सिकल एनालाइज़र (Lexical Analyzer) बनाने के लिए किया जाता है। यह Lexical Analysis की प्रक्रिया को आसान बनाता है और Regular Expressions का उपयोग करके Tokens की पहचान करता है। 2025 में भी यह टूल Compiler Construction और Programming Language Development में अत्यधिक प्रासंगिक है।
📘 LEX का परिचय (Introduction to LEX)
LEX (Lexical Analyzer Generator) का निर्माण Mike Lesk और Eric Schmidt द्वारा UNIX सिस्टम के लिए किया गया था। यह Regular Expressions के माध्यम से Tokens को पहचानने वाले C भाषा में आधारित प्रोग्राम्स बनाता है। LEX को अक्सर YACC (Yet Another Compiler Compiler) के साथ Parser Generation के लिए उपयोग किया जाता है।
⚙️ LEX का उद्देश्य (Purpose of LEX)
- 🔹 Lexical Analyzer को मैन्युअली कोड करने की आवश्यकता समाप्त करता है।
- 🔹 Regular Expressions के आधार पर Token पहचान को सरल बनाता है।
- 🔹 Compiler Development की गति और दक्षता बढ़ाता है।
📗 LEX प्रोग्राम की संरचना (Structure of a LEX Program)
एक LEX प्रोग्राम तीन मुख्य भागों में विभाजित होता है:
%{
/* Declarations Section */
#include <stdio.h>
%}
%%
/* Rules Section */
[0-9]+ { printf("NUMBER\n"); }
[a-zA-Z]+ { printf("IDENTIFIER\n"); }
[\n] { /* newline ignore */ }
%%
int main() {
yylex(); /* Function call to start lexical analysis */
return 0;
}
📂 भागों का विवरण:
- 1️⃣ Declarations Section (%{ %}): इसमें हेडर फाइलें, ग्लोबल वेरिएबल्स और आवश्यक घोषणाएँ शामिल होती हैं।
- 2️⃣ Rules Section (%% ... %%): इसमें Regular Expressions और उनसे संबंधित actions लिखे जाते हैं।
- 3️⃣ User Subroutines: इसमें मुख्य प्रोग्राम (main function) और अन्य user-defined functions लिखे जाते हैं।
🧩 LEX का कार्यप्रणाली (Working of LEX)
LEX का कार्य सरल चरणों में विभाजित किया जा सकता है:
- Regular Expressions को DFA (Deterministic Finite Automata) में परिवर्तित किया जाता है।
- DFA को C कोड के रूप में ट्रांसलेट किया जाता है।
- इस कोड को lex.yy.c नामक फाइल में सेव किया जाता है।
- उसके बाद, yylex() function input पढ़कर tokens पहचानता है।
📘 LEX का Execution Process:
$ lex sample.l $ cc lex.yy.c -o sample $ ./sample < input.txt
📊 Output Example:
यदि input.txt में लिखा है:
sum = a + b;
Output:
IDENTIFIER ASSIGN IDENTIFIER PLUS IDENTIFIER SEMICOLON
🧮 Regular Expressions in LEX:
LEX में टोकन्स की पहचान के लिए Regular Expressions का उपयोग किया जाता है।
- [0-9]+ → Numbers
- [a-zA-Z]+ → Identifiers
- \+ | \- | \* | \/ → Operators
⚙️ yylex() Function:
yylex() LEX द्वारा उत्पन्न मुख्य फ़ंक्शन है जो input stream से tokens पढ़ता है और प्रत्येक token से जुड़ी action को execute करता है।
📗 LEX और YACC का संबंध:
LEX केवल lexical analysis करता है जबकि YACC syntax analysis करता है। दोनों को साथ में उपयोग करने से पूर्ण compiler front-end तैयार किया जा सकता है।
LEX → Tokenization → Pass to YACC → Parsing → AST Generation
🚀 आधुनिक उपयोग (LEX in 2025):
- 🔹 Cloud-based Compiler Development Platforms में Integration।
- 🔹 AI-based Lexical Analyzer Generation।
- 🔹 LEX-to-Python और LEX-to-LLVM Translators।
- 🔹 Modern variants जैसे FLEX (Fast Lexical Analyzer) का व्यापक उपयोग।
📙 निष्कर्ष:
LEX Compiler Design का एक शक्तिशाली उपकरण है जो token generation और lexical analysis को स्वचालित करता है। यह Compiler Construction, Code Analysis, और Programming Language Research में अब भी महत्वपूर्ण भूमिका निभा रहा है। 2025 में, LEX और उसके modern versions (जैसे FLEX) Machine Learning आधारित compiler tools के लिए आधार बन गए हैं।
Related Post
- Introduction of Compiler | कंपाइलर का परिचय - Working, Structure, and Importance in Compiler Design
- Major Data Structures in Compiler | कंपाइलर में उपयोग होने वाले प्रमुख डेटा स्ट्रक्चर
- Bootstrapping and Porting in Compiler Design | बूटस्ट्रैपिंग और पोर्टिंग क्या है? कार्य, चरण और उदाहरण सहित
- Compiler Structure: Analysis–Synthesis Model of Compilation | कंपाइलर की संरचना और विश्लेषण-संश्लेषण मॉडल
- Various Phases of a Compiler | कंपाइलर के विभिन्न चरण और उनका कार्य (With Diagram & Examples)
- Lexical Analysis in Compiler Design | लेक्सिकल एनालिसिस क्या है? प्रक्रिया, टोकन, बफरिंग और उदाहरण सहित
- Input Buffering in Compiler Design | इनपुट बफरिंग क्या है? डबल बफरिंग तकनीक और उदाहरण सहित
- Specification and Recognition of Tokens in Compiler Design | टोकन की स्पेसिफिकेशन और पहचान - रेगुलर एक्सप्रेशन एवं फाइनाइट ऑटोमाटा सहित
- LEX in Compiler Design | LEX टूल क्या है? संरचना, कार्यप्रणाली और उदाहरण सहित पूर्ण व्याख्या
- Syntax Analysis and Context-Free Grammars (CFGs) | वाक्य विश्लेषण और संदर्भ-मुक्त व्याकरण - Compiler Design Notes 2025
- Top-Down Parsing (Brute Force & Recursive Descent) | टॉप-डाउन पार्सिंग - सिद्धांत, एल्गोरिथ्म और उदाहरण सहित
- Grammar Transformations and Predictive Parsing | व्याकरण रूपांतरण एवं प्रेडिक्टिव पार्सिंग - Compiler Design Notes 2025
- Bottom-Up Parsing and Operator Precedence Parsing | बॉटम-अप पार्सिंग और ऑपरेटर प्रीसीडेंस पार्सिंग - Compiler Design Notes 2025
- LR Parsers (SLR, LALR, Canonical LR) | एलआर पार्सर्स - सिद्धांत, निर्माण प्रक्रिया और उदाहरण सहित
- Parser Generation | पार्सर निर्माण प्रक्रिया - Compiler Design Notes 2025 (Hindi + English)
- Syntax Directed Definitions (SDD) and Construction of Syntax Trees | सिंटैक्स निर्देशित परिभाषाएँ और सिंटैक्स वृक्ष निर्माण - Compiler Design Notes 2025
- Bottom-Up Evaluation of S-Attributed Definitions | एस-एट्रीब्यूटेड डेफिनिशन्स का बॉटम-अप मूल्यांकन - Compiler Design Notes 2025
- L-Attributed Definitions and Top-Down Translation | एल-एट्रीब्यूटेड डेफिनिशन्स और टॉप-डाउन अनुवाद - Compiler Design Notes 2025
- Bottom-Up Evaluation of Inherited Attributes | इनहेरिटेड एट्रीब्यूट्स का बॉटम-अप मूल्यांकन - Compiler Design Notes 2025
- Recursive Evaluation and Syntax Directed Definition Analysis | रिकर्सिव मूल्यांकन और सिंटैक्स निर्देशित परिभाषा विश्लेषण - Compiler Design Notes 2025
- Type System | टाइप सिस्टम क्या है?
- Specification of Simple Type Checker | सरल टाइप चेकर का विश्लेषण
- Equivalence of Expressions and Types in Compiler Design | कंपाइलर डिज़ाइन में अभिव्यक्तियों और टाइप्स की समानता
- Type Conversion in Compiler Design | कंपाइलर डिज़ाइन में टाइप रूपांतरण
- Overloading of Functions and Operations in Compiler Design | कंपाइलर डिज़ाइन में फ़ंक्शन और ऑपरेशन का ओवरलोडिंग
- Polymorphic Functions in Compiler Design | कंपाइलर डिज़ाइन में बहुरूपी फ़ंक्शन
- Storage Organization in Compiler Design | कंपाइलर डिज़ाइन में स्टोरेज संगठन
- Storage Allocation Strategies in Compiler Design | कंपाइलर डिज़ाइन में स्टोरेज आबंटन रणनीतियाँ
- Parameter Passing in Compiler Design | कंपाइलर डिज़ाइन में पैरामीटर पासिंग
- Dynamic Storage Allocation in Compiler Design | कंपाइलर डिज़ाइन में डायनेमिक स्टोरेज आबंटन
- Symbol Table in Compiler Design | कंपाइलर डिज़ाइन में सिंबल टेबल
- Intermediate Code Generation: Declarations | इंटरमीडिएट कोड जनरेशन में घोषणाएँ
- Intermediate Code Generation: Assignment Statements | इंटरमीडिएट कोड जनरेशन में असाइनमेंट स्टेटमेंट्स
- Intermediate Code Generation: Boolean Expressions | इंटरमीडिएट कोड जनरेशन में बूलियन अभिव्यक्तियाँ
- Intermediate Code Generation: Case Statements | इंटरमीडिएट कोड जनरेशन में केस स्टेटमेंट्स
- Intermediate Code Generation: Backpatching | इंटरमीडिएट कोड जनरेशन में बैकपैचिंग
- Intermediate Code Generation: Procedure Calls | इंटरमीडिएट कोड जनरेशन में प्रोसीजर कॉल्स
- Code Generation: Issues in the Design of Code Generator | कोड जनरेटर के डिज़ाइन में समस्याएँ
- Basic Blocks and Flow Graphs | बेसिक ब्लॉक्स और फ्लो ग्राफ़्स
- Register Allocation and Assignment | रजिस्टर आबंटन और असाइनमेंट
- DAG Representation of Basic Blocks | बेसिक ब्लॉक्स का DAG प्रतिनिधित्व
- Peephole Optimization | पीपहोल ऑप्टिमाइज़ेशन
- Generating Code from DAG | DAG से कोड जनरेशन
- Introduction to Code Optimization | कोड ऑप्टिमाइज़ेशन का परिचय
- Sources of Optimization of Basic Blocks | बेसिक ब्लॉक्स के ऑप्टिमाइज़ेशन के स्रोत
- Loops in Flow Graphs | फ्लो ग्राफ़्स में लूप्स
- Dead Code Elimination | डेड कोड एलिमिनेशन
- Loop Optimization | लूप ऑप्टिमाइज़ेशन
- Introduction to Global Data Flow Analysis | ग्लोबल डेटा फ्लो एनालिसिस का परिचय
- Code Improving Transformations in Compiler Design | कोड सुधार परिवर्तन की उन्नत तकनीकें
- Data Flow Analysis of Structured Flow Graph | स्ट्रक्चर्ड फ्लो ग्राफ का डेटा फ्लो विश्लेषण
- Symbolic Debugging of Optimized Code | ऑप्टिमाइज़्ड कोड का प्रतीकात्मक डीबगिंग