Big Data में Hive के डेटा प्रकार - Hive Data Types in Big Data in Hindi


Big Data में Hive के डेटा प्रकार (Hive Data Types in Big Data in Hindi)

Apache Hive एक डेटा वेयरहाउस प्रणाली है, जो Big Data को संग्रहीत और प्रोसेस करने के लिए SQL जैसी HiveQL भाषा प्रदान करता है। Hive में विभिन्न प्रकार के डेटा प्रकार (Data Types) होते हैं, जो संरचित डेटा को प्रभावी रूप से मैनेज करने में मदद करते हैं। इस ब्लॉग में हम Hive में उपलब्ध विभिन्न डेटा प्रकारों (Data Types) को विस्तार से समझेंगे।

1. Hive में डेटा प्रकार क्या हैं? (What are Data Types in Hive?)

Hive में डेटा को विभिन्न प्रकारों में विभाजित किया जाता है, जिससे डेटा को संग्रहीत और प्रोसेस करना आसान हो जाता है। Hive में डेटा प्रकार तीन मुख्य श्रेणियों में आते हैं:

  • प्रारंभिक डेटा प्रकार (Primitive Data Types)
  • संरचित डेटा प्रकार (Complex Data Types)
  • Miscellaneous Data Types

2. Hive के प्रारंभिक डेटा प्रकार (Primitive Data Types in Hive)

Primitive डेटा प्रकार सबसे सरल डेटा प्रकार होते हैं, जो संख्यात्मक, तारकीय (String), और दिनांक/समय डेटा को संग्रहीत करते हैं।

डेटा प्रकार विवरण उदाहरण
TINYINT 8-बिट साइन किए गए पूर्णांक (-128 से 127 तक) 100
SMALLINT 16-बिट साइन किए गए पूर्णांक (-32,768 से 32,767 तक) 2500
INT 32-बिट पूर्णांक 100000
BIGINT 64-बिट पूर्णांक 9223372036854775807
FLOAT 32-बिट फ्लोटिंग पॉइंट नंबर 10.75
DOUBLE 64-बिट फ्लोटिंग पॉइंट नंबर 100.123456789
DECIMAL विस्तृत सटीकता (Precision) के लिए DECIMAL(10,2) = 12345678.90
STRING चर लंबाई का टेक्स्ट डेटा "Big Data Analysis"
VARCHAR निश्चित लंबाई का स्ट्रिंग डेटा VARCHAR(50)
CHAR निश्चित लंबाई का कैरेक्टर डेटा CHAR(10)
BOOLEAN सत्य (TRUE) या असत्य (FALSE) TRUE
DATE YYYY-MM-DD प्रारूप में दिनांक संग्रहीत करता है 2024-03-20
TIMESTAMP YYYY-MM-DD HH:MM:SS.ffffff प्रारूप 2024-03-20 14:30:00

3. Hive के संरचित डेटा प्रकार (Complex Data Types in Hive)

Hive में Complex Data Types का उपयोग तब किया जाता है जब डेटा संरचित (Structured) या नेस्टेड (Nested) होता है।

डेटा प्रकार विवरण उदाहरण
ARRAY समान प्रकार के तत्वों की सूची संग्रहीत करता है। ARRAY: ["Apple", "Banana", "Mango"]
MAP Key-Value जोड़े संग्रहीत करता है। MAP: {"Maths": 90, "Science": 85}
STRUCT विभिन्न डेटा प्रकारों को एक साथ संग्रहीत करता है। STRUCT = {"John", 25}
UNIONTYPE अलग-अलग डेटा प्रकारों को संग्रहीत करने की अनुमति देता है। UNIONTYPE = 100 OR "Hundred"

4. Hive के विशेष डेटा प्रकार (Miscellaneous Data Types in Hive)

  • BINARY: बाइनरी डेटा संग्रहीत करता है।
  • INTERVAL: समय अवधि को संग्रहीत करता है।

5. Hive में डेटा प्रकार कैसे उपयोग करें? (How to Use Data Types in Hive?)

Hive में डेटा प्रकारों का उपयोग करने के लिए CREATE TABLE स्टेटमेंट का उपयोग किया जाता है:

CREATE TABLE students (
    id INT,
    name STRING,
    age INT,
    marks ARRAY,
    address STRUCT,
    subjects MAP
) STORED AS ORC;

6. Hive डेटा प्रकार बनाम पारंपरिक डेटाबेस डेटा प्रकार (Hive Data Types vs Traditional Database Data Types)

विशेषता Hive पारंपरिक डेटाबेस (RDBMS)
डेटा भंडारण HDFS सेंट्रल डेटाबेस
डेटा प्रोसेसिंग HiveQL और MapReduce SQL
डेटा प्रकार ARRAY, MAP, STRUCT JSON, XML सपोर्ट
परफॉर्मेंस बैच प्रोसेसिंग रीयल-टाइम प्रोसेसिंग

7. Hive के अनुप्रयोग (Applications of Hive)

  • डेटा वेयरहाउसिंग: बड़े पैमाने पर डेटा संग्रहीत और प्रोसेस करने के लिए।
  • ई-कॉमर्स: उत्पाद और ग्राहक डेटा विश्लेषण।
  • बैंकिंग: वित्तीय लेनदेन विश्लेषण।
  • सोशल मीडिया: उपयोगकर्ता गतिविधि लॉग्स संग्रहीत करना।

8. निष्कर्ष (Conclusion)

Hive में विभिन्न Primitive, Complex और Miscellaneous डेटा प्रकार होते हैं, जो Big Data को प्रभावी ढंग से संग्रहीत और प्रोसेस करने में मदद करते हैं। Hive डेटा प्रकार स्केलेबिलिटी, फ्लेक्सिबिलिटी, और असंगठित डेटा को संरचित करने की क्षमता प्रदान करते हैं।

Related Post

Comments

Comments