Data Statistics मे Exploratory Data Analysis या व्याख्यात्मक डेटा विश्लेषण एक approach है जिसमे Data Set को analyze किया जाता है ओर उनके मुख्य characteristics (गुणो) को visual method के द्वारा प्रस्तुत किया जाता है। इसके लिये सांख्यिकीय मॉडल (statistic model) का उपयोग किया भि जा सकता है ओर नहीं भी, लेकिन EDA का मुख्य रुप से उपयोग यह देखने के लिए है कि डेटा हमें Formal Modeling या hypothesis testing tasks के परे या उनसे अधिक ओर क्या बता सकता है।
Exploratory Data Analysis डेटा पर प्रारंभिक जांच करने की प्रक्रिया को बताता है जिससे कि
- Data Set मे Data Pattern की खोज की जा सके,
- विसंगतियों (Anomalies) का पता लगाया जा सके,
- Hypothesis को test किया जा सके और
- Statistics और Graphical Representations की मदद से Assumptions की जाँच की जा सके
EDA के उद्देश्य हैं कि
- Observed Phenomena(घटना) के कारणों के बारे में Hypothesis Suggest करना
- जिन पर Statistics Result आधारित होगा उन अनुमानों का आकलन करना
- उचित सांख्यिकीय उपकरणों और तकनीकों के चयन मे मदद करना
- आगे के डेटा संग्रह के लिए, सर्वेक्षण या प्रयोगों के माध्यम से एक आधार प्रदान करना
EDA की कई तकनीकों को Data Mining में और Data Analytics में भी उपयोग किया जाता है।
Key Concepts of Exploratory Data Analysis
2 types of Data Analysis
-
Confirmatory Data Analysis
-
Exploratory Data Analysis
- Confirmatory Data Analysis
- Exploratory Data Analysis
4 Objectives of EDA
- Discover Patterns
- Spot Anomalies
- Frame Hypothesis
- Check Assumptions
2 methods for exploration
- Univariate Analysis
- Bivariate Analysis
Stuff done during EDA
- Trends
- Distribution
- Mean
- Median
- Outlier
- Spread measurement (SD)
- Correlations
- Hypothesis testing
- Visual Exploration
एक टिप्पणी भेजें
1 टिप्पणियाँ
Parametric
जवाब देंहटाएं