अगर आप Feature Extraction बारे मे जानना चाह्ते है तो आप को उससे पेहले Dimensionality Reduction के बारे मे पड लेना चाहिये क्योकि Feature Reduction ओर Feature Selection, Dimensionality Reduction  कि 2 मुख्य Approaches है।

Feature Extraction

Feature Extraction मतलब Input Data को Features के रुप मे बदलना। ईसका उपयोग मुख्य रुप से Machine Learning, Image Processing ओर Pattern Recognition आदि मे किया जाता है।

Feature Extraction एक प्रोसेस है जो कि measured data के initial set से शुरु होती है ओर फिर derived values बनाती है। इन Derived Values को Features भि कहते है ओर ये Informative तथा Non-Redundant होते है। ये Features, माडल कि learning ओर उसके Generalization मे मदद करते है तथा कुछ case मे ये Human Interpretation (मानविय व्याख्याओ) के लिये भि उपयोगी होते है।



Feature Extraction एक Dimensionality Reduction कि महत्वपुर्ण प्रोसेस है जिसमे एक Raw Variables के प्रारंभिक set को प्रोसेसिंग के लिये ओर ज्यादा Manageable Groups (Features) मे Reduce किया जाता है ओर तब भि ये सारे Features पुराने Original Data Set को Complete और Accurate तरिके से Describe करते है।

जब एक Algorithm के लिये Input Data बहुत बड़ा होता है तो वहा पर Error, Redundant या अनावश्यक चिजो के होने कि संभावना होती है जैसे उदाहरण के लिए Feet ओर Meter के लिये एक ही माप का उपयोग। तो इस बडे Input Data को Feature Extraction का उपयोग करके कम किया जा सकता है।

इन प्रारंभिक विशेषताओं के सबसेट को निर्धारित करने कि प्रोसेस को Feature Selection कहा जाता है। जो Feature Select किये जाते है उनमे इनपुट डेटा से संबंधित लगभग सारी जानकारी शामिल होती है, जिससे कि प्रारंभिक डेटा के बजाय इस कम किए गए डेटा का उपयोग करके Desired Task किया जा सके।


Algorithms for Feature Extraction and Feature Selection

Oracle Data Mining के द्वारा Non-Negative Matrix Factorization (NMF) algorithm को  Feature Extraction के लिये तथा Minimum Description Length (MDL) algorithm को Feature Selection के लिये use किया जाता है\