Dimensionality Reduction in Hindi

Machine Learning मे Dimensionality का मतलब होता है कि आपके Database मे कितने Feature या Input Variable है।

जब आपके database मे Features की संख्या, observations कि संख्या कि तुलना मे बहुत ज्यादा होती है तो model को सही तरह से train करने मे कठिनाई का सामना करना पडता है इसे "Curse of Dimensionality" कहते है।

मशिन लर्निंग classification problem मे कई सारे कारक (factors) होते है जिनके आधार पर final classification होता है। ये कारक basically; variables होते है है जिन्हे Features भी कहते है। जितने ज्यादा features होते है, उन पर काम करना उतना ही कठिन होता है। एसे मे हम Dimensionality Reduction का उपयोग करते है।

Dimensionality Reduction एक एसी प्रोसेस है जिसके जरिये Principle Variable के सेट को बना कर के, Random Variables की संख्या को कम किया जाता है। दुसरे शब्दो मे कहे तो High Dimensional Data-set को Low Dimensional Data-set मे बदला जाता है

Dimensionality Reduction के Components

Dimensionality Reduction के मुख्य रुप से 2 Components है या दुसरे शब्दो मे कहे तो यह दो तरिको से किया जा सकता है।

Feature Selection : इसमे एक बडे डेटा सेट के Subsets बनाये जाते है।
Feature Extraction : इसमे Data को high dimensional space से lower dimensional space मे बदला जाता है।

Methods of Dimensionality Reduction

Dimension Reduction को कई सारी methods के जरिये किया जा सकता है।

Missing Values
Low Variance
Decision Tree
Random Forest
High Correlation
Backward Features Elimination

Dimensionality Reduction in Hindi - Machine Learning