Dimensionality Reduction in Hindi

Machine Learning मे Dimensionality का मतलब होता है कि आपके Database मे कितने Feature या Input Variable है। 

जब आपके database मे Features की संख्या, observations कि संख्या कि तुलना मे बहुत ज्यादा होती है तो model को सही तरह से train करने मे कठिनाई का सामना करना पडता है इसे "Curse of Dimensionality" कहते है।

मशिन लर्निंग classification problem मे कई सारे कारक (factors) होते है जिनके आधार पर final classification होता है। ये कारक basically; variables होते है है जिन्हे Features भी कहते है। जितने ज्यादा features होते है, उन पर काम करना उतना ही कठिन होता है। एसे मे हम Dimensionality Reduction का उपयोग करते है। 

Dimensionality Reduction एक एसी प्रोसेस है जिसके जरिये Principle Variable के सेट को बना कर के, Random Variables की संख्या को कम किया जाता है। दुसरे शब्दो मे कहे तो High Dimensional Data-set को Low Dimensional Data-set मे बदला जाता है

Dimensionality Reduction के Components

Dimensionality Reduction के मुख्य रुप से 2 Components है या दुसरे शब्दो मे कहे तो यह दो तरिको से किया जा सकता है।

  1. Feature Selection : इसमे एक बडे डेटा सेट के Subsets बनाये जाते है।
  2. Feature Extraction : इसमे Data को high dimensional space से lower dimensional space मे बदला जाता है।

Methods of Dimensionality Reduction

Dimension Reduction को कई सारी methods के जरिये किया जा सकता है।
  1. Missing Values
  2. Low Variance
  3. Decision Tree
  4. Random Forest
  5. High Correlation
  6. Backward Features Elimination