Dimensionality Reduction in Hindi
Machine Learning मे Dimensionality का मतलब होता है कि आपके Database मे कितने Feature या Input Variable है।
जब आपके database मे Features की संख्या, observations कि संख्या कि तुलना मे बहुत ज्यादा होती है तो model को सही तरह से train करने मे कठिनाई का सामना करना पडता है इसे "Curse of Dimensionality" कहते है।
मशिन लर्निंग classification problem मे कई सारे कारक (factors) होते है जिनके आधार पर final classification होता है। ये कारक basically; variables होते है है जिन्हे Features भी कहते है। जितने ज्यादा features होते है, उन पर काम करना उतना ही कठिन होता है। एसे मे हम Dimensionality Reduction का उपयोग करते है।
Dimensionality Reduction एक एसी प्रोसेस है जिसके जरिये Principle Variable के सेट को बना कर के, Random Variables की संख्या को कम किया जाता है। दुसरे शब्दो मे कहे तो High Dimensional Data-set को Low Dimensional Data-set मे बदला जाता है
Dimensionality Reduction के Components
Dimensionality Reduction के मुख्य रुप से 2 Components है या दुसरे शब्दो मे कहे तो यह दो तरिको से किया जा सकता है।
- Feature Selection : इसमे एक बडे डेटा सेट के Subsets बनाये जाते है।
- Feature Extraction : इसमे Data को high dimensional space से lower dimensional space मे बदला जाता है।
Methods of Dimensionality Reduction
Dimension Reduction को कई सारी methods के जरिये किया जा सकता है।
- Missing Values
- Low Variance
- Decision Tree
- Random Forest
- High Correlation
- Backward Features Elimination
एक टिप्पणी भेजें
0 टिप्पणियाँ