Machine Learning या Data Mining मे जब हमे माडल को Develop करना होता है तो हमे उसके लिये Data कि जरुरत होती है। फिर इस Data set को मुख्य रुप से तीन कामो के लिये उपयोग किया जाता है।
- Training Data set
- Validation Data set
- Testing Data set
जब माडल को Training Data कि मदद से Train कर लिया जाता है तो फिर उसे Testing Data कि मदद से Test किया जाता है। ओर जब हम माडल को कुछ नया Input देते है तो वह जो Result, Predict करता है तो इससे हमे यह निर्धारित करना आसान होता है कि क्या मॉडल का अनुमान सही है। क्योंकि Training सेट में मौजूद डेटा में उसके लिए पहले से ही Values शामिल हैं जिनके लिये आप भविष्यवाणी करना चाहते हैं
जब किसी एक डेटा सेट को Training ओर Testing डेटासेट मे विभाजित किया जाता है तो इसके लिये दो चीजो का ध्यान रखना होता है कि
Data Set इतना बडा होना चाहिये कि जिससे सही Results मिल सके।
दोनो Dataset (Training & Testing) एक Complete Dataset को represent करना चाहिये मतलब Testing डेटा के characteristics; Training Dataset से अलग नही होना चाहिये।
जब किसी एक डेटा सेट को Training ओर Testing डेटासेट मे विभाजित किया जाता है तो इसके लिये दो चीजो का ध्यान रखना होता है कि
Data Set इतना बडा होना चाहिये कि जिससे सही Results मिल सके।
दोनो Dataset (Training & Testing) एक Complete Dataset को represent करना चाहिये मतलब Testing डेटा के characteristics; Training Dataset से अलग नही होना चाहिये।
एक टिप्पणी भेजें
6 टिप्पणियाँ
nice explanation
जवाब देंहटाएंNicely explained ....Thanks
जवाब देंहटाएंThank you for explanation. Keep it up.
जवाब देंहटाएंgood explanation..
जवाब देंहटाएंGood info
जवाब देंहटाएंhttps://www.machinelearninginhindi.in/
It's really very useful to me. Thanks for sharing with us.
जवाब देंहटाएंBest Aviation Academy in Chennai