Machine Learning या Data Mining मे जब हमे माडल को Develop करना होता है तो हमे उसके लिये Data कि जरुरत होती है। फिर इस Data set को मुख्य रुप से तीन कामो के लिये उपयोग किया जाता है।
- Training Data set
- Validation Data set
- Testing Data set
जब माडल को Training Data कि मदद से Train कर लिया जाता है तो फिर उसे Testing Data कि मदद से Test किया जाता है। ओर जब हम माडल को कुछ नया Input देते है तो वह जो Result, Predict करता है तो इससे हमे यह निर्धारित करना आसान होता है कि क्या मॉडल का अनुमान सही है। क्योंकि Training सेट में मौजूद डेटा में उसके लिए पहले से ही Values शामिल हैं जिनके लिये आप भविष्यवाणी करना चाहते हैं
जब किसी एक डेटा सेट को Training ओर Testing डेटासेट मे विभाजित किया जाता है तो इसके लिये दो चीजो का ध्यान रखना होता है कि
Data Set इतना बडा होना चाहिये कि जिससे सही Results मिल सके।
दोनो Dataset (Training & Testing) एक Complete Dataset को represent करना चाहिये मतलब Testing डेटा के characteristics; Training Dataset से अलग नही होना चाहिये।
जब किसी एक डेटा सेट को Training ओर Testing डेटासेट मे विभाजित किया जाता है तो इसके लिये दो चीजो का ध्यान रखना होता है कि
Data Set इतना बडा होना चाहिये कि जिससे सही Results मिल सके।
दोनो Dataset (Training & Testing) एक Complete Dataset को represent करना चाहिये मतलब Testing डेटा के characteristics; Training Dataset से अलग नही होना चाहिये।
एक टिप्पणी भेजें
7 टिप्पणियाँ
nice explanation
जवाब देंहटाएंNicely explained ....Thanks
जवाब देंहटाएंThank you for explanation. Keep it up.
जवाब देंहटाएंgood explanation..
जवाब देंहटाएंGood info
जवाब देंहटाएंhttps://www.machinelearninginhindi.in/
Thanks for giving an Excellent Blog, it's very useful information to us, I learned new info in this article, keep on it doing like this, I waiting for your updates, Thank you So much...
जवाब देंहटाएंBest Air hostess Training Institute in Chennai
Best Ground staff Training institute in Chennai
Best Ground staff Academy in Chennai
Airport Ground Handling Training Institute in Chennai
It's really very useful to me. Thanks for sharing with us.
जवाब देंहटाएंBest Aviation Academy in Chennai