Engineers के द्वारा कई तरह के Algorithm; use किये जाते है जिन्हे दो Groups मे divide किया गया है। इन एल्गोरिथम को हि Supervised Learning कि methods कहते है। ये methods है - Regression और Classification । दोनो का main goal होता है कि input data मे Relationship या Structure को determine करे जो हमे correct output data को प्राप्त करवा सके और दोनो का Goal होता है कि वह attribute variable से dependent variable कि value पता कर सके । बस दोनो मे अंतर ये होता है कि Regression के लिये dependent attribute; numerical होता है और Classification के लिये dependent variable; Categorical होता है।
Classification (वर्गिकरण )
इसमे Output Variables को Labels या Category कहा जाता है क्योकि इसमे output; categorical रुप मे होता है मतलब इसमे Output दो या दो से ज्यादा category मे divide हो जाता है जैसे कि किसी Email को दो तरह से categorize किया जा सकता है Spam ओर Not Spam, किसी Age ग्रुप को तीन भागो बच्चे, जवान ओर बुडे मे categorize करना।
दुसरे शब्दो मे कहु तो Classification; training data और class label के आधार पर वर्गिक्रत class के label को predict करता है या डेटा का वर्गिकरण करता है। तो जब हमे किसी एसी प्रोब्लम को solve करना है जहा हमे categories या labels बनाने पडते है तो हम Classification Algorithms का उपयोग करते है
एक Classification माडल जो values; observed कि गयी है उनसे किसी तरह का निष्कर्ष निकालने का प्रयास करता है। एक या उससे अधिक इनपुट को देखते हुए एक classification मॉडल एक या अधिक परिणामों कि value का अनुमान लगाने की कोशिश करेता है। Classification मे Discrete या Real-Valued; Input Variable हो सकते है।
Classification प्रोब्लम को दो प्रकार से बताया जा सकता है-
- Binary Classification : दिए गए सेट के input variables को दो समूहों में वर्गीकृत करना।
- Multi-Class Classification : दिए गए सेट के input variables को तीन या उससे ज्यादा समूहों में वर्गीकृत करना।
Classification Algorithm
इसके लिये कई सारे एल्गोरिथम है -
- Neural Networks
- K-Nearest Neighbors(KNN)
- Decision Trees
- Random Forests
- Support Vector Machines(SVM)
- Naive Bayes
एक टिप्पणी भेजें
0 टिप्पणियाँ