Clustering वह प्रोसेस है जिसमे समान चीजो को एक साथ रखा जाता है। Unsupervised Learning मे Clustering का goal होता है कि Data Set मे समानता ढुंढ्ना।

जैसा कि हम जानते है कि Unsupervised learning मे Training के दोरान Model को कोई labelled डेटा नही दिया जाता । इस लर्निंग मे Model को इस तरह से Train किया जाता है कि वह दिये गये Data Set मे Similar Data या Pattern को Identify करके उनका एक Group बना ले जिसे Cluster कहते है।

चलिये इसे मे आपको एक उदाहरण के द्वारा समझाता हु तो मान लिजिये आप के पास एक फलो कि टोकरी है जिसमे कई तरह के फल रखे हुए है। अब आपका task है कि एक तरह के फलो को अलग अलग रखा जाये तो यहा हम इसके लिये Clustering का उपयोग करते है। Clustering एल्गोरिथम के लिये ये सारे फल एक जैसे है उसे नहि पता कि कोन सा फल किस तरह का होता है तो वह इन फलो के बीच समानता ढुंढता है। तो वह अभी उनके एक गुण जैसे "रंग" को ले लेता है ओर इन फलो को उनके रंगो के हिसाब से सबसे पहले अलग करता है फिर वह इनका दुसरा गुण जैसे उनका Shape या Size के हिसाब से अलग अलग करता है तो इस प्रकार इन फलो के बीच समानता को ढुंढ कर इन फलो का अलग अलग ग्रुप बना लेता है जिसे Cluster कहते है और इस प्रोसेस को Clustering कहते है।

Clustering Algorithms

कुछ famous clustering algorithm के नाम निचे दिये गये है। इन्हे Detail मे भि मैंने बताया है आप इन पर क्लिक करके इनके बारे मे detail मे पड सकते हो।
  1. K Means Clustering
  2. Hierarchical Clustering
  3. DBSCAN - Density-Based Spatial Clustering of Applications with Noise
  4. Expectation–Maximization (EM) Clustering using Gaussian Mixture Models (GMM)