Silhouette in Machine Learning

Silhouette का मतलब अगर हम हिंदी मे देखे तो एक एसा रेखा चित्र जिसमे काला रंग भर दिया जाता है।

सिल्हूट एक Method है जो Cluster of Data (डेटा के समूहों) के भीतर Interpretation (स्थिरता की व्याख्या) और Validation(सत्यापन की विधि) को बताता है।

यह एक सामान्य Graphical विधी है जो कि Cluster Analysis के लिये उपयोग कि जाती है। ओर इसके लिये Silhouette Function का उपयोग किया जाता है।

Silhouette Function को Calculate करने के लिये दो तरह के Data; Use होते है।

  1. Collection of all Distances b/w Objects. 
  2. The Partition(Clustering)
हर Cluster Element के लिये Silhouette Value Calculate कि जाती है। एक अच्छे Cluster Element के लिये value 1 के आस पास होती है। और एक कमजोर Cluster Element के लिये वेल्यु -1 के आस पास होती है।

Silhouette Function के दो Coefficient है 
  1. Cohesion : यह बताता है कि Cluster मे Object कितने नजदीक है।
  2. Separation : यह बताता है कि एक Cluster दुसरे Cluster से कितना अलग है।