Visualisation des classes avant et après échantillonnage
La visualisation des classes avant et après échantillonnage permet de comparer la répartition des classes dans un jeu de données avant et après avoir appliqué des techniques de sous-échantillonnage ou de sur-échantillonnage. Voici les étapes de cette visualisation : Avant échantillonnage : Afficher un graphique de la distribution des classes à l’aide de matplotlib ou seaborn, comme un histogramme ou un diagramme en barres. Cela permet de voir combien de données appartiennent à chaque classe, mettant en évidence un éventuel déséquilibre. Après échantillonnage : Appliquer une méthode d’échantillonnage (comme RandomUnderSampler, RandomOverSampler, SMOTE, etc.) pour ajuster les proportions des classes. Afficher un graphique similaire pour le jeu de données équilibré, permettant de comparer les nouvelles proportions des classes après échantillonnage. Cela aide à mieux comprendre l’impact de l’échantillonnage sur la répartition des classes et à visualiser si l’échantillonnage a permis de corriger ou d’améliorer l’équilibre des classes dans le jeu de données.