Asymétrie (Skewness)
L’asymétrie, aussi appelée skewness en anglais, est une mesure statistique qui décrit la symétrie d’une distribution de données. Elle permet de savoir si les données sont réparties de manière équilibrée autour de leur moyenne ou si elles penchent davantage d’un côté.
Une distribution parfaitement symétrique présente une asymétrie nulle. Lorsque la distribution est asymétrique à droite (skewness positive), cela signifie que la queue de la distribution est étirée vers les valeurs plus élevées, indiquant la présence de quelques valeurs extrêmes élevées. À l’inverse, une asymétrie négative (skewness négative) indique que la queue est étirée vers les valeurs plus faibles, avec des valeurs extrêmes basses.
L’asymétrie est importante car elle influence les statistiques descriptives et les choix méthodologiques en analyse de données. Par exemple, les données fortement asymétriques peuvent nécessiter des transformations avant d’appliquer certains modèles statistiques.
Cette page vous expliquera comment calculer l’asymétrie, interpréter sa valeur, et utiliser cette information pour mieux comprendre vos données.
Fonctions :
-
skew()
La fonction skew() de pandas calcule l'asymétrie (ou skewness) des données. L'asymétrie mesure l'irrégularité de la distribution d'une variable par rapport à une distribution normale. Si le skewness est égal à 0, la distribution est symétrique. Un skewness positif indique une distribution étendue à droite (taille plus longue à droite), tandis qu'un skewness négatif indique une distribution étendue à gauche (taille plus longue à gauche).
Importation :
import pandas as pd
Attributs :
Nom Type Description axis int, optionnel Définit l'axe le long duquel calculer l'asymétrie. Par défaut, `axis=0` pour les séries (calcul sur les colonnes). skipna bool, optionnel Si True (par défaut), ignore les valeurs NaN dans le calcul. Si False, la présence de NaN rend le résultat NaN. bias bool, optionnel Si True (par défaut), utilise la formule biaisée pour l'asymétrie. Si False, utilise la formule non biaisée. Exemple de code :
import pandas as pd # Données d'exemple data = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) # Calcul de l'asymétrie asymmetry = data.skew() # Affichage des résultats print(asymmetry)
Explication du code :
La ligne
import pandas as pd
importe la bibliothèque pandas, renommée ici enpd
, qui permet la manipulation efficace de données sous forme de séries ou de tableaux (DataFrame).Données d’exemple
data = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
crée une Série pandas contenant une séquence de nombres entiers de 1 à 10.Calcul de l’asymétrie
asymmetry = data.skew()
calcule le coefficient d’asymétrie (ou skewness) de la distribution des données. Ce coefficient mesure la symétrie de la distribution autour de la moyenne.Une valeur proche de 0 indique une distribution symétrique. Une valeur positive indique une asymétrie vers la droite (queue plus longue à droite), tandis qu’une valeur négative indique une asymétrie vers la gauche.
Affichage des résultats
print(asymmetry)
affiche la valeur calculée du coefficient d’asymétrie de la série.