Asymétrie (Skewness)

L’asymétrie, aussi appelée skewness en anglais, est une mesure statistique qui décrit la symétrie d’une distribution de données. Elle permet de savoir si les données sont réparties de manière équilibrée autour de leur moyenne ou si elles penchent davantage d’un côté.

Une distribution parfaitement symétrique présente une asymétrie nulle. Lorsque la distribution est asymétrique à droite (skewness positive), cela signifie que la queue de la distribution est étirée vers les valeurs plus élevées, indiquant la présence de quelques valeurs extrêmes élevées. À l’inverse, une asymétrie négative (skewness négative) indique que la queue est étirée vers les valeurs plus faibles, avec des valeurs extrêmes basses.

L’asymétrie est importante car elle influence les statistiques descriptives et les choix méthodologiques en analyse de données. Par exemple, les données fortement asymétriques peuvent nécessiter des transformations avant d’appliquer certains modèles statistiques.

Cette page vous expliquera comment calculer l’asymétrie, interpréter sa valeur, et utiliser cette information pour mieux comprendre vos données.

Fonctions :

  • skew()

    La fonction skew() de pandas calcule l'asymétrie (ou skewness) des données. L'asymétrie mesure l'irrégularité de la distribution d'une variable par rapport à une distribution normale. Si le skewness est égal à 0, la distribution est symétrique. Un skewness positif indique une distribution étendue à droite (taille plus longue à droite), tandis qu'un skewness négatif indique une distribution étendue à gauche (taille plus longue à gauche).

    Importation :

    import pandas as pd

    Attributs :

    Nom Type Description
    axis int, optionnel Définit l'axe le long duquel calculer l'asymétrie. Par défaut, `axis=0` pour les séries (calcul sur les colonnes).
    skipna bool, optionnel Si True (par défaut), ignore les valeurs NaN dans le calcul. Si False, la présence de NaN rend le résultat NaN.
    bias bool, optionnel Si True (par défaut), utilise la formule biaisée pour l'asymétrie. Si False, utilise la formule non biaisée.

    Exemple de code :

    import pandas as pd
    
    # Données d'exemple
    data = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
    
    # Calcul de l'asymétrie
    asymmetry = data.skew()
    
    # Affichage des résultats
    print(asymmetry)
    Résultat du code

    Explication du code :

    La ligne import pandas as pd importe la bibliothèque pandas, renommée ici en pd, qui permet la manipulation efficace de données sous forme de séries ou de tableaux (DataFrame).

    Données d’exemple

    data = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) crée une Série pandas contenant une séquence de nombres entiers de 1 à 10.

    Calcul de l’asymétrie

    asymmetry = data.skew() calcule le coefficient d’asymétrie (ou skewness) de la distribution des données. Ce coefficient mesure la symétrie de la distribution autour de la moyenne.

    Une valeur proche de 0 indique une distribution symétrique. Une valeur positive indique une asymétrie vers la droite (queue plus longue à droite), tandis qu’une valeur négative indique une asymétrie vers la gauche.

    Affichage des résultats

    print(asymmetry) affiche la valeur calculée du coefficient d’asymétrie de la série.