Écart-type (Standard Deviation)

L’écart-type, ou standard deviation, est une mesure statistique qui indique à quel point les valeurs d’un ensemble de données sont dispersées autour de la moyenne. Il permet d’évaluer la variabilité ou la volatilité d’un phénomène mesuré, ce qui est essentiel pour comprendre la stabilité ou l’incertitude de vos données.

Un écart-type faible signifie que les données sont regroupées près de la moyenne, tandis qu’un écart-type élevé indique que les données sont plus étalées. C’est un outil fondamental en statistiques descriptives, utilisé aussi bien en science, en finance, qu’en intelligence artificielle.

Sur cette page, vous apprendrez comment calculer l’écart-type, comment l’interpréter dans divers contextes, et en quoi il diffère d’autres mesures de dispersion comme la variance ou l’intervalle interquartile.

Fonctions :

  • np.std()

    Cette fonction de la bibliothèque NumPy permet de calculer l'écart type (standard deviation) des éléments d’un tableau. L’écart type mesure la dispersion des valeurs par rapport à la moyenne.

    Importation :

    import numpy as np

    Attributs :

    Nom Type Description
    a array_like Tableau d'entrée contenant les données dont on veut l'écart type.
    axis int ou tuple d’int, optionnel Axe ou axes le long desquels l’écart type est calculé. Par défaut, il est calculé sur l’ensemble du tableau.
    dtype data-type, optionnel Type des données à utiliser pour le calcul. Permet d’éviter les erreurs de précision.
    out ndarray, optionnel Emplacement où stocker le résultat. Doit avoir la même forme que la sortie attendue.
    ddof int, optionnel Degré de liberté Delta : la valeur par défaut est 0. Pour un échantillon, on utilise souvent 1 (équivalent à diviser par N-1).
    keepdims bool, optionnel Si True, les axes réduits sont conservés dans le résultat comme dimensions de taille un.

    Exemple de code :

    import numpy as np
    
    data = np.array([1, 2, 3, 4, 5])
    ecart_type_population = np.std(data)
    ecart_type_echantillon = np.std(data, ddof=1)
    
    print("Écart type (population) :", ecart_type_population)
    print("Écart type (échantillon) :", ecart_type_echantillon)
    Résultat du code

    Explication du code :

    import numpy as np importe la bibliothèque numpy, renommée ici en np pour faciliter son utilisation dans le code.

    Création d'un tableau de données

    Le code crée un tableau data de dimension 1x5 à l'aide de np.array(). Ce tableau contient les éléments [1, 2, 3, 4, 5].

    Calcul de l'écart type pour la population

    La fonction np.std() calcule l'écart type des éléments d'un tableau. En appelant np.std(data), le code calcule l'écart type de tous les éléments du tableau data, en considérant qu'il s'agit d'une population entière (aucune correction pour les degrés de liberté).

    Le résultat est assigné à la variable ecart_type_population et est ensuite affiché via print("Écart type (population) :", ecart_type_population).

    Calcul de l'écart type pour un échantillon

    En spécifiant ddof=1 dans l'appel de np.std(data, ddof=1), le code calcule l'écart type en ajustant les degrés de liberté pour un échantillon. Cela permet de diviser par n-1 au lieu de n, ce qui est couramment utilisé pour les échantillons afin de corriger le biais dans l'estimation de l'écart type de la population.

    Le résultat est assigné à la variable ecart_type_echantillon et est ensuite affiché via print("Écart type (échantillon) :", ecart_type_echantillon).