Écart-type (Standard Deviation)

L’écart-type, ou standard deviation, est une mesure statistique qui indique à quel point les valeurs d’un ensemble de données sont dispersées autour de la moyenne. Il permet d’évaluer la variabilité ou la volatilité d’un phénomène mesuré, ce qui est essentiel pour comprendre la stabilité ou l’incertitude de vos données.

Un écart-type faible signifie que les données sont regroupées près de la moyenne, tandis qu’un écart-type élevé indique que les données sont plus étalées. C’est un outil fondamental en statistiques descriptives, utilisé aussi bien en science, en finance, qu’en intelligence artificielle.

Sur cette page, vous apprendrez comment calculer l’écart-type, comment l’interpréter dans divers contextes, et en quoi il diffère d’autres mesures de dispersion comme la variance ou l’intervalle interquartile.

Fonctions :

np.std()

Cette fonction de la bibliothèque NumPy permet de calculer l'écart type (standard deviation) des éléments d’un tableau. L’écart type mesure la dispersion des valeurs par rapport à la moyenne.

Importation :

import numpy as np

Attributs :

Nom	Type	Description
a	array_like	Tableau d'entrée contenant les données dont on veut l'écart type.
axis	int ou tuple d’int, optionnel	Axe ou axes le long desquels l’écart type est calculé. Par défaut, il est calculé sur l’ensemble du tableau.
dtype	data-type, optionnel	Type des données à utiliser pour le calcul. Permet d’éviter les erreurs de précision.
out	ndarray, optionnel	Emplacement où stocker le résultat. Doit avoir la même forme que la sortie attendue.
ddof	int, optionnel	Degré de liberté Delta : la valeur par défaut est 0. Pour un échantillon, on utilise souvent 1 (équivalent à diviser par N-1).
keepdims	bool, optionnel	Si True, les axes réduits sont conservés dans le résultat comme dimensions de taille un.

Exemple de code :

import numpy as np

data = np.array([1, 2, 3, 4, 5])
ecart_type_population = np.std(data)
ecart_type_echantillon = np.std(data, ddof=1)

print("Écart type (population) :", ecart_type_population)
print("Écart type (échantillon) :", ecart_type_echantillon)

Explication du code :

import numpy as np importe la bibliothèque numpy, renommée ici en np pour faciliter son utilisation dans le code.

Création d'un tableau de données

Le code crée un tableau data de dimension 1x5 à l'aide de np.array(). Ce tableau contient les éléments [1, 2, 3, 4, 5].

Calcul de l'écart type pour la population

La fonction np.std() calcule l'écart type des éléments d'un tableau. En appelant np.std(data), le code calcule l'écart type de tous les éléments du tableau data, en considérant qu'il s'agit d'une population entière (aucune correction pour les degrés de liberté).

Le résultat est assigné à la variable ecart_type_population et est ensuite affiché via print("Écart type (population) :", ecart_type_population).

Calcul de l'écart type pour un échantillon

En spécifiant ddof=1 dans l'appel de np.std(data, ddof=1), le code calcule l'écart type en ajustant les degrés de liberté pour un échantillon. Cela permet de diviser par n-1 au lieu de n, ce qui est couramment utilisé pour les échantillons afin de corriger le biais dans l'estimation de l'écart type de la population.

Le résultat est assigné à la variable ecart_type_echantillon et est ensuite affiché via print("Écart type (échantillon) :", ecart_type_echantillon).