Scatter plots

Les scatter plots ou nuages de points sont des graphiques indispensables pour explorer la relation entre deux variables numériques. Chaque point représente une observation avec ses coordonnées sur les axes x et y, ce qui permet de visualiser rapidement des tendances, corrélations, regroupements ou anomalies.

Ils sont particulièrement utiles en analyse exploratoire des données pour détecter des patterns linéaires ou non linéaires, évaluer la force d’une association, ou identifier des sous-groupes dans les données.

Matplotlib et Seaborn offrent des fonctions simples et puissantes pour créer des scatter plots, avec des options de personnalisation avancées telles que la couleur, la taille et la forme des points, afin d’ajouter des dimensions supplémentaires à la visualisation.

Cette section vous guidera dans la création, l’interprétation et la personnalisation des scatter plots pour améliorer la compréhension de vos données.

Fonctions :

  • plt.scatter()

    La fonction plt.scatter() permet de créer un diagramme de dispersion (scatter plot), qui est un graphique utilisé pour afficher la relation entre deux variables. Chaque point du graphique représente une observation dans les données.

    Importation :

    import matplotlib.pyplot as plt

    Attributs :

    Paramètre Type Description Valeur par défaut
    x array-like Les coordonnées des points sur l'axe des x. None
    y array-like Les coordonnées des points sur l'axe des y. None
    s array-like ou scalar Taille des points. Peut être un scalaire (tous les points auront la même taille) ou une liste/array (chaque point aura une taille différente). 20
    c array-like / str Couleur des points. Peut être une couleur unique ou un tableau de valeurs (avec une correspondance de couleur via un colormap). 'b' (bleu)
    marker str Le style du marqueur (le symbole utilisé pour chaque point, par exemple 'o', 's', '^', etc.). 'o'
    alpha float Transparence des points, entre 0 (transparent) et 1 (opaque). 1.0

    Exemple de code :

    import matplotlib.pyplot as plt
    
    # Données à afficher
    x = [1, 2, 3, 4, 5]
    y = [10, 20, 25, 30, 40]
    
    # Création du graphique de dispersion
    plt.scatter(x, y, color='green', s=100, alpha=0.6, edgecolor='black')
    
    # Ajouter des labels et un titre
    plt.title("Exemple de graphique de dispersion")
    plt.xlabel("X")
    plt.ylabel("Y")
    
    # Afficher le graphique
    plt.show()
    Résultat du code