Scatter plots (scatter)

  • plt.scatter()

    La fonction plt.scatter() permet de créer un diagramme de dispersion (scatter plot), qui est un graphique utilisé pour afficher la relation entre deux variables. Chaque point du graphique représente une observation dans les données.

    Importation :
    import matplotlib.pyplot as plt
    Attributs :
    Paramètre Type Description Valeur par défaut
    x array-like Les coordonnées des points sur l’axe des x. None
    y array-like Les coordonnées des points sur l’axe des y. None
    s array-like ou scalar Taille des points. Peut être un scalaire (tous les points auront la même taille) ou une liste/array (chaque point aura une taille différente). 20
    c array-like / str Couleur des points. Peut être une couleur unique ou un tableau de valeurs (avec une correspondance de couleur via un colormap). 'b' (bleu)
    marker str Le style du marqueur (le symbole utilisé pour chaque point, par exemple ‘o’, ‘s’, ‘^’, etc.). 'o'
    alpha float Transparence des points, entre 0 (transparent) et 1 (opaque). 1.0
    Exemple de code :
    import matplotlib.pyplot as plt
    
    # Données à afficher
    x = [1, 2, 3, 4, 5]
    y = [10, 20, 25, 30, 40]
    
    # Création du graphique de dispersion
    plt.scatter(x, y, color='green', s=100, alpha=0.6, edgecolor='black')
    
    # Ajouter des labels et un titre
    plt.title("Exemple de graphique de dispersion")
    plt.xlabel("X")
    plt.ylabel("Y")
    
    # Afficher le graphique
    plt.show()
    Explication du code :

    La fonction plt.scatter() est utilisée pour créer un graphique de dispersion avec les coordonnées x et y des points. Ici, les points sont colorés en vert, leur taille est définie à 100 (avec s=100), et un effet de transparence est appliqué avec alpha=0.6. Les bords des points sont en noir grâce à edgecolor='black'.

    Remarques :

      • Utilisation de la couleur et de la taille : Vous pouvez ajuster la couleur des points avec le paramètre c et leur taille avec s. La couleur peut également être définie à partir d’un tableau de valeurs, et une palette de couleurs peut être utilisée pour une meilleure visualisation des différences.

      • Point de vue clair : scatter() est particulièrement utile pour observer des tendances ou des relations entre deux variables continues.

      • Optimisation pour la visualisation : Si vous avez des valeurs numériques dans x et y, le graphique peut aider à observer des tendances linéaires ou non linéaires dans vos données.