Afficher les premières lignes d’un DataFrame (head())

La fonction head() de Pandas permet d’afficher les premières lignes d’un DataFrame, ce qui est utile pour avoir un aperçu rapide de la structure et des données qu’il contient. Par défaut, head() retourne les 5 premières lignes, mais il est possible de spécifier un autre nombre en passant un argument à la fonction (par exemple, head(10) pour afficher les 10 premières lignes). Cela permet d’explorer rapidement un jeu de données sans le charger entièrement, ce qui est particulièrement utile lors de l’inspection des grandes bases de données.

Fonctions :

  • pandas.head()

    La fonction head() permet d'afficher les premières lignes d'un DataFrame en pandas. Elle est souvent utilisée pour vérifier les premières données d'un DataFrame lors de l'exploration initiale.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Type Description Valeur par défaut
    n int, optionnel Le nombre de lignes à afficher. 5
    skiprows int, optionnel Le nombre de lignes à ignorer au début. None
    axis int ou None, optionnel Permet de spécifier l'axe sur lequel opérer. Utilisé pour les objets à plusieurs dimensions. None

    Exemple de code :

    import pandas as pd
    
    # Création d'un DataFrame exemple
    data = {
        'Nom': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
        'Âge': [24, 30, 35, 40, 22],
        'Ville': ['Paris', 'Lyon', 'Marseille', 'Nice', 'Bordeaux']
    }
    
    df = pd.DataFrame(data)
    
    # Afficher les 3 premières lignes
    print(df.head(3))

    Explication du code :

    • Un DataFrame est créé à partir d'un dictionnaire avec des colonnes Nom, Âge, et Ville.
    • La fonction head(3) est utilisée pour afficher les trois premières lignes du DataFrame df.
    • L'argument 3 dans head(3) spécifie que nous voulons voir les trois premières lignes. Par défaut, si l'argument est omis, pandas affichera les 5 premières lignes.