Afficher les premières lignes d’un DataFrame

La fonction head() de Pandas permet d’afficher les premières lignes d’un DataFrame, ce qui est utile pour avoir un aperçu rapide de la structure et des données qu’il contient. Par défaut, head() retourne les 5 premières lignes, mais il est possible de spécifier un autre nombre en passant un argument à la fonction (par exemple, head(10) pour afficher les 10 premières lignes). Cela permet d’explorer rapidement un jeu de données sans le charger entièrement, ce qui est particulièrement utile lors de l’inspection des grandes bases de données.

Fonctions :

  • pandas.head()

    La fonction head() permet d'afficher les premières lignes d'un DataFrame en pandas. Elle est souvent utilisée pour vérifier les premières données d'un DataFrame lors de l'exploration initiale.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Type Description Valeur par défaut
    n int, optionnel Le nombre de lignes à afficher. 5
    skiprows int, optionnel Le nombre de lignes à ignorer au début. None
    axis int ou None, optionnel Permet de spécifier l'axe sur lequel opérer. Utilisé pour les objets à plusieurs dimensions. None

    Exemple de code :

    import pandas as pd
    
    # Création d'un DataFrame exemple
    data = {
        'Nom': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
        'Âge': [24, 30, 35, 40, 22],
        'Ville': ['Paris', 'Lyon', 'Marseille', 'Nice', 'Bordeaux']
    }
    
    df = pd.DataFrame(data)
    
    # Afficher les 3 premières lignes
    print(df.head(3))
    Résultat du code

    Explication du code :

    import pandas as pd importe la bibliothèque pandas, qui permet de manipuler des données sous forme de DataFrame en Python.

    Création d'un DataFrame exemple

    Le dictionnaire data contient trois clés : 'Nom', 'Âge' et 'Ville', chacune associée à une liste de valeurs. Ces listes représentent les données de cinq personnes.

    df = pd.DataFrame(data) crée un DataFrame df à partir du dictionnaire data.

    Afficher les 3 premières lignes

    df.head(3) affiche les trois premières lignes du DataFrame df. Cela permet de visualiser rapidement un extrait des données.

    print(df.head(3)) affiche donc ces trois premières lignes dans la sortie.