Filtrer selon des conditions logiques sur les lignes (df.loc[df['column'] > value])

Fonctions :

  • Filtrage logique avec loc[]

    La méthode loc[] permet de filtrer les lignes d'un DataFrame en fonction d'une condition logique appliquée à une colonne spécifique. Cela est particulièrement utile pour extraire des sous-ensembles de données qui respectent un critère donné, comme des valeurs supérieures ou inférieures à un certain seuil.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    row_label L'étiquette de la ligne à sélectionner. Peut être une valeur unique, un intervalle, ou une liste d'étiquettes.
    column_label L'étiquette de la ou des colonnes à sélectionner. Peut être une valeur unique ou une liste d'étiquettes.

    Exemple de code :

    import pandas as pd
    
    # Exemple de DataFrame
    data = {
        'nom': ['Alice', 'Bob', 'Charlie', 'David'],
        'âge': [24, 30, 35, 40],
        'score': [88, 92, 75, 85],
        'ville': ['Paris', 'Lyon', 'Marseille', 'Paris']
    }
    df = pd.DataFrame(data)
    
    # Filtrer les lignes où la colonne 'âge' est supérieure à 30
    resultat_1 = df.loc[df['âge'] > 30]
    print("Lignes où l'âge est supérieur à 30 :")
    print(resultat_1)
    
    # Filtrer les lignes où la colonne 'score' est inférieure à 85
    resultat_2 = df.loc[df['score'] < 85]
    print("\nLignes où le score est inférieur à 85 :")
    print(resultat_2)

    Explication du code :

    • DataFrame : Un DataFrame est créé avec des informations fictives (nom, âge, score, ville).
    • Filtrage avec loc[] :
      • La première opération filtre les lignes où la colonne 'âge' est supérieure à 30, en utilisant la condition df['âge'] > 30.
      • La deuxième opération filtre les lignes où la colonne 'score' est inférieure à 85, avec la condition df['score'] < 85.
    • Résultat : Le DataFrame retourné contient les sous-ensembles de données qui satisfont les conditions respectives.

    Remarque :

    • Conditions multiples : Il est possible de combiner plusieurs conditions logiques dans loc[] en utilisant les opérateurs & (ET), | (OU) et ~ (NON).
    • Attention aux parenthèses : Lorsque vous combinez des conditions, assurez-vous d'utiliser des parenthèses pour éviter des erreurs de priorité.