Filtrer des lignes selon une ou plusieurs conditions

Fonctions :

  • Filtrage avec conditions multiples

    Le filtrage de lignes avec une ou plusieurs conditions permet de sélectionner des sous-ensembles d'un DataFrame basé sur des critères spécifiques. Cela peut être fait à l'aide d'opérateurs logiques comme & (ET), | (OU) et ~ (NON), ainsi que des conditions sur les colonnes.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    condition Expression logique qui définit les lignes à conserver.
    inplace Si True, modifie le DataFrame en place. Par défaut, False.

    Exemple de code :

    import pandas as pd
    
    # Exemple de DataFrame
    data = {
        'nom': ['Alice', 'Bob', 'Charlie', 'David'],
        'âge': [24, 30, 35, 40],
        'ville': ['Paris', 'Lyon', 'Marseille', 'Paris'],
        'score': [88, 92, 75, 85]
    }
    df = pd.DataFrame(data)
    
    # Filtrage avec une seule condition
    resultat_1 = df[df['âge'] > 30]
    print("Filtrage sur âge > 30")
    print(resultat_1)
    
    # Filtrage avec plusieurs conditions
    resultat_2 = df[(df['âge'] > 30) & (df['score'] > 80)]
    print("\nFiltrage sur âge > 30 et score > 80")
    print(resultat_2)

    Explication du code :

    • DataFrame : Un DataFrame est créé avec des informations fictives (nom, âge, ville et score).
    • Filtrage avec une condition : La première opération de filtrage sélectionne les lignes où l'âge est supérieur à 30.
    • Filtrage avec plusieurs conditions : La seconde opération applique deux conditions, âge > 30 et score > 80, en utilisant l'opérateur logique & (ET). Il est essentiel d'entourer chaque condition entre parenthèses.
    • Les résultats affichent les sous-ensembles de données qui répondent aux conditions spécifiées.

    Remarque :

    • Utiliser les opérateurs logiques & (ET) et | (OU) entre les conditions. Assurez-vous de bien entourer chaque condition avec des parenthèses afin d'éviter des erreurs de priorité.
    • L'opérateur ~ est utilisé pour inverser une condition. Par exemple, ~df['ville'] == 'Paris' sélectionne les lignes où la ville n'est pas Paris.