Utiliser des conditions logiques avec query()

Fonctions :

  • query()

    La fonction query() de Pandas permet d'effectuer des filtrages conditionnels sur un DataFrame de manière lisible et concise. Elle est très utile pour appliquer des conditions logiques complexes sans avoir à utiliser des syntaxes compliquées.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    expr Expression conditionnelle sous forme de chaîne de caractères.
    inplace Si True, modifie le DataFrame en place. Par défaut, False.
    kwargs Arguments supplémentaires qui peuvent être utilisés dans l'expression.

    Exemple de code :

    import pandas as pd
    
    # Exemple de DataFrame
    data = {
        'nom': ['Alice', 'Bob', 'Charlie', 'David'],
        'âge': [24, 30, 35, 40],
        'ville': ['Paris', 'Lyon', 'Marseille', 'Paris']
    }
    df = pd.DataFrame(data)
    
    # Filtrage avec query()
    resultat = df.query('âge > 30 and ville == "Paris"')
    print(resultat)

    Explication du code :

    • DataFrame : Un DataFrame est créé avec des informations fictives sur des personnes (nom, âge, ville).
    • query() : La méthode query() est utilisée pour filtrer les lignes où l'âge est supérieur à 30 et la ville est "Paris".
    • Le résultat affichera uniquement les lignes qui répondent à ces critères.

    Remarque :

    • L'expression dans query() peut être une combinaison d'opérateurs logiques comme and, or, not.
    • La syntaxe de query() utilise des variables de manière implicite sans nécessiter de [], ce qui rend le code plus lisible.