Utiliser des conditions logiques avec query()
Fonctions :
-
query()
La fonction query() de Pandas permet d'effectuer des filtrages conditionnels sur un DataFrame de manière lisible et concise. Elle est très utile pour appliquer des conditions logiques complexes sans avoir à utiliser des syntaxes compliquées.
Importation :
import pandas as pd
Attributs :
Paramètre Description expr
Expression conditionnelle sous forme de chaîne de caractères. inplace
Si True
, modifie le DataFrame en place. Par défaut,False
.kwargs
Arguments supplémentaires qui peuvent être utilisés dans l'expression. Exemple de code :
import pandas as pd # Exemple de DataFrame data = { 'nom': ['Alice', 'Bob', 'Charlie', 'David'], 'âge': [24, 30, 35, 40], 'ville': ['Paris', 'Lyon', 'Marseille', 'Paris'] } df = pd.DataFrame(data) # Filtrage avec query() resultat = df.query('âge > 30 and ville == "Paris"') print(resultat)
Explication du code :
- DataFrame : Un DataFrame est créé avec des informations fictives sur des personnes (nom, âge, ville).
query()
: La méthodequery()
est utilisée pour filtrer les lignes où l'âge est supérieur à 30 et la ville est "Paris".- Le résultat affichera uniquement les lignes qui répondent à ces critères.
Remarque :
- L'expression dans
query()
peut être une combinaison d'opérateurs logiques commeand
,or
,not
. - La syntaxe de
query()
utilise des variables de manière implicite sans nécessiter de[]
, ce qui rend le code plus lisible.