Utiliser des conditions logiques avec query()
L’analyse de données implique souvent de filtrer les lignes d’un tableau en fonction de conditions précises. La méthode query()
permet d’exprimer ces conditions logiques de manière plus lisible et naturelle, en utilisant une syntaxe proche du langage humain. Elle est particulièrement utile pour enchaîner plusieurs critères de filtrage de façon fluide, tout en rendant le code plus clair et plus facile à maintenir, notamment dans le cadre d’analyses complexes ou de projets collaboratifs.
Fonctions :
-
query()
La fonction query() de Pandas permet d'effectuer des filtrages conditionnels sur un DataFrame de manière lisible et concise. Elle est très utile pour appliquer des conditions logiques complexes sans avoir à utiliser des syntaxes compliquées.
Importation :
import pandas as pd
Attributs :
Paramètre Description expr
Expression conditionnelle sous forme de chaîne de caractères. inplace
Si True
, modifie le DataFrame en place. Par défaut,False
.kwargs
Arguments supplémentaires qui peuvent être utilisés dans l'expression. Exemple de code :
import pandas as pd # Exemple de DataFrame data = { 'nom': ['Alice', 'Bob', 'Charlie', 'David'], 'âge': [24, 30, 35, 40], 'ville': ['Paris', 'Lyon', 'Marseille', 'Paris'] } df = pd.DataFrame(data) # Filtrage avec query() resultat = df.query('âge > 30 and ville == "Paris"') print(resultat)
Explication du code :
- DataFrame : Un DataFrame est créé avec des informations fictives sur des personnes (nom, âge, ville).
query()
: La méthodequery()
est utilisée pour filtrer les lignes où l'âge est supérieur à 30 et la ville est "Paris".- Le résultat affichera uniquement les lignes qui répondent à ces critères.
Remarque :
- L'expression dans
query()
peut être une combinaison d'opérateurs logiques commeand
,or
,not
. - La syntaxe de
query()
utilise des variables de manière implicite sans nécessiter de[]
, ce qui rend le code plus lisible.