Filtrer des lignes selon une ou plusieurs conditions
Fonctions :
-
Filtrage avec conditions multiples
Le filtrage de lignes avec une ou plusieurs conditions permet de sélectionner des sous-ensembles d'un DataFrame basé sur des critères spécifiques. Cela peut être fait à l'aide d'opérateurs logiques comme & (ET), | (OU) et ~ (NON), ainsi que des conditions sur les colonnes.
Importation :
import pandas as pd
Attributs :
Paramètre Description condition
Expression logique qui définit les lignes à conserver. inplace
Si True
, modifie le DataFrame en place. Par défaut,False
.Exemple de code :
import pandas as pd # Exemple de DataFrame data = { 'nom': ['Alice', 'Bob', 'Charlie', 'David'], 'âge': [24, 30, 35, 40], 'ville': ['Paris', 'Lyon', 'Marseille', 'Paris'], 'score': [88, 92, 75, 85] } df = pd.DataFrame(data) # Filtrage avec une seule condition resultat_1 = df[df['âge'] > 30] print("Filtrage sur âge > 30") print(resultat_1) # Filtrage avec plusieurs conditions resultat_2 = df[(df['âge'] > 30) & (df['score'] > 80)] print("\nFiltrage sur âge > 30 et score > 80") print(resultat_2)
Explication du code :
- DataFrame : Un DataFrame est créé avec des informations fictives (nom, âge, ville et score).
- Filtrage avec une condition : La première opération de filtrage sélectionne les lignes où l'âge est supérieur à 30.
- Filtrage avec plusieurs conditions : La seconde opération applique deux conditions,
âge > 30
etscore > 80
, en utilisant l'opérateur logique&
(ET). Il est essentiel d'entourer chaque condition entre parenthèses. - Les résultats affichent les sous-ensembles de données qui répondent aux conditions spécifiées.
Remarque :
- Utiliser les opérateurs logiques
&
(ET) et|
(OU) entre les conditions. Assurez-vous de bien entourer chaque condition avec des parenthèses afin d'éviter des erreurs de priorité. - L'opérateur
~
est utilisé pour inverser une condition. Par exemple,~df['ville'] == 'Paris'
sélectionne les lignes où la ville n'est pas Paris.