Trier les valeurs par ordre décroissant
Dans l’analyse de données, trier les valeurs est une étape essentielle pour mettre en évidence les éléments les plus importants ou les plus extrêmes. Le tri par ordre décroissant permet de classer les données du plus grand au plus petit, que ce soit pour des valeurs numériques (comme des revenus, des scores ou des quantités) ou des données ordonnées. Cette opération facilite l’identification rapide des tendances, des anomalies ou des priorités dans un jeu de données.
Fonctions :
-
sort_values(by='colonne', ascending=False)
La méthode sort_values(by='colonne', ascending=False) permet de trier les valeurs d’une colonne spécifique dans un ordre décroissant. Ce tri est particulièrement utile lorsque vous souhaitez analyser les données en mettant en avant les plus grandes valeurs, comme les meilleurs scores, les plus grands revenus ou toute autre donnée importante en haut de la liste.
Importation :
import pandas as pd
Attributs :
Paramètre Description by
Le nom de la colonne sur laquelle effectuer le tri. ascending
Booléen qui définit l'ordre du tri : True
pour un tri ascendant (par défaut) etFalse
pour un tri descendant (ordre décroissant).inplace
Booléen qui permet de modifier le DataFrame en place. Si True
, le DataFrame est modifié sans création d’une nouvelle copie. Par défaut,False
.Exemple de code :
import pandas as pd # Exemple de DataFrame data = { 'nom': ['Alice', 'Bob', 'Charlie', 'David'], 'âge': [24, 30, 35, 40], 'score': [88, 92, 75, 85], 'ville': ['Paris', 'Lyon', 'Marseille', 'Paris'] } df = pd.DataFrame(data) # Trier les valeurs de la colonne 'âge' par ordre décroissant df_decroissant_age = df.sort_values(by='âge', ascending=False) print("DataFrame trié par âge (décroissant) :") print(df_decroissant_age) # Trier les valeurs de la colonne 'score' par ordre décroissant df_decroissant_score = df.sort_values(by='score', ascending=False) print("\nDataFrame trié par score (décroissant) :") print(df_decroissant_score) # Trier en place et modifier directement le DataFrame par ordre décroissant sur la colonne 'nom' df.sort_values(by='nom', ascending=False, inplace=True) print("\nDataFrame trié par nom (décroissant) en place :") print(df)
Explication du code :
import pandas as pd
importe la bibliothèque pandas, renommée ici enpd
, pour faciliter la manipulation de données tabulaires.Création d’un DataFrame
Le dictionnaire
data
contient les données de quatre colonnes :nom
,âge
,score
etville
. Ce dictionnaire est ensuite transformé en un DataFrame viapd.DataFrame(data)
, et assigné à la variabledf
.Trier par âge en ordre décroissant
La méthode
sort_values()
permet de trier le DataFrame selon une colonne spécifique. Le paramètreby='âge'
précise que le tri doit se faire selon la colonneâge
.ascending=False
indique que le tri doit être effectué dans l'ordre décroissant (du plus grand au plus petit).df_decroissant_age = df.sort_values(by='âge', ascending=False)
renvoie un nouveau DataFrame trié parâge
dans l'ordre décroissant, sans modifier l'original.Trier par score en ordre décroissant
De la même manière,
df.sort_values(by='score', ascending=False)
trie le DataFrame selon la colonnescore
dans l'ordre décroissant. Le résultat est assigné à la variabledf_decroissant_score
.Trier en place par nom en ordre décroissant
Le tri peut également être effectué en place, c'est-à-dire directement sur le DataFrame original. Cela est possible grâce au paramètre
inplace=True
.df.sort_values(by='nom', ascending=False, inplace=True)
trie le DataFramedf
selon la colonnenom
dans l'ordre décroissant, modifiant directement l'objet sans créer de nouveau DataFrame.