Trier les valeurs par ordre décroissant

Dans l’analyse de données, trier les valeurs est une étape essentielle pour mettre en évidence les éléments les plus importants ou les plus extrêmes. Le tri par ordre décroissant permet de classer les données du plus grand au plus petit, que ce soit pour des valeurs numériques (comme des revenus, des scores ou des quantités) ou des données ordonnées. Cette opération facilite l’identification rapide des tendances, des anomalies ou des priorités dans un jeu de données.

Fonctions :

  • sort_values(by='colonne', ascending=False)

    La méthode sort_values(by='colonne', ascending=False) permet de trier les valeurs d’une colonne spécifique dans un ordre décroissant. Ce tri est particulièrement utile lorsque vous souhaitez analyser les données en mettant en avant les plus grandes valeurs, comme les meilleurs scores, les plus grands revenus ou toute autre donnée importante en haut de la liste.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    by Le nom de la colonne sur laquelle effectuer le tri.
    ascending Booléen qui définit l'ordre du tri : True pour un tri ascendant (par défaut) et False pour un tri descendant (ordre décroissant).
    inplace Booléen qui permet de modifier le DataFrame en place. Si True, le DataFrame est modifié sans création d’une nouvelle copie. Par défaut, False.

    Exemple de code :

    import pandas as pd
    
    # Exemple de DataFrame
    data = {
        'nom': ['Alice', 'Bob', 'Charlie', 'David'],
        'âge': [24, 30, 35, 40],
        'score': [88, 92, 75, 85],
        'ville': ['Paris', 'Lyon', 'Marseille', 'Paris']
    }
    df = pd.DataFrame(data)
    
    # Trier les valeurs de la colonne 'âge' par ordre décroissant
    df_decroissant_age = df.sort_values(by='âge', ascending=False)
    print("DataFrame trié par âge (décroissant) :")
    print(df_decroissant_age)
    
    # Trier les valeurs de la colonne 'score' par ordre décroissant
    df_decroissant_score = df.sort_values(by='score', ascending=False)
    print("\nDataFrame trié par score (décroissant) :")
    print(df_decroissant_score)
    
    # Trier en place et modifier directement le DataFrame par ordre décroissant sur la colonne 'nom'
    df.sort_values(by='nom', ascending=False, inplace=True)
    print("\nDataFrame trié par nom (décroissant) en place :")
    print(df)
    Résultat du code

    Explication du code :

    import pandas as pd importe la bibliothèque pandas, renommée ici en pd, pour faciliter la manipulation de données tabulaires.

    Création d’un DataFrame

    Le dictionnaire data contient les données de quatre colonnes : nom, âge, score et ville. Ce dictionnaire est ensuite transformé en un DataFrame via pd.DataFrame(data), et assigné à la variable df.

    Trier par âge en ordre décroissant

    La méthode sort_values() permet de trier le DataFrame selon une colonne spécifique. Le paramètre by='âge' précise que le tri doit se faire selon la colonne âge.

    ascending=False indique que le tri doit être effectué dans l'ordre décroissant (du plus grand au plus petit).

    df_decroissant_age = df.sort_values(by='âge', ascending=False) renvoie un nouveau DataFrame trié par âge dans l'ordre décroissant, sans modifier l'original.

    Trier par score en ordre décroissant

    De la même manière, df.sort_values(by='score', ascending=False) trie le DataFrame selon la colonne score dans l'ordre décroissant. Le résultat est assigné à la variable df_decroissant_score.

    Trier en place par nom en ordre décroissant

    Le tri peut également être effectué en place, c'est-à-dire directement sur le DataFrame original. Cela est possible grâce au paramètre inplace=True.

    df.sort_values(by='nom', ascending=False, inplace=True) trie le DataFrame df selon la colonne nom dans l'ordre décroissant, modifiant directement l'objet sans créer de nouveau DataFrame.