Accéder aux groupes individuellement
La méthode get_group() vous permet d’accéder directement à un groupe spécifique dans un objet groupby. En passant la valeur de la clé du groupe comme argument, vous pouvez récupérer le sous-DataFrame correspondant à ce groupe. Cette approche est pratique lorsque vous souhaitez travailler avec un groupe particulier après avoir effectué un regroupement.
Fonctions :
-
groupby('colonne').get_group(valeur)
La méthode get_group(valeur) permet d'accéder à un groupe spécifique après avoir effectué un regroupement avec groupby(). En spécifiant la valeur d'une des colonnes utilisées pour le regroupement, vous pouvez obtenir un DataFrame contenant uniquement les lignes qui correspondent à cette valeur de groupe.
Importation :
import pandas as pd
Attributs :
Paramètre Type Description Valeur par défaut groupby()
function Méthode pour regrouper les données par une ou plusieurs colonnes. None
get_group()
function Méthode pour accéder à un groupe spécifique en fonction de la valeur d'une colonne utilisée pour le regroupement. None
Exemple de code :
import pandas as pd # Exemple de DataFrame data = { 'nom': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'], 'ville': ['Paris', 'Lyon', 'Paris', 'Lyon', 'Paris'], 'âge': [24, 30, 35, 30, 24], 'score': [88, 92, 75, 85, 95] } df = pd.DataFrame(data) # Regrouper par 'ville' et obtenir le groupe spécifique pour 'Paris' grouped = df.groupby('ville') # Accéder au groupe correspondant à 'Paris' paris_group = grouped.get_group('Paris') print("Groupe pour la ville 'Paris' :") print(paris_group)
Explication du code :
import pandas as pd
importe la bibliothèque pandas, renommée ici enpd
pour simplifier son utilisation dans le code.Exemple de DataFrame
Le dictionnaire
data
contient quatre clés :'nom'
,'ville'
,'âge'
, et'score'
, chacune associée à une liste de valeurs. Ce dictionnaire est utilisé pour créer un DataFramedf
.Regrouper par 'ville' et obtenir le groupe spécifique pour 'Paris'
La méthode
groupby('ville')
permet de regrouper les lignes du DataFrame en fonction de la colonne'ville'
. Cela crée un objet GroupBy qui permet d'appliquer des opérations sur chaque groupe (ici chaque ville).La méthode
get_group('Paris')
permet ensuite d'accéder directement au groupe correspondant à la ville 'Paris'. Cela renvoie un sous-DataFrame contenant uniquement les lignes où la ville est 'Paris'. Ce sous-DataFrame est assigné à la variableparis_group
.Enfin,
print(paris_group)
affiche le groupe des lignes correspondant à la ville 'Paris', montrant les informations pour Alice, Charlie et Eve.