Manipulation des séries temporelles
La gestion des données temporelles est essentielle pour analyser et prévoir des tendances dans les séries chronologiques. Cette section vous guide à travers les principales techniques de manipulation des séries temporelles avec pandas, vous permettant ainsi de décaler les données, appliquer des fenêtres glissantes et effectuer des regroupements temporels.
Ce que vous allez apprendre dans cette section :
-
Conversion en format
datetime
Apprenez à convertir vos colonnes de dates ou de chaînes de caractères en objetsdatetime
avec la fonctionpd.to_datetime()
. Cela vous permettra de manipuler facilement les dates et heures, et de bénéficier de toutes les fonctionnalités dédiées aux séries temporelles dans pandas. -
Indexer un DataFrame par une colonne de dates
Découvrez comment définir une colonne contenant des dates comme index de votre DataFrame. Cela permet de mieux organiser vos données temporelles et facilite l’accès aux données associées à des périodes spécifiques. -
Décalage des valeurs avec
shift()
Apprenez à utiliser la méthodeshift()
pour décaler les données sur une période donnée. Cela est utile pour comparer les valeurs d’un moment à celles de la période précédente ou suivante. -
Décalage avec
shift()
pour créer une différence temporelle
Utilisezshift()
pour créer une nouvelle colonne qui contient la différence temporelle entre les observations, par exemple, la variation des valeurs d’un jour à l’autre ou d’une heure à l’autre. -
Appliquer une fenêtre glissante avec
rolling()
Apprenez à utiliserrolling()
pour appliquer une fenêtre glissante sur vos données. Cette technique permet d’effectuer des calculs sur des sous-ensembles de données dans une fenêtre définie par un nombre d’observations ou une période temporelle. -
Fenêtre glissante avec des fonctions d’agrégation (moyenne, somme, etc.)
Découvrez comment appliquer des fonctions d’agrégation comme la moyenne, la somme, ou la médiane sur une fenêtre glissante pour lisser vos données temporelles ou en extraire des statistiques locales. -
Fenêtre glissante avec une taille variable (dynamique)
Explorez l’utilisation d’une taille dynamique pour les fenêtres glissantes. Vous pouvez ainsi ajuster la taille de la fenêtre en fonction de critères spécifiques, comme la date ou la saisonnalité des données. -
Appliquer une fonction personnalisée sur une fenêtre glissante avec
apply()
Apprenez à appliquer des fonctions personnalisées sur vos fenêtres glissantes en utilisantapply()
. Cela vous permet d’effectuer des transformations complexes qui ne sont pas directement disponibles via les fonctions d’agrégation standard. -
Utiliser des méthodes de resampling pour regrouper les données temporelles
Découvrez comment utiliser des techniques de resampling pour regrouper vos données temporelles à une fréquence différente, comme passer d’une fréquence horaire à quotidienne, hebdomadaire ou mensuelle. -
Gérer les valeurs manquantes avec des séries temporelles
Apprenez à gérer les valeurs manquantes dans vos séries temporelles. Vous verrez comment les traiter efficacement, soit par interpolation, soit par remplissage avec une valeur spécifique, afin de maintenir la cohérence et l’intégrité de vos analyses.
💡 Manipuler les séries temporelles, c’est comprendre l’évolution des données au fil du temps pour en dégager des tendances et des patterns significatifs.
Sous-sections du Chapitre
- Conversion en format datetime
- Indexer un DataFrame par une colonne de dates
- Décalage des valeurs avec shift()
- Décalage avec shift() pour créer une différence temporelle
- Appliquer une fenêtre glissante avec rolling()
- Fenêtre glissante avec des fonctions d’agrégation (moyenne, somme, etc.)
- Fenêtre glissante avec une taille variable (dynamique)
- Appliquer une fonction personnalisée sur une fenêtre glissante avec apply()
- Utiliser des méthodes de resampling pour regrouper les données temporelles
- Gérer les valeurs manquantes avec des séries temporelles