Enregistrement d’objets Python
La sérialisation d’objets en Python consiste à convertir des objets en un format qui peut être facilement stocké sur disque ou transmis à travers un réseau. Cela permet de sauvegarder des objets complexes, comme des modèles de machine learning ou des résultats d’analyse, et de les recharger ultérieurement. Dans cette section, nous allons explorer deux des bibliothèques les plus courantes pour la sérialisation : pickle et joblib.
Ce que vous allez apprendre dans cette section :
Introduction à la sérialisation d’objets Python
Apprenez à sérialiser des objets Python pour les enregistrer ou les transmettre, en particulier pour les modèles de machine learning ou les objets complexes entre différents environnements Python.
Enregistrer un objet avec pickle
Découvrez comment utiliser pickle.dump()
pour sérialiser et enregistrer des objets Python dans un fichier binaire.
Charger un objet avec pickle
Apprenez à restaurer un objet sérialisé en utilisant pickle.load()
afin de le recharger et l’utiliser à nouveau.
Protéger contre l’exécution de code malveillant lors de l’utilisation de pickle
Découvrez comment éviter les risques d’exécution de code malveillant lors de la désérialisation d’objets avec pickle, notamment en ne chargeant que des objets provenant de sources sûres.
Utiliser joblib pour la sérialisation efficace de grands objets
Apprenez à sérialiser efficacement des objets volumineux, comme des modèles de machine learning, avec joblib, un outil optimisé pour ce type d’objets.
Charger un objet avec joblib
Découvrez comment recharger un objet sérialisé avec joblib.load()
, une méthode optimisée pour les objets volumineux.
Comparaison entre pickle et joblib
Comparez pickle
et joblib
, et apprenez dans quels cas utiliser l’un ou l’autre selon le type et la taille des objets à sérialiser.
Sérialisation d’objets personnalisés avec pickle
Apprenez à sérialiser des objets Python personnalisés (comme des classes définies par l’utilisateur) avec pickle, en vous assurant que tous les attributs et méthodes de l’objet sont correctement enregistrés.
Utilisation de joblib pour la compression de fichiers lors de l’enregistrement
Découvrez comment utiliser joblib pour compresser des fichiers sérialisés et économiser de l’espace disque lors de l’enregistrement d’objets.
Enregistrement et chargement de modèles de machine learning avec joblib
Apprenez à enregistrer et recharger des modèles de machine learning avec joblib, un outil essentiel pour gérer des modèles scikit-learn et les partager efficacement.
💡 Sérialiser et stocker vos objets Python avec pickle
ou joblib
vous permet de gagner du temps en évitant de recalculer ou de reconstruire vos objets et modèles. Cela améliore l’efficacité de vos workflows de données et de machine learning.