Charger des fichiers géospatiaux avec gpd.read_file()
En science des données géospatiales, la première étape d’une analyse consiste souvent à charger des fichiers contenant des données géographiques. La bibliothèque GeoPandas, extension de Pandas dédiée aux données spatiales, fournit une méthode simple et puissante pour cette tâche : gpd.read_file()
.
Cette fonction permet de lire directement une grande variété de formats géospatiaux courants, comme :
- Shapefile (.shp)
- GeoJSON (.geojson)
- KML, GPKG, TopoJSON, etc.
Le fichier chargé est automatiquement converti en un objet GeoDataFrame
, une structure de données qui combine les capacités d’un DataFrame de Pandas avec des colonnes géométriques (points, lignes, polygones). Cela permet d’accéder facilement à des opérations géospatiales complexes comme les jointures spatiales, les découpages de zones, ou les projections cartographiques.
Utiliser gpd.read_file()
constitue donc une passerelle simple et efficace pour intégrer des données géographiques dans un pipeline d’analyse ou de visualisation cartographique.
Fonctions :
-
gpd.read_file()
gpd.read_file() permet de lire un fichier contenant des données géospatiales (comme des fichiers Shapefile, GeoJSON, KML, etc.) et de les charger dans un GeoDataFrame GeoPandas, un tableau de données enrichi de géométrie spatiale.
Importation :
import geopandas as gpd
Attributs :
Paramètre Type Description Valeur par défaut filename
str Chemin vers le fichier géospatial à lire (ex: .shp, .geojson). Obligatoire bbox
tuple ou list Filtrer les géométries dans une boîte englobante (xmin, ymin, xmax, ymax). None
mask
GeoDataFrame ou GeoSeries Filtrer les géométries qui intersectent cette zone. None
rows
slice, list ou None Sous-ensemble des lignes à charger. None
ignore_geometry
bool Si True
, ne charge que les attributs non géométriques (pas la colonne géométrie).False
crs
str ou CRS Projeter les données à la lecture dans ce système de coordonnées. None
Exemple de code :
import geopandas as gpd # Chargement d'un fichier Shapefile dans un GeoDataFrame gdf = gpd.read_file("data.shp") # Affichage des 5 premières lignes du GeoDataFrame print(gdf.head())
Explication du code :
importe la bibliothèque GeoPandas.
Lecture du fichier géospatial
`gpd.read_file("data/communes.shp")` lit un fichier shapefile contenant des données géographiques (ici, des communes). Le résultat est stocké dans un GeoDataFrame `gdf`.Affichage
`print(gdf.head())` affiche les 5 premières lignes du GeoDataFrame, montrant les colonnes attributaires ainsi que la colonne de géométrie.