Charger des fichiers géospatiaux avec gpd.read_file() 

En science des données géospatiales, la première étape d’une analyse consiste souvent à charger des fichiers contenant des données géographiques. La bibliothèque GeoPandas, extension de Pandas dédiée aux données spatiales, fournit une méthode simple et puissante pour cette tâche : gpd.read_file().

Cette fonction permet de lire directement une grande variété de formats géospatiaux courants, comme :

Le fichier chargé est automatiquement converti en un objet GeoDataFrame, une structure de données qui combine les capacités d’un DataFrame de Pandas avec des colonnes géométriques (points, lignes, polygones). Cela permet d’accéder facilement à des opérations géospatiales complexes comme les jointures spatiales, les découpages de zones, ou les projections cartographiques.

Utiliser gpd.read_file() constitue donc une passerelle simple et efficace pour intégrer des données géographiques dans un pipeline d’analyse ou de visualisation cartographique.

Fonctions :

  • gpd.read_file()

    gpd.read_file() permet de lire un fichier contenant des données géospatiales (comme des fichiers Shapefile, GeoJSON, KML, etc.) et de les charger dans un GeoDataFrame GeoPandas, un tableau de données enrichi de géométrie spatiale.

    Importation :

    import geopandas as gpd

    Attributs :

    Paramètre Type Description Valeur par défaut
    filename str Chemin vers le fichier géospatial à lire (ex: .shp, .geojson). Obligatoire
    bbox tuple ou list Filtrer les géométries dans une boîte englobante (xmin, ymin, xmax, ymax). None
    mask GeoDataFrame ou GeoSeries Filtrer les géométries qui intersectent cette zone. None
    rows slice, list ou None Sous-ensemble des lignes à charger. None
    ignore_geometry bool Si True, ne charge que les attributs non géométriques (pas la colonne géométrie). False
    crs str ou CRS Projeter les données à la lecture dans ce système de coordonnées. None

    Exemple de code :

    import geopandas as gpd
    
    # Chargement d'un fichier Shapefile dans un GeoDataFrame
    gdf = gpd.read_file("data.shp")
    
    # Affichage des 5 premières lignes du GeoDataFrame
    print(gdf.head())
    Résultat du code

    Explication du code :

    importe la bibliothèque GeoPandas.
    
    
    Lecture du fichier géospatial
    `gpd.read_file("data/communes.shp")` lit un fichier shapefile contenant des données géographiques (ici, des communes). Le résultat est stocké dans un GeoDataFrame `gdf`.
    Affichage
    `print(gdf.head())` affiche les 5 premières lignes du GeoDataFrame, montrant les colonnes attributaires ainsi que la colonne de géométrie.