Votre navigateur ne supporte pas impress.js, cette présentation a donc été simplifiée.

Pour une meilleure expérience, utilisez un navigateur Chrome, Safari ou Firefox à jour.

Thomas GRANDJEAN, Nordine FRIKHA
Service IDDÉE, DREAL Hauts-de-France
Webinaire connaissance (06/10/2023)

# Webinaire données # Systèmes d'information géographiques ## Expériences en DREAL Hauts-de-France

Plan

1. Notions (pas si) théoriques 2. Organisation pratique 3. Organisation de la DREAL Hauts-de-France avec une solution numérique transverse : SIGNE 4. Ouvrons le capot : cas pratiques

Notions théoriques

Un peu de vocabulaire pour commencer

 Detail in a digital elevation model (DEM) of the Mt. Everest region

Source : Eyes Roger & NSIDC, via Wikimedia licence CC Attribution-2.0 generic [🔗](https://commons.wikimedia.org/wiki/File:Digital_elevation_model_(DEM)_of_Mt._Everest_region_-_50090950171.png)

**La géomatique, ce n'est pas _(que)_ de la cartographie !** > La géomatique regroupe l’ensemble des connaissances et des technologies nécessaires à la production, au traitement et à la diffusion des données numériques (souvent massives, 3D et en temps réel) décrivant le territoire, ses ressources ou tout autre objet ou phénomène ayant une position géographique. > Qu'est-ce que la géomatique? Ses racines sont "Géo", qui veut dire Terre, et "matique" vient de informatique , soit le traitement automatique de l’information géographique. > Méconnue du grand public, la géomatique est pourtant de plus en plus présente dans plusieurs de nos activités quotidiennes. Quatre-vingt pourcent des données ont une position sur la Terre : imaginez les possibilités! Université de Laval, Faculté de foresterie, de géographie et de géomatique, [en ligne 🔗](https://www.scg.ulaval.ca/la-geomatique-cest-quoi)

Vous avez dit SIG ?

Analisi territoriale assistita da GIS

Source : Daniele Masi, via Wikimedia licence CC Attribution-Share alike 4.0 international [🔗](https://commons.wikimedia.org/wiki/File:Gis.jpg)

**SIG = Système d'Information Géographique** > Le SIG est un domaine relativement nouveau, qui est apparu dans les années 1970. Le SIG, utilisant l’informatique, > n’était disponible et utilisé que par des entreprises et des universités qui avait un équipement informatique qui coutait > cher. De nos jours, quelqu’un ayant un ordinateur individuel ou un ordinateur portable peut utiliser un logiciel SIG. > Au fil du temps, les applications SIG sont aussi devenues plus faciles à utiliser — cela exigeait beaucoup de formation > pour utiliser une application SIG, mais maintenant il est beaucoup plus facile de commencer à utiliser un SIG, même > pour des amateurs et des utilisateurs occasionnels. Gentle GIS Introduction (QGIS Project, v.3.28), [en ligne 🔗](https://docs.qgis.org/3.28/pdf/fr/QGIS-3.28-GentleGISIntroduction-fr.pdf) On parle donc de SIG (système d'information géographique), de logiciel SIG, de SIG-iste (géomaticien en bon Français).

Les métiers traditionnels

le géomaticien

C'est lui qui traite les données ; il transforme la donnée et se charge de la visualisation. Il produit des couches de données (digitalisation, traitement SIG, etc.), des cartes statiques (images) ou dynamiques (PDF, web) et parfois des packages QGIS. En pratique, il doit aujourd'hui connaître les données métier et savoir où trouver la donnée pour être force de proposition.

l'administrateur des données locales

Il se charge de centraliser les données locales sur un serveur commun et d'acquérir les données de référence auprès des producteurs de données. Il est le garant de la qualité des données (nettoyage des géométries, etc.). C'est aussi lui qui assure la diffusion des données géographiques (en lien avec la géoplateforme régionale).

Les outils métiers

**La géomatique utilise des outils métiers qui peuvent être très pointus, mais aussi très abordables (pour certains).**
Copie d'écran QGIS

Copie d'écran QGIS

* outils sous licence : ArcGis, MapInfo... * écosystème libre : QGis (et toute la suite : SAGA, GRASS,...), Google Earth... * des langages de programmation : Python, R, javascript * du web (avec une pléthore de librairies javascript dédiées à la cartographie en ligne) Pour aller plus loin, on trouve des benchmarks [en ligne 🔗](https://gisgeography.com/best-gis-software/), pour l'essentiel en anglais 🇬🇧 (comme souvent dans le domaine du libre). Aujourd'hui, la plupart des géomaticiens du pôle ministériel travaillent certainement sur des outils libres. Chaque outil a sa spécificité ; on choisit l'outil en fonction de l'usage (cartographie, digitalisation, modélisation de terrain ou de processus) et du format des données (vecteur ou raster).

Encore une notion théorique, celle de projection

Projection de Fuller

Source : Sting, via Wikimedia licence CC Attribution-Share alike 2.5 Generic [🔗](https://commons.wikimedia.org/wiki/File:Fuller_projection.svg)

Chaque couche de donnée géographique est établie dans un **système de coordonnées**. La projection officielle en France métropolitaine est le **Lambert 93**, mais de nombreuses autres projections existent (par exemple, ce n'est pas la référence pour les DOM/TOM). Plus d'une trentaine sont référencés [sur wikipedia 🔗](https://fr.wikipedia.org/wiki/Système_de_coordonnées_(cartographie)#Systèmes_de_coordonnées_géographiques_fréquemment_utilisés) pour la France métropolitaine. Plus de documentation technique sur les projections françaises sur [ce document 🔗](https://geodesie.ign.fr/contenu/fichiers/projections_cartographiques.pdf) de l'IGN. Toutes les projections ne s'expriment pas en mètres (incidences sur les arrondis, les calculs de distance, d'aire...) et la plupart des algorithmes spaciaux nécessitent une projection uniforme. Dans le jargon, on utilise souvent le code "EPSG" _(European Petroleum Survey Group)_ pour identifier un système de projection, mais tous les systèmes de projection n'ont pas un code EPSG.

Vecteur ou raster ?

graph showing differences in vector and raster files using tikz

Source : Wegmann, via Wikimedia licence CC Attribution-Share alike 3.0 [🔗](https://commons.wikimedia.org/wiki/File:Raster_vector_tikz.png)

Ce sont deux concepts différents de représentation d'une même donnée en deux dimensions : * Raster = matrice de pixels, nombre variable de "bandes" * Vecteur : des géométries point, lignes ou polygones (et des données tabulaires associées) _Nota : ce n'est pas un sujet limité à la cartographie (on a exactement le même sujet en dessin). Des ressources supplémentaires [en ligne 🔗](https://naturagis.fr/cartographie-sig/difference-vecteur-raster/)_
# Que peut faire une équipe SIG d'un format vecteur ? * Opérations géométriques unitaires : calcul d'aire, de longueur, ou de distances, calcul de centroïde, triangulation de Delaunay, enveloppe concaves ou convexes, rotations, transformations affines * Opérations géométriques binaires (liste extensive des [commandes geopandas 🔗](https://geopandas.org/en/stable/docs/reference/geoseries.html#binary-predicates), en anglais) : _contains, crosses, disjoint, geom\_equals, geom\_almost\_equals, geom\_equals\_exact, intersects, overlaps, touches, within, covers, covered\_by_ * Opérations spatiales ensemblistes : intersection, différence, différence symétrique, union, ... * Opérations de bases de données : union (sur la base d'un champ), explosion * Intelligence artificielle : clustering, etc.
Voire le frelon ? https://www.thomasgrandjean.fr/media/tutorial/media/1/frelon_examen.jpg https://www.thomasgrandjean.fr/media/tutorial/media/1/frelon_complet_20k.jpg

Exemple de cas d'usage

Trouver les ilots culturaux à moins de 5 mètres d'un cours d'eau "BCAE"

Description d'une sélection de géométries par requête spatiale et tampon

Sélection de parcelles par requête spatiale et tampon

1. récupérer les jeux de données BCAE et PAC 2. joindre la couche des cours d'eau BCAE à une donnée de référence (BD Topage, tronçons hydrographiques) par jointure relationnelle et/ou spatiale 3. s'assurer que la couche obtenue des cours d'eau BCAE est dans un système de projection exprimé en mètres 4. donner une épaisseur au cours d'eau (à partir des classes de largeur définies par la BD Topage) en effectuant un tampon pour obtenir des "polygones hydrographiques" 5. effectuer un tampon des "polygones hydrographiques" (5 mètres) 6. s'assurer de l'unicité du système de projection entre les polygones et les ilots culturaux 7. effectuer une jointure spatiale entre ilots culturaux et le tampon des polygones **[Autre exemple 🔗](https://www.thomasgrandjean.fr/portfolio/tutoriel/1/)** avec un projet personnel exploratoire impliquant un peu d'IA : analyse du front d'expansion du frelon asiatique en France.

Que peut faire une équipe SIG d'un format raster ?

Carte illustrant le risque de coulées de boues

Source : DREAL Hauts-de-France, utilisation d'une couche raster comme fonds de plan atypique pour illustrer le risque de coulées de boues

* Fond de plan (3 ou 4 "bandes" : Red Green Blue Alpha) et ombrages (modèle numérique de terrain) * Données numériques servant de couches d'entrée pour une modélisation physique : * Hydrographie : calcul de bassins versants à partir d'un "modèle numérique de terrain" * Pluviométrie : calcul d'une lame d'eau sur une superficie à partir d'images radar * Feux de forêt : modélisation du risque d'incendie (couches d'occupation du sol en herbacées, en forêt, modèle numérique de terrain, vitesse du vent...) * Image satellitaire et usage émergent en intelligence artificielle : détection de zones inondées, pilotage de la politique de l'eau (humidité des sols : agriculture, aléa argiles...), droit des sols (ex. [détection des piscines 🔗](https://www.impots.gouv.fr/actualite/generalisation-du-foncier-innovant)), occupation et usage des sols, base de données nationale des bâtiments [par le CSTB 🔗](https://www.data.gouv.fr/fr/datasets/base-de-donnees-nationale-des-batiments/)...

Exemple de cas d'usage

Utiliser les modèles numériques de terrain pour identifier une erreur dans le découpage des masses d'eau

Identification des thalwegs sur le bassin versant de la Liane

Identification des thalwegs sur le bassin versant de la Liane

1. récupérer les modèles de terrain de l'IGN 2. récupération du découpage (vecteur) du bassin existant et lui ajouter un tampon de plusieurs kilomètres 3. masque du MNT autour du tampon du bassin existant 4. post-traitement du MNT (traitement des "plats", et points bas) 5. calcul des directions d'écoulement 6. calcul de l'accumulation (valeur numérique = nombre de pixels en amont de chaque pixel) 7. repérage des thalwegs sur le raster (par exemple filtre des pixels sur la base d'un percentile 99 des valeurs d'accumulation) 8. vectorisation des thalwegs (polylignes) et repérage des exutoires 4. recalcul des bassins versant à partir d'exutoires judicieusement choisis

Vecteur : attention aux géométries

Une couche vecteur pose la question de la validité des géométries. Voir par exemple le guide [accompagnement à la détection et la correction des erreurs de géométrie dans les données d’urbanisme 🔗](https://www.geoportail-urbanisme.gouv.fr/image/FicheAide_InvaliditeGeometries_1-0.pdf).

Absence de géométrie

Polygones non fermés

Surfaces nulles

(apprécié à l'aune de la précision des valeurs numériques...)

Noeuds trop proches ou en doublons

Arcs pendants

Sections de polygones de surface nulle

Polygones en papillon

Polygones en papillon

Contour de polygone se refermant sur lui-même

Anneaux envelopés

Contours de polygone se touchant

Erreur de contour
Des outils existent pour aider les équipes de géomaticiens à corriger ces géométries. De manière assez suprenante, ces opérations de nettoyage doivent aussi être conduites sur les jeux de données de référence... _Nota : [certains 🔗](https://shapely.readthedocs.io/en/stable/manual.html#validation.make_valid) vont avoir des effets de bord : faut-il préserver la topologie ou la géométrie apparente ?_

Un dernier rappel théorique

Une donnée de qualité

Source : Principes généraux de qualité des données, dessins d'[Étienne Appert 🔗](https://www.etienneappert.fr)

L'équipe SIG est rarement le producteur initial de la donnée, même s'il en produit. Pour de bons résultats, il faut donc disposer de données [de qualité 🔗](https://www.ecologie.gouv.fr/sites/default/files/Principes_generaux_qualite_des_donnees_MTE_MTECT_1-1.pdf). En vrac, parmi les sujets de la qualité qui reviennent fréquemment dans un service SIG de service déconcentré : * la validité de la géométrie, * la projection géographique, * le millésimage des codes commune (derniers développements en Hauts-de-France, [un package python 🔗](https://pypi.org/project/french-cities/#history) en test pour re-millésimer un jeu de données multi-millésimé) * le typage des champs (texte ou numérique : "02001" ≠ 2001 !), * l'encodage des fichiers (UTF8, Windows-1252, y compris dans les jeux de données de référence...) * ...
# Organisation pratique
sequenceDiagram Title: Organisation classique d'une équipe SIG (prises de commande) participant Service métier participant Manager SIG participant Géomaticien participant Administrateur de données participant Administrateur web participant Producteur de données participant Géoplateforme Service métier ->> Manager SIG: commande Manager SIG ->> Service métier: validation de commande Manager SIG ->> Géomaticien: transmission de commande Service métier -->> Géomaticien : transmission de données Producteur de données -->> Administrateur de données : livraison de données Administrateur de données -->> Géomaticien : mise à disposition
de données de référence rect rgb(191, 223, 255) note right of Service métier: Production agile Géomaticien ->> Géomaticien : traitement de données Service métier ->> Géomaticien : feedback Géomaticien ->> Service métier : livraison end Géomaticien ->> Manager SIG : validation commande Service métier ->> Manager SIG : validation commande rect rgb(191,223,225) note left of Géoplateforme: Valorisation :
transmission pour publication
(sauf exceptions) Géomaticien ->> Administrateur web : Publication web des Cartes Géomaticien ->> Administrateur de données : Stockage des données Administrateur de données ->> Géoplateforme : Exposition des jeux de données end

Quelles commandes pour le SIG ?

Part des commanditaires SIG

Une offre de service très tournée vers la DREAL

Typologie des commandes

Une production dominée par trois thématiques : milieu naturel, paysage et risques

Nuage de mots sur l'objet des commandes

Et surtout, une production dominée par les spécificités locales

Nuage de mots sur l'objet des commandes (épuré)

En gommant les spécificités locales, on voit bien réapparaître la transversalité des missions

Évolution des commandes

Évolution des commandes SIG

Évolution des commandes SIG

Combinaison de facteurs : * autoformation des services métier durant les confinements ; * montée en puissance de SIGNE ; * développement de cartographies dynamiques mises à jour en continu (ex. [carte dynamique éolien 🔗](https://carto2.geo-ide.din.developpement-durable.gouv.fr/frontoffice/?map=232004cc-1491-4644-9920-dec062de6754) sur GéoIDE). Une évolution des commandes qui ne reflète pas exactement l'évolution du plan de charge (mutation des commandes). Globalement une baisse des commandes qui permet tout de même de trouver le temps d'accompagner la mutation du métier (autoformation python, javascript).

SIGNE

On change d'interlocuteur !

Ouvrons le capot de SIGNE

Suivi de la chaîne de la donnée autour d'un jeu de données particulier : GUN & Infosols

# 1. Écoute utilisateurs et définition du problème Scope : métier des inspecteurs ICPE (Installations classées pour la protection de l'environnement) Anciennement, synchronisation de SIGNE à S3IC (ancêtre de GUN) avec remontée des données ICPE sur SIGNE, digitalisation poussée (polygone) directement sur SIGNE. Aujourd'hui saisie de données dans les applications métier GUN (vie administrative des installations classées) et Infosols (sites et sols pollués). **Problème : quid de la mise à jour des données GUN & Infosols sur SIGNE pour les missions régaliennes ?**
sequenceDiagram
    participant Service métier
    participant Application S3IC
    participant Application GUN
    participant SIGNE

    rect rgb(156, 156, 156)
        note left of Application S3IC: Ancienne orchestration
        Service métier -->> Application S3IC: saisie
        Application S3IC -->> SIGNE: synchronisation par accès base de données
    end
    Application S3IC ->> Application GUN : bascule des données
    rect rgb(191, 223, 255)
        note left of Application GUN: Orchestration à construire
        Service métier ->> Application GUN: saisie
        Application GUN --x SIGNE: rupture d'alimentation
    end
    SIGNE -->> Service métier : mise à disposition des données ?
            

Prototypage

Ecriture d'un algorithme qui collecte les données de l'API GUN de Géorisques 🔗.

Extrait du script de collecte GUN sur repository Gitlab

Extrait du script de collecte GUN sur repository Gitlab [🔗](https://gitlab-forge.din.developpement-durable.gouv.fr/dreal-hdf/ppc/georisques/-/blob/master/georisques/gun/api_gun.py)

sequenceDiagram title: Projet applicatif participant Service métier participant Application GUN participant Géorisques participant SIGNE Service métier ->> Application GUN: saisie sur application web Application GUN ->> Géorisques : exposition des données par API rect rgb(191, 223, 255) note right of Géorisques: Orchestration Géorisques ->> SIGNE: collecte des données par algorithme SIGNE -->> SIGNE : transformation SIGNE -->> SIGNE : stockage PostgreSQL end SIGNE -->> Service métier : mise à disposition des données J-1 ?
Définition d'un algorithme

Source : reproduit avec l'autorisation de FIX, [http://www.fix-dessinateur.com](http://www.fix-dessinateur.com)

# Aparté # 1 : qu'est-ce qu'un algorithme ? > La CNIL définit un algorithme comme "une suite finie et non ambigüe d’instructions permettant d’aboutir à un résultat à partir de données fournies en entrée." ETALAB, les algorithmes publics : enjeux et obligations [en ligne 🔗](https://guides.etalab.gouv.fr/algorithmes/guide/) * Concerne les algorithme papiers **et** numériques ! * Principe de redevabilité vis à vis des algorithmes : * signalement, * description du fonctionnement, * justification du recours aux algorithmes, * explicabilité des résultats, * accessibilité au code source et à la documentation, * voies de recours. > "With great power comes great responsibility: keeping public sector algorithms accountable" Etalab 🕷️, white paper for RightsCon Tunis, juin 2019, [en ligne 🔗](https://github.com/etalab/algorithmes-publics/blob/master/20190611_WorkingPaper_PSAAccountability_Etalab.pdf)

Aparté #2 : qu'est-ce qu'une API ?

API = Application programming interface (interface de programmation d'application)

Les API permettent de se connecter à des systèmes d'information tiers. Elles sont fondamentales dans l'accès à la donnée pour le partage applicatif. Elles sont largement citées dans les feuilles de routes ministérielles sur la donnée (retrouvez celle du MTECT [ici 🔗](https://www.ecologie.gouv.fr/feuille-route-donnee-des-algorithmes-et-des-codes-sources)). Pour un inventaire, rendez-vous sur la platforme [api.gouv.fr 🔗](https://api.gouv.fr/).

Pour mémoire, les API disponibles sur Géorisques sont (à date) :

* AZI : Opérations sur les Atlas des Zones Inondables (AZI) * CATNAT : Opérations sur les catastrophes naturelles * Cavites : Opérations sur les Cavités Souterraines (Cavites) * DICRIM : Opérations sur les Documents d'Information Communal sur les Risques Majeurs (DICRIM) * Etats documents PPR : Opérations sur les états des documents PPR
* Familles risque PPR : Opérations sur les familles de risque PPR * Installations Classées : Opérations sur les installations classées * MVT : Opérations sur les Mouvements de terrains (MVT) * PAPI : Opérations sur les Programmes d'Actions de Prévention des Inondations (PAPI) * PCS : Opérations sur les Plans Communaux de Sauvegarde (PCS)
* PPR : Opérations sur les documents PPR * Radon : Opérations sur le risque radon * Rapport PDF : Opération pour la génération du rapport PDF * Retrait gonflement des argiles : Opérations sur les retrait de gonflement des argiles * Risques : Opérations sur le Détail des risques
* SIS : Opérations sur les données SIS * TIM : Opérations sur les Transmissions d'Informations au Maire (TIM) * TRI : Opérations sur les Territoires à Risques importants d'Inondation (TRI) * Zonage Sismique : Opérations sur le risque sismique

3. Retour à nos moutons : retour utilisateurs du premier prototype de récupération de données

### Limites techniques de l'API * l'API GUN peut s'interroger par code commune, mais nous n'avons pas le millésime du jeu de données ; * on constate d'ailleurs des mélanges de codes commune et de codes arrondissement municipaux ; * **mais** l'API utilise le code commune comme paramètre optionnel, on peut donc collecter la totalité des données nationales (127260 résultats sur une API limitée à une page de 1000 entités : 128 pages à collecter) * une évolution de l'API GUN permet en plus d'interroger par date de mise à jour = grosse avancée sur le plan écoconception !
### Limites métier de l'API * 😥 toutes les ICPE ne sont pas présentes (critères liés au régime et à l'inspection) ; * 😑 géolocalisation dégradée au centroïde communal pour les sites présentant des risques pour la sécurité publique.
### Feedback service métier * ⚠️ « on saisit des polygones, pourquoi on récupère des points ? »
Nota : une erreur détectée (aujourd'hui résolue) sur les codes communes (Fretin et Lesquin apparaissent tous les deux sous le code commune 59256). Ce bugue est aujourd'hui résolu, mais symptomatique du problème de millésimage des codes commune. **Un code commune n'est pas suffisant pour identifier une commune, il faut également disposer de la date de validité.**

4. Poursuite de l'écoute utilisateurs

Copie d'écran d'infosols

Copie d'écran d'Infosols

* GUN autorise la saisie d'une géométrie "point" mais comme la section INFOSOLS permet la saisie de polygones, on observe en pratique une double saisie * mais pas d'export possible d'INFOSOLS (exposition de données SIS, SUP, ex-BASOL, ex-CASIAS sur géorisques : données morcelées, incomplètes) * le choix est fait de tester un **scraping** d'Infosols avec des droits ad hoc.
# Aparté #3 : c'est quoi du scraping, et pourquoi il faut l'éviter * le [web scraping 🔗](https://fr.wikipedia.org/wiki/Web_scraping) est une technique qui consiste à simuler l'accès à un site web en utilisant un robot 🤖 qui est chargé de collecter certaines données * ce n'est pas un piratage (sauf exception) ; ici, le profil est administré classiquement et l'authentification transite par Cerbère ; * il s'appuie souvent sur des "API internes" qui sont aujourd'hui au coeur d'un site internet moderne ; * mais le scraping doit être utilisé **avec modération** : * les serveurs ne sont pas nécessairement dimensionnés pour cela : même si un scraping correctement conduit est "léger" (ciblé sur les seules requêtes nous intéressant là ou un utilisateur humain déclenche plusieurs dizaines de requêtes), il se déplace très vite sur un site internet (facilement plusieurs centaines de requête par seconde), ce qui peut faire tomber un serveur (cf. [attaque par déni de service 🔗](https://fr.wikipedia.org/wiki/Attaque_par_d%C3%A9ni_de_service)) * c'est souvent moins bien qu'une extraction ciblée par API (utilise souvent plus de requêtes, ce qui entraîne des délais et de la consommation d'énergie supplémentaire) * et surtout la maintenance est une gageure à long terme (à chaque évolution du site web, risque de devoir tout reprendre, contrairement à une API qui se doit d'être versionnée).
# 5. Second prototype
sequenceDiagram
    title: Projet logiciel à date (et partiellement éprouvé)
    participant Service métier
    participant Application GUN
    participant Géorisques
    participant Application Infosols
    participant SIGNE

    Service métier ->> Application GUN: saisie sur application web
    Service métier ->> Application Infosols: saisie sur application web
    Application GUN ->> Géorisques : exposition des données par API
    rect rgb(191, 223, 255)
    note right of Géorisques: Orchestration par algorithme
    Géorisques ->> SIGNE: collecte des données APIsées
    Application Infosols ->> SIGNE: collecte des polygones par webscraping
    SIGNE -->> SIGNE : jointure des jeux de données
    SIGNE -->> SIGNE : transformation : millésimage des codes commune
    SIGNE -->> SIGNE : stockage PostgreSQL
    end
    SIGNE -->> Service métier : mise à disposition des données J-1
            
# 6. Conclusion et perspectives * faisabilité validée et intérêt confirmé des services métiers (repérage d'anomalies dans les données extraites) * conduite du projet "en lignes de commandes" sans ETL * création d'un package python (publié sur le [gitlab ministériel 🔗](https://gitlab-forge.din.developpement-durable.gouv.fr/dreal-hdf/ppc/infosols)) pour la collecte des données Infosols * création d'un package python en cours pour collecter les données de l'API GUN [repo gitlab 🔗](https://gitlab-forge.din.developpement-durable.gouv.fr/dreal-hdf/ppc/georisques) * orchestration à venir (script python, des pistes avec AirFlow) * une restitution à organiser en dehors des SIG : des données dépourvues de géométrie, des erreurs de géolocalisation en dehors de l'emprise de la carte dynamique : SIGNE ne peut pas restituer ces anomalies !

Aparté #4 : c'est quoi un package ?

Copie d'écran de PyPI

Copie d'écran de PyPI

* le **packaging** d'un code, c'est une démarche initiée pour partager son code et permettre sa réutilisation par d'autres utilisateurs ; * cela permet de partager son code sur un _repo_ gitlab et de permettre à tout utilisateur (développeur ou simple utilisateur) de signaler ses bugues sur un support partagé, voire même de proposer ses améliorations ; * la démarche est "code-agnostique" : on la retrouve en python et en R (pour ne citer que ceux-ci) ; ce processus est par exemple au coeur de la [démarche PROPRE 🔗](https://rdes_dreal.gitlab.io/publication_guide/production/) initiée par la DREAL Pays-de-la-Loire. _Nota : en python (le langage utilisé ici), on peut produire des packages python stricts, mais aussi spécifiques à QGis (ou même des exécutables windows, mais c'est une autre histoire)._
# Réflexions sur la dimension RH de ce "pipeline" * des compétences de gestion de projet : méthode agile, écoute utilisateur * des compétences technique (data) : API, webscraping, reverse-engineering, packaging * des compétences géomatiques basiques : projections, gestion de couches SIG * des compétences métier : compréhension des processus métier * des **compétences devops** à développer : orchestration * un projet à échelle humaine : travail en équipe séquentiel, 2 personnes Mais pour l'essentiel : des agents data-couteaux-suisses...!
# Merci pour votre attention ! ### Des questions ?