Vocabulaire
|
La géomatique ce n'est pas (que) de la cartographie : c'est le traitement automatique de l'information géographique. Il y a donc de fortes dimensions "donnée" et "numérique".
|
|
Un SIG c'est un système d'information géographique ; par extension, on parle aussi de logiciel SIG, SIG-iste (géomaticien).
|
Traitement des données
|
Pour traiter les données, on utilise des algorithmes (avec ou sans orchestration, avec ou sans outils).
|
La CNIL définit un algorithme comme "une suite finie et non ambigüe d’instructions permettant d’aboutir à un résultat à partir de données fournies en entrée."
Les algorithmes peuvent être numériques ou papier. Pour en savoir plus : consulter le guide d'Etalab.
|
"Packager" un algorithme, c'est le rendre disponible à tous sur une étagère numérique sous forme de package. Plus d'information à ce sujet dans la démarche démarche PROPRE (valable pour tout langage).
|
Extraction des données
|
On peut extraire les données de plusieurs manières : cela peut être manuel, semi-automatisé, orchestré...
|
Une API (interface de programmation) est un point d'entrée pour que des programmes échangent de la donnée ;
les API sont au coeur des stratégies de partage de la donnée.
Elles permettent de récupérer ou même de créer de la donnée.
Pour un inventaire des API publiques, consulter la plateforme api.gouv.fr.
|
|
Le webscraping est une solution qui consiste à simuler la consultation d'un site internet par un humain.
Parfois à la limite de la légalité, cette technique reste à éviter : elle peut causer la panne d'un serveur (surcharge)
et est très consommatrice de ressources (énergie électrique, énergie humaine en matière de développement et surtout maintenance).
|
| |
Format des données géographiques
Les données géographiques sont exprimées dans une certaine projection cartographique
(la plupart du temps référencée à partir de son code EPSG).
La projection de référence pour la France métropolitaine est le Lambert 93 (code EPSG 2154), mais d'autres référentiels existent (par ex. pour les DOMTOM).
|
|
La donnée est le plus souvent fournie au format vecteur. Chaque donnée du jeu est dotée d'une géométrie et de données attributaires (= la ligne d'un jeu de donnée tableur).
|
Une couche vecteur peut présenter des erreurs de géométrie. Voir quelques exemples dans ce document.
|
|
Une donnée vecteur peut subire des opérations relationnelles (jointure, sélection...), géométriques (aire, tampon, triangulation...) ou spatiales (intersection, différence...).
Les opérations disponibles sont généralement propres à chaque outil.
|
|
La donnée géographique peut aussi être présente au format raster ; un raster correspond à une grille de pixels dotés d'une unique valeur numérique.
Ce format est par exemple utilisé gérer les fonds de plan avec trois bandes numériques (rouge, vert, bleu).
|
|
Un jeu de données raster est exhaustif sur son emprise, contrairement à un jeu de données vecteur : on l'utilise souvent pour modéliser des processus présentant une dimension géographique.
|
Les outils du géomaticien
|
Il existe de nombreux outils, du plus pointu au plus abordable.
|
|
'Outils sous licence propriétaire : ArcGis, MapInfo...
|
|
Outils sous licence libre : QGIS, SAGA, GRASS, Google Earth...
|
|
Des langages de programmation à visée beaucoup plus large : python, R, javascript...
|
|
Des outils web à profusion : geoportail, Google maps, leaflet, openstreetmap, GéoIDE...
|
|
Bien souvent, le choix des outils se fait en fonction de l'usage et du format des données.
|
| |
Qualité des données
Pour de bons résultats, il faut disposer de données de qualité (à ce sujet, voir ce document).
|
Les problèmes de qualité les plus fréquemment rencontrés en DREAL sont :
- validité de la géométrie,
- erreur de projection,
- millésimage des codes commune,
- typage des champs (texte ou nuémrique),
- encodage des fichiers.
|
Les métiers
|
Pour fonctionner, une équipe SIG dispose d'au moins deux métiers.
|
|
Le géomaticien traite les données (transformation, visualisation, production). Il produit des cartes statiques (images) ou dynamiques (PDF, web), parfois des packages.
Il doit connaître les données métier, savoir où trouver la donnée pour être force de proposition.
|
|
L'administrateur de données locales se charge de centraliser les données sur un serveur commun et d'acquérir les données de référence auprès des producteurs.
Il est le garant de la qualité des données.
C'est aussi lui qui assure la diffusion des données géographiques (en lien avec la géoplateforme régionale).
|
Réflexion sur les compétences
Les compétences mises en oeuvre sont en réalité plus diversifiées que ces deux profils ; elles sont en lien avec les nouveaux métiers de la donnée
(Data Architect/Engineer, Développeur(se), Data Scientist/Analyst, Data Steward, ...).
En services déconcentrés, les équipes ne disposent que rarement de profils aussi pointus ; les agents doivent être polyvalents.
| |