Votre navigateur ne supporte pas impress.js, cette présentation a donc été simplifiée.
Pour une meilleure expérience, utilisez un navigateur Chrome, Safari ou Firefox à jour.
Thomas Grandjean & Patrice Sauvage
Service IDDÉE, DREAL Hauts-de-France Open Data Camp (09/11/2021)
# Qualité de la donnée :
# les bonnes pratiques pour faciliter la réutilisation
### Open Data Camp, atelier n°7
### 09/11/2021
Mode opératoire
Deux supports pour cet atelier :
* cette (rapide !) présentation ;
* et un *board Klaxoon*.
Les "ateliers Klaxoon" feront l'objet de temps dédiés, avec des coupures au milieu de la présentation (un compte à rebours sera affiché).
Bien évidemment, ceux qui se sentent parfaitement à l'aise sur le sujet de la donnée ** *et* ** sur Klaxoon peuvent déjà aller regarder le board !
Durant toute la présentation :
* une question 🙋 ? Rendez-vous sur le tchat *Teams* ! (Et on tâchera d'y répondre du mieux possible...)
* perdu 😱 sur le *board* ? Référez-vous au code couleur (celle du compte à rebours de la présentation)
Après l'atelier : une synthèse, qui sera adressée/publiée.
Quelques pistes concernant cet atelier
Qualité
de la
donnée :
les
bonnes pratiques
pour faciliter la
réutilisation
Qualité : notion d'indicateur -> défini par quelle(s) métrique(s) ?
Donnée : tout est donnée -> quel type ?
Réutilisation : qualité dépendante de l'usage ?
Objectif de l'atelier : définir (collectivement !) des (les ?)bonnes pratiques ?
Juste une parenthèse juridique
Pour certains organismes, l'open data de qualité n'est pas une simple volonté ; c'est aussi une obligation !
> Toute organisation de plus de 50 agents chargée d’une **mission de service public** (les administrations, les collectivités de plus de 3500 habitants et les délégations de service public) est tenue de publier ses jeux de données dans un format **ouvert**, **utilisable** et **exploitable par un système de traitement automatisé**.
> Étalab (article L312-1-1 du CRPA)
Pour une information détaillée - mais simplifiée - rendez-vous sur le Code des relations entre le public et l'administration simplifié
[https://search.piaf.etalab.studio/crpa](https://search.piaf.etalab.studio/crpa)
Rendez-vous sur le cadre n°1 du board (le bleu) pour vous présenter
Plusieurs activités/questions vous sont proposées :
* ajouter une idée à votre nom ;
* votre profil vis à vis de la donnée : producteur, réutilisateur, "touche à tout" ?
* votre sphère professionnelle : public, privé, associatif ?
* les données que vous manipulez : classique, géo ?
* votre niveau d'expertise dans la donnée ;
* vos outils préférés pour produire ou réutiliser de la donnée ;
* pensez aussi à "liker" l'idée créée en bas de l'atelier !
# Ce qu'on vous propose pour la suite de l'atelier
Plusieurs équipes se sont déjà intéressées au sujet :
Etalab et data.gouv.fr, la CNIG...
On vous propose de commencer par une rapide restitution de nos lectures.
C'est bien sûr optionnel (et à apprécier en fonction de votre expérience du sujet) :
on a mis la question au vote, direction le cadre n°2 du board (le vert).
Ensuite, on retourne au board pour élaborer ensemble les bonnes pratiques en matière de qualité des données.
### Et bien sûr, on prend toutes vos questions en parallèle sur le tchat !
flowchart LR
subgraph Preparer["Préparer les données"]
Extraction["Automatiser l'extraction du jeu de données"]
Structure{"La structure correspond à un schéma existant"}
Extraction --> Structure
DefinirStructure(("Définir un schéma : secret statistique, données personnelles, colonnes pivot"))
Structure -- non --> DefinirStructure
ValiderStructure["Valider la conformité du jeu au schéma"]
DefinirStructure --> ValiderStructure
Structure -- oui --> ValiderStructure
ChoixFormat["Choix du format : ouvert, facilement réutilisable, exploitable par un automate"]
ValiderStructure --> ChoixFormat
ContenuJeu["Définir le contenu : titre, encodage, colonnes, séparateurs, lacunes"]
ChoixFormat --> ContenuJeu
end
Geocodage["Géocodage"]
PartageReferentiel["Partager ses référentiels"]
subgraph Referentiels["Référentiels"]
direction LR
Referentiels1["Référentiels du service public de la donnée"]
Referentiels2["Autres référentiels : NAF, ..."]
Referentiels3["Référentiels techniques : WGS84, ISO8601 (date/heure)..."]
end
Referentiels & Geocodage & PartageReferentiel --> DefinirStructure
subgraph Documenter["Documentation du jeu"]
direction LR
DescriptionGenerale["Description générale : données, fichiers, format, fréquence MAJ"]
DescriptionModeProd["Description du mode de production : manuel, automatique, par qui, exhaustif ou non ?"]
DescriptionModelDonnees["Description du modèle de données : champs, types, descriptions, exemples, lexique"]
DescriptionMetadonnees["Description des métadonnées : titre, sigle, description, licence, fréquence MAJ, mots-clefs, couverture temporelle, couverture spatiale granularité spatiale mode privé"]
DescriptionChangements["Description des changements majeurs : date, nature, liens associés"]
PointContact["Description du point de contact"]
end
ContenuJeu -- "Documenter la donnée" --> Documenter
subgraph Organisation["Éléments organisationnels"]
direction LR
Identifier["Identifier le coordonateur"]
Retroaction["Élaborer un processus de rétroaction retour utilisateurs"]
Valoriser["Valoriser le jeu : blogs, réseaux sociaux, hackathons"]
Animer["Animer la communauté de réutilisateurs"]
end
Documenter -- Vie du jeu --> Organisation
Je sais, c'est difficilement lisible 😩 ; mais pas de panique, c'est juste pour donner une idée avant de passer au *board* !
# Et donc direction le *board* pour le 3ème atelier
Le cadre du *board* est composé de 4 éléments :
* les référentiels (externes ou internes) & géocodage ;
* la préparation des données
* la documentation des données
* les éléments organisationnels
Ce sont globalement les blocs sui semblent faire concensus.
Néanmoins, on a prévu une boîte "bonus" pour les idées supplémentaires qui sortiraient de ce cadre.
L'objectif est de venir ajouter des idées de "bonnes pratiques" dans les différentes cases.
N'hésitez pas à "liker" les idées des uns et des autres !
# Dernier atelier (le numéro 4 !) du *board*
Nous (les animateurs !) allons dupliquer toutes les idées et les ramener sur le cadre (gris) du dernier atelier.
Vous allez avoir 5 minutes pour positionner toutes les idées (de préférence pas celles que vous avez écrites)
sur une matrice difficulté/importance.
Dans un second temps, il doit nous rester environ 10 minutes (? 🤞) pour debriefer
collectivement de ce positionnement (la parole sera distribuée initialement aux "créateurs" des idées :
d'accord ou pas avec le positionnement de votre idée ?).
# Quelles perspectives pour nos données ?
## Géo2France ?