Votre navigateur ne supporte pas impress.js, cette présentation a donc été simplifiée.

Pour une meilleure expérience, utilisez un navigateur Chrome, Safari ou Firefox à jour.

Thomas Grandjean & Patrice Sauvage
Service IDDÉE, DREAL Hauts-de-France
Open Data Camp (09/11/2021)

# Qualité de la donnée : # les bonnes pratiques pour faciliter la réutilisation
### Open Data Camp, atelier n°7 ### 09/11/2021

Mode opératoire

image/svg+xmlonline_organizeronline_organizer
Deux supports pour cet atelier : * cette (rapide !) présentation ; * et un *board Klaxoon*. Les "ateliers Klaxoon" feront l'objet de temps dédiés, avec des coupures au milieu de la présentation (un compte à rebours sera affiché). Bien évidemment, ceux qui se sentent parfaitement à l'aise sur le sujet de la donnée ** *et* ** sur Klaxoon peuvent déjà aller regarder le board ! Durant toute la présentation : * une question 🙋 ? Rendez-vous sur le tchat *Teams* ! (Et on tâchera d'y répondre du mieux possible...) * perdu 😱 sur le *board* ? Référez-vous au code couleur (celle du compte à rebours de la présentation) Après l'atelier : une synthèse, qui sera adressée/publiée.

Quelques pistes concernant cet atelier

Qualité de la donnée : les bonnes pratiques pour faciliter la réutilisation

Qualité : notion d'indicateur -> défini par quelle(s) métrique(s) ?

Donnée : tout est donnée -> quel type ?

Réutilisation : qualité dépendante de l'usage ?

Objectif de l'atelier :
définir (collectivement !) des (les ?) bonnes pratiques ?

Juste une parenthèse juridique

image/svg+xmljudge_katerina_limpitsouni
Pour certains organismes, l'open data de qualité n'est pas une simple volonté ; c'est aussi une obligation !
> Toute organisation de plus de 50 agents chargée d’une **mission de service public** (les administrations, les collectivités de plus de 3500 habitants et les délégations de service public) est tenue de publier ses jeux de données dans un format **ouvert**, **utilisable** et **exploitable par un système de traitement automatisé**. > Étalab (article L312-1-1 du CRPA)
Pour une information détaillée - mais simplifiée - rendez-vous sur le Code des relations entre le public et l'administration simplifié [https://search.piaf.etalab.studio/crpa](https://search.piaf.etalab.studio/crpa)
# Échauffement Klaxoon 🔥 ## Vous avez 3 minutes ! ### https://app.klaxoon.com/participate/board/BY9QVCH

Rendez-vous sur le cadre n°1 du board (le bleu) pour vous présenter

Plusieurs activités/questions vous sont proposées : * ajouter une idée à votre nom ; * votre profil vis à vis de la donnée : producteur, réutilisateur, "touche à tout" ? * votre sphère professionnelle : public, privé, associatif ? * les données que vous manipulez : classique, géo ? * votre niveau d'expertise dans la donnée ; * vos outils préférés pour produire ou réutiliser de la donnée ; * pensez aussi à "liker" l'idée créée en bas de l'atelier !
# Ce qu'on vous propose pour la suite de l'atelier Plusieurs équipes se sont déjà intéressées au sujet : Etalab et data.gouv.fr, la CNIG...

On vous propose de commencer par une rapide restitution de nos lectures. C'est bien sûr optionnel (et à apprécier en fonction de votre expérience du sujet) : on a mis la question au vote, direction le cadre n°2 du board (le vert).

Ensuite, on retourne au board pour élaborer ensemble les bonnes pratiques en matière de qualité des données. ### Et bien sûr, on prend toutes vos questions en parallèle sur le tchat !

Les recommandations de data.gouv.fr

et Étalab

Nuage de mots généré à partir de la page https://www.data.gouv.fr/fr/posts/nos-reflexions-sur-la-qualite-des-donnees/

flowchart LR subgraph Preparer["Préparer les données"] Extraction["Automatiser
l'extraction du jeu de données"] Structure{"La structure
correspond
à un schéma
existant"} Extraction --> Structure DefinirStructure(("Définir un schéma :
secret statistique,
données personnelles,
colonnes pivot")) Structure -- non --> DefinirStructure ValiderStructure["Valider la conformité
du jeu au schéma"] DefinirStructure --> ValiderStructure Structure -- oui --> ValiderStructure ChoixFormat["Choix du format :
ouvert,
facilement réutilisable,
exploitable par un automate"] ValiderStructure --> ChoixFormat ContenuJeu["Définir le contenu :
titre, encodage,
colonnes, séparateurs,
lacunes"] ChoixFormat --> ContenuJeu end Geocodage["Géocodage"] PartageReferentiel["Partager ses référentiels"] subgraph Referentiels["Référentiels"] direction LR Referentiels1["Référentiels du
service public de la donnée"] Referentiels2["Autres référentiels :
NAF, ..."] Referentiels3["Référentiels techniques :
WGS84, ISO8601 (date/heure)..."] end Referentiels & Geocodage & PartageReferentiel --> DefinirStructure subgraph Documenter["Documentation du jeu"] direction LR DescriptionGenerale["Description générale :
données, fichiers,
format, fréquence MAJ"] DescriptionModeProd["Description
du mode de production :
manuel, automatique,
par qui, exhaustif ou non ?"] DescriptionModelDonnees["Description
du modèle de données :
champs, types,
descriptions, exemples,
lexique"] DescriptionMetadonnees["Description
des métadonnées :
titre, sigle,
description, licence,
fréquence MAJ, mots-clefs,
couverture temporelle,
couverture spatiale
granularité spatiale
mode privé"] DescriptionChangements["Description
des changements majeurs :
date, nature,
liens associés"] PointContact["Description
du point de contact"] end ContenuJeu -- "Documenter la donnée" --> Documenter subgraph Organisation["Éléments organisationnels"] direction LR Identifier["Identifier le coordonateur"] Retroaction["Élaborer un processus de rétroaction
retour utilisateurs"] Valoriser["Valoriser le jeu :
blogs, réseaux sociaux, hackathons"] Animer["Animer la communauté
de réutilisateurs"] end Documenter -- Vie du jeu --> Organisation
Je sais, c'est difficilement lisible 😩 ; mais pas de panique, c'est juste pour donner une idée avant de passer au *board* !
# Et donc direction le *board* pour le 3ème atelier Le cadre du *board* est composé de 4 éléments : * les référentiels (externes ou internes) & géocodage ; * la préparation des données * la documentation des données * les éléments organisationnels Ce sont globalement les blocs sui semblent faire concensus. Néanmoins, on a prévu une boîte "bonus" pour les idées supplémentaires qui sortiraient de ce cadre. L'objectif est de venir ajouter des idées de "bonnes pratiques" dans les différentes cases. N'hésitez pas à "liker" les idées des uns et des autres !

# Dernier atelier (le numéro 4 !) du *board* Nous (les animateurs !) allons dupliquer toutes les idées et les ramener sur le cadre (gris) du dernier atelier. Vous allez avoir 5 minutes pour positionner toutes les idées (de préférence pas celles que vous avez écrites) sur une matrice difficulté/importance.

Dans un second temps, il doit nous rester environ 10 minutes (? 🤞) pour debriefer collectivement de ce positionnement (la parole sera distribuée initialement aux "créateurs" des idées : d'accord ou pas avec le positionnement de votre idée ?).
# Quelles perspectives pour nos données ? ## Géo2France ?
maquette grand lyon

Un exemple de maquette reproduit dans "Preuve de concept de restitution automatisée", Mathieu Rajerison (CEREMA Med), CNIG Réunion QuaDoGéo du 02/10/2020 http://cnig.gouv.fr/wp-content/uploads/2020/10/201003_Preuve-de-concept-de-restitution-automatis%C3%A9e.pdf

Merci pour votre attention participation !

Contacts : [thomas.grandjean@developpement-durable.gouv.fr](mailto:thomas.grandjean@developpement-durable.gouv.fr) [patrice.sauvage@developpement-durable.gouv.fr](mailto:patrice.sauvage@developpement-durable.gouv.fr)