Explore.data.gouv, les avantages de la prévisualisation de données


L’open data connait une véritable recrudescence. Les données qui sont mises à disposition sont nombreuses, et de sources diverses.

Depuis plusieurs années, de plus en plus de données sont rendues accessibles sur des plateformes d’open data. L’ouverture des données des collectivités territoriales impose notamment, depuis le 7 octobre 2016, la publication en ligne de bases de données. Ces bases de données et données doivent représenter selon la CNIL un « intérêt économique, social, sanitaire ou environnemental » et une mise à jour régulière. Cependant, les données ne sont pas toujours à jour, ni très explicites quant à leur contenu.

La plateforme data.gouv en quelques mots

Si votre quotidien est animé par la donnée, vous connaitrez sans aucun doute data.gouv. La plateforme data.gouv.fr permet la centralisation des données de collectivités, entre autres, mais également de diverses sources grâce à son aspect communautaire. On doit sa création et son maintien à la Direction interministérielle du numérique, au travers d’Etalab. Si vous souhaitez en savoir un peu plus, voici des articles qui vous intéresseront :

https://veillecarto2-0.fr/2017/04/12/data-gouv-service-public-de-donnee/

https://veillecarto2-0.fr/2022/04/13/visualiser-lopen-data-en-france-avec-datafrance/

Avec un grand nombre de thématiques traitées, la qualité des jeux de données varie entre les jeux, entre les producteurs. Les métadonnées ne sont pas toujours bien complètes, les noms des fichiers pas toujours assez clairs, et les descriptions ne permettent pas toujours d’identifier le contenu des données.

Photo des thématiques présentes sur data.gouv.fr

Grandes thématiques présentes sur data.gouv.fr

 

Ce qu’offre l’application explore.data.gouv.fr

La phase de recherche de données peut être longue. Le département Etalab a pour cela développé explore.data.gouv.fr, pour la prévisualisation du contenu de ces données.

Il s’agit d’une application à part pour le moment, qui pourra évoluer selon Etalab. Mais dans l’état, elle très utile pour :

  • Regarder les différents champs et leurs types
  • Filtrer
  • Trier
  • Faire des statistiques de base

Il y a de nombreuses possibilités, avec des spécificités pour les tables avec des champs sur les données SIREN/SIRET, et les codes communes de l’INSEE, qui sont détaillées sur le fil twitter : https://twitter.com/datagouvfr/status/1585943559424815105?s=46&t=RKz7mbKnmvnGGjGtO5TE6A

Enfin, nous pouvons ne télécharger que le jeu de données filtré, ce qui peut faciliter grandement le traitement, voire limiter l’utilisation de données nécessaires au téléchargement de gros volumes.

Prenons alors l’exemple du jeu de données des immeubles protégés au titre des monuments historiques :

  • Vous devrez copier le lien du jeu de données depuis data.gouv.fr
  • Le coller dans explore.data.gouv.fr
  • Dans notre exemple, nous filtrons les immeubles protégés du Calvados, qui sont également propriété de l’état.

Exemple de prévisualisation et filtrage sur explore.data.gouv

L’application Explore.data.gouv.fr est alors très utile pour voir le jeu de données que l’on consulte et qui nous intéresse, en permettant d’aller plus loin grâce aux filtres. Cela évite de télécharger un fichier qui ne servira pas, et d’aller au-delà de l’indicateur de la qualité de la donnée, en se faisant une idée plus approfondie.


Sources :

À propos de data.gouv.fr – data.gouv.fr. (s. d.). https://www.data.gouv.fr/fr/pages/about/a-propos_data-gouv/

CNIL. (2019, 18 septembre). Les collectivités territoriales et l’open data : concilier ouverture des données et protection des données personnelles. Consulté le 10 décembre 2022, à l’adresse https://www.cnil.fr/fr/les-collectivites-territoriales-et-lopen-data-concilier-ouverture-des-donnees-et-protection-des

Ministère de la culture. (2022). Immeubles protégés au titre des Monuments Historiques [Base de données ; Data.gouv.fr]. https://www.data.gouv.fr/fr/datasets/immeubles-proteges-au-titre-des-monuments-historiques-2/

Refonte de la prévisualisation et de l’exploration des données – data.gouv.fr. (s. d.). https://www.data.gouv.fr/fr/posts/refonte-de-la-previsualisation-et-de-lexploration-des-donnees/