Datamix le blog de tripotage de données


Données ouvertes et jolies cartographies

Pour les passionnés de données qui aiment faire ressortir des corrélations entre des jeux de données hétéroclites, ce blog vaut le détour. L’auteur, Mathieu Garnier, aime utiliser des données ouvertes pour réaliser des infographies ou des cartographies en mettant en parallèle différentes thématiques, pour un résultat parfois surprenant. Par ailleurs, il est possible de le suivre sur Twitter (@matamix) , où son fil est très régulièrement alimenté par de nouvelles infographies en tout genre.

 

Des études originales

Par exemple, il s’est amusé à déterminer les « plus gros trous perdus de France « , c’est à dire les points du territoire français les plus éloignés de toute trace d’habitation aux alentours. Dans un premier temps, l’auteur fait une classification des départements ayant les plus gros « trous perdus » c’est à dire les départements comportement des cercles inhabités dont le rayon est le plus important. La savoir remporte la palme avec un cercle de rayon 9,5 km situé dans la Vanoise, ce qui n’est par surprenant au vu du relief du lieu. Par ailleurs,  dans Paris intramuros, le rayon le plus important mesure 750 mètres. Après avoir analysé les différentes localités trouvées, l’auteur constate que les plus grands lieux sans habitations sont en réalité des camps militaires, des lieux aux reliefs prononcés ou composés de zones marécageuses. Enfin, l’auteur présente sa méthodologie de manière détaillée avec la source de ses données (ici l’INSEE).

L’analyse des mamies de Paris est également intéressante et surprenante. L’étude porte sur la part des mamies par station de métro dans Paris intra-muros, en petite couronne puis par département. Il présente ensuite graphiquement l’évolution de la part des personnes agées de la gente féminine entre 1990 et 2013 en se basant sur les données de l’INSEE, de la RATP et de la SNCF. Enfin la méthodologie est décrite et l’accès aux scripts est donné.

Les mamies des stations de métro intramuros parisiennes

De nouveaux outils de dataviz

Une représentation originale du relief français

En dehors, de lire des informations originales le blog présente un réel intérêt pédagogique. Dans chacun de ses articles, l’auteur présente son sujet et les résultats auxquels il a abouti. Pour un résultat plus pertinent il utilise différents modes de représentation. Cela présente un premier point d’intérêt : comprendre les choix de représentations (et pourquoi privilégier tel type de représentation plutôt qu’un autre), et cela permet éventuellement de découvrir un nouveau type de représentation. L’accès aux scripts permet de comprendre comment ont été réalisés les différentes représentations et éventuellement de les réutiliser pour ses propres travaux. Par ailleurs les sources utilisées sont toujours détaillées Slate, le web magazine indépendant et les Cahiers du Foot, le magazine  » de football et d’eau fraîche » comme ils se qualifient eux-même, republient régulièrement ses articles. Mais le journal d’informations Libération a également publié les résultats de l’étude sur les noms des bar, ou pourquoi, entre autres, les noms des bars sont identiques dans de nombreuses villes françaises.

Dans les commentaires, certains lecteurs posent des questions et/ou proposent des améliorations, s’étonnent parfois du parti pris par l’auteur. Ce dernier répond aux commentaires en les étayant, et modifie parfois sa cartographie.

Ainsi, ce blog ludique est un excellent moyen de découvrir le pouvoir des données et de leur représentation. Il permet de découvrir à la fois des informations amusantes tout en ayant une valeur pédagogique.

 

Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *