Open data (gouvernement, google, …)

Lorsqu’on enseigne les probabilités et les statistiques, on recherche parfois des séries de données à exploiter qui serait réelles plutôt que d’inventer des données dont on ne connaît pas la pertinence. Par exemple, lorsque j’enseignais les biostatistiques en classe préparatoire pour les étudiants en santé, j’étais à la recherche de données comme la situation périnatale en France en 2010, ou tout autre type de données de ce genre. Jusqu’à présent, on pouvait trouver ce genre données sur des sites comme l’insee par exemple, ou dans des livres comme l’enquête sur la sexualité en France qui présente et commente l’enquête « Contexte de la sexualité en France » réalisée en 2006, qui procure alors de nombreux nombres très pertinents (et intéressants) !

Hier, lundi 5 décembre 2011, le gouvernement a dévoilé le site data.gouv.fr

qui rassemble plus de 350 000 jeux de données publiques, plus ou moins facilement utilisables et réexploitables (en fonction du format), selon les critères de l’open data. Outre l’utilisation que je mentionnais ci-dessus comme ensemble de valeurs intéressantes à utiliser dans un cadre scolaire, chacun pourra juger de la pertinence des données publiées, ou s’intéresser aux applications utiles qui pourront découler de la diffusion de ces données, comme celles présentées dans cet article du journal « Le Post ».

Un lien à garder sous la main et à surveiller du coin de l’œil !

Ajout (7/12/2011) : On pourra aussi noter le Google Public Data Explorer, qui rend accessible de larges séries de données. Les graphiques et carter évoluent constamment, et permettent ainsi de mieux appréhender les changements qui not lieu dans le monde. On pourra apprécier grandement le choix des pays que l’on souhaite comparer, par exemple sur le taux de chômage en Europe ou la dette publique (e.g. en fonction du PIB). Différentes représentations des données sont proposées (courbes, diagrammes en bâtons), dont une représentation sur carte quand le sujet s’y apprête, avec une animation permettant d’observer l’évolution dans le temps. Très visuel et appréciable !