Les data en forme

Le 14 novembre 2011

La veille des journalistes de données d'OWNI vous fait cette semaine jouer au Rubik's Cube, classer les gouvernements ou encore faire le marathon de New York. Comble du luxe, vous pourrez même comparer la Bible et le Coran...

Qu’il ait été pour vous un cauchemar ou une fascination, vous avez forcément été confronté à un moment de votre vie à ce casse-tête addictif : le Rubik’s Cube. Cette semaine, nous vous proposons de vous replonger dans ce jeu de logique et d’équilibre, dans une version data aussi osée que prometteuse.

Le projet E-cube-Librium, développé par le mystérieux Damon, propose de visualiser la croissance des pays du monde et ses diverses composantes sous la forme d’un Rubik’s cube.

Sur chacune des six faces, Damon a positionné différents indicateurs (certains indicateurs se retrouvent sur plusieurs faces) selon trois piliers principaux :

  • Développement social : indicateur de développement humain (IDH), santé de la population, taux d’emploi,
  • Environnement : accès à l’eau, émission de CO2,
  • Développement économique : taux de croissance du PIB par tête, urbanisation, dépenses de santé.

La vision d’ensemble du cube permet donc de visualiser quels sont les secteurs les plus développés, et ceux pour lesquels il reste encore des efforts à faire. Et surtout, selon les règles d’équilibre relatives au Rubik’s Cube, chaque secteur est en corrélation avec un autre, pour avancer vers une croissance plus équilibrée : par exemple, le taux de croissance du PIB se retrouve relativisé avec les émissions de CO2.

Utilisant les données des Nations Unies sur le développement durable, Damon a réalisé la visualisation pour une douzaine de pays, sur les quatre périodes permises par les données : 1990-1995, 1995-2000, 2000-2005, 2005-2010. “A partir de ces visualisations et ces excroissances en 3D, il est facile de dessiner des connections et d’identifier visuellement quel facteur affecte l’équilibre du système global. Avec ce système d’E-cube, on peut commencer à faire tourner le puzzle dans le but de résoudre les équations ou en tout cas d’éviter qu’ils deviennent encore plus déséquilibrés” explique Damon sur son site.

On regrette juste que le travail graphique ne soit pas plus soigné et qu’une animation ne permette pas de mettre en scène les évolutions des cubes sur les quatre périodes. Mais le projet n’en est qu’à ses débuts…

Républicains et religieux

Après avoir joué avec les formes, jouons avec les mots.

L’analyse sémantique est un domaine que nous suivons de près à OWNI et deux projets particulièrement séduisants ont retenu notre attention dans ce domaine cette semaine.

Le premier s’intéresse à deux des plus grands best-sellers de tous les temps : la Bible et le Coran.

La société Pitch Interactive (dont le slogan est “Doing good with data”, “faire le bien avec les data”…) a voulu déconstruire les préjugés souvent associés à ces deux livres sacrés : par exemple que l’idée que le Coran soit un livre “violent” ou “de terreur”. Pour ce faire, ils ont analysé le contenu de la Bible et du Coran. Le résultat de leur recherche est présenté dans une application en HTML5, permettant de chercher une thématique et de comparer sa fréquence d’apparition dans les deux livres.

La référence et le contenu des versets qui citent tel ou tel sujet est indiqué, permettant ainsi de naviguer en profondeur dans les détails des livres et de re-situer chaque mot dans son contexte.

Pour chaque thématique est également présenté des données chiffrées : nombre d’occurrences, nombre de versets qui citent le mot, pourcentage de versets y faisant référence (ce qui a son importance, la Bible étant beaucoup plus longue que le Coran). Essayez sur TRUST (confiance), FORGIVE (pardon), ou PEACE (paix), le résultat est assez saisissant.

Le deuxième exemple s’applique au champ de la politique et sera à suivre pendant les prochaines semaines : le projet “Politilines” a pour ambition de visualiser les mots utilisés lors des débats pour les primaires républicaines. Cette application met en relation les mots les plus prononcés, les sujets auxquels ils se rapportent et les candidats qui les ont le plus utilisés, le tout dans une navigation très simple. Pour les plus curieux, la méthode est précisée dans l’onglet “Methods and source”.

Transportons-nous

Il y a deux semaines, nous vous parlions dans les Data en forme du concours lancé par CheckMyMetro et l’agence Creads pour la création d’un nouveau plan du métro. Le concours est terminé et les différentes créations peuvent être consultées ici. Vous avez jusqu’au 21 novembre pour voter pour votre carte préférée. Plusieurs dizaines de projets ont été soumis, quelques uns ont attiré notre œil :

  • une carte géolocalisée (les stations sont à leur emplacement exact les unes par rapport aux autres), qui prend en compte également les distances de quai à quai quand on doit faire un changement, utilisable par les daltoniens, et qui conserve (presque) les couleurs des lignes officielles de la RATP, élément de repère essentiel.
  • une carte végétale, quand les lignes de métro se voient pousser des feuilles

Ensuite, vous cliquerez vers cette application pour rêver, une fois de plus, à tous les services qui pourront voir le jour quand les données de la SNCF ou de la RATP seront ouvertes… Cette app néerlandaise, à la façon de l’appli Locomote développée par Isokron à Rennes, permet de visualiser les distances en transports en commun d’un point à l’autre du pays. Une granularité dans les choix et un très joli travail de design rendent cette application particulièrement réussie.

Il ne faut pas croire que les data ne s’intéressent qu’aux transports en commun. La course à pied peut aussi être un sujet, ou tout du moins constituer une porte d’entrée pour un sujet data. La preuve par ce sujet du New York Times. Dans les bureaux de Paule on s’est partagé le lien avec ce petit commentaire en accompagnement : “Bon, bah c’est le New York Times quoi…”. Comprendre : une idée brillante et pertinente, une réalisation simple, esthétique et efficace. Le genre de projets qui nous rend jaloux.

Leurs journalistes se sont fait la réflexion que depuis 1976, le parcours du marathon de New York, n’avait pas évolué. A l’inverse des quartiers foulés et des zones traversées. Notamment en termes de revenu moyen et de diversité ethnique. Ces journalistes ont donc représenté ces évolutions au moyen d’une dataviz vidéo, montrant sur une carte le tracé du marathon et pour chaque critère (revenu moyen, présence de Noirs, Blancs, etc.), la courbe se situe au-dessus ou en-dessous du tracé du marathon suivant que les données ont cru ou décru.

Restons à New York (en partie) : le mouvement Occupy Wall Street continue et nous fournit chaque semaine un traitement data intéressant. Cette semaine, c’est le travail de Jenn Finnäs qui nous a interpellé. Il a répertorié sur une carte et sur un calendrier le nombre de mouvements, dans le monde, se réclamant de cette manifestation. Et surtout, il explique comment il a fait : se basant sur les données du site meetup.com qui coordonne le mouvement, un script en ruby et un petit travail de mise en forme ensuite, et hop, une joli visu sur le web.

A signaler également l’intiative du Guardian de recenser les différentes mouvements par le crowdsourcing.

Le point Open Data à la mi-journée

La Norvège a lancé cette semaine son portail d’Open Data. Comme il n’existe pas de version anglaise, nous laisserons le soin à nos lecteurs norvégiens, s’il en existe de nous faire un retour sur le contenu du site…

Cette initiative devrait en tout cas probablement permettre à la Norvège de figurer en bonne place dans le classement de l’Open Government réalisé par l’entreprise Digital Daya (spécialisée dans l’accompagnement des décideurs dans leur action et dans l’utilisation des outils du web – réseaux sociaux, plates-formes, etc.).

Le résultat est graphiquement très moyen, mais réalisé avec StatPlanet, un outil de visualisation en ligne gratuit et le contenu est quant à lui plutôt puissant. Pour chaque pays du globe, Digital Daya évalue leur niveau sur deux critères : le statut d’ouverture du gouvernement (fermé, éligible, ouvert) et ses capacités en termes de gouvermement 2.0 (sans activité, novice, doué, faisant autorité). Un bon tour d’horizon du niveau d’ouverture des gouvernements dans le monde.

Autre réalisation dans la philosophie de l’Open Data, Haiti Aid Map recense et géolocalise les projets d’aide lancés en Haïti suite au tremblement de terre de janvier 2010. Les données peuvent être recherchées par commune, par secteur, ou encore par organisation. Chaque projet comporte une description, un calendrier, le budget et un point sur les personnes qui financent le projet. Toutes les données sont exportables en csv, en xml ou en excel.

Pour Noël, offrez-vous votre dashboard data

Bloomberg s’est offert une pleine page d’accueil dédiée aux data (les siennes essentiellement), pour un rendu néanmoins bien sympa. Il est à parier que cette initiative fera de très nombreux petits à travers le monde.


Retrouvez tous les épisodes des Data en forme !

Laisser un commentaire

  • Tom B le 14 novembre 2011 - 13:07 Signaler un abus - Permalink

    Pour un article aussi centré sur le “data” (qui mériterait d’ailleurs d’être traduit en “donnée(s)”, qui n’est pas une dénomination moins appropriée parce qu’en Français), il est dommage de montrer des visualisations sans légendes ou sans mention des “data points” illustrés…

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • Hubert le 14 novembre 2011 - 18:34 Signaler un abus - Permalink

    L’outil de visualisation bible/coran est aussi très très intéressant sur le mot “Woman”, qui laisse apparaitre
    - très peu d’apparition dans le Coran
    - des synonymes peu flatteurs pour la Bible

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
2 pings

Derniers articles publiés