2 ans de datajournalisme vus par le Guardian

Le 29 juillet 2011

Premier média au monde à se mettre au data journalisme, le quotidien britannique The Guardian revient sur ses deux ans d’expérience et les leçons à en tirer.

Tous les liens de l’article sont en anglais.

Voilà une information intéressante : le data journalisme a désormais gagné ses lettres de noblesse. Pas à la manière de l’élite d’Oxbridge1 (bien qu’il y ait des données là-dessus), mais plutôt en devenant une norme de l’industrie.

Il y a deux ans, quand nous avons lancé le Datablog, tout ça était nouveau. Les gens demandaient encore si raconter des histoires à partir de données relevait vraiment du journalisme et tout le monde n’avait pas vu la risposte d’Adrian Holovaty. Depuis, le scandale des dépenses des parlementaires et WikiLeaks sont passés par là, et, étonnamment, plus personne ne pose ces questions. Ils demandent plutôt : “Comment est-ce que vous faites ?”

Entre-temps, chaque jour amène de nouveaux journalistes toujours plus innovants dans ce domaine. Et avec eux de nouvelles compétences et de nouvelles techniques. Donc non seulement le data journalisme lui-même change, mais il change également le journalisme.

Voilà quelques pistes issues de mes récentes conférences. J’ai pensé qu’il serait bon de les réunir toutes en un post, notamment depuis que nous avons reçu une mention honorable au Knight Batten Award pour l’innovation journalistique.

1. C’est peut-être à la mode mais ce n’est pas nouveau

Le data journalisme existe depuis que des données existent, au moins depuis les fameux schémas et reportages de Florence Nightingale sur les conditions de vie des soldats britanniques en 1858. Un long tableau (qui avait fuité) recensant chaque école de Manchester, ses coûts et le nombre d’élèves, constituait la toute première édition du Guardian.

La grosse différence avec cette époque ? Les données étaient publiées dans des livres, des livres très chers où les graphiques se rapportaient à des “chiffres”. Maintenant nous avons des fichiers et des tableaux formatés pour les ordinateurs. Ce qui veut dire que les ordinateurs eux-mêmes peuvent poser les questions.

2. L’”open data” signifie “open data journalisme”

Maintenant que les statistiques ont été démocratisées, elles ne sont plus l’apanage de quelques-uns mais de toute personne ayant un tableur sur son ordinateur portable, fixe ou même sur son mobile ou sa tablette. N’importe qui peut s’attaquer à une effrayante série de données et les mettre en forme à l’issue du combat. Bien sûr, ils peuvent facilement se tromper mais maintenant vous pouvez facilement trouver quelqu’un pour vous aider. Désormais nous n’errons plus seuls.

Straight Statistics vous donnera un millier d’exemples de journalistes qui utilisent ces nombres et partent dans la mauvaise direction en les manipulant. Mais il ne faut pas aller bien loin pour trouver des exemples de data journalisme tout à fait convenables. Même quand ce n’est pas au sein de certains vieux journaux ou médias, il y a de nombreux groupes indépendants – voyez ProPublica, Wheredoesmymoneygo? et la Sunlight Foundation – qui savent ce qu’ils font. Le data journalisme, c’est surtout la diversité des sources.

Au Guardian, faire partie du “news process” signifie que nous appartenons au “news desk” (les médias sont obsédés par la géographie interne) et allons aux “news meetings” importants pour être sûr que le data rentre dans le débat éditorial.

3. Le data journalisme est-il devenu un agrégateur ?

Parfois. Il y a tellement de données dans la nature que nous essayons de n’en faire ressortir que les faits-clés de chaque histoire (et trouver la bonne information peut être aussi long que le travail journalistique consistant à trouver une interview pour un article). Nous avons commencé à faciliter les recherches parmi les données des gouvernements et du développement international.

4. Des séries de données plus importantes, de plus en plus pour des détails



Read more about this map

Les bases de données deviennent gigantesques (391.000 documents pour la publication de WikiLeaks sur l’Irak, des millions pour la base du Treasury Coins). Les indices du dénuement multiple, utilisés par le gouvernement pour mesurer la pauvreté à travers l’Angleterre, contiennent 32.482 entrées. De plus en plus, d’importantes données des États sont accessibles pour de petites choses. Rendre ces données plus faciles d’accès, plus faciles d’utilisation, est désormais intégré à part entière dans le processus de data journalisme.

5. Data journalisme : 80% de transpiration, 10% de bonnes idées, 10% de production

C’est tout. Nous passons des heures à faire marcher des bases de données, à reformater des pdf, à mixer les jeux de données ensemble. Vous pouvez constater sur le PREZI ci-dessous tout ce que nous traversons avant de vous livrer les données. La plupart du temps, nous sommes un pont entre les données (et ceux qui s’avèrent incapables de les expliquer correctement) et les personnes extérieures, du vrai monde, qui veulent comprendre les vrais enjeux d’une question.

6. Long et bref

Traditionnellement, le pire aspect du data journalisme implique de passer des semaines sur un seul tableau, le triturant dans tous les sens et produisant finalement quelque chose de modérément divertissant. Le meilleur consiste à explorer des données pendant des semaines, avant d’en ressortir avec des scoops incroyables. Mais, de plus en plus, une forme courte du data journalisme émerge : trouver rapidement les données-clés, les analyser et guider le lecteur à travers elles tant que le sujet est d’actualité. L’astuce est de produire ces nouvelles analyses de données, en utilisant la technologie à notre disposition, le plus rapidement possible. Et de tirer dans le mille.

7. N’importe qui peut le faire…

Surtout avec les logiciels gratuits que nous utilisons comme Google Fusion Tables, Many Eyes, Google Charts ou Timetric. Vous pouvez voir certains des travaux que nos utilisateurs ont produit et posté sur notre groupe Flickr.

8. …mais l’apparence peut être primordiale

Un bon design fait vraiment la différence. Quelque chose comme le guide de la haute administration (conçu par le graphiste du Guardian Jenny Ridley) ou le “Qui Connaît Qui?” du scandale des écoutes de News Of The World (produit par le journaliste James Ball et le designer Paul Scruton) marchent parce qu’ils sont pensés, non par une machine, mais par des humains qui comprennent les enjeux de ces affaires.

9. Vous ne voulez pas être un programmeur

Vous pouvez devenir un codeur de premier ordre si vous le souhaitez. Mais le plus dur est de penser les données en journaliste plutôt qu’en analyste. Qu’y a-t-il d’intéressant dedans ? Qu’est-ce qui est nouveau ? Que se passerait-il si je les mélangeais avec d’autres variables ? Répondre à ces questions est crucial.

L’ensemble marche au mieux quand on fait une combinaison des deux. Ce guide des opérations de l’OTAN en Libye est nourri dynamiquement à partir d’un tableur, qui est mis à jour au point presse quotidien de l’OTAN. C’est beau car bien dessiné, et ça marche car facile à actualiser.

10. Les histoires avant tout (encore et toujours)

Le data journalisme ne se résume pas à des graphiques et à des visualisations. Le but est de raconter des histoires, de la meilleure façon possible. Parfois ce sera une visualisation ou une carte (voyez le travail de David McCandless ou Jonathan Stray).

Parfois ce sera de l’actualité. Parfois, sortir un chiffre s’avèrera suffisant.

Si le data journalisme doit se définir par quelque chose, c’est avant tout la recherche de nouvelles manières de traiter des sujets. Et de plus en plus de reporters le réalisent. Soudain, nous avons de la compagnie (et de la compétition).

Être un journaliste data n’est plus inhabituel.
Faire du datajournalisme n’est plus exceptionnel, c’est désormais juste du journalisme

Article initialement publié sous le titre “Data journalism at the Guardian: what is it and how do we do it?” sur le datablog du Guardian.
Traduction par Alexandre Marchand
Illustration Flickr CC Blprnt_van

  1. contraction d’Oxford et Cambridge []

Laisser un commentaire

8 pings

Derniers articles publiés