9,94 milliards, c’est un netbook pour chaque Français. C’est le train gratuit pour tous pendant 6 mois. C’est le feu d’artifice du 14 juillet (celui du Champ de Mars, hein, pas de Agen) tous les jours de l’année dans toutes les capitales de région.
C’est aussi ce que reçoit la France tous les ans au titre de la politique agricole commune. OK, on paye moins qu’on ne donne. Mais ca signifie que les autres prétendants à des subventions européennes sont désavantagés (régions, associations) puisque Bruxelles essaye d’aplanir le solde net de chaque pays.
Malgré des sommes colossales et des enjeux qui dépassent largement l’agriculture, les contribuables ne reçoivent que peu d’info de qualité. Depuis maintenant 9 mois, la liste des bénéficiaires de la PAC est en ligne. Le site farmsubsidy.org l’a même remise en forme, pour que les internautes ne soient pas obligés de subir le site du ministère de l’agriculture. Malgré cette manne d’info, les journalistes français se sont montrés très circonspects.
Pourtant, l’OLAF (les incorruptibles de l’Union) a trouvé en 2006 que 48% des vaches slovènes n’existaient que sur les formulaires de demande de subvention. Plus tôt, c’était les Irlandais qui faisaient tourner leurs moutons d’exploitation en exploitation pour toucher plus de sous. Selon toute probabilité, les chiffres de la PAC recèlent bien d’autres histoires salaces.
L’année dernière déjà, j’avais lancé un ballon d’essai pour un projet de datajournalisme sur la PAC, sans résultat. J’ai mené depuis une plus grande étude de faisabilité, mais je ne peux pas aller plus loin, faute de temps et d’argent.

Je balance ici mes plans, dans l’espoir qu’un codeur (ou, qui sait, un rédac chef) la reprenne et la développe.
Construire un programme pour récupérer les 135.000 points de données, c’est long. C’est pour ca que farmsubsidy.org a déjà fait le boulot et vous offre une base Access à peu près propre. (Le lien vers le fichier zip si vous le demandez dans les coms).
La base nous donne le nom et la commune du bénéficiaire. On peut donc les chercher dans l’annuaire.
Pour chaque territoire, il serait intéressant de voir si les subventions reçues s’éloignent de la moyenne nationale.
Grâce à de telles données, le journaliste et l’utilisateur peuvent très vite identifier les zones s’éloignant sensiblement de la moyenne. Et commencer à enquêter.
[#owni] PACinfo: Où sont passés les 10 milliards de la PAC? http://goo.gl/fb/S3JL
Commentaire posté via Twitter
Une appli sur la PAC? Le projet est défini, reste plus qu’à trouver le codeur
http://owni.fr/2010/01/13/pacinfo/
Commentaire posté via Twitter
Pourquoi prendre Agen comme ville pourrie? J’ai tapé “ville pourrie” dans Facebook, et Agen gagne, devant Béziers.
#veille PACinfo: Où sont passés les 10 milliards de la PAC?: 9,94 milliards, c’est un netbook pour chaqu.. http://twurl.nl/w8qf71
Commentaire posté via Twitter
#PACinfo: “Où sont passés les 10 milliards de la PAC?” http://goo.gl/fb/S3JL par @nicolaskb [tu peux retouiter]
Commentaire posté via Twitter
RT @nicolasvoisin: #PACinfo: “Où sont passés les 10 milliards de la PAC?” http://goo.gl/fb/S3JL par @nicolaskb [tu peux retouiter]
Commentaire posté via Twitter
“Où sont passés les 10 milliards de la PAC?” Exercice de data-journalisme http://bit.ly/5oVxIg par @nicolaskb via @nicolasvoisin
Commentaire posté via Twitter
Joli programme. J’aimerais pouvoir te dire que je relèverai un jour le défi…
Plus sérieusement, autant il me semble très intéressant d’établir des comparaisons par territoire (Commune de la Capelle Bonnance subvention par ouvrier agricole supérieure de 1270€ à la moyenne nationale) et de construire des visualisations permettant de les mettre en valeur.
Autant je suis sceptique sur l’éditorialisation de données nominatives, individuelles (Alphonse Durand, 24 000€ de subvention, et sa maison pointée sur Googlemap). Seule l’enquête de terrain permet ici de déterminer s’il est normal que cet Alphonse Durand touche ce montant de subvention ou s’il compte deux fois les mêmes moutons. Quel est alors l’intérêt d’attirer l’attention sur ce Mr Durand avant d’avoir fait l’enquête ?
Il me semble indispensable que ces données (même nominative) soient mises à la disposition du grand public, que la base de données soit libre d’accès. Mais je crois qu’un projet de database journalisme doit avoir, en plus, une vraie politique éditoriale, que cette réflexion éditoriale ne peut se satisfaire d’une mise en image indiscriminée des données disponibles, qu’elle doit, au contraire donner des clés d’analyse de ces données, par la construction d’indicateurs et de visualisations pertinents, selon les résultats de ses enquêtes.
Je me rend compte, en écrivant ce commentaire, que l’acte de réaliser une visualisation revient en fait à un éditorialiser des données, que rendre visible une base de donnée n’est pas neutre : cela ne relève pas de la simple action du web-designer, mais engage aussi une responsabilité journalistique.
[WORDPRESS HASHCASH] The poster sent us ‘0 which is not a hashcash value.
Le #databasejournalism en action? RT @nicolaskb: Une appli sur la PAC? Le projet est défini [...] http://bit.ly/87AFHp #owni
Commentaire posté via Twitter
RT @nicolaskb: Une appli sur la PAC? Le projet est défini, reste plus qu’à trouver le codeur
http://owni.fr/2010/01/13/pacinfo/
Commentaire posté via Twitter
RT: @Vendredi_direct: “Où sont passés les 10 milliards de la PAC?” Exercice de data-journalisme http://bit.ly/5oVxIg
Commentaire posté via Twitter
Datajournalism on progress: projet d’appli de @nicolaskb sur la PAC. Il cherche un codeur et un diffuseur http://owni.fr/2010/01/13/pacinfo/
Commentaire posté via Twitter
RT @lagedefaire RT: @Vendredi_direct: “Où sont passés les 10 milliards de la PAC?” Exercice de data-journalisme http://bit.ly/5oVxIg
Commentaire posté via Twitter
Il serait intéressant de connaître également la répartition des subventions entre agriculture conventionnelle vs agriculture biologique. On peut le voir?
Ariane,
Bonne idée en effet. Je sais pas si une base liste les exploitations certifiées. Faudrait demander soit au ministère, soit à Ecocert, mais la nature nominative de la certification fait qu’on peut pas invoquer la loi de 1978 sur les données publiques. Au mieux, on peut demander le nombre d’exploitations certifiées par commune.
Très bonne idée, il faudrait que cela soit consultable par beaucoup de monde.
Pouvez vous mettre le lien vers le zip de la base access faite par farmsubsidy.org ?
“Data-journalisme” : le projet de @nicolaskb autour des subventions de la PAC :
http://bit.ly/5KhqJv Belle idée, à suivre !
Commentaire posté via Twitter
RT @lagedefaire @Vendredi_direct: “Où sont passés les 10 milliards de la #PAC?” Exercice de data-journalisme http://bit.ly/5oVxIg
Commentaire posté via Twitter
Database journalism + données sur la PAC = article intéressant de Nicolas Kayser-Bril sur owni.fr http://owni.fr/2010/01/13/pacinfo/
Commentaire posté via Twitter
PACinfo: Où sont passés les 10 milliards de la PAC? http://bit.ly/5mSlo3 via @AddToAny
Commentaire posté via Twitter
Please forgive me for replying in English. My French is approximative at best, though sufficient to understand the article. We’re working along these lines already. We did some mapping work on Sweden a while ago (you can see one of the prototypes here: http://tinyurl.com/ycmfeou It only works for Sweden and Denmark and is not totally up-to-date in terms of data. But you get the idea.
For France the problem is that we only have geographical locations by 5 digit postcode, not more than this. However, this should give us something to work with as the centre points of postcode zones is known. Moving to more precise location of recipients may require a crowd-sourcing approach. You suggest cross-referencing recipient names with other databases to find address, but this is difficult since most recipients are simply an name, e.g. Pascal Dupont. I can imagine the possibilities for incorrect matches is very great.
For anyone who wants to play with the data we have screen-scraped from the French Ministry site, you’re welcome to it, we have made if available on a Creative Commonns Attribution License. This means you’re free to use and remix it as long as you attribute the source as ‘farmsubsidy.org’.
Anyone interested in collaborating with us (and we do have some budget for developer time if we find the right people!) please get in touch. team (at) farmsubsidy (dot) org.
Hi Jack,
I just posted this to share the ideas I played with. Now, we need a developer to estimate the proportion of correct matches we can hope for. Crowdsourcing would be a good idea, but we’d need to start small, with support from a local paper or TV. Unlikely to happen, as scrutiny over the agribusiness isn’t part of what they do.
Thanks for the link to the SE/DK map. Cool geocoding, but without clustering, it resembles a population density map
I think we can add more value to this dataset.
http://bit.ly/87AFHp - PACinfo: Où sont passés les 10 milliards de la PAC?
Commentaire posté via Twitter
@Caroline,
Complètement d’accord avec toi sur l’éditorialisation des visualisations. C’est là que le journalisme de données devient différent de la statistique ou de la gestion de base de données.
Concernant la PAC, t’as raison que la majeure partie de la valeur qu’on peut ajoutée, à faible coût pour nous, réside dans les données communales, voire cantonales.
Dans l’hypothèse - hautement improbable
- où les 3 premières étapes offrent des résultats hyper fiables et que l’étape 4 fonctionne, on pourrait avoir une carte cadastrale + images satellites, i.e. les outils qu’utilisent les mecs de la Commission pour détecter les fraudes. Reste plus qu’à trouver un moyen de pas faire trop “chasse aux sorcières” et ça peut donner une expérience de crowdsourcing intéressante.