Pour un opendata des usagers

Le 21 février 2011

Aujourd'hui, les administrations mènent la danse de l'ouverture des données. Cette politique de l'offre doit être remplacée par une démarche où les usagers demandent directement des comptes à leurs administrations - et où elles leur répondent.

Depuis mai 2009 et la mise en ligne de data.gov, l’ouverture des données publiques a avancé à pas de géants. Les catalogues de données publiques se sont multipliés. Le Royaume-Uni a sorti data.gov.uk, la Suède édite opengov.se et même les gouvernements les moins transparents s’y mettent, avec, par exemple, opengovdata.ru en Russie. On compte près de 60 initiatives de ce type à travers le monde, comme le montre la carte collaborative ci-dessous :


Voir World Map of Open Government Data Initiatives sur une plus grande carte.

Ces catalogues ne sont pas que des concessions faites à quelques activistes. Ils se développent, avec le soutien de certaines administrations. Data.gov, par exemple, a multiplié par 10 le nombre de séries de données disponibles sur le site depuis son lancement.

Tim Berners Lee, père fondateur de data.gov.uk et grand défenseur de l’opendata, est revenu l’année dernière sur la croissance phénoménale du nombre de données ouvertes. Internautes, entrepreneurs et administrations se saisissent des jeux de données pour les manipuler et, in fine, leur ajouter de la valeur.

Les perspectives ouvertes par les données publiques sont vertigineuses, comme l’a rappelé Xavier Crouan lors du CapCom de Rennes. Même à Paris, alors que le projet ParisData et ses 19 (!) jeux de données ont essuyé de nombreuses critiques lors du lancement, des internautes ont su mettre à profit cette nouvelle matière mise à leur disposition. Mounir et Simon ont produit en quelques jours une carte politique de la ville, où l’on voit à quel point les populations de droite et de gauche se mélangent peu.

Inégalités et culs-de-sac techniques

Pourtant, ces initiatives ne changent pas grand-chose. Les catalogues de données représentent une avancée, mais ils ne relèvent pas vraiment d’une démarche d’ouverture et de transparence. Avec ces catalogues, l’administration décide toujours de ce qui est public et de ce qui reste sous clé.

L’argument selon lequel la croissance des jeux de données disponibles conduira à plus de transparence ne tient pas non plus. Il serait extrêmement cher de mettre en ligne l’ensemble des données produites par l’administration. Si chaque fonctionnaire en France n’écrivait que 10 000 signes de documents potentiellement publics par jour, on aurait déjà  50 gigas de données à mettre en ligne toutes les 24 heures. Sans compter les entreprises réalisant une mission de service public, qu’il faudrait inclure à ce total, ou encore les archives nationales.

L’approche par l’offre, telle qu’on la pense aujourd’hui, est également porteuse d’inégalités. On demande à l’administration de mettre en ligne des données, de préférence dans un format compréhensible par les machines, mais le citoyen est rarement le premier bénéficiaire de ces efforts. Tout le monde ne peut pas lire un tableau au format Excel ou une base de données organisée au format sémantique RDF, ce qu’exigaient certains défenseurs de l’opendata lors de l’Open Government Data Camp du 18 novembre dernier.

Pour caricaturer, on pourrait dire que les lobbyistes de l’opendata demandent à l’administration de dépenser l’argent du contribuable pour créer des bases de données. Or, celles-ci ont vocation à être utilisées en priorité par… les lobbyistes de l’opendata. Le contribuable, qui paye pour la mise en ligne des données, n’est pas le principal bénéficiaire de l’opération.

Repenser l’approche de l’opendata

Aujourd’hui, les administrations sont au cœur du processus de publication des données. Nous les laissons décider elles-mêmes de la direction à prendre. Nous leur laissons le soin de s’autoréguler. Mais l’autorégulation n’est pas la panacée, surtout lorsqu’elle n’est pas assortie de sanctions. Les banques nous en ont offert un bel exemple lors de la crise des subprimes (voir cet article, ‘Self-regulation means no regulation’, pour les détails techniques). Dans l’industrie aussi, une étude (pdf) de plus de 4000 entreprises montre que les programmes d’auto-régulation n’ont pas beaucoup d’impact. L’administration fera peut-être exception à la règle, mais mieux vaut ne pas compter dessus.

L’ouverture des données publiques doit se faire par le bas, dans un processus bottom-up plutôt que top-down. C’est aux demandeurs de s’organiser pour transformer les données de l’administration en une base utilisable par les machines, pas aux contribuables. Mais c’est également à l’administration de s’adapter pour répondre aux besoins des demandeurs et fournir les données.

Les répertoires gérés par les réutilisateurs permettent déjà d’organiser les données publiques libérées, sans qu’une administration ne soit impliquée dans sa gestion. Qu’ils soient privés comme data-publica ou ouverts comme nosdonnées.fr, ils montrent que le problème ne tient pas à l’organisation des données – ils le font déjà – mais bien à la possibilité pour les citoyen de pouvoir demander un jeu de données. Fait révélateur, presque aucun des catalogues gérés par des administrations n’invite les utilisateurs à demander des données non-encore disponibles (la Suède fait exception).

Cette démarche, prévue par la loi, n’est pas défendue aujourd’hui. Pourtant, comme le montre l’enquête que nous avons réalisée auprès d’une vingtaine de collectivités, l’administration n’est absolument pas en mesure de respecter la loi de 1978 relative à l’accès aux documents administratifs.

Lorsqu’un journaliste, un chercheur ou un citoyen demande des données à l’administration, il se heurte presque systématiquement à un refus initial. S’il a la chance de connaître l’existence de la loi de 1978, il peut faire appel du refus de communication auprès de la CADA. Or, aujourd’hui, la CADA ne fait qu’appeler l’administration en question pour lui demander des explications, puis rend un avis.

Son budget de 1 million d’euros (6 fois moins que l’HADOPI) et ses 12 agents ne lui permettent pas de mener l’enquête lorsqu’une administration affirme ne pas détenir les données demandées. Elle n’a pas les moyens d’analyser en profondeur les 350 demandes mensuelles qu’elle reçoit (voir son excellent rapport d’activité au format pdf). Surtout, elle n’a pas de pouvoir de sanction – elle doit se borner à rendre des « avis ».

On comprend alors que si les données recherchées n’ont pas été gracieusement mises en ligne par l’administration, vos chances de les obtenir sont très minces.

Si l’ouverture des données par le haut reste une initiative louable, la transparence ne progressera que lorsque tous les fonctionnaires seront formés pour répondre aux demandes concernant les documents administratifs. Tout comme les standardistes des administrations disposent de pense-bête lorsqu’on leur demande les pièces nécessaires à l’établissement d’un passeport ou d’une carte grise, il devrait y avoir une marche à suivre pour satisfaire les demandes de documents administratifs.

Les données publiques, en France, ne seront réellement disponibles que lorsque :

  • La loi CADA sera connue du grand public, des fonctionnaires et des entreprises délégataires de service public,
  • La CADA aura le budget nécessaire pour mener des enquêtes,
  • La loi offrira à la CADA un pouvoir de sanction.

D’ici là, les catalogues continueront à grossir, mais les données qui n’y figurent pas seront toujours aussi difficile à obtenir.

Illustration: Carte de New-York CC walkingsf

Laisser un commentaire

  • marc le 22 février 2011 - 11:02 Signaler un abus - Permalink

    Vraiment, vous êtes des gros feinteurs. Vous dites opendata au lieu de transparence et droit à l’information. Autant j’adhère sur le fond, autant la posture marketing du titre de l’article me dérange passablement…

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • jeff le 22 février 2011 - 11:04 Signaler un abus - Permalink

    ahah marc ! tes vraiment sans pitié ! un “openfeinteur” en somme !

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • olivier le 22 février 2011 - 15:47 Signaler un abus - Permalink

    Vous mélangez tout cher monsieur. Les données anonymes sur le trafic du métro, les délibérations, les courriers de l’administration, les marchés publics… Vous voyez des 0 et des 1 partout (à raison, car tout ou presque est numérique ;-)). Tout n’est pas public cependant et heureusement :La transparence absolue mène tout droit au totalitarisme (cf. 1984). Aujourd’hui des monceaux de “données” sont d’ores et déjà accessibles en ligne sur les sites des ministères comme des collectivités territoriales (au hasard, vous connaissez le géocatalogue ?). Ce ne sont pas les données que vous cherchez ? Mais que cherchez vous exactement ? des scoops à la wikileaks ? Il est un peu facile de crier au scandale et les initiatives des collectivités locales même si elles sont modestes et largement perfectibles, méritent d’être saluées, car mettre à disposition des données “réutilisables” et avec des métadatas, c’est du boulot.

    nkb: Comme je le dit dans l’article, je ne demande certainement pas la transparence absolue, mais uniquement l’application de la loi, qui définit fort bien les documents administratifs, comme vous pouvez le vérifier par vous-même. Vous avez tout à fait raison de souligner que de nombreuses données sont disponibles en ligne. Mais toutes les données exigeables ne le seront sans doute jamais, d’où la nécessité d’une approche ‘par le bas’ permettant aux réutilisateur d’accéder facilement aux données, comme le prévoit la loi du 17 juillet 1978.

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • wilnock le 22 février 2011 - 20:57 Signaler un abus - Permalink

    Je parlais recemment de ce sujet avec un groupe de refugier politique, comment faire pour mettre en place l’opendata, globalement, les retours etait qu’il y a deux forme d’opendata, celle poussee par la population, c’est un mouvement democratique, et l’opendata poussee par le managment.
    les deux forme arriveront sans doute aux meme resultats, mais pas a la meme vitesse.

    @olivier, jolie troll! /clap

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • libertic le 28 février 2011 - 13:45 Signaler un abus - Permalink

    Retour sur les fondamentaux:
    Opendata = raw data

    Pour ce qui est de la CADA, ce n’est pas elle qui a le pouvoir de sanction mais ce pouvoir existe bien avec les recours au Tribunal Administratif. Des procédures de sanction existent donc déjà.

    Par contre tout à fait d’accord avec l’idée que les plateformes doivent offrir un format de données brutes automatisables et ciblées devs mais en complément avec un format et/ou outils de lisibilité pour le citoyen non-geek.

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • Batulescu le 5 mai 2014 - 18:35 Signaler un abus - Permalink

    It is perfect time to make some plans for the furtue and it is time to be happy. I’ve read this post and if I could I want to suggest you some interesting things or suggestions. Perhaps you can write next articles referring to this article. I wish to read more things about it!

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
6 pings

Derniers articles publiés