Une certaine idée de l’open data

Le 29 juillet 2011

Le 13 juillet dernier est sorti un rapport produit par 4 élèves de l'école des Ponts ParisTech, intitulé "Pour une politique ambitieuse des données publiques". Il résume parfaitement une certaine idée de l'Open Data.

L’open data est à la mode. Le conseil général de Gironde vient de lancer son site DataLocale, la Saône-et-Loire a annoncé l’ouverture d’un portail pour octobre, celui du gouvernement sortira dans quelques mois. Plusieurs villes y réfléchissent : Le Havre, Saint-Maur-des-fosses et Montpellier a sauté le pas. L’ouverture des données publiques est devenue la nouvelle mesure phare des collectivités en matière de transparence et de démocratie.

Dans ce contexte est sorti un rapport très complet, intitulé Pour une politique ambitieuse des données publiques produit par quatre élèves de l’école des Ponts ParisTech : Romain Lacombe, François Vauglin, Pierre-Henri Bertin et Alice Vieillefosse.

Il fait la synthèse des enjeux de l’open data et fournit une série de 16 recommandations pour la mise en oeuvre de la politique de l’État. Logique, puisque ces élèves sortent du Master Action Publique de l’école des Ponts. Le rapport a été remis le 13 juillet dernier à Éric Besson, ministre de l’Industrie, de l’Énergie et de l’Économie numérique .

Romain Lacombe, qui travaille aujourd’hui à Etalab en tant que chargé de l’innovation et du développement, explique à OWNI la genèse et le but de ce rapport.

“Identifier des modèles économiques”

Comment l’idée de ce rapport est-elle née ? Est-ce une commande ?

“Après des études scientifiques à l’école Polytechnique, j’ai intégré le corps des Ponts et suis parti terminer mes études au MIT [ndlr : Massachussets Institute of Technology, une prestigieuse université américaine] ; après mon diplôme, j’ai lancé en 2008, puis cédé début 2010, une startup d’applications mobiles géolocalisées, implantée dans la Silicon Valley.

Du fait de ma double culture, celle du numérique et celle des politiques publiques, l’ouverture des données m’est apparue, à mon retour en France, comme un des leviers majeurs à travers lesquels l’État pouvait encourager l’innovation. Pour apporter une contribution, modeste mais je l’espère utile, au développement de l’Open Data en France, j’ai proposé à l’école des Ponts ParisTech, à la fin de l’été 2010, de réaliser une étude sur les données publiques.

L’étude portait principalement sur l’économie des données publiques, mais nos expériences complémentaires nous ont poussé à nous intéresser à toute la largeur du spectre des enjeux qui entourent l’open data.”

Quel en était l’objectif ?

“L’objectif de notre étude était d’identifier des stratégies et des modèles économiques, desquels l’État puisse s’inspirer pour faciliter l’ouverture des données publiques et encourager leur réutilisation. Il s’agit donc d’une réflexion sur les leviers d’action de l’état en faveur de l’open data, et les raisons qui pourraient motiver ce choix de politique publique, concernant aussi bien ses données que celles des autres acteurs concernés, des établissements publics aux collectivités territoriales.

À partir d’un état des lieux des expériences internationales et locales, nous avons identifié les enjeux et les acteurs de l’open data, ainsi que les principaux freins subsistant à l’ouverture et la réutilisation des données, notamment techniques, juridiques, économiques et organisationnels ; et nous avons esquissé des solutions pour les dépasser.

Il s’agissait en particulier d’identifier des modèles économiques permettant d’assurer à la fois le soutien à l’innovation et à la réutilisation, et la sauvegarde des équilibres financiers du service public permettant la production de ces données.”

Quel lien entre ce rapport et la politique de l’État en termes d’open data ?

“Ce travail de prospective et nos échanges fructueux avec les différents acteurs du sujet ont abouti à la formulation de 16 propositions pour une politique ambitieuse des données publiques, présentées au Ministère de l’Enseignement supérieur et de la Recherche et au Ministère de l’Industrie, de l’Energie et de l’Economie numérique.

Elles se déclinent en recommandations très concrètes sur des sujets comme les formats ouverts et l’interopérabilité, la gratuité de réutilisation, l’enrichissement « bottom-up » des données par la communauté, une stratégie nationale avec l’ensemble des acteurs publics, et l’émergence d’un véritable écosystème des données publiques.”

Des ambitions…

Les 16 propositions du rapport évoquent en effet quelques idées ambitieuses et rarement pointées, notamment :

- la nécessité de formation et de pédagogie auprès des différents acteurs publics qui devront intégrer la production et publication de données dans leur travail : c’est la première proposition du rapport. OWNI avait déjà eu l’occasion de constater à quel point le manque de connaissances et de consignes relatives aux données publiques sont des obstacles à leur accès.

- la question des formats est abordée à plusieurs reprises. La proposition 2 y est même entièrement consacrée :

encourager l’utilisation de formats facilement réexploitables, qui respectent les normes d’interopérabilité et de “lisibilité machine”.

La question est en effet cruciale : d’après les données issues de l’étude réalisée par François Bancilhon (Data publica) et Benjamin Gans (INRIA) et publiées par Proxima mobile le 26 juillet dernier, sur les 6,2 millions de fichiers de données publiques disponibles en ligne, seuls 11% le sont sous des formats exploitables.

- faire de la gratuité la norme. Le paiement d’une redevance pour accéder à certaines séries devient une exception. Une proposition à laquelle les auteurs du rapport sont arrivés de manière empirique :

Notre analyse économique nous mène à conclure que la gratuité la plus large, y compris pour une réutilisation des données à titre commercial, favorise l’innovation et les nouveaux usages, et contribue à financer le service public par l’impôt généré ; c’est le modèle économique optimal pour les données publiques.

- Plusieurs propositions visent à faire émerger un écosystème des données publiques, mettant ainsi en valeur que l’open data est une politique qui doit s’inscrire dans la durée et dans les habitudes de l’administration.

Il est ainsi préconisé que “l’ensemble des Contrats d’Objectifs et de Moyens des Etablissements publics et des Délégations de Service Public contractées avec des entreprises abordent explicitement le statut et les droits de réutilisation afférant aux données générées dans leur cadre”. Les données liées à de nouveaux contrats signés pour la délégation du service public de l’eau, des transports pourraient ainsi être rendues publiques…

…mais une volonté de contrôle

Comme l’essentiel des initiatives en open data, la philosophie portée par ce rapport reste celle d’une approche “top down” où le choix des données rendues publiques appartient à l’organisme qui les met en ligne. Ce qui n’est pas la seule voie : ouvrir les données publiques, c’est aussi les “rendre” aux citoyens grâce à qui elles sont produites.

C’est ce qu’explique ici Jean-Marc Manach et c’était l’idée de la campagne du Guardian “Free our data” qui a amené le gouvernement britannique à se lancer dans l’open data.

Dans le rapport, l’alternative inverse est même présentée comme un danger. Par exemple, le rapport évoque trois scénarios possibles d’attitude de l’État face à l’ouverture des données publiques : inertie, capture et symbiose.
Dans la cas de l’interie (c’est-à-dire le développement de l’offre de données publiques à son rythme historique) un des inconvénients évoqués est “le risque fort de manquer les opportunités stratégiques de l’ouverture des données publiques” et par là “fragiliser les institutions productrices de données” :

“la frustration des citoyens et consommateurs face à la difficulté d’accès à des données qui leur importent pourrait les pousser à développer leurs propres solutions ad hoc, par exemple de manière collaborative. Bien que louable si ces solutions évoluent vers une relation public-privé efficace, ce développement comporte une part de risques, notamment celui de la perte de légitimité des institutions qui historiquement ont produit des données importantes pour les citoyens. Le risque serait alors grand de voir s’effriter un tissu d’expertises utiles, et la qualité des services aux citoyens pourrait en souffrir.”

Lâcher le monopole de production des données n’est pas pour demain.

Ainsi, la seule fonctionnalité “bottom-up” (la demande ou l’initiative vient des citoyens) proposée dans le rapport se fait par le biais du crowdsourcing et reste relativement limitée.

L’État devra donc réfléchir à la possibilité de passer d’un modèle “à sens unique” (diffusion des données du secteur public vers la société civile) à un modèle d’écosystème où les données de l’État et des collectivités, ouvertes à la société civile, pourraient être enrichies en retour de façon collaborative (“crowdsourcing”).

Le rapport ne recommande pas la mise en place, sur le site d’ouverture des données, d’un formulaire permettant de demander un jeu de données spécifiques, par exemple. Dans les sites open data des gouvernements, la Suède est d’ailleurs la seule à le proposer.

Ce rapport est une étude remise à un ministère : il ne représente pas la feuille de route d’Etalab ni même la politique globale du gouvernement français autour de l’ouverture des données publiques, même si de nombreux points sont communs (la gratuité des données par exemple).

Son contenu est cependant assez révélateur de la philosophie qui prévaut actuellement dans les politiques et initiatives open data et qui constitue une façon bien spécifique de voir l’ouverture des données publiques. Les données publiques commencent à être libérées en France. Mais d’une certaine manière.


Crédits photos Flickr CC by-nd loop_oh et Laurent Jégou

Laisser un commentaire

  • diversite le 29 juillet 2011 - 19:06 Signaler un abus - Permalink

    TRÈS BONNE RÉFLEXION, SUR CE QUI VA CHANGER EN PROFONDEUR, LES RELATIONS PUBLIC-PRIVÉ, ET J’EN SUIS SÛR, PUBLIC-PUBLIC ET PRIVÉ-PRIVÉ … QUAND LA BARRIÈRE DES ÉCO-SYSTÈMES NUMÉRIQUES SERA FRANCHIE DURABLEMENT.
    LES BONS MÉDIA AURONT DU GRAIN À MOUDRE, ET LES CONSOMMATEURS D’INFO, PLUS DE MOYENS DE CROISER LES DONNÉES,
    CAR:
    RESTERA LE PROBLÈME DE MANIPULATION DE CES DONNÉES, DÉJÀ TROP COURANT, JE ME DEMANDE SI UN SYSTÈME DE RÉGULATION ET D’ALERTE TYPE WIKIPEDIA NE DEVRAIT PAS ÊTRE INTÉGRÉ AUS OPEN-DATA .

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • gans benjamin le 30 juillet 2011 - 17:17 Signaler un abus - Permalink

    Les chiffres de Proxima Mobile que vous reproduisez et illustrez avec le graph viennent de l’étude que nous avons faite avec François Bancilhon de Data Publica. L’étude est notamment visible notamment ici http://gov.opendata.at/site/sites/default/files/Size%20and%20Structure%20of%20French%20PSI_0.pdf

    Donc merci de préciser la source.

    Benjamin Gans

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • marchange le 30 juillet 2011 - 17:49 Signaler un abus - Permalink

    Ecrire un article sur l’open data et l’illustrer par un pie chart en 3D.
    Mes yeux pleurent des larmes de sang.

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • Instructeur le 30 juillet 2011 - 19:48 Signaler un abus - Permalink

    Les données que nous enregistrons parfois dans un esprit d’anticipation, à comme but de préparer l’avenir. Lors de certain travaux pour le compte du Pôle Instruction Contrôle ; je fait en sorte d’utiliser les outils mis à la disposition d’un agent, pour faire augmenter le poids du document. L’impression numérique laisse des traces. Sujet, thésaurus, la données c’est le nerf de la guerre.

    Il va de soit que l’illustration ne pousse pas “Open-Office” au bout, il me semble malgré tous qu’il est possible de faire mieux.

    Chapeau au chasseur Mrs GANS, il semble que l’open-source lui fonctionne.

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • Admin le 31 juillet 2011 - 22:13 Signaler un abus - Permalink

    @Benjamin Gans : merci, erreur corrigée, et mes excuses.

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • Désespéré le 1 août 2011 - 13:00 Signaler un abus - Permalink

    “Notre analyse économique nous mène à conclure que la gratuité la plus large, y compris pour une réutilisation des données à titre commercial, favorise l’innovation et les nouveaux usages, et contribue à financer le service public par l’impôt généré ; c’est le modèle économique optimal pour les données publiques. ”

    Normal, ces rapports sont fait par de futurs ou d’actuel dirigeants de start-up qui ne risquent pas de dire qu’ils veulent payer leur matière première…

    Bonjour ami citoyen, tes impôts vont financer les business modeles de jeunes prétentieux, j’espère que tu es content.
    Enfin bref, on a l’habitude…

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • diversite le 1 août 2011 - 14:16 Signaler un abus - Permalink

    “… la gratuité la plus large, y compris pour une réutilisation des données à titre commercial, … contribue à financer le service public par l’impôt généré ; c’est le modèle économique optimal pour les données publiques. ”
    “Désespéré le 1 août 2011″ ne comprend pas cette affirmation, de la même manière que moi.
    Personnellement, j’ai retenu qu’avec l’hypothèse de l’accès gratuit pour tout le monde, dans l’absolu, je paierais aussi moins d’impôts ( toutes choses étant égales par ailleurs) car l’activité commerciale générée par l’exploitation rémunérée des données, produirait au minimum de la TVA, au mieux des salaires et autres revenus imposables … plus une diffusion par les média et entre services publics elle aussi “gratuite” mais au bénéfice de la pluralité des sources, donc de la connaissance en général, et des entreprises en particulier.
    Ce qui ne m’empêcherait pas d’y accéder à l’état brut, gratuitement.
    Les “jeunes-pousses” ne trouveront rémunération que de leurs services marchands, donc répondant à un besoin précis.
    ( Vu mon âge, je ne suis qui peu concerné par tout ceci, mais je milite pour la diversité des sources, des cultures, et de l’accès à l’information sous contrôle)

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • Paris le 1 août 2011 - 17:30 Signaler un abus - Permalink

    Merci beaucoup pour la qualité de cette réflexion. Pour info, Paris a ouvert il y a déjà plusieurs mois son site http://opendata.paris.fr Vous pouvez y trouver une première expérience avec des données aussi bien sur les prénoms que sur les équipements ou encore les arbres ou les statistiques de prêts dans les bibliothèques. Le site permet aux utilisateurs de proposer des jeux de données à libérer en priorité pour guider les travaux des services de la Ville.

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • Max le 3 août 2011 - 18:01 Signaler un abus - Permalink

    Au sujet de l’open data et des possibles réutilisations de ces données, je vous conseille l’article suivant : http://culturevisuelle.org/esthetiquesindustrielles/archives/31

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
5 pings

Derniers articles publiés