L’Open Data à la croisée des chemins juridiques

Le 7 juin 2012

La libération des données publiques franchit une étape importante de sa courte existence avec l'avis rendu cette semaine par le Conseil national du numérique. Coincé entre bonne volonté apparente et lacunes flagrantes, l'Open Data à la française semble tergiverser entre le juridique et le politique pour tracer son avenir.

Les premiers bilans de l’Open Data en France, 6 mois après le lancement du portail data.gouv.fr, oscillent entre la reconnaissance des efforts consacrés par les administrations publiques à l’ouverture des données et le constat de lacunes persistantes, que ce soit au niveau technique ou de retombées réelles pour les citoyens.

Mais en matière d’Open Data, la dimension juridique est également essentielle et c’est ce que vient de rappeler le Conseil national du numérique (CNNum), en publiant cette semaine un avis [pdf] qui recommande d’apporter des modifications substantielles au cadre législatif français.

Open Data, un premier bilan français

Open Data, un premier bilan français

Six mois après le lancement du portail gouvernemental de libération des données publiques Etalab, de nombreuses ...


C’est la loi CADA du 17 juillet 1978, qui pose les grands principes en la matière, modifiée à l’issue de la transposition en 2005 d’une directive européenne concernant la réutilisation des informations du secteur public.

Longtemps, le débat en France a tourné autour des questions de licences employées par les administrations pour libérer leurs données et de leur compatibilité, à la fois avec les principes de l’Open Data qu’avec les exigences de la loi du 17 juillet 1978. Cette question contractuelle tend aujourd’hui à passer au second plan, l’essentiel des initiatives françaises ayant choisi d’opter soit pour la Licence Ouverte d’Etalab, soit pour l’ODbL proposée par l’Open Knowledge Foundation.

Néanmoins, comme l’indique le Conseil national du numérique dans son avis, c’est sans doute au niveau législatif que les questionnements pourraient à présent glisser, et, au-delà, au niveau communautaire, puisqu’une proposition de révision de la directive sur les informations du secteur public a été avancée par la Commission européenne en décembre 2011[pdf]. Il est intéressant de confronter les recommandations du CNNum avec les orientations possibles de la future directive européenne, pour essayer de cerner les différents chemins juridiques qui s’ouvrent pour l’Open Data.

Conforter le droit à la réutilisation des informations publiques

La première recommandation du CNNum consiste à imposer progressivement aux administrations l’obligation de publier d’elles-mêmes leurs données, alors que la loi de 1978 les oblige seulement à les communiquer sur demande. Il s’agirait en effet d’une avancée indiscutable, mais en la matière, il faut cependant voir que la France est en quelque sorte en avance au sein de l’Union européenne, car la loi de 1978 reconnaît un véritable droit au profit des citoyens à la réutilisation des informations publiques, dès lors que les documents qui les contiennent sont accessibles.

La directive européenne de 2003 n’allait pas si loin, dans la mesure où elle laissait la possibilité aux Etats ou aux administrations de décider quelles informations ils souhaitent rendre réutilisables ou non. Comme le dit Katleen Janssen dans une analyse d’avril 2012 [pdf], la directive “ne créait donc pas un droit plein et entier à la réutilisation” et cette limitation a pu constituer un frein important à la réutilisation des données publiques en Europe.

Pour lever cet obstacle, la Commission recommande une modification de la directive qui exigera que toutes les informations accessibles puissent être réutilisées, aussi bien à des fins non-commerciales que commerciales. Les seules restrictions qui persistent concerneront la protection des données personnelles ou des droits de propriété intellectuelle de tiers. D’une certaine façon, l’Union européenne s’aligne en la matière sur des principes que la France a déjà mis en oeuvre dans sa législation dès la transposition de 2005 et il faut reconnaître que notre droit avait déjà franchi cette étape.

La gratuité comme objectif

En ce qui concerne la question de la gratuité, le CNNum et la Commission ont des approches un peu différentes, mais qui tendent toutes les deux à étendre le champ de la réutilisation gratuite des données.

En France, comme le rappelle le CNNum, la gratuité a été fixée comme un principe par la circulaire du 26 mai 2011 qui a créé le portail data.gouv.fr. Ce texte  demande aux ministères et aux établissements publics relevant de leur tutelle de diffuser leurs données via le portail unique de l’Etat , en recourant à la Licence Ouverte qui permet la réutilisation gratuite, y compris à des fins commerciales.

La France entr’ouverte

La France entr’ouverte

L'État a lancé son site data.gouv.fr. La France, enthousiaste, ouvre donc ses données publiques comme les États-Unis. ...

Selon cette même circulaire, les administrations ne pourront plus après le 1er juillet 2012 instaurer d’elles-mêmes une redevance pour la réutilisation des données. Cela ne sera possible que par le biais d’un décret du Premier Ministre et à condition de pouvoir avancer des “éléments dûment motivés” considérés comme pertinents par le Conseil d’Orientation de l’Edition Publique et de l’Information Administrative (COEPIA). Pour renforcer encore cette dynamique de gratuité, le CNNum propose d’appliquer également cette procédure aux redevances instituées avant le 1er juillet 2012, afin de réexaminer leur bien-fondé au regard des évolutions actuelles.

La proposition de directive européenne ne va pas de son côté jusqu’à proclamer un principe de gratuité en matière de réutilisation des informations publiques. Elle laisse, comme c’est le cas actuellement, la faculté aux administrations de décider d’instaurer des redevances, mais elle introduit des principes plus stricts que jusqu’alors en matière de calcul des tarifs. En principe, les redevances ne devront pas excéder “le coût marginal de reproduction et de diffusion“, ce qui empêchera aux administrations de rechercher à dégager des bénéfices importants et peut les inciter fortement à autoriser la réutilisation gratuite des données.

Comme le relève le CNNum, ces préconisations sont plus restrictives que l’actuelle loi française qui permet aux administrations de tenir compte des coûts de collecte et de production, mais aussi d’inclure dans la redevance “une rémunération raisonnable de ses investissements“.

Des licences ouvertes, mais les formats ?

En ce qui concerne la question des licences, la proposition de directive européenne contient une consécration de cette démarche contractuelle inspirée des licences libres, alors que certains avaient pu douter un temps qu’elle soit vraiment compatible avec le régime légal de la réutilisation des données.

La Commission indique que “les organismes du secteur public peuvent autoriser la réutilisation sans conditions ou poser des conditions, telle qu’une indication de la source, le cas échéant par le biais d’une licence”. Cette modification ouvre la voie à l’adoption de licences très ouvertes, telle la Creative Commons Zéro (CC0) et conforte la licence ouverte créée par Etalab.

En ce qui concerne les formats en revanche, on peut regretter un manque de volontarisme aussi bien du côté de la directive que du CNNum. La proposition de révision de la directive impose l’obligation de diffuser les données dans des formats “lisibles par des machines”, mais elle n’indique pas que ces formats doivent être libres et non propriétaires. Pareillement, le CNNum propose que soit mis en place un Référentiel Général de Réutilisabilité des données publiques, qui comportera des indications concernant les formats, mais ne donne pas de recommandation forte en faveur des formats ouverts.

Conjurer l’ #EPICFAIL en matière d’Open Data

En revanche, le CNNum fait preuve d’audace en s’attaquant à une des limitations les plus importantes au développement de l’Open Data en France. Il préconise en effet que le droit à la réutilisation des données publiques soit étendu à celles produites par des SPIC (Services Publics à caractère Industriel et Commercial), alors que la loi du 17 juillet 1978 considère pour l’instant qu’il ne s’agit pas d’informations publiques.

Or de nombreux EPIC (Établissements Publics à caractère Industriel et Commercial) disposent de données particulièrement intéressantes pour l’Open Data, comme c’est le cas de la SNCF, du CNES, de l’ONF, de l’IGN, de l’IFREMER et d’autres encore. La restriction de la loi de 1978 n’a certes pas empêché un établissement comme la SNCF de se lancer dans une démarche d’Open Data, mais elle l’a fait sur une base purement volontaire (et avec certaines frictions du côté des licences).

(cliquez sur la photo pour la version PDF) Une des nouvelles proposition de cartes du métro de Paris lors du concours lancé par Check My Metro - Plan de Nojhan. Vote du Jury : Plan d’Argent.

Le régime particulier des EPIC a pu conduire aussi à des #EPICFAILS (;-), comme ce fut le cas en 2011 avec l’épisode rocambolesque du conflit entre la RATP et CheckMyMetro. On peut du coup se réjouir de la proposition faite par le CNNum, tout en restant conscient que la question de la tarification des réutilisations pourra néanmoins continuer à se poser.

L’épineuse question des données culturelles

C’est également une des prises de positions du CNNum les plus fortes que celles qu’il avance à propos des données culturelles. A l’heure actuelle, les données culturelles relèvent elles aussi d’un régime dérogatoire, dénommé “exception culturelle”,  qui découle de la directive européenne. J’ai déjà eu l’occasion sur Owni de montrer que ce régime d’exception soulève de réelles difficultés et qu’il provoque une marginalisation des données culturelles au sein du mouvement d’Open Data en France.

Le CNNum partage cette analyse et déplore la sous-exploitation des données culturelles, qui sont pourtant par leur richesse particulièrement propices à la réutilisation. Considérant que leur nature ne justifie pas qu’elles soient traitées à part, il recommande que l’exception culturelle soit purement et simplement levée et que les données culturelles réintègrent le régime général de la loi de 1978.

Mieux encore, le CNNum condamne une des dérives les plus criantes de l’emploi du droit des données publiques en France. En effet, certains établissements culturels utilisent ce droit pour empêcher la réutilisation à des fins commerciales des oeuvres du domaine public qu’ils numérisent, à moins de payer une redevance. D’autres utilisent le droit de la propriété intellectuelle pour “reprivatiser” le domaine public en s’arrogeant un droit sur les images scannées. Le CNNum déplore ces pratiques et c’est sans doute la première fois en France qu’une position officielle s’élève aussi nettement en faveur de la défense du domaine public.

Des données culturelles à diffuser

Des données culturelles à diffuser

La libération des données est loin d'être complètement acquise en France. Si le portail Etalab est une première étape, ...

Mais hélas, en matière de données culturelles, la proposition de révision de la directive européenne s’avère plus décevante et elle pourrait même conduire à une régression en France. En effet, en apparence, la nouvelle directive propose également de considérer les données des bibliothèques, des musées et des archives comme des informations réutilisables, ce qui supprime la fameuse exception culturelle. Mais plus loin, et de manière assez contradictoire, le texte réintroduit des règles spécifiques en ce qui concerne les données produites par ces établissements, et elles ne vont pas dans le sens de l’ouverture.

Par exemple, pour les informations sur lesquelles les bibliothèques, musées et archives détiennent eux-mêmes des droits de propriété intellectuelle, ces établissements pourraient toujours continuer à décider de permettre ou non a priori la réutilisation des données. De telles dispositions appliquées en France constitueraient une régression, car la  jurisprudence administrative a déjà décidé que l’exception culturelle ne permettait pas, par exemple, à un service d’archives de s’opposer à la réutilisation de données numérisées par une entreprise.

Par ailleurs, la proposition de directive indique que par dérogation avec les principes généraux qu’elle énonce, les établissements culturels pourraient continuer à fixer des tarifs de réutilisation des données supérieur “aux coûts marginaux de reproduction et de diffusion” qu’elle fixe comme limite aux autres administrations. Il n’y a pas pire signal à envoyer aux établissements culturels, qui cèderont sans doute à la tentation de monétiser leurs données, ce qui continuera à les couper de l’Open Data. La CADA avait pourtant déjà interdit aux services d’archives de fixer des tarifs trop élevés et là aussi, la nouvelle directive constituerait une forme de régression.

On peut franchement déplorer le manque de cohérence de la proposition de révision de la directive en matière de données culturelles et espérer que ces aspects soient modifiés avant son adoption.

Les données publiques, des biens communs ?

Il y a une question relative à l’Open Data qui n’est abordée ni par le CNNum, ni par la proposition de révision de la directive et qui me paraît pourtant correspondre à un véritable enjeu.

Le cadre juridique n’envisage pour l’instant, ni au niveau européen, ni au niveau national, la possibilité d’appliquer une clause de partage à l’identique (Share Alike) en cas de réutilisation de données publiques, à l’image de ce qui caractérise le Copyleft dans le domaine du logiciel libre. Une clause de ce type impose à celui qui réutilise des éléments de placer ses propres enrichissements sous la même licence, afin de conserver le caractère ouvert et réutilisable prévu par la licence initiale. Appliquée aux données publiques, une telle démarche signifie qu’en cas de réutilisation, une firme serait par exemple obligée de placer les bases qu’elles auraient constituées sous une licence ouverte et de permettre elle aussi la réutilisation des données en les reversant à une sorte de “pot commun” où d’autres pourraient venir puiser.

Certaines administrations françaises, au niveau local, ont déjà opté pour cette logique du partage à l’identique, en choisissant de placer leurs données sous la licence ODbL, qui comporte une telle clause virale. Mais au niveau des administrations centrales, cette démarche est pour l’instant impossible, car la Licence Ouverte de data.gouv.fr n’impose pas le Share Alike, mais seulement la mention de la source.

Certains estiment que le partage à l’identique serait nécessaire pour constituer les données publiques en biens communs et empêcher qu’elles soient réappropriées de manière définitive par des acteurs privés. On évoluerait ainsi vers une approche moins “libérale” de l’Open Data et des rapports économiques plus équilibrés entre le public et le privé. Force est de constater que cette dimension ne figure ni dans les recommandations du CNNum, ni dans la proposition de directive, mais la situation pourrait être modifiée si le partage à l’identique était au moins proposé commune option dans la Licence Ouverte de data.gouv.fr.

Au niveau européen, on peut même se demander si l’ajout d’un Share Alike par le biais d’une licence est bien compatible avec les orientations de la nouvelle directive, dans la mesure où celle-ci indique que conditions posées par les licences ne doivent pas “limiter indument les possibilités de réutilisation“.

Doit-on faire de l’Open Data la règle ?

Dans une chronique précédente, j’avais évoqué les recommandations du réseau européen Communia, qui préconisait de faire de l’Open Data un principe général applicable par défaut au données publiques. Pour ce faire, Communia recommandait :

1) de recourir à des licences les plus ouvertes possibles, afin de rapprocher au maximum le régime juridique des données publiques du domaine public ;

2) de rendre obligatoire la diffusion des données dans des formats ouverts, lisibles par des machines ;

3) d’affirmer un principe de gratuité en matière de réutilisation des données publiques.

Les recommandations du CNNum et la proposition de révision de directive contiennent des orientations fortes en ce sens, mais ils ne vont ni l’un, ni l’autre jusqu’à consacrer l’Open Data comme un principe général. Cela signifie que l’Open Data restera encore dans les années à venir avant tout une question de volonté politique et non la simple conséquence d’une obligation juridique.


Photo par Tim.tom [CC-byncsa] ; Plan du métro par Nohjan via CheckMyMetro et via sa galerie Flickr [CC-bysa]

Laisser un commentaire

  • duschnouk le 13 juin 2012 - 17:15 Signaler un abus - Permalink

    Le principe du partage à l’identique de l’ODbl est pas mal du tout, mais c’est regrettable que le terme de “convey” de cette licence n’inclue pas l’utilisation via un réseau informatique. Donc il manque la version AOdBL (pour Affero – a l’instar de l’AGPL pour la GPL).

    Car j’en déduis que si j’utilise une BDD sous ODbl sur un site internet et que mes utilisateurs y accèdent et la complètent par ce biais, je ne suis pas tenu de donner accès à ce qui en résulte sous la licence ODbl… c’est un peu nul à l’heure de l’internet.

    Pour être précis sur ce point, l’ODbl est en fait contradictoire: l’article 4.2 indique ” If You Publicly Convey this Database, any Derivative Database, or the Database as part of a Collective Database, then You must: a. Do so only under the terms of this License or another license permitted under Section 4.4 (…)” donc sous-entendu ça ne s’applique pas si la bdd est sur un site internet (car on a le terme “Convey”) mais ensuite l’article 4.4 auquel le 4.2 renvoie ne comporte plus le terme de “convey” et indique “Any Derivative Database that You Publicly Use must be only under the terms of i. This License; (…)”.

    Mais j’ai quand même l’impression que l’esprit du texte c’est bien le “convey” – il faudrait demander aux auteurs.

    Ensuite pour un partenariat gagnant public/privé, une base de donnée proposée en AODbl pourrait être doublée d’une licence commerciale supprimant l’obligation de “partage à l’identique” moyennant finance – et dans ce cas le problème du texte européen qui indique qu’il ne faut pas que ces licences “limitent indument les possibilités de réutilisation” saute car les réutilisations commerciales seront possibles.

    En tout cas je vais regarder tout cela de près. Merci pour cet article très complet.

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • psammos le 14 juin 2012 - 20:16 Signaler un abus - Permalink

    L’IGN n’est pas un EPIC, mais un EPA (Établissement public à caractère administratif) depuis 1967

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
  • EdileMax le 19 juin 2012 - 9:03 Signaler un abus - Permalink

    Si je peux me permettre, l’inclusion d’une composante “share alike” mérite un réel débat. Car si on peut y voir un avantage évident, une telle clause repousserait les intervenants du secteur privé (auto-entrepreneurs, PME, et méga-corpos) : si les informations transformées doivent être partagées gratuitement, quel intérêt pour de telles sociétés de s’investir dans ces démarches, de proposer de nouveaux services basées sur l’open-data ? Beaucoup de sociétés ont pour fond de commerce le croisement de données pour fournir de nouveaux services. Et pour être honnête, ce sont surtout eux qui font avancer -il me semble en tout cas- l’open data aujourd’hui. Cette dimension industrielle et commerciale est clairement mise en avant par tous les textes fondateurs de l’opendata “à la française”. L’opendata a déjà bien du mal à s’implanter, je ne suis à l’heure actuelle pas convaincu que les seules bonnes volontés “citoyennes” suffisent à lancer la machine.

    Il me semble qu’à l’heure actuelle, inclure une obligation de partage à l’identique dans les licences qui sous-tendent l’opendata reviendrait à lui tirer une balle dans le pied.

    (Ou alors je commente totalement à côté de la plaque, ce qui n’est pas impossible vu la fatigue accumulée ces derniers jours, auquel cas, mes plus plates excuses pour ce pavé qui manque de structure ! ^^)

    • Vous aimez
    • Vous n'aimez pas
    • 0
    Lui répondre
4 pings

Derniers articles publiés