Point de vue: L’Open Data : des données gratuites seulement ?

Point de vue de Stéphane, Manager au sein du Groupe Estia

 

L’Open Data : des données gratuites seulement ?

Coureur à mes heures perdues, j’ai comme beaucoup de mes congénères sportifs, une montre connectée et un compte Strava qui me permet de partager / suivre mes autres camarades de jeu.

En ce début d’année, l’heure du bilan 2019 se faisait sentir et échangeant avec un ami datascientist de son état, il m’explique qu’il vient de découvrir que Strava nous mettait à disposition nos données via une API. Une création de compte, quelques lignes de code R (avec notamment l’utilisation d’un package Rstrava dédié pour cette API), un peu de leaflet et on a à disposition plusieurs datavisualisations plutôt sympas sur les différentes statistiques, les parcours, etc.

Partageant cela auprès de mon entourage (évoluant dans des sphères assez lointaine de la data), on me fait la réflexion que l’Open Data « ouvre des perspectives incroyables ».

Cette petite phrase m’a rappelé que cette notion d’Open Data n’était pas forcément si limpide pour tout le monde et que beaucoup utilisaient ce terme à mauvais escient.

En effet, l’Open Data est très encadrée et toutes les données auxquelles nous accédons, même gratuitement, ne sont pas à considérer comme de la « donnée ouverte». Par exemple, mes données Strava, bien que gratuites n’en font pas partie. En effet, elles ne sont pas accessibles à tous.

Profitons donc de ce début d’année pour nous remettre à niveau.

 

Un peu d’histoire

Bien que démocratisé sur la dernière décennie, le terme d’« Open Data » apparait pour la première fois dans les années 1970, lors de la signature des accords entre la NASA et des pays partenaires en vue du partage de données satellitaires. C’est en 1995 qu’on en voit le premier usage public aux Etats-Unis dans un rapport de la National Academy of Science intitulé On the Full and Open Exchange of Scientific Data. En 2005, l’Open Knowledge Foundation pose les bases d’une définition du savoir ouvert. Puis en 2007, sont définis les grands principes de l’open Data. En 2009, Tim Berners-Lee, le père du web, propose d’aller plus loin en demandant que les grandes administrations « ouvrent les données brutes ». Cela débouche en 2013 sur la rédaction d’une charte internationale qui fixe les grands principes pour l’ouverture des données.

Stéphane 1

 

 

Les 10 commandements des données Open Data

Pour être considérées comme de l’ « Open Data », les données doivent être :

  1. complètes: elles doivent représenter l’intégralité de ce qui est collecté par l’administration sur un sujet donné avec des métadonnées qui explique comment elles ont été collectées, c’est le principe d’open data par défaut réclamé par la charte internationale de l’open data qui est aujourd’hui la norme en France avec la loi pour une République Numérique
  2. primaires: les données doivent être non agrégées et telles que collectées à la source, cela équivaut à la demande de données brutes popularisée par Tim Berners-Lee
  3. fraîches: les données doivent être publiées dès que possible pour garder leur valeur
  4. accessibles: les données doivent être directement téléchargeables sans enregistrement préalable
  5. lisibles par les machines: les données doivent être exploitables automatiquement
  6. accessibles sans discrimination: les usagers doivent pouvoir accéder aux données à tout moment sans s’enregistrer ni fournir de justification
  7. disponibles sous des formats ouverts: les spécifications de standards de données doivent être ouvertes et, si possible, faire l’objet d’une gouvernance partagée
  8. disponibles sous licence ouverte: l’Open Definition donne les critères juridiques d’une licence ouverte
  9. accessibles de façon pérenne en ligne: les données doivent être archivées et les versions précédentes conservées
  10. sans coût d’utilisation: l’accès et la réutilisation des données doivent être gratuits.

 

Un eldorado pour enrichir ses données

Des données multi-sectorielles

Stéphane 2

Il existe aujourd’hui en France plus de 150 portails d’Open Data disponibles sur le net. Bien que la grande majorité des portails soit détenue par les institutions publiques, quelques entreprises semi-publiques (comme la SNCF) mettent aujourd’hui leurs données à disposition. On retrouve également les sources de grands organismes nationaux comme l’INSEE ou la CNIL. Cela permet donc d’accéder à des données de tous secteurs.

 

Exemples d’open data

data.gouv.fr

C’est le site de référence.

En effet, avec plus de 38000 jeux de données, issus bien sûr du gouvernement mais aussi d’autres sources telles que l’INSEE ou la Poste. Vous trouverez aussi beaucoup de jeux de données issus des régions et de datalocale. L’outil de recherche permet des recherches par thème, par mot-clé ou encore par origine.

data.ratp.fr/explore/

Envie d’intégrer les transports en commun dans la définition de votre zone de chalandise. La Ratp met à disposition horaires, équipements et services en gare, régularité, lignes et correspondances, accessibilité, etc.

donneespubliques.meteofrance.fr

Les données météorologiques font parties des données les plus importantes dans nos sociétés (et oui, savoir le temps qu’il fera est une question que chacun se pose). Météo France publie depuis peu les données utilisées pour ses modèles, il s’agit seulement d’un début mais cela montre que même une institution aussi classique que Météo France se met à l’open data.

Quelques usecase

Ces  données offrent de nombreuses opportunités, notamment la possibilité pour les entreprises de créer de nouveaux services, de compléter leur propre data pour aller plus loin dans la compréhension de leur client et le développement de leur business.

Ci-dessous quelques illustrations qu’Estia a pu mettre en œuvre auprès de nos clients

Stéphane 3

 

Des opportunités au-delà de leur utilisation

Les bénéfices ne se limitent pas à l’exploitation de la donnée. En effet, l’open-data peut notamment permettre à l’entreprise d’améliorer son image (transparence, innovation, collaboration). De plus, les données mises à disposition, peuvent sembler ne pas être exploitables à prime abord mais elles peuvent le devenir si elles sont complétées par d’autres. Ce qui donne l’opportunité de nouer des partenariats qui peuvent s’avérer intéressant.

Donc n’attendez plus, que ce soit au travers de leur exploitation ou de leur mise à disposition, l’open data est une réelle opportunité de développement pour les entreprises. Attention cependant, car cette prise de conscience de la valeur de la donnée pourrait bien conduire certains à des réflexions autour de sa monétisation et ainsi remettre en cause le 10ème commandement, à savoir sa gratuité.

 

Sources 

https://www.lebigdata.fr/open-data-definition

https://datactivist.coop/ardeche/rapport/

https://www.groupe-scala.com/tout-sur-open-data/

_________________________

A PROPOS DE GROUPE ESTIA

Le Groupe Estia est un cabinet de conseil spécialisé dans la transformation des données en actifs.

Créé en 2010, il rassemble aujourd’hui 100 consultants experts de la donnée et de son exploitation à forte valeur ajoutée (data scientists, statisticiens, experts du décisionnel et experts fonctionnels) et génère 10m€ de CA.

Le Groupe Estia intervient auprès des directions métiers de plus de 30 clients grands comptes, dans tous les secteurs d’activités : Banques, Assurances, Distribution, Energie, Transports, Médias, Services,… Son objectif : faire des données un accélérateur business pour nos clients. Son intervention couvre l’intégralité du cycle de transformation et de valorisation de la data.

Notre gamme de services se décline en 6 offres : Pilotage des activités, Connaissance clients, Communication omnicanal, Modélisation à visée prédictive, Transformation vers une organisation data centrics, Gestion de projets data & nos expertises couvrent l’ensemble des problématiques data : CRM analytique, gestion de campagnes, datamining & webmining, business intelligence, conception d’outils, d’applications analytiques, d’algorithmes & de modèles,…

En 2017 la société accélère son développement en s’appuyant sur un nouvel actionnaire de référence, le groupe Consort NT intégrateur et opérateur de solutions et d’infrastructures (2 000 collaborateurs, 140m€ de CA, 6 pays). Le Groupe Consort NT et Groupe Estia proposent dorénavant une offre unique couplant technologies, infrastructures et capacités algorithmiques au service de la performance de leurs clients.

0 Avis

Laisser une réponse

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>