Point de vue: Data visualisation, une nouvelle ère de l’exploitation de la donnée

Point de vue: Data visualisation, une nouvelle ère de l’exploitation de la donnée

Point de vue, Gaël, Manager Data science

Le phénomène « Big Data » est désormais connu de tous, innombrables sont les articles ou présentations décrivant les énormes quantités de données générées dans notre monde à dominante digitale et les nouveaux usages qui pourraient en découler; ainsi l’exploitation de ces masses de données pourraient permettre d’encore mieux connaître les clients, de pouvoir les cibler au mieux, de prédire le churn, de capter les différents centres d’intérêts des clients, de pouvoir prédire des pannes …en somme de répondre à toutes les attentes potentielles !

Ces « nouvelles » données couvrent un vaste périmètre : navigations sur le Web, réseaux sociaux, Open Data,  plateformes techniques, objets connectés, véhicules connectés, …

Elles sont exploitées par des équipes de Data Scientists, qui, développent sur divers outils/ technologies des solutions produisant des indicateurs à valeur dont l’usage est de servir de socle pour répondre aux besoins des organisations : analyses, modèles, …

Cependant pour rendre l’utilisation de ces informations réellement efficiente il est nécessaire de démocratiser la diffusion de ces indicateurs et analyses et de permettre leur bonne interprétation « business » aux différents échelons de l’entreprise.

La data-visualisation est l’un des moyens présentant un fort intérêt dans ce cadre.

Elle a pour principe de restituer sous forme graphique les différentes données pour exploiter le sens dominant chez l’Homme, la vue. De nombreuses informations passent par la vue, comme le veut l’expression consacrée « une image vaut mille mots ».

L’exemple le plus souvent utilisé pour montrer la puissance de la data-visualisation est celui d’un tableau Excel. Supposons que nous disposions d’un tableau sans aucune mise en forme représentant les ventes de différents produits sur diverses années. Déceler les valeurs maximales pour chaque période parait compliqué…. En ajoutant une légère mise en forme, avec en vert les valeurs maximales de chaque année et en rouge les minimales permet déjà de simplifier l’exploration. En représentant désormais ces données sur un graphique avec différentes couleurs selon les produits et permettant de filtrer par période, l’identification des différentes valeurs est désormais très simplifiée, et il est aisé de répondre à différentes questions. C’est un exemple de gain apporté par la data-visualisation. Par ailleurs, des phénomènes complexes à identifier peuvent transparaitre plus aisément avec des vues graphiques.

Coté outils, de nombreuses solutions existent sur le marché. Elles permettent de déployer une solution de dataviz à l’échelle d’une entreprise tels SAS VA, Power BI, Qlik Sense ou bien encore Tableau software (la liste n’étant pas exhaustive !); elles vont donner la possibilité de créer des dashboard exploitables sur le web, sur les outils de CRM et de pouvoir échanger/ commenter les différents résultats par groupe d’utilisateurs. Ces solutions permettent également d’exploiter les différents formats de sources de données (Fichiers plats, Datamart, Business View, données en environnement BIG DATA, …) et d’analyser des données en temps réel. D’autres outils pourront permettre de réaliser une rapide visualisation pour appuyer une présentation, illustrer des articles sur le web ou compléter les possibilités d’Excel.

Les nombreuses solutions de cette famille d’outils sont très différentes à la fois dans leur utilisation quotidienne mais également en termes de choix d’environnement de déploiement (On Premise, Cloud,…).

Ainsi, à titre d’illustration, SAS VA permettra de définir des liens dynamiques dans le rapport et de pouvoir gérer les relations entre les différentes « pages du rapport ». L’utilisateur va pouvoir travailler ses données en amont en utilisant le code SAS et a donc accès à l’ensemble des possibilités offertes par SAS.

Qlik Sense, pour sa part, utilise son célèbre moteur associatif qui permettra aux utilisateurs de pouvoir comprendre directement quelles sont les relations entre les différentes variables. Le code BNF sera utilisé pour du prétraitement avancé des données et l’utilisation de « set analysis » va permettre de créer des variables préfiltrées sur une sélection de son choix. L’ergonomie de l’outil permet aussi de pouvoir jouer facilement sur les différents filtres de l’utilisateur et faire des retours arrière.

Pour Power BI, l’utilisateur Windows n’est pas perdu, la restitution est gérée sous forme d’onglets indépendants et de nombreuses fonctionnalités, y compris avancées, sont accessibles via de simples clics. L’utilisateur pourra ensuite avoir accès aux scripts Power Query et les formules DAX qui pourront paraîtres assez proche de VBA notamment sur la partie “calcul”. La notion de mesure, qui est un agrégat définit par l’utilisateur, est recalculée automatiquement à chaque niveau de restitution utilisé, cette forme peut être très pratique pour le calcul d’agrégats temporel.

Chacun de ces outils va disposer de bibliothèques de visualisations pouvant être élargies par les utilisateurs et il est important de prendre en considération ces bibliothèques qui permettront de répondre à des besoins spécifiques plus ou moins aisément, notamment par exemple, pour l’exploitation d’un « radarchart » qui est parfois compliqué sur certains outils.

En plus de la partie création de rapport, il est important de prendre en considération le niveau d’utilisation qui sera accessible aux utilisateurs, en la matière, plusieurs options existent :

  • Des rapports figés, qui seront des restitutions des métriques essentielles. Cette restitution demande de forts échanges avec les consommateurs, elle peut être exploitée notamment pour le suivi de production en temps réel de plateformes.
  • Des rapports animés, permettant d’exploiter les différents axes mis à disposition des métiers via différents filtres et l’exploration des visualisations. Les consommateurs pourront analyser des axes supplémentaires et comparer différentes périodes ou cibles, ce qui permet une plus grande latitude dans l’exploration.
  • L’accès à l’entière exploration des données, par laquelle les consommateurs peuvent créer leurs propres rapports mais ont aussi accès aux différentes données sources et peuvent réaliser les différents recoupements. Cette forme laisse l’entière liberté vis-à-vis des données, elle nécessite donc une réelle connaissance des bases, des données exploitées et des différentes interactions afin d’éviter des conclusions erronées.
  • La réalisation d’infographie fait également partie de la Dataviz mais est réalisée avec des outils spécifiques. Elle est la restitution pour laquelle la mise en forme est la plus personnalisée, la contrepartie étant qu’elle devient souvent déconnectée des bases de données…

Une fois le rapport réalisé, se posera le choix du mode de partage, via un portail Web, Mobile, des fichiers partagés, les différents outils permettent également de partager des restitutions figées en PDF ou en Powerpoint.

Les différentes solutions se distinguent donc dans de nombreux domaines fonctionnels et techniques. De par leur puissance, ces solutions intéressent l’ensemble des directions métiers ou techniques qui ont des buts bien différents. Il est donc important lors de la réalisation d’un projet de Data-visualisation d’identifier en premier lieu l’ensemble du périmètre d’utilisateurs potentiels.

De fortes interactions entre ces équipes sont nécessaires pour dimensionner le projet, choisir la solution adéquate permettant de réaliser les différentes restitutions souhaitées mais également répondre aux contraintes techniques.

Une méthode efficace pour sélectionner la solution la plus adéquate est la réalisation d’un premier benchmark, après rencontre des éditeurs pour cibler les solutions paraissant les plus pertinentes. Les différents recueils de besoins et les analyses d’avant-projet permettront de cibler au mieux les solutions participant au POC. La préparation devra intégrer la création d’une grille d’évaluation des outils, objective et permettant d’apprécier la complétude des outils sur les besoins. Ces échanges préalables pourront permettre d’initier également la création de communauté d’utilisateurs au sein de l’entreprise pour une meilleure adoption de la solution finale mais également une meilleure adhésion des équipes. Elles commenceront également à se familiariser aux différents outils, explorer leurs limites et mieux évaluer les différences mais aussi les freins à l’adoption d’une nouvelle solution et un nouveau mode de consommation de la donnée.

En savoir plus sur la data visualisation et sa mise en œuvre ? contact@groupe-estia.fr

_________________________

A PROPOS DE GROUPE ESTIA

Le Groupe Estia est un acteur majeur de la data intelligence rassemblant plus de 90 experts (statisticiens, Data Scientists, experts du décisionnel et experts fonctionnels), autour d’une même passion : le management et la valorisation de l’information au service des directions métiers et d’un même objectif, faire des données un accélérateur business pour nos clients.

Cette spécialisation intègre des expertises pointues dans plusieurs grands domaines métier : CRM analytique & marketing opérationnel (gestion de campagnes marketing en environnement cross canal, DMP,…), Connaissance client (Datamining, Webmining,…), modélisation quantitative notamment au service des services financiers, Business Intelligence et accompagnement de nos clients sur les sujets de Data Science & Big Data.

Le Groupe Estia délivre des prestations de conseil, de technologie et de marketing services autour de ce cœur de métier.

Le Groupe connait une croissance de + de 25 % chaque année depuis sa création en 2010 ; il accompagne actuellement plus de 30 clients grands comptes (Banques, Assurances, Médias, Energie, Distribution, ….).

 

0 Avis

Laisser une réponse

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>