Social Data : du data mining au produit fini avec Captain Dash et Visibrain

Par Arnaud Paillard


Tweets évoquant une marque, billets de blogs, checkins, volumes de partages de liens sur Facebook, hashtags sur des photos instagram (etc.) : en moins de 10 ans l’avènement des plateformes social media et la massification de leurs usages ont donné naissance à un nouveau type de données que l’on appelle social media data ou social data. toutes ces données sont aujourd’hui utilisées par de nombreux acteurs pour mesurer, identifier, comprendre et illustrer nos comportements à l’heure du social media. La Commission Social Data du Social Media Club a pour objectif de réunir l’ensemble les praticiens de la social data pour échanger sur les enjeux de la manipulation de ce nouveau type de données.

Facts and figures :

  1. « Le but premier d’un dashboard, c’est de trouver de nouveaux insights » Kate Lewensten

  2. La social data doit s’exprimer par une analyse quantitative et une analyse qualitative

  3. En août 2015, avec 115 000 tweets en moins de douze heures, la population de Melbourne a forcé la police à stopper action de contrôles inopinés, qui avait fuité sur les réseaux sociaux 9 minutes avant l’annonce officielle.

  4. Au-delà de la donnée sociale, il y a la donnée, l’accessibilité de celle-ci, et sa mise à disposition.

Social Data : du data mining au produit fini

Si les données sociales enthousiasment journalistes, annonceurs et chercheurs, les enjeux de son utilisation ne sont pas encore correctement définies. Comment la social data devient-elle un produit fini ? Quels sont les enjeux de la collecte, de l’analyse, et de l’opérabilité des données ? Peut-on, enfin, parler d’une gouvernance de la social data et appréhender les enjeux que soulève son utilisation ? Pour en discuter, nous avons invité Nicolas Huguenin, PDG de Visibrain, Georgina Parsons, Content Manager at Visibrain, Kate Lewensten, Project Manager & Business Developement Manager chez Captain Dash et Kim-Jenny DINH Lead Project Manager chez Captain Dash à partager leurs regards et expériences. Une séance animée par Rémi Douine, fondateur de the metrics factory, Anna Oualid, Directrice du Social Media Research chez Opinion Way et Gilles Achache, fondateur de Scan-Research.

Less is more

« Les données, il y en a plein. Les entreprises en génèrent énormément. Mais le problème de cette data brute, c’est qu’elle part dans tous les sens » Pour Kim-Jenny Dinh, lead project manager chez Captain Dash, la question n’est pas l’exhaustivité des données, mais leur pertinence : l’enjeu est plutôt dans la sélection des KPI. Réduire le nombre d’indicateurs permet de mieux exprimer les besoins des utilisateurs, et donc de construire des outils qui seront plus et mieux utilisés. Cette simplicité n’est pas une coquetterie de consultant. C’est elle qui donne la valeur ajoutée d’un tableau de bord, qui doit raconter une histoire pour, selon le motto de Captain Dash, « Aider le client à passer moins de temps à collecter les données et plus de temps à penser à sa stratégie ». Mais il reste difficile de convaincre les entreprises et les institutions de se séparer de leurs indicateurs « Les gens sont vraiment attachés à leurs KPI, c’est surprenant ». Même son de cloche chez Nicolas Huguenin, fondateur de Visibrain : « C’est une utopie de vouloir analyser tout le web ».

Data telling

Lors de sa prestation pour L’Oréal sur la campagne ‘Beauty for all’, Captain Dash a convaincu le service marketing de l’entreprise de cosmétique de réduire les KPI à une centaine. Cette réduction a permis de croiser des données, et de s’apercevoir que la stratégie de L’Oréal, orientée vers les tablettes car le temps passé par page était plus important, était erronée : si les utilisateurs smartphone passaient moins de temps sur les pages, ils en consultaient quatre fois plus. C’est un croisement de données simple qui permet à une équipe marketing de raconter une histoire et de prendre conscience de son potentiel de développement. Pour Nicolas Saintagne, directeur Europe chez Synthésio, le data telling doit permettre de mieux partager les outils issus des social data au sein de l’entreprise : « Le problème, c’est l’adoption; les projets les plus réussis, c’est quand la personne qui s’occupe de la production, le technicien opérationnel chez Peugeot, me dit que ça l’aide à comprendre pourquoi les gens vont changer leurs plaquettes de frein à l’extérieur du réseau de réparateurs agréés ». « Le but premier d’un dashboard, c’est de trouver de nouveaux insights » explique Kate Lewenstern.

La limite de l’opérationnel

Si le but de la donnée sociale est d’aider les institutions et les entreprises à guider leur prise de décision, les dashboards qui monitorent les données sociales sont le plus souvent davantage des outils de reporting que véritablement des outils de pilotage. Lors de sa prestation pour la SNCF, le dashboard conçu par Captain Dash a été cantonné à un rôle informatif. Selon Anna Oualid, Directrice du pôle social media chez Opinion Way, une piste à explorer serait l’apport d’une analyse écrite au sein des tableaux de bord, qui est souvent sous-traitée par les entreprises de data analysis. L’alliance de l’analyse de la donnée sociale quantitative et qualitative, une piste pour évoluer vers davantage d’opérationnel ?

La donnée sociale, absente du débat publique ?

Pour Gilles Achache, fondateur de Scan Research, il y a un angélisme certain dans l’utilisation des data, surtout en entreprises : si « ce sont des outils qui peuvent servir au pilotage, qui, tant qu’ils sont au vert, ne posent pas de problème », on n’a pas encore de recul suffisant pour connaître l’utilisation qui peut être faite du data mining en cas de conflit. L’exemple soulevé à ce titre par l’entreprise Visibrain est éloquent. En août 2015, une information concernant l’action de la police aux frontières australiennes, la Border Force, fuite neuf minutes avant l’annonce officielle de contrôles inopinés dans la ville de Melbourne. La réaction sur Twitter est immédiate et importante, avec 115 000 tweets en moins de douze heures. Une pression en ligne qui a poussé les pouvoirs publics à annuler l’opération. Visibrain a analysé comment cette crise a débuté et qui l’a amorcé. En faisant l’archéologie Twitter de cet événement, Visibrain montre non seulement un exemple d’intrusion de la social data dans le débat public et politique, mais pose des questions lourdes de conséquences sur la surveillance des médias sociaux. Est-il, en résumé, éthique de dénoncer des lanceurs d’alerte sur Twitter ou des animateurs de foule ?

De nouveaux standards de mobilisation

La question reste posée, même si, pour Nicolas Huguenin « Ce n’est pas parce qu’on identifie un individu comme étant à l’origine d’une alerte qu’on engage des poursuites du jour au lendemain ». Gilles Achache confirme : « il n’y a pas eu de questions très graves de dénonciation sur les réseaux sociaux ». La Commission Nationale Informatique et Liberté (CNIL), ferait déjà un travail plus que suffisant pour limiter les abus. Et puis, continue M. Achache « le partage entre vie publique et vie privée a évolué de façon assez dramatique en quelques années. Tous ces gamins qui racontent leur vie sur les réseaux sociaux, ça peut sembler a priori un peu bizarre, mais c’est pour moi une recherche de la reconnaissance sociale. Ce n’est pas nécessairement un danger, et je ne suis pas sûr qu’il faille le voir nécessairement comme une décadence ou comme une réduction de liberté ».

Et M. Douine de conclure : « la social data devient de fait une nouvelle forme d’engagement : plutôt que de signer une pétition, on va retweeter un hashtag, qui va faire monter un compteur que politiques et gouvernements regardent. Ce qui pose plutôt la questions des nouveaux standards de mobilisation du politique ».

Gouvernance et démocratisation de la donnée

Au-delà de la donnée sociale, il y a la donnée, l’accessibilité de celle-ci, et sa mise à disposition. A propos de son expérience avec la direction de la transparence de la SNCF, il est intéressant de noter que Kim-Jenny Dinh n’hésite pas à employer l’expression de gouvernance de la data : « Dans le cadre de son programme transparence, la SNCF souhaite démocratiser la donnée et libérer les indicateurs. La direction de la transparence a mis une année à collecter les données qu’elle voulait intégrer au dashboard, elle a dû supplier chaque direction du groupe ferroviaire pour accéder aux données ». La libération des données, qui ne sont plus seulement sociales dans le cas de la SNCF, ne va pas de soi. Des « silos » de données se forment, pour reprendre une expression de Captain Dash, et les ouvrir peut s’avérer compliqué. « Savoir où est la donnée et comment la récupérer est fondamental » continue Mme Dinh. L’enjeu, pourtant, est de taille. C’est en effet en travaillant sur la datavisualisation qu’il est possible de démocratiser la donnée, et de permettre son appropriation, aussi bien en entreprise que dans le débat public : « tout le monde, au sein d’une entreprise, doit être en mesure de lire les données et de les comprendre », conclut Kate Lewensten.

Quel avenir pour la social data ?

L’importance du temps réel, la facilité d’utilisation, l’instantanéité permise grâce aux API, autant de facteurs qui, pour Mme Lewensten, vont continuer à placer la social data au centre des préoccupations des entreprises, des institutions, et du public. La rusticité des indicateurs et le manque de renouvellement de la donnée, en revanche, semblent conduire la social data vers une obsolescence rapide, selon Mme Dinh. La preuve ? « On a commencé chez Captain Dash vraiment axé social data. Maintenant, on se dirige plus vers de la donnée issue de la vente, des RH, vers des données plus difficiles à récupérer, en CSV ou en data legacy ; on se dirige vers de l’analyse beaucoup plus poussée ».

La social data en 2020, toujours en temps réel mais plus complexe, et mieux analysée ?

 

Vous venez de lire le compte-rendu d’un atelier du :