Tous plateformisés #4 : Quel avenir pour la social data ?

Par Elise Koutnouyan

Ce qu’il faut retenir :

Évolution de la nature de la donnée collectée : un travail d’accompagnement auprès des annonceurs est nécessaire pour accompagner le RGPD
La responsabilité juridique : il est parfois difficile de situer la chaîne de responsabilité entre donneurs d’ordre et sous-traitants
La volatilité de la data : les différentes réglementations juridiques dessinent un Internet re-nationalisé

L’heure est à la restriction en termes d’accès à la social data. Alors que l’opinion publique est de plus en plus sensibilisée aux enjeux de privacy sur les réseaux sociaux, la mise en oeuvre du RGPD d’une part et le durcissement des conditions d’accès aux API des plateformes d’autre part ont profondément impacté les métiers de la social data.

L’entrée en vigueur du règlement européen RGPD constitue la principale source de changement dans l’extraction et l’exploitation de la donnée sociale par les praticiens. Mais ce nouveau cadre législatif se révèle complexe à interpréter par les acteurs. « Il existe effectivement un vide juridique, explique Victor Fabre, avocat en nouvelle technologies au cabinet De Gaulle Fleurance & Associés. Depuis l’entrée en vigueur du RGPD, la CNIL n’a pas été en mesure de donner des explications concrètes sur la social data, le marketing et le commerce électronique. Il n’existe que peu d’orientations dans ces domaines. » Les manquements au RGPD peuvent être sanctionnés à hauteur de 20 millions d’euros ou 4% du CA annuel mondial. Mais dans les faits, la CNIL manque de moyens humains et financiers pour effectuer les contrôles de mise en conformité : seuls 300 contrôles ont été effectués l’an dernier. « La CNIL est consciente que de grands acteurs ne respectent pas la loi, mais elle cible également ses contrôles en fonction des plaintes des individus », poursuit Victor Fabre.

 

DE LA DONNÉE D’IDENTITÉ À LA DONNÉE TEXTUELLE

Du côté des acteurs de la social data, l’application du RGPD a nécessité d’importants ajustements dans les outils utilisés et le type de données collectées. « Le RGPD a été un gros chantier en interne dès début janvier 2018, témoigne Anne-Sophie Omboua-Jalais, social intelligence lead chez Publicis Media. Les demandes clients concernaient principalement notre outil de social analytics interne, Social Tools. » Chez Publicis Medias, c’est le principe de précaution qui a été appliqué. Concrètement, le cas le plus parlant en termes de perte de données concerne la répartition démographique, sur les “like” des pages par exemple. « Nos client nous la demandent encore souvent mais c’est un no go », poursuit Anne-Sophie Omboua-Jalais.

« Notre position : prendre ce que les API nous donnent. À partir du moment où une donnée n’est plus disponible, on n’essaie pas d’aller la chercher », précise Anne-Sophie Omboua-Jalais.

C’est désormais la donnée textuelle qui est valorisée dans le social listening. Plutôt que de se concentrer sur les personnes qui s’expriment, il s’agit désormais de s’intéresser à la voix des consommateurs. Le verbatim est la principale data exploitée. Si la question de l’anonymat et du respect de la vie privée a été centrale dans la réglementation RGPD, les GAFA ont par ailleurs restreint l’accès à un autre type de données : l’historique. Youtube interdit par exemple la collecte des données de plus de 30 jours, idem pour Instagram. Seul Twitter autorise encore de remonter dans ses données. De plus, les API de Facebook et Instagram interdisent la portabilité de la donnée collectée en social listening : la transférer d’un outil à un autre est interdit aux prestataires. « C’est l’autre nouvelle frontière de la social data qu’on n’avait pas forcément anticipée et qui se révèle beaucoup plus embêtante pour notre métier », estime Clément Brygier, co-fondateur et CEO de Digital Insighters.

 

ÉVOLUTION DANS LA NATURE DU MÉTIER ET DANS L’ACCOMPAGNEMENT CLIENT

Ce changement de nature de la donnée collectée a nécessité, de la part des agences et cabinets de conseil, une évolution dans l’accompagnement client : « Avant, les annonceurs avaient tendance à collecter des fichiers qu’ils n’utilisaient pas », se rappelle Clément Brygier. C’est d’ailleurs l’esprit dans lequel a été pensé ce texte, estime Victor Fabre : « La plupart du temps, le premier réflexe des sociétés était de collecter les données et les stocker, parce que ça ne coûtait rien. Mais ça ne servait aussi à rien ! Avec la nouvelle réglementation, le principe est de dire : ‘dès lors que la donnée personnelle n’est pas nécessaire, arrêtez de la collecter » Ce travail d’éducation à la donnée a été amorcé en amont de la mise en oeuvre du RGPD, par les acteurs juridiques publics et privés. « Dès 2015, le service juridique d’une multinationale nous a présenté de nouvelles règles, explique Clément Brygier (Digital Insighters). Quand le RGPD est tombé, les GAFA ont mis leurs API en conformité, les outils de social listening ont suivi. » Désormais, « se présenter comme RGPD compliant est un avantage concurrentiel », estime-t-il.

« Le RGPD nous aide à accompagner les clients vers de meilleures clés de compréhension de leurs communautés et de leurs cibles. » explique Clément Brygier.

Les chercheurs, autres acteurs exploitant la social data, ont également subi les conséquences des restrictions d’accès. « Dans le monde scientifique, on parle plus d’éthique et de déontologie dans l’exploitation de données que de conformité juridique », estime Nicolas Turenne, docteur en informatique et chercheur à l’INRA. Il assume : « les chercheurs ont différentes manières de procéder qui ne sont pas forcément en accord avec la loi. Personnellement, j’ai déjà utilisé un crawler pour contourner les restrictions des API d’un réseau social chinois et donc récupérer certaines données. » La restriction temporelle dans la collecte de la social data est aussi un frein pour les chercheurs : « pour Youtube, c’est un problème important car cette plateforme est une mine d’or », poursuit Nicolas Turenne. Plusieurs dispositions jouent néanmoins en faveur des acteurs scientifiques. D’un part, les pouvoirs publics peuvent solliciter des travaux dans certains domaines de recherche, à condition de publier en open data. Certains secteurs subissent donc moins de contraintes pour ces raisons. D’autre part, des exceptions juridiques fournissent un cadre plus souple aux travaux de recherche, par exemple sur le text mining. Ces exceptions rappellent également celles concernant la liberté de la presse. Les médias peuvent exploiter certains contenus issus des réseaux sociaux qu’une entreprise ne peut utiliser. « Les journalistes ont le droit d’utiliser des informations personnelles dès lors qu’elles présentent un intérêt public. La jurisprudence de la CEDH est très claire à ce sujet », rappelle Victor Fabre. Le principe de la liberté d’information l’emporte sur celui de la protection de la vie privée.

 

LA DIFFICILE QUESTION DE LA RESPONSABILITÉ

Pour autant, outre l’exception de la presse, la question se pose aux acteurs privés de la social data de la frontière entre ce qui relève d’une déclaration publique et ce qui tombe sous le coup du RGPD. « À quel moment doit-on anonymiser les listes d’influenceurs ? », demande Clément Brygier. Selon Victor Fabre, « il n’y a aucun problème à collecter et stocker une déclaration publique, sur Instagram par exemple. Là où ça devient problématique, c’est quand il s’agit d’un compte privé. » Anne-Sophie Omboua-Jalais explique que « sur Instagram, on peut uniquement collecter les profils business. On part donc du principe que la personne fait la démarche de se mettre en ‘business’ et de monétiser. On est donc en droit de collecter et d’exploiter sa donnée ».

« Les pouvoirs publics ont compris que les entreprises ont dépensé beaucoup d’argent pour le RGPD et sont conscients que toutes ne sont pas encore compliant », rappelle Victor Fabre.

L’arrivée de nouvelles restrictions juridiques a également redéfini le principe de responsabilité face à la loi. Pour le RGPD, c’est un principe de responsabilité en cascade qui s’applique. Pourtant celui-ci reste « flou dans les critères », remarque Rémi Douine, fondateur de The Metrics Factory et co-animateur de cette session. Chez Publicis Media, la question de la responsabilité a été anticipée et pensée au moment de la mise en conformité des outils internes de social listening. Résultat : peu de demandes de clients. En revanche, les agences pointent une tendance des grands comptes à poser des restrictions juridiques plus fortes que ce qu’exige le RGPD. Le revers de cette démarche : « du fait de l’asymétrie des services juridiques, les grands comptes poussent à déléguer la responsabilité de traitement aux agences alors que celle-ci devrait être partagée. On se retrouve coincé entre un statut de responsable vis-à-vis de la loi et de sous-traitant vis-à-vis du client », pointe Rémi Douine. Les acteurs de la social data peuvent néanmoins compter sur la démarche d’accompagnement dont fait preuve la CNIL. Certaines données, notamment celles liées à la santé et aux opinions publiques, sont considérées comme sensibles d’un point de vue juridique. Leur exploitation est plus étroitement surveillée.

 

L’ÉCOSYSTÈME DE LA SOCIAL DATA EST EN PERPÉTUEL MOUVEMENT

La matière de la donnée sociale est par essence mouvante, les métiers qui la traitent sont donc amenés à évoluer constamment. « Les usages évoluent constamment et il y a aujourd’hui un apprentissage global dans la société autour de la privacy des data. Les frontières changent et rien n’est figé, y compris au niveau juridique », remarque Rémi Douine. Dans la restriction d’accès aux données des API, un participant explique par exemple avoir noté que : « les GAFA avaient fermé le robinet en juillet dernier, mais ils ont commencé à autoriser à nouveau l’accès à certaines données très récemment. Je pense que d’ici juillet, l’accès va s’assouplir encore plus. » Si certains imaginent un scénario catastrophe où les GAFA fermeraient complètement leurs API pour ne plus laisser passer aucune donnée (comme Linkedin), d’autres se montrent plus optimistes. Le cas de Twitter montre que l’exploitation des API peut aussi être un atout pour le business de ces plateformes. Néanmoins, la réputation entre également en jeu dans la mise à disposition des données, comme l’a montré le scandale Cambridge Analytica). Le cas de Crimson Hexagon prouve également que les GAFA peuvent, pour des enjeux réputationnels, couper leurs API.

Clément Brygier identifie deux grandes tendances pour le futur de la social data et du business. D’une part, un fractionnement de l’Internet mondial, longtemps perçu comme une entité sans frontières « on va assister à la création de plusieurs Internets (européen, chinois, américain, africain…) selon les pays et les réglementations. Dans les prochaines années, capter de la donnée demandera une présence physique sur certains continents. » Cette tendance à la renationalisation du web est observée par d’autres intervenants. D’autre part, sur la relation aux plateformes : « en tant que cabinet de conseil, il serait judicieux de développer des technologies permettant d’être moins dépendants des acteurs du social listening, eux-même négociant des contrats secrets avec les GAFA pour l’exploitation de leurs API. » L’extrême volatilité de cet environnement invite donc à relativiser les questions qui se posent actuellement sur l’accès à la social data. « Avec le RGPD, le futur règlement ePrivacy et le débat public, le sujet sur le poids des réseaux sociaux et l’usage de la social data est très fort aujourd’hui. Mais il faut rappeler que les métiers de la social data ne représentent qu’une infime partie du marché général de la data », conclut Rémi Douine. Des datas dont l’exploitation est réelle, comme les données d’achat auprès de la grande distribution, et auxquelles le grand public n’est que très peu sensible.