Par Brice Andlauer

Le marché des assistants intelligents, aujourd’hui dominé par les GAFA, interpelle autant qu’il attire avec des promesses de nouveaux usages et marchés multiples. Amazon avec Alexa, Apple avec Siri, Google avec Assistant, Microsoft avec Cortana … ces technologies basées sur un système de commande vocale sont censées accélérer la présence des intelligences artificielles dans notre vie quotidienne, notamment dans nos foyers.

Pour en discuter, nous avons invité chez SoLocal Ari de Sousa (Radio France), Moustafa Zouinar (Orange Labs), Claude de Loupy (Syllabs) et Frédéric Cavazza (Consultant Indépendant). Une session organisée et animée par Daniel Lemin (SoLocal), Nicholas Vieuxloup (Social Media Club) et Pierre-Olivier Cazenave (Social Media Club).

Il semble que le marché soit réactif : selon une étude de Global Market Insights, il devrait représenter 3 milliards de dollars en 2020, 11 milliards en 2024[1]. Assistant vocal, intelligent ou universel, les termes correspondent en fait à des réalités technologiques et à des usages très variés.

« On est en train de vivre une évolution remarquable. Ça peut faciliter la vie quotidienne. Mais il y a encore beaucoup de défis techniques et d’utilisation à relever. » Moustafa Zouinar (OrangeLabs)

Si le marché est présent, les usages et les modèles économiques sont encore à explorer, car ils reposent sur des technologies encore naissantes et évolutives. D’abord apparus comme des assistants vocaux installés dans les systèmes d’exploitation des smartphones (Siri pour Apple, Cortana pour Windows, Assistant pour Google) les assistants intelligents prennent aujourd’hui aussi la forme d’enceintes connectées placées dans les foyers.(Amazon Echo, Google Home, Homepod). Principalement basée sur de la commande vocale, la technologie semble pour l’instant très éloignée d’une intelligence artificielle forte. « Nous sommes en présence d’une technologie assez basique. C’est un micro sur lequel sont branchés des déclencheurs, comme la phrase OK Google. Une fois que ces déclencheurs ont été détectés, le micro enregistre les éléments, les transforme en texte, et les fait remonter vers un moteur de recherches, » explique Claude de Loupy (Syllabs).

« À ce stade, il n’y a pas de compréhension de la part de la machine. Il y a une extraction vers un moteur de recherches, et de la remontée d’informations. » Claude de Loupy (Syllabs)

Les limites techniques de la machine impliquent par conséquent des usages limités. « Il y a des indexicaux (des termes dont la signification dépend du contexte, comme ceci ou cela) qui sont très compliqués à interpréter pour une machine. On observe que l’utilisateur se projette spontanément dans une conversation naturelle et utilise ce type de termes, ce qui engendre des difficultés interactionnelles. Au bout de deux ou trois fois, l’utilisateur arrête d’utiliser la machine, » détaille Moustafa Zouinar (OrangeLabs).

DIALOGUE OU REQUÊTE ?

Le problème ne viendrait donc pas de la technologie en soi, mais du décalage qu’il existe entre la promesse de ces objets et leur utilisation concrète. « Le côté déceptif est évident. Il y a un problème de marketing. Cela fait vingt ans que l’on parle de moteur intelligent, de compréhension et de machines qui donnent du sens, alors que pour l’instant ce n’est pas comme ça qu’elles fonctionnent, » analyse Claude de Loupy (Syllabs).

« Les échanges restent très simples et très scénarisés. En l’état actuel des choses, on reste sur un système de requête basique. Est-ce qu’un jour on arrivera à un véritable dialogue “naturel” ? Tout dépendra de l’évolution des capacités techniques de ces systèmes » Moustafa Zouinar (OrangeLabs)

Une autre évolution envisageable serait aussi que l’homme s’habitue au fonctionnement de l’assistant pour en améliorer son usage, comme le rappelle Frédéric Cavazza en se référant à un article de Frédéric Kaplan[2]. « Il y a du machine Learning, mais il y aussi du human Learning. L’homme adapte son langage à la machine, en s’axant sur le mot clé, sur la simplification, » argumente-t-il.

D’autres réticences à l’utilisation, liées à l’authentification permettant l’accès et la privatisation des données sont également soulignées. L’absence de reconnaissance vocale du locuteur poserait notamment un problème de sécurité, en cas de cambriolage par exemple. Mais c’est surtout du côté de la protection des données que les inquiétudes sont les plus grandes. « Le problème, c’est que toutes les données collectées sont envoyées sur un cloud, alors que ce n’est absolument pas une nécessité : un modèle acoustique comprenant un très grand nombre de mots tient sur 16 gigaoctets. Cela peut être intégré à l’assistant. L’objectif principal n’est pas de rendre service, mais de récupérer des données, » analyse Claude de Loupy (Syllabs). « Nous sommes dans un pays qui légifère avant de voir de venir, contrairement à la Chine notamment, qui va innover même si c’est dangereux. Le problème avec ces technologies c’est de trouver un juste milieu entre légifération et innovation, » poursuit Raphaël Chenol, responsable des opérations et du marketing chez hamak.fr (un service édité par PagesJaunes).

DES OBJETS COMPLÉMENTAIRES ET DÉMATÉRIALISÉS

Les usages évoluant avec les technologies, les perspectives sont multiples, d’autant plus que l’utilisation des assistants ne se limite pas au foyer. Les médias surveillent par exemple de très près l’utilisation des assistants dans la voiture. « C’est un sujet structurant et central pour nous, car 90% de l’usage de la radio se fait dans le véhicule ou le foyer, d’autant plus que nos contenus sont nativement conçus pour ces supports. Après l’ère de l’écrit et de l’image, on entre aujourd’hui avec les assistants dans un monde où la voix est favorisée, » explique Ari de Sousa (Radio France).

« Il serait dommage de se concentrer uniquement sur un assistant vocal. C’est une interface, on peut donc la solliciter avec du texte (grâce aux services de messagerie ou au SMS), de la voix, ou même visuellement. » Frédéric Cavazza

Plus encore, l’utilisation des assistants pose la question de l’utilité d’autres objets comme le smartphone. Il semble que l’assistant apporte surtout un complément aux objets déjà existants. « Nous entrons dans l’ère de l’informatique ubiquitaire, c’est-à-dire un monde dans lequel l’utilisateur dispose d’une grande diversité d’appareils, par exemple, un Smartphone, une tablette, ou une montre connectée, et à la maison de plus en plus d’objets connectés » analyse Moustafa Zouinar (OrangeLabs). Avec des innovations et des recherches constantes, la question de savoir quel rôle va jouer l’intelligence artificielle dans nos foyers reste ouverte et suscite des inquiétudes. La forme que doivent prendre les intelligences artificielles pose également question. L’anthropomorphisme est une piste exploitée depuis de plusieurs années, mais soulève des questions notamment le fait que plus on se rapproche de l’humain plus on fait l’expérience d’un sentiment d’étrangeté. Une évocation des émotions humaines reste cependant une possibilité étudiée, comme avec Spoon, un robot constitué uniquement d’un bras au bout duquel se trouve un écran reproduisant les expressions d’un visage humain. « Par ce biais, avec un côté ludique, on peut contourner les réticences au dialogue avec la machine, » analyse Claude de Loupy (Syllabs).

« L’objectif d’un Amazon ou d’un Google n’est pas tant d’être un constructeur mais davantage un opérateur de données. A l’avenir, l’assistant vocal ne sera pas forcément un objet visible en tant que tel, mais pourra être intégré dans un autre objet. » Ari de Sousa (Radio France)

Hormis les limites conversationnelles des assistant vocaux “intelligents”, la maison “intelligente” et connectée pose d’autres défis . « Cette idée d’objets pilotés par un système central nécessite de les connecter à celui-ci. Ce qui pose la question de l’interopérabilité qui reste largement ouverte, du fait de l’hétérogénéité technique des objets commercialisés. » explique Moustafa Zouinar (OrangeLabs). Un retour à l’utilisation d’écrans pour les assistants reste par ailleurs une tendance envisageable. Amazon a en effet réintroduit l’écran avec Amazon Echo pour conserver la capacité de l’utilisateur de faire des choix. « C’est un appareil parmi d’autres. Sur des demandes complexes, je pense qu’il lui sera demandé de projeter de l’information sur un écran pour qu’ensuite l’utilisateur fasse un choix, » poursuit Claude de Loupy (Syllabs).

LE MONOPOLE DE LA RÉPONSE ?

Les assistants intelligents étant pour l’instant essentiellement développés par les GAFA, la question de leur position monopolistique reste centrale, notamment dans le traitement des résultats que les assistants font remonter. « La question de l’opt in, c’est-à-dire du choix de recevoir ou non une information, est centrale. Le paramétrage est un enjeu clé (l’ajout de services externes par l’utilisateur). Mais il est très probable que le choix sera fait par les GAFA, » analyse Frédéric Cavazza. « Avant, nous avions des moteurs de recherche. Aujourd’hui, nous avons des moteurs de réponse. Le problème c’est comment se situer dans la réponse, comment catégoriser et segmenter son offre. Le pouvoir de négociation n’est pas forcément de notre côté mais nous avons des atouts et une position forte en particulier dans l’audio» raconte Ari de Sousa (Radio France). « Nous pensons que l’utilisateur ira de moins en moins chercher le service d’un professionnel sur un moteur de recherches, il le demandera. Notre problématique, c’est de savoir comment nos clients seront référencés auprès des assistants vocaux. La réponse n’est pas du tout évidente, et je ne pense pas que c’est le consommateur qui va la paramétrer. Pour les entreprises, il y a une question d’attribution. Est-ce que nous devons devenir une pure société de service, ou est-ce que nous continuons à être une marque qui fidélise ? » ajoute Jean-Pierre Remy, DG de SoLocal Group. Ce nouveau positionnement des marques dépend intrinsèquement d’une réponse unique que fournirait l’assistant, qui serait atténué dans le cas où la capacité de choix serait conservée. « On parle toujours du côté mono réponse de l’assistant. Mais c’est un usage qui selon moi est difficilement acceptable par les utilisateurs et l’utilisation d’un écran permettant un choix plus large sera nécessaire. Je pense que le positionnement des marques sera de la même logique qu’avec les moteurs de recherche, c’est-à-dire être référencé dans les dix premiers résultats, » argumente Claude de Loupy.

« Mon sentiment, c’est que la commande vocale va prendre le dessus. Je ne vis pas ça comme un injonction des GAFA, mais comme une évolution des usages que nous devons appréhender et nous positionner comme un acteur fort . » Ari de Sousa (Radio France)

Même à travers les assistants, les possibilités de référencement existent toujours. Ari de Sousa explique par exemple que la marque est citée dans chacune des réponses construites pour ces nouveaux supports. « C’est de cette manière que nous allons fidéliser à la marque, pour qu’elle ne soit pas diluée avec toutes les autres réponses. C’est à la fois une demande de l’utilisateur et du diffuseur de contenus, on veut identifier la source, » explique-t-il. Le monopole des GAFA paraît d’autant moins important au niveau local. « C’est la marque qui fait la skills (l’équivalent de l’application pour les Smartphones), donc elle ne va pas effacer son nom. Les assistants ne peuvent pas faire grand chose contre ça. Le seul problème c’est le modèle économique. Quel est le service et comment le paye-t-on ? » lance François Millet, cofondateur de la société de production digitale 44.

C’est au niveau local que se situe le véritable enjeu de pénétration. Pour le groupe SoLocal par exemple, qui tire les trois quarts de ses revenus annuels (soit 491 millions d’euros) d’offres de référencement local sur ses propres plateformes (PagesJaunes, Mappy, Ooreka, AvendreALouer,) le positionnement sur ces nouvelles méthodes de recherche est indispensable. Le groupe a signé un partenariat avec Microsoft pour expérimenter son assistant virtuel Cortana. « Il n’y a pas que les grands comptes qui ont des opportunités. Avec la génération de textes à partir de données, notre cible c’est l’hyperlocal. Il n’est pas rentable de produire manuellement, de manière récurrente, une information pour un village de 250 habitants, il faut donc passer par l’automatisation, » précise également Claude de Loupy (Syllabs).

Malgré les limites technologiques, les enjeux commerciaux sont importants et suivis de très près par l’ensemble des acteurs du numérique. « Au final, que ce soit de la grande ou de la petite technologie, ce n’est pas le plus important. Aujourd’hui, les investissements ne se font plus sur les Smartphones, mais sur l’intelligence artificielle. Nous ne sommes plus dans la phase d’observation de la technologie, on fait des affaires, » explique Jean-Pierre Remy (SoLocal Group). « Nous ne pouvons pas nous permettre de nous poser autant de questions sur l’éthique ou le ROI. Il faut avancer vite pour ne pas se faire distancer sur ces sujets, » ajoute Frédéric Cavazza.

Si les investissements sont très importants et les résultats encourageants (Alexa est passé de 2 000 à 12 000 skills en moins d’un an, Amazon a vendu 11 millions d’assistants aux Etats-Unis et au Royaume-Uni en 2016), il est vrai que le modèle économique des assistants intelligents en est encore à ses balbutiements. Aujourd’hui, Amazon offre des assistants à ses meilleurs clients. « Peut-être qu’au final, il n’y aura jamais de monétisation. Si les assistants représentent 10% des usages, il serait envisageable de les donner dans une optique de fidélisation, » analyse Frédéric Cavazza. Comme de nombreuses avancées technologiques, les questions techniques, éthiques, commerciales et économiques posées par les assistants intelligents vont probablement se régler avec le temps de façon empirique, avec les nouveaux usages.

Références : 

[1] « Intelligent Virtual Assistant (IVA) Market Size over $11bn by 2024. » Market Research Reports, Consulting: Global Market Insights Inc. 18 Dec. 2016.
[2] Kaplan, Frédéric, and Dana Kianfar. « Google Et L’impérialisme Linguistique. » Le Monde Diplomatique, 01 Jan. 2015.

Les trois points à retenir :

  • La technologie utilisée reste encore dans le domaine de l’IA faible, ce qui constitue souvent une entrave à la fluidité des usages dans le foyer.
  • L’enjeu est prioritaire pour les annonceurs et les médias, qui voient une opportunité dans l’hyperlocalisation de l’information (journalistique ou servicielle).
  • Les assistant intelligents soulèvent plus que jamais la question de la protection des données, et de leur utilisation par les GAFA.

Pour en savoir plus sur les assistants intelligents et l’intelligence artificielle :

Scherer, Éric. « South by SouthWest : Sans IA, Pas D’avenir ! » Meta-media | La Révolution De L’information. 04 Apr. 2017. 

Pignol, Juliette. « Faut-il Avoir Peur De L’intelligence Artificielle ? » Blog Du Modérateur, 09 June 2017. 

Chatalic, Paul. « Préparez-vous : Avec L’intelligence Artificielle S’ouvre L’ère De L’hyper-service. » Offremedia.com, 8 June 2017.

Une session organisée par le

Logo-smc-1

Retrouvez également nos articles sur le blog du SMC sur Zdnet :

ZDNet-partenriat-SMC