
que Google envisage qu'il se présente avant de démarrer une conversation
Ces dernières années, nous avons assisté à une révolution dans la capacité des ordinateurs à comprendre et à générer des discours naturels, en particulier avec l'application de réseaux neuronaux profonds. Pourtant, même avec les systèmes de pointe d'aujourd'hui, il est souvent frustrant de devoir parler à des voix informatisées qui ne comprennent pas le langage naturel. En particulier, les systèmes téléphoniques automatisés ont encore du mal à reconnaître des mots et des commandes simples. Ils ne s'engagent pas dans un flux de conversation et forcent l'appelant à s'adapter au système au lieu que le système s'ajuste à l'appelant.
Durant l’édition 2018 de sa conférence développeur, Google a présenté sa dernière nouveauté dans la matière : Google Duplex, un chatbot tellement réaliste que, pendant la démonstration, certains humains au bout du fil n’ont pas réalisé qu’ils échangeaient avec une IA. Voici la vidéo de présentation :
Si la prouesse a été saluée par la communauté, certains n’ont pas manqué de soulever des problèmes d’éthiques liés à une IA dont la voix générée ne peut pas facilement être distinguée d’une personne réelle. Rappelons que tout ne se limite pas à la voix, Google a étudié d’autres aspects de la conversation naturelle.
La filiale d’Alphabet rappelait par exemple que conduire des conversations naturelles comporte plusieurs défis : le langage naturel est difficile à comprendre, le comportement naturel est difficile à modéliser, les attentes de latence nécessitent un traitement rapide et la génération d'un son naturel avec les intonations appropriées est difficile.
Quand les gens se parlent, ils utilisent des phrases plus complexes que lorsqu'ils parlent à des ordinateurs. Il arrive qu’ils se corrigent souvent en mi-phrase, sont plus verbeux que nécessaire, ou omettent des mots et s'appuient plutôt sur le contexte; ils expriment aussi un large éventail d'intentions, parfois dans la même phrase, par exemple, « Donc, du mardi au jeudi, nous sommes en pause entre midi et deux, puis nous rouvrons pour terminer à six heures ».
Dans les discours spontanés naturels, les gens parlent plus vite et moins clairement que lorsqu'ils parlent à une machine, ce qui rend la reconnaissance de la parole plus difficile et Google observe des taux d'erreur de mots plus élevés. Le problème s'aggrave pendant les appels téléphoniques, qui ont souvent de forts bruits de fond et des problèmes de qualité sonore.
Dans des conversations plus longues, la même phrase peut avoir des significations très différentes selon le contexte. Par exemple, lors de la réservation des réservations « Ok pour 4 » peut signifier l'heure de la réservation ou le nombre de personnes. Souvent, le contexte pertinent peut être plusieurs phrases de retour, un problème qui est aggravé par l'augmentation du taux d'erreur de mots dans les appels téléphoniques.
Autant d’éléments qui ont été pris en compte pendant le développement de Google Duplex.
Pour calmer les critiques, Google a envisagé que Duplex s’identifie au préalable avant les échanges avec les humains, comme l’a confirmé un porte-parole de l’entreprise :
« Nous comprenons et apprécions la discussion autour de Google Duplex - comme nous l'avons dit depuis le début, la transparence de la technologie est importante. Nous concevons cette fonctionnalité avec une divulgation intégrée, et nous nous assurerons que le système s’identifie correctement. Ce que nous avons montré à I / O était une avant-première d’une démo technologique, et nous prenons en considération les retours / suggestions lorsque nous développons un produit ».
Le PDG de Google, Sundar Pichai, a préempté les préoccupations éthiques dans un billet de blog qui correspondait à l'annonce faite plus tôt cette semaine :
« Il est clair que la technologie peut être une force positive et améliorer la qualité de vie de milliards de personnes à travers le monde, mais il est tout aussi clair que nous ne pouvons pas nous contenter de réfléchir à ce que nous créons. Nous sommes conscients que la voie à suivre doit être soigneusement et délibérément explorée, et nous ressentons un profond sentiment de responsabilité à l'égard de cette décision ».
Avantages pour les entreprises et les utilisateurs
Lors de la présentation, Google a évoqué certains avantages aussi bien pour les entreprises que pour les utilisateurs. Les entreprises qui utilisent des réservations de rendez-vous prises en charge par Duplex et qui ne sont pas encore alimentées par des systèmes en ligne peuvent bénéficier de Duplex en permettant aux clients de réserver via l'Assistant Google sans devoir modifier leurs pratiques quotidiennes ni former leurs employés. L'utilisation de Duplex permet également de réduire les non-présentations aux rendez-vous en rappelant aux clients leurs rendez-vous à venir de manière à faciliter l'annulation ou le rééchelonnement.
.
Pour illustrer avec un autre cas l’utilité de Google Duplex pour les entreprises, Google rappelle que les clients appellent souvent les entreprises pour se renseigner sur les informations qui ne sont pas disponibles en ligne, telles que les heures d'ouverture pendant les vacances. Duplex peut appeler l'entreprise pour se renseigner sur les heures d'ouverture et rendre l'information disponible en ligne avec Google, ce qui réduit le nombre d'appels reçus par les entreprises, tout en rendant l'information plus accessible à tous. Les entreprises peuvent fonctionner comme elles l'ont toujours fait, il n'y a pas de courbe d'apprentissage ou de changements à faire pour bénéficier de cette technologie.
Pour les utilisateurs, Google Duplex facilite les tâches prises en charge. Au lieu de passer un appel téléphonique, l'utilisateur interagit simplement avec l'Assistant Google, et l'appel se déroule entièrement en arrière-plan sans intervention de l'utilisateur.
Un autre avantage pour les utilisateurs est que Duplex permet une communication déléguée avec les fournisseurs de services de manière asynchrone, par exemple, en demandant des réservations en dehors des heures d'ouverture, ou avec une connectivité limitée. Il peut également contribuer à résoudre les problèmes d'accessibilité et les barrières linguistiques, par exemple en permettant aux utilisateurs malentendants ou aux utilisateurs ne parlant pas la langue locale d'effectuer des tâches par téléphone.
Sources : blog Google, BI
Et vous ?


Voir aussi :





Vous avez lu gratuitement 8 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.