Google Duplex, un système d'IA qui vise à mieux résoudre les problèmes posés par téléphone,
Va-t-il révolutionner les interactions homme-machine ?

103PARTAGES

9  0 
Ces dernières années, nous avons assisté à une révolution dans la capacité des ordinateurs à comprendre et à générer des discours naturels, en particulier avec l'application de réseaux neuronaux profonds. Pourtant, même avec les systèmes de pointe d'aujourd'hui, il est souvent frustrant de devoir parler à des voix informatisées qui ne comprennent pas le langage naturel. En particulier, les systèmes téléphoniques automatisés ont encore du mal à reconnaître des mots et des commandes simples. Ils ne s'engagent pas dans un flux de conversation et forcent l'appelant à s'adapter au système au lieu que le système s'ajuste à l'appelant.

Afin de permettre de mener les conversations naturelles pour effectuer des tâches «réelles» par téléphone, la filiale d’Alphabet a présenté sa technologie Google Duplex. Celle-ci est orientée vers l'accomplissement de tâches spécifiques, telles que la planification de certains types de rendez-vous. Pour de telles tâches, promet Google, le système rend l'expérience conversationnelle aussi naturelle que possible, permettant aux gens de parler normalement, comme ils le feraient à une autre personne, sans avoir à s'adapter à une machine.

L'une des principales idées de recherche était de contraindre Duplex à des domaines fermés, qui sont suffisamment étroits pour être explorés de manière approfondie. Il convient de préciser que Duplex ne peut effectuer des conversations naturelles qu'après avoir été profondément formé dans de tels domaines. Il ne peut donc pas effectuer de conversations générales.

La technologie Google Duplex est conçue pour paraître naturelle afin de rendre l'expérience de conversation confortable. Google assure qu’il est important que les utilisateurs et les entreprises aient une bonne expérience avec ce service, et la transparence en est un élément clé. « Nous voulons être clairs sur l'objectif de l'appel afin que les entreprises comprennent le contexte. Nous expérimenterons la bonne approche au cours des prochains mois ».

Mener des conversations naturelles

Conduire des conversations naturelles comporte plusieurs défis : le langage naturel est difficile à comprendre, le comportement naturel est difficile à modéliser, les attentes de latence nécessitent un traitement rapide et la génération d'un son naturel avec les intonations appropriées est difficile.

Quand les gens se parlent, ils utilisent des phrases plus complexes que lorsqu'ils parlent à des ordinateurs. Il arrive qu’ils se corrigent souvent en mi-phrase, sont plus verbeux que nécessaire, ou omettent des mots et s'appuient plutôt sur le contexte; ils expriment aussi un large éventail d'intentions, parfois dans la même phrase, par exemple, « Donc, du mardi au jeudi, nous sommes en pause entre midi et deux, puis nous rouvrons pour terminer à six heures ».

Dans les discours spontanés naturels, les gens parlent plus vite et moins clairement que lorsqu'ils parlent à une machine, ce qui rend la reconnaissance de la parole plus difficile et Google observe des taux d'erreur de mots plus élevés. Le problème s'aggrave pendant les appels téléphoniques, qui ont souvent de forts bruits de fond et des problèmes de qualité sonore.

Dans des conversations plus longues, la même phrase peut avoir des significations très différentes selon le contexte. Par exemple, lors de la réservation des réservations « Ok pour 4 » peut signifier l'heure de la réservation ou le nombre de personnes. Souvent, le contexte pertinent peut être plusieurs phrases de retour, un problème qui est aggravé par l'augmentation du taux d'erreur de mots dans les appels téléphoniques.


Décider quoi dire est une fonction à la fois de la tâche et de l'état de la conversation. En outre, il existe des pratiques courantes dans les conversations naturelles - les protocoles implicites qui incluent des détails (« ça marche pour vendredi en huit » - qui désigne le second vendredi à compter de la date de l’échange), un besoin de synchronisation (« peux-tu m’entendre ? » - lorsque nous avons l’impression que l’interlocuteur ne nous entend pas bien ou lorsque nous ne l’entendons pas bien nous même), les interruptions (« que disais-tu à propos d’Amélie ? » - lorsque nous perdons le fil), et les pauses (« un moment stp » - pour signifier à l’interlocuteur que nous lui reviendrons plus tard).

Intervient donc Google Duplex

Les conversations de Google Duplex semblent naturelles grâce aux progrès de la compréhension, de l'interaction, du timing et de la parole.

Au cœur de Duplex est un réseau de neurones récurrent (RNN) conçu pour faire face à ces défis, construit en utilisant TensorFlow Extended (TFX). Pour obtenir sa haute précision, Google a formé le RNN de Duplex sur un corpus de données de conversations téléphoniques anonymisées. Le réseau utilise la sortie de la technologie de reconnaissance vocale automatique (ASR) de Google, ainsi que les caractéristiques de l'audio, l'historique de la conversation, les paramètres de la conversation (par exemple, le service souhaité pour un rendez-vous ou l'heure actuelle) et plus encore.

Google a formé notre son modèle de compréhension séparément pour chaque tâche, mais a exploité le corpus partagé à travers les tâches. Enfin, Google a utilisé l'optimisation de l'hyperparamètre de TFX pour améliorer encore le modèle


Avantages pour les entreprises et les utilisateurs

Les entreprises qui utilisent des réservations de rendez-vous prises en charge par Duplex et qui ne sont pas encore alimentées par des systèmes en ligne peuvent bénéficier de Duplex en permettant aux clients de réserver via l'Assistant Google sans devoir modifier leurs pratiques quotidiennes ni former leurs employés. L'utilisation de Duplex permet également de réduire les non-présentations aux rendez-vous en rappelant aux clients leurs rendez-vous à venir de manière à faciliter l'annulation ou le rééchelonnement.
.
Pour illustrer avec un autre cas l’utilité de Google Duplex pour les entreprises, Google rappelle que les clients appellent souvent les entreprises pour se renseigner sur les informations qui ne sont pas disponibles en ligne, telles que les heures d'ouverture pendant les vacances. Duplex peut appeler l'entreprise pour se renseigner sur les heures d'ouverture et rendre l'information disponible en ligne avec Google, ce qui réduit le nombre d'appels reçus par les entreprises, tout en rendant l'information plus accessible à tous. Les entreprises peuvent fonctionner comme elles l'ont toujours fait, il n'y a pas de courbe d'apprentissage ou de changements à faire pour bénéficier de cette technologie.

Pour les utilisateurs, Google Duplex facilite les tâches prises en charge. Au lieu de passer un appel téléphonique, l'utilisateur interagit simplement avec l'Assistant Google, et l'appel se déroule entièrement en arrière-plan sans intervention de l'utilisateur.


Un autre avantage pour les utilisateurs est que Duplex permet une communication déléguée avec les fournisseurs de services de manière asynchrone, par exemple, en demandant des réservations en dehors des heures d'ouverture, ou avec une connectivité limitée. Il peut également contribuer à résoudre les problèmes d'accessibilité et les barrières linguistiques, par exemple en permettant aux utilisateurs malentendants ou aux utilisateurs ne parlant pas la langue locale d'effectuer des tâches par téléphone.

Source : Google

Et vous ?

Que pensez-vous de Google Duplex ?
Ces avancées technologiques en intelligence artificielle constituent-elles une menace pour des emplois comme téléconseiller ? Pour quelles raisons ?

Voir aussi :

Google déploie Android P Beta, la prochaine version majeure de son OS mobile, qui s'accompagne d'un nouveau système de navigation
Google serait en train de tester une fonctionnalité permettant aux utilisateurs de poser des questions, et recevoir des réponses d'autres utilisateurs
Android P : Google veut empêcher les applications de surveiller votre activité réseau, une faille de confidentialité que la firme a décidé de corriger
Google publie en open source le framework Asylo pour offrir une meilleure isolation aux charges de travail cloud sensibles
WebP, le format d'image moderne de Google, sort en version 1.0 avec des améliorations au niveau de la compression avec perte

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de sami_c
Membre averti https://www.developpez.com
Le 12/05/2018 à 22:04
edit: j'ai rien contre les maghrébins mais les centre d'appels sont au maroc/tunisie/algérie, donc j'y peut rien moi si c'est des maghrébins qui me font chier. j'ai plus rarement des asiatiques mais j'en ai aussi des vietnamiens/indiens qui m’appelle pour m'emmerder.

>> [sarcasme-on] ça se voit bien que vous n'avez rien contre les maghrébins ! [sarcasme-off] Ces gents que vous insultez, ils travaillent pour le compte de qui ? leur propre compte ? Vous savez très bien c'est pour le compte de sociétés françaises. Vous aurez très bien pu utiliser le terme "télé-opérateur", mais au lieu de ça vous avez préféré indiquer l'origine de ces personnes, qui en fin de compte ne font que leur travail !
4  1 
Avatar de marsupial
Membre expert https://www.developpez.com
Le 09/05/2018 à 12:48
Il s'agit d'une avancée assez phénoménale dans la compréhension de conversation même s'il s'agit de balbutiements dans le domaine. Plus qu'une prise de rendez-vous, cela peut automatiser la recherche de dossier (impôts, caf, banque, etc... ) avant de parler à un être humain au lieu de naviguer par touche de clavier. Action fastidieuse lorsqu'on a à faire à un serveur vocal.
3  0 
Avatar de ShigruM
Nouveau Candidat au Club https://www.developpez.com
Le 12/05/2018 à 19:19
Je suis surtout inquiet des données collecté sur ce genre de plateforme...
Aujourd'hui le téléphone en dehors d'appeler mes proches je m'en sers pour des trucs important, rendez vous chez un médecin, demande de renseignement auprès de la secu, de la préfecture...
c'est des données sensible qui passe par mon téléphone (données médicale,...etc)
J'imagine que pour utiliser ce services, il sera impossible d'avoir son propre serveur, faudra passer par le cloud google.

Inversement, les coups de telephone que je reçois, c'est par des maghrébin/indiens qui veulent me vendre leurs merde, si je reçois du spam par des bots sa vas pas le faire, cela le fait déjà pas quand c'est un maghrébin que j'insulte de tous les noms pour son dérangement et je lui ordonne de me supprimer de sa liste
mais si c'est un bot qui peut m'appeler 3000fois/secondes...

edit: j'ai rien contre les maghrébins mais les centre d'appels sont au maroc/tunisie/algérie, donc j'y peut rien moi si c'est des maghrébins qui me font chier. j'ai plus rarement des asiatiques mais j'en ai aussi des vietnamiens/indiens qui m’appelle pour m'emmerder.
2  2 
Avatar de weed
Membre éprouvé https://www.developpez.com
Le 13/05/2018 à 1:39
@ShigruM, bien sur que ce sont les pays du magrab, ce sont des pays parlant extrèment bien francais, ayant un décalage horaire réduit par rapport à la France et on un smic très bas par rapport à la France, l'équivalent de 400€ au maroc si ma mémoire est bonne.

Si tu reçois sans cesse l'appel, pourquoi décrocher ? Utilises dans ce cas une appli comme par exemple "should I answer?"

En terme de sécurité de données, bien sur que Google va essayer de recouper un maximum d'information de ses différents services pour récupérer des info précises. Tu pars du principe que l'on saura obliger de faire appel à un assistant IA pour passer nos appels automatiquement. Encore heureux que ce ne soit pas encore obligatoire.

Par contre, le destinataire, lui, il pourra être une IA et tu pourras lui divilguer des informations confidentiels à ton insus, sans que tu le saches que tu as une IA et non pas une personne. C'est plutot cela en terme de sécurité qui me gène.

Un jour, on prendra plus du tout le téléphone. Les IA passera et prendra également des appels hahah.
2  0 
Avatar de ShigruM
Nouveau Candidat au Club https://www.developpez.com
Le 13/05/2018 à 10:10
Citation Envoyé par weed Voir le message
@ShigruM, bien sur que ce sont les pays du magrab, ce sont des pays parlant extrèment bien francais, ayant un décalage horaire réduit par rapport à la France et on un smic très bas par rapport à la France, l'équivalent de 400€ au maroc si ma mémoire est bonne.

Si tu reçois sans cesse l'appel, pourquoi décrocher ? Utilises dans ce cas une appli comme par exemple "should I answer?"
parce qu’ils m’appellent sur ma ligne fixe... évidement mon portable est vierge de toute ces saloperies
Avec leurs accent je reconnais de suite si c'est des français ayant vécu en France avec l'accent Français ou des étrangers (maghrébins ou asiatiques)
Il n'y a rien de polémique la dessus, je suis français ayant vécu en France mais aussi je parle le danois, mais si je parle avec un danois il verra bien que je suis un étranger avec mon accent

Vous aurez très bien pu utiliser le terme "télé-opérateur", mais au lieu de ça vous avez préféré indiquer l'origine de ces personnes, qui en fin de compte ne font que leur travail !
Avec le temps, mon cerveau a développé un mécanisme qui me mets en colère des que j'entends l'accent maghrébins ou asiatique au téléphone, j'y peut rien moi car c'est con a dire mais j'ai un algo de construit dans mon cerveau :

Code : Sélectionner tout
1
2
3
4
5
6
Décroche_Téléphone()
SI Accent Maghrébin OU Asiatique:
Alors Poison qui m’emmerde
SI Accent Français :
Proche OU Truc Important
Un peu comme mon cerveau avec le temps ignore les encarts publicitaires, zap la pub à la télé...etc.
C'est le système qui m'a formaté ainsi, je pense pas etre le seul...

Non je n'utilise pas le terme "télé-opérateur", car se serait faire le poisson devant ce probleme, avec le terme Maghrébin ou Asiatique je rends le probleme plus percutent/choquant.
C'est comme remplacer Femme de ménage par Agent d'entretiens de surface, c'est juste des mots décoratif pour amoindrir/embellir des propos. Je n'aime pas la langue de bois.
Je reçois des appelles 1-2 fois par semaines un peu pres

Bon bref pour recentrer sur le sujet, j’espère pas qu'a terme ces "télé-opérateurs" serons remplacé par des bots parce que j'ai peur que l'on ai du spam téléphonique
2  2 
Avatar de melka one
Membre éprouvé https://www.developpez.com
Le 18/05/2018 à 22:33
dans l'univers de l'informatique je trouve que l'on a constamment tendance a gonfler les chose.
1  0 
Avatar de ShigruM
Nouveau Candidat au Club https://www.developpez.com
Le 06/07/2018 à 8:11
donc au lieu que se soit un marocain ou un indien qui te dérange pour te vendre des trucs inutile
Aujourd'hui se sera une IA travaillant H24 qui pourra t'appeler H24 (oui les centres d’apelles ne respecte absolument pas les lois française, j'ai déje au des macrocains m'appelant a 22H !)

Bref la semaine prochaine je supprime ma ligne fixe. Merci Google c'est toi qui maura enfin donner le courage de la faire (avant j'avais trop la flemme)
1  0 
Avatar de ryvega
Inactif https://www.developpez.com
Le 06/07/2018 à 10:50
Infine c'est donc donné son dossier médicale a google ?
Je pose un rdz chez mon spécialiste proctologue, google saura désormais que j'ai un probleme avec mon anus...

Et dans le futur, imaginer ce système connecte a son compte linkedid, le recruteur vous demandera pourquoi tu est aller chez ton proctologue ? j'ai un cancer du cu en phase terminal, vous voulez toujours m'embaucher ?
1  0 
Avatar de CoderInTheDark
Membre expérimenté https://www.developpez.com
Le 08/07/2018 à 16:48
Beaucoup de personne travaillent dans les centres d'appels, c'est un travail très dur.
Il y a beaucoup de déficients visuels, car les entreprises on du mal à recruter
Historiquement il y avait des formations tournans autour des métiers du téléphones, surtout le standard

Et comme les entreprises avaient du mal à recruter elles étaient pouvertes
Car les candidats ne se bousculaient pas
C'est éprouvant de se faire raccrocher au nez
Un certain nombre de société ont relocalisé en France, pour avoir des conseillers qui n'ont pas d'accents et surtout qui partagent la même culture pour mieux comprendre les clients.

Cela risque de toucher un publique fragile

L'IA sera capable de lire l'argumentaire et de choisir la proposition alternative adéquate
Ca va faire du travaille pour ceux qui font du RPA
Même si la voix est plus belle, ça va encore plus déshumaniser ce genre d'appels
1  0 
Avatar de HHesse
Nouveau membre du Club https://www.developpez.com
Le 13/05/2018 à 14:08
On appelle de moins en moins, les choses se font de plus en plus par messageries. Néanmoins, cela craint pour ceux qui bossent dans des call centers. A voir aussi, la question de la vie privée comme mentionné plus haut.
0  0 
Contacter le responsable de la rubrique Accueil

Partenaire : Hébergement Web