Au lieu de cela, note-t-il, quand la plupart des gens sont au téléphone ou bavardent en personne, ils parlent et écoutent en même temps – prédisant souvent comment l'autre pourrait finir une phrase, pouvant interrompre quelqu'un quand c'est approprié ou rompre un silence gênant en s’orientant vers une nouvelle réflexion basée sur les informations qu'ils collectent.
Et Microsoft pense avoir réalisé la première percée technologique qui va permettre aux humains d’avoir une conversation avec un chatbot alimenté par une IA qui ressemblera davantage à la seconde expérience (conversation plus naturelle donc) qu’à la première (qui est plutôt classique pour le domaine).
L'entreprise a récemment incorporé ces avancées dans XiaoIce, un chatbot social de Microsoft qui compte plus de 200 millions d'utilisateurs en Asie, et elle travaille à appliquer les mêmes avancées à d'autres chatbots sociaux, dont Zo de Microsoft aux États-Unis.
Dans le langage des télécommunications, la percée permet à XiaoIce de fonctionner en « full duplex » (il s’agit ici d’un terme qui désigne la capacité à communiquer simultanément dans les deux sens, comme un appel téléphonique). Il diffère du « semi-duplex », qui ressemble plus à l'expérience de talkie-walkie dans laquelle une seule personne peut parler à la fois.
Zhou a déclaré que la nouvelle mise à jour, que Microsoft appelle « full duplex voice sense », augmente également la capacité de XiaoIce à prédire ce que la personne avec laquelle elle échange va dire par la suite. Cela l'aide à prendre des décisions sur comment et quand répondre à quelqu'un qui discute avec elle, un ensemble de compétences qui est très naturel pour les humains, mais pas encore commun dans les chatbots.
Li Zhou, engineer lead de XiaoIce
« C'est l'art de la conversation que les gens utilisent dans leur vie quotidienne », a expliqué Zhou.
Cette mise à jour permet également de réduire le temps de latence non naturel qui peut parfois donner un caractère forcé aux interactions avec les chatbots.
« Cela accélère vraiment ses réponses pour qu’elles semblent beaucoup plus naturelles », a affirmé Ying Wang, un directeur de Microsoft qui supervise Zo.
En outre, la nouvelle technologie signifie que les utilisateurs n'ont pas besoin d'utiliser un « mot de réveil » – généralement, le nom du chatbot – chaque fois qu'ils répondent pendant les conversations.
Cette mise à jour vient également améliorer d'autres compétences développées par XiaoIce, comme la capacité de mettre en pause une chose qu'elle fait (vous raconter une histoire, par exemple) afin qu'elle puisse faire autre chose, comme allumer une lumière. Elle peut alors se rappeler de revenir à son histoire. À ce propos, Microsoft rappelle qu’il arrive que les humains changent de sujet dans une conversation pendant un moment, puis reviennent au sujet d'origine.
Rappelons que la semaine dernière Microsoft a annoncé une réorganisation structurelle autour du cloud et de l’intelligence artificielle dans une tentative de développer ses capacités dans ces domaines. Il ne sera donc probablement pas rare de voir ce genre d’initiative se multiplier.
Source : Microsoft
Et vous ?
Êtes-vous d'accord avec la remarque de Li Zhou sur les échanges au téléphone ?
Que pensez-vous de cette avancée ?
Voir aussi :
Microsoft corrige une vulnérabilité critique dans son moteur de protection contre les logiciels malveillants, susceptible d'être exploitée à distance
USA : le DoJ obtient un nouveau mandat pour contraindre Microsoft à fournir des données stockées en Irlande en vertu du CLOUD Act signé par Trump
Microsoft annonce la disponibilité en préversion d'un client Web Remote Desktop, pour accéder à son poste de travail depuis un navigateur Web