Lors de sa conférence annuelle re:Mars qui bat son plein à Las Vegas, Rohit Prasad, premier vice-président et scientifique en chef d'Amazon pour Alexa, a annoncé une série de nouvelles fonctionnalités et de fonctionnalités à venir pour l'assistant intelligent de la société. L’innovation qui a le plus retenu l’attention est une nouvelle fonctionnalité potentielle qui permet de synthétiser de courts clips audio en un discours plus long.
Dans le scénario présenté lors de l'événement, la voix d'un être cher décédé (une grand-mère, dans ce cas) est utilisée pour lire une histoire à son petit-fils. Prasad note que, grâce à cette nouvelle technologie, l'entreprise est en mesure d'obtenir des résultats audio très impressionnants à partir d'une seule minute de parole. « Cela a nécessité des inventions où nous avons dû apprendre à produire une voix de haute qualité avec moins d'une minute d'enregistrement contre des heures d'enregistrement en studio. La façon dont nous avons réussi à le faire est de formuler le problème comme une tâche de conversion de la voix et non comme une voie de génération de la parole. Nous vivons incontestablement l'âge d'or de l'IA, où nos rêves et nos fictions scientifiques deviennent une réalité », note le dirigeant.
Prasad a déclaré que l'objectif d'Amazon pour Alexa est « l'intelligence généralisable », c'est-à-dire la capacité de s'adapter aux environnements des utilisateurs et d'apprendre de nouveaux concepts avec peu de données externes. Il a ajouté que cet objectif « ne doit pas être confondu avec l'intelligence générale artificielle omnisciente, omnisciente et uberisée », ou AGI, que recherchent l'unité DeepMind d'Alphabet et OpenAI, fondée par Elon Musk.
Les détails sont maigres, pour l'instant. Il n'y a pas de calendrier ou d'autres détails, mais au moins c'est le genre de nouvelles qui va probablement inviter toutes sortes d'examens sur les applications potentielles au-delà de quelque chose d'aussi banal ou même réconfortant que de lire à un enfant "Le Magicien d'Oz".
Cela rappelle l'enceinte intelligente Takara Tomy qui peut imiter la voix d'un parent à l'heure du coucher afin qu'il puisse lire à ses enfants même s'il n'est pas physiquement disponible. C'est une idée intéressante pour les parents qui voyagent souvent pour leur travail ou qui en ont simplement marre de lire le même livre. Mais cela soulève la question de savoir si une fausse copie de la voix d'une personne peut offrir le même confort et la même sécurité qu'une personne à sang chaud dans la pièce.
À cet égard, ce type de technologie soulève également d'autres questions, comme le type d'émotions que susciterait chez une personne le fait d'entendre la voix d'un être cher emporté par la COVID ou une autre maladie incurable. Ne serait-ce pas simplement une source de colère pour la personne disparue ? Et comment cette interaction avec le défunt fonctionne-t-elle avec une personne qui travaille activement sur son deuil ? Interrompt-elle le processus ou l'aide-t-elle ? En outre, qu'en penserait le défunt ? Bien sûr, il y a aussi toujours le risque de sécurité de deep fake, bien que l'on ne sache pas exactement comment les échantillons de voix de la fonction seront stockés.
Bien qu'il puisse être utilisé pour reproduire n'importe quelle voix, Prasad a suggéré qu'il pourrait être utilisé pour aider à commémorer un membre de la famille décédé. Rendre l'intelligence artificielle conversationnelle et semblable à un compagnon est devenu un objectif clef, d'autant plus que « tant d'entre nous ont perdu un être cher » pendant la pandémie de Covid-19, a déclaré M. Prasad. « Si l'IA ne peut pas éliminer la douleur de la perte, elle peut certainement faire durer les souvenirs », a-t-il ajouté. Le géant du commerce électronique souhaite rendre la conversation avec Alexa plus naturelle en général, et a déployé une série de fonctionnalités qui permettent à son assistant vocal de reproduire un dialogue plus humain, jusqu'à poser des questions à l'utilisateur.
La conférence re:MARS d'Amazon a pour but de mettre en avant les projets de l'entreprise dans le domaine de l'informatique ambiante, qui inclut les fonctionnalités d'Alexa. MARS est l'abréviation de machine learning, automation, robots et space. On s'attend à ce qu'Amazon partage d'autres informations lors de cette conférence de Las Vegas au cours des prochains jours.
Et vous ?
Quel est votre avis sur le sujet ?
Voir aussi :
Des plaintes accusent Siri, Alexa et Google d'écouter quand ils ne sont pas censés le faire, et Apple devrait faire face à un procès concernant la confidentialité de Siri
Des tiers écoutent ce que vous dites à Google Home au motif de ce qu'il faut améliorer l'IA, d'après Google
Amazon atteint 100 millions de vente d'appareils intégrant Alexa, son assistant vocal intelligent
Les travailleurs d'Amazon écoutent ce que vous dites à Alexa, son assistant vocal intelligent, et en parlent dans un forum de discussion interne