Developpez.com

Le Club des Développeurs et IT Pro

Alexa pourra bientôt lire les histoires comme votre grand-mère décédée

Amazon a réussi à insérer la voix d'un mort dans les haut-parleurs d'Alexa

Le 2022-06-23 07:33:09, par Nancy Rey, Expert éminent sénior
Lors de la conférence Re:Mars d'Amazon à Las Vegas mercredi, la société a fait la démonstration d'une fonctionnalité permettant à son assistant vocal Alexa d'émuler n'importe quelle voix. Cette fonctionnalité, qui est encore en cours de développement, peut être utilisée pour reproduire la voix d'un membre de la famille, même après son décès. Rohit Prasad, vice-président senior et scientifique en chef de l'équipe Alexa, a présenté une fonctionnalité qui permet à l'assistant vocal de reproduire une voix humaine spécifique. Mais certains s'inquiètent du fait que cette technologie pourrait également être utilisée pour propager des "deepfakes" politiques. Cette fonctionnalité est en cours de développement et Amazon n'a pas précisé quand la fonctionnalité sera déployée auprès du public. L'inquiétante vallée du futur ne comprend pas seulement des robots réalistes, mais aussi des voix profondément simulées.


Lors de sa conférence annuelle re:Mars qui bat son plein à Las Vegas, Rohit Prasad, premier vice-président et scientifique en chef d'Amazon pour Alexa, a annoncé une série de nouvelles fonctionnalités et de fonctionnalités à venir pour l'assistant intelligent de la société. L’innovation qui a le plus retenu l’attention est une nouvelle fonctionnalité potentielle qui permet de synthétiser de courts clips audio en un discours plus long.

Dans le scénario présenté lors de l'événement, la voix d'un être cher décédé (une grand-mère, dans ce cas) est utilisée pour lire une histoire à son petit-fils. Prasad note que, grâce à cette nouvelle technologie, l'entreprise est en mesure d'obtenir des résultats audio très impressionnants à partir d'une seule minute de parole. « Cela a nécessité des inventions où nous avons dû apprendre à produire une voix de haute qualité avec moins d'une minute d'enregistrement contre des heures d'enregistrement en studio. La façon dont nous avons réussi à le faire est de formuler le problème comme une tâche de conversion de la voix et non comme une voie de génération de la parole. Nous vivons incontestablement l'âge d'or de l'IA, où nos rêves et nos fictions scientifiques deviennent une réalité », note le dirigeant.

Prasad a déclaré que l'objectif d'Amazon pour Alexa est « l'intelligence généralisable », c'est-à-dire la capacité de s'adapter aux environnements des utilisateurs et d'apprendre de nouveaux concepts avec peu de données externes. Il a ajouté que cet objectif « ne doit pas être confondu avec l'intelligence générale artificielle omnisciente, omnisciente et uberisée », ou AGI, que recherchent l'unité DeepMind d'Alphabet et OpenAI, fondée par Elon Musk.

Les détails sont maigres, pour l'instant. Il n'y a pas de calendrier ou d'autres détails, mais au moins c'est le genre de nouvelles qui va probablement inviter toutes sortes d'examens sur les applications potentielles au-delà de quelque chose d'aussi banal ou même réconfortant que de lire à un enfant "Le Magicien d'Oz".


Cela rappelle l'enceinte intelligente Takara Tomy qui peut imiter la voix d'un parent à l'heure du coucher afin qu'il puisse lire à ses enfants même s'il n'est pas physiquement disponible. C'est une idée intéressante pour les parents qui voyagent souvent pour leur travail ou qui en ont simplement marre de lire le même livre. Mais cela soulève la question de savoir si une fausse copie de la voix d'une personne peut offrir le même confort et la même sécurité qu'une personne à sang chaud dans la pièce.

À cet égard, ce type de technologie soulève également d'autres questions, comme le type d'émotions que susciterait chez une personne le fait d'entendre la voix d'un être cher emporté par la COVID ou une autre maladie incurable. Ne serait-ce pas simplement une source de colère pour la personne disparue ? Et comment cette interaction avec le défunt fonctionne-t-elle avec une personne qui travaille activement sur son deuil ? Interrompt-elle le processus ou l'aide-t-elle ? En outre, qu'en penserait le défunt ? Bien sûr, il y a aussi toujours le risque de sécurité de deep fake, bien que l'on ne sache pas exactement comment les échantillons de voix de la fonction seront stockés.

Bien qu'il puisse être utilisé pour reproduire n'importe quelle voix, Prasad a suggéré qu'il pourrait être utilisé pour aider à commémorer un membre de la famille décédé. Rendre l'intelligence artificielle conversationnelle et semblable à un compagnon est devenu un objectif clef, d'autant plus que « tant d'entre nous ont perdu un être cher » pendant la pandémie de Covid-19, a déclaré M. Prasad. « Si l'IA ne peut pas éliminer la douleur de la perte, elle peut certainement faire durer les souvenirs », a-t-il ajouté. Le géant du commerce électronique souhaite rendre la conversation avec Alexa plus naturelle en général, et a déployé une série de fonctionnalités qui permettent à son assistant vocal de reproduire un dialogue plus humain, jusqu'à poser des questions à l'utilisateur.

La conférence re:MARS d'Amazon a pour but de mettre en avant les projets de l'entreprise dans le domaine de l'informatique ambiante, qui inclut les fonctionnalités d'Alexa. MARS est l'abréviation de machine learning, automation, robots et space. On s'attend à ce qu'Amazon partage d'autres informations lors de cette conférence de Las Vegas au cours des prochains jours.

Et vous ?

Quel est votre avis sur le sujet ?

Voir aussi :

Des plaintes accusent Siri, Alexa et Google d'écouter quand ils ne sont pas censés le faire, et Apple devrait faire face à un procès concernant la confidentialité de Siri

Des tiers écoutent ce que vous dites à Google Home au motif de ce qu'il faut améliorer l'IA, d'après Google

Amazon atteint 100 millions de vente d'appareils intégrant Alexa, son assistant vocal intelligent

Les travailleurs d'Amazon écoutent ce que vous dites à Alexa, son assistant vocal intelligent, et en parlent dans un forum de discussion interne
  Discussion forum
7 commentaires
  • sergio_is_back
    Expert confirmé
    C'est d'un glauque !!!
  • Fleur en plastique
    Membre extrêmement actif
    C'est génial. Comme ça, je vais demander à Alexa de me lire les discours de Macron mais avec la voix de Chirac. Comme ça j'aurais l'impression d'avoir un vrai président.
  • Cpt Anderson
    Membre émérite
    C'est le progrès.
  • Arya Nawel
    Membre extrêmement actif
    Du grand n'importe quoi.... Me demande bien ou tout ça nous mener. C'est d'un glauque
  • jvallois
    Membre éprouvé
    Envoyé par sergio_is_back
    C'est d'un glauque !!!
    J'avoue que ça me semble totalement de mauvais goût !
  • noremorse
    Membre habitué
    Le prochain Paranormal Activity : The Death Voice
  • Arya Nawel
    Membre extrêmement actif
    Bah voyons