Amazon AlexaAmazon Alexa, plus connu sous le nom Alexa, est un assistant virtuel développé par Amazon et utilisé pour la première fois dans les enceintes intelligentes Amazon Echo et Amazon Echo Dot. Il est capable d'interaction vocale, de jouer de la musique, de lister des tâches à effectuer, de régler des alarmes, de diffuser des podcasts, de lire des livres audio et de fournir des informations sur la météo, la circulation, les sports et d'autres informations en temps réel telles que les actualités.
Il y a quelques mois, nous avons appris que les employés d'Amazon qui travaillent à améliorer son assistant vocal écoutent les enregistrements vocaux de ce qui se dit dans les maisons et les bureaux des propriétaires d’Echo, lorsque ce dernier est activé. Ces employés peuvent écouter jusqu'à 1000 enregistrements par jour.
En général, lorsque vous donnez un ordre à un périphérique Amazon Echo, seul le logiciel de reconnaissance vocale d'Amazon écoute. Mais, il a été découvert qu'une copie de l'audio est envoyée à un humain dans l'un des bureaux d'Amazon dans le monde. Cette personne écoute l'enregistrement audio, le transcrit et ajoute des annotations pour aider les algorithmes d'Amazon à s'améliorer. Les enregistrements incluent à la fois des commandes Alexa explicites et des conversations en arrière-plan.
Amazon a déclaré qu'un nombre « extrêmement faible » d'enregistrements Alexa étaient annotés afin d'améliorer ses systèmes de reconnaissance vocale.
Google Assistant et Siri d’Apple
Sur la base de multimédias diffusés par les lanceurs d'alerte, les médias ont récemment annoncé que Google utilisait son assistant vocal Google Home pour évaluer les enregistrements vocaux afin d'améliorer les capacités de reconnaissance vocale de Google Assistant. Dans ces évaluations, les employés de Google ou de sociétés mandatées entendent les enregistrements vocaux et les transcrivent pour analyser si les informations acoustiques enregistrées ont été traitées correctement par le système sous-jacent, une pratique que Google a reconnu dans un billet de blog.
En effet, le mois dernier, Google a confirmé que des travailleurs tiers analysant les données vocales d'Assistant avaient divulgué des conversations néerlandaises privées. Le radiodiffuseur public belge VRT NWS a déclaré que plus de 1 000 fichiers avaient été divulgués, y compris des enregistrements de cas où des utilisateurs avaient accidentellement déclenché le logiciel de Google.
Les entrepreneurs Apple auraient également entendu des enregistrements privés, y compris des informations médicales, selon un rapport publié le mois dernier. Apple a confié qu'une « petite partie » des données est utilisée pour améliorer Siri et les commandes vocales.
Toutefois, dans un communiqué, Apple a expliqué « Pendant que nous effectuons un examen approfondi, nous suspendons l’analyse des conversations Siri au niveau mondial. De plus, dans le cadre d’une future mise à jour logicielle, les utilisateurs auront la possibilité de choisir de participer au programme ». L'entreprise va donc introduire bientôt une option de consentement qui n’existait pas jusqu’ici.
Microsoft Cortana
Apple, Google, Amazon et, plus récemment, Facebook ont été trouvés en train d'embaucher des travailleurs humains pour transcrire l'audio capturé avec leurs propres produits.
Un cache de documents qui ont fuités, obtenu par MB, donne un aperçu de ce que font les travailleurs humains derrière le développement des services d’intelligence artificielle des grandes enseignes numériques : des tâches laborieuses et répétitives conçues pour améliorer l’interprétation automatisée de la parole humaine. En fait, les assistants virtuels sont entraînés en partie par le travail monotone de ces personnes.
« Le gros du travail que j'ai effectué pour Microsoft était axé sur l'annotation et la transcription des commandes Cortana », a déclaré un sous-traitant de Microsoft sous couvert de l’anonymat, une condition nécessaire pour parler plus franchement des processus internes de Microsoft en plus du fait qu'elle avait signé un accord de confidentialité.
Les manuels d'instructions sur la classification de ce type de données couvrent des centaines de pages, avec un nombre vertigineux d'options à suivre pour les sous-traitants afin de classer les données, ou des guides de style de ponctuation qu'ils doivent suivre. Le contractant a déclaré...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.