Des chercheurs ont annoncé que de récentes percées dans la reconnaissance vocale et l'intelligence artificielle feront bientôt des gadgets spectaculairement meilleurs pour comprendre les humains. Cette nouvelle race de machines hautement compétentes, qui sont en mesure non seulement de nous entendre, mais aussi de comprendre le contexte et les nuances, sera là dans juste un an ou deux, d’après Johan Schalkwyk, un ingénieur de Google.
Schalkwyk travaille sur un projet de recherche ambitieux à Google pour créer des systèmes de parole. Un projet actuellement à l'essai dans le laboratoire permet aux ordinateurs d'entendre et essentiellement «penser» à ce que les gens disent dans l'oreille numérique de Google.
Il y a deux ans et demi, des chercheurs de Google et de l'Université de Toronto ont publié un article influent sur l'utilisation de «réseaux neuraux profonds» pour modéliser la parole dans les ordinateurs, et plusieurs mois plus tard, un autre article résultant d'une collaboration entre Microsoft et IBM. Cela a conduit à ce que l'ingénieur de Google Jeff Dean a décrit comme la «plus grande amélioration unique en 20 ans de recherche sur la parole.»
Les résultats ont ressuscité une invention sur les réseaux de neurones numériques vieille de plusieurs décennies. La technologie testée dans les années 1980 a vu sa performance entravée par la vitesse des ordinateurs à l'époque. Les réseaux de neurones ne sont devenus une option viable que récemment, suite à une accélération massive de traitement informatique.
Il y a six mois, l'équipe de projet de Google est passée à une nouvelle méthode sur les réseaux de neurones. Celle-ci permet au système de stocker plus d'informations, et de mieux traiter les séquences complexes. Les résultats révolutionnaires de Google permettront à son logiciel d'avoir plus d'idées et concepts dans le même système, ce qui permet de poser des questions complexes et obtenir des réponses sensées.
Comme le système actuel de Google, la nouvelle technologie de réseau utilise le contexte, l'emplacement physique et certaines autres informations sur le haut-parleur pour faire des hypothèses sur la direction d'une conversation et ce que tout cela signifie, exactement comme les humains. Mais le nouveau système devrait le faire aussi efficacement qu'il peut traiter de grandes quantités de données comme jamais auparavant, ce qui lui permet de répondre à des demandes plus complexes.
Ces récentes inventions dans le domaine de la parole et de l'apprentissage de la machine devraient conduire à des changements majeurs dans la façon dont nous murmurons, crions, questionnons et interrogeons nos appareils.
Il y a un an, des études ont montré que cela n'était pas possible, « mais tout cela a changé, principalement en raison de ces améliorations, » a déclaré Tim Tuttle, PhD de MIT et spécialiste de l'IA. « Vous allez voir des systèmes de reconnaissance vocale qui ont une précision humaine ou meilleure que celle de l'homme commencer à être commercialisés.»
Il y a trois ans, la reconnaissance vocale de Google pourrait reconnaître trois des quatre mots qui sortent de votre bouche. Grâce à un rythme accéléré de l'innovation, les applications Google sur votre téléphone en ce moment peuvent deviner correctement 12 mots sur tous les 13. Très vite, selon Tuttle, « nous allons vivre dans un monde où les appareils n'ont pas claviers. » Toutes les instructions leur seront données par une communication vocale.
Source : Bloomberg
Et vous ?
« Nous allons vivre dans un monde où les appareils n’ont pas de claviers », qu’en pensez-vous ? La reconnaissance vocale aussi précise soit-elle peut-elle remplacer les claviers ?
La reconnaissance vocale aussi précise qu'un humain est désormais possible
Le système disponible sur nos smartphones dans un ou deux ans
La reconnaissance vocale aussi précise qu'un humain est désormais possible
Le système disponible sur nos smartphones dans un ou deux ans
Le , par Michael Guilloux
Une erreur dans cette actualité ? Signalez-nous-la !