Web Speech API franchit un nouveau cap

La spécification JavaScript permettra d'intégrer la reconnaissance vocale dans les pages Web

Le 2012-11-26 16:15:32, par Hinault Romaric, Responsable .NET

La spécification Web Speech API vient de franchir une étape importante dans sa normalisation.

Le groupe de travail Web Speech API du W3C a récemment publié le futur standard avec un appel des membres pour un accord de la spécification finale.

Cette spécification décrit une API JavaScript qui permettra aux développeurs d’intégrer la reconnaissance vocale dans les pages Web.

Grâce à cette API, les développeurs pourront utiliser des Scripts pour générer du texte à partir des paroles, utiliser la reconnaissance vocale comme entrée pour les formulaires, la dictée en continu et les contrôles.

Le projet Web Speech API avait débuté en août 2010 par Google, Microsoft et la fondation Mozilla au sein du groupe HTML Speech Incubator, qui avait publié un document final en décembre 2011, décrivant les différents cas d’utilisation développés par le groupe ainsi que les exigences du système.

A la suite de ce document, Google avait proposé une API JavaScript soutenant 15 des 17 cas d’utilisation énumérés par le groupe HTML Speech Incubator, dont la recherche vocale, le contrôle vocal, la détection de l’activité vocale, la traduction du discours et bien plus.

Le groupe de travail Web Speech API avait été créé en avril 2012 pour poursuivre les travaux de Google sur l’API et faire de la spécification une norme reconnue du W3C.

Bien que la spécification n’ait pas encore eu le statut de standard du W3C, elle est déjà implémentée au sein du navigateur Chrome de Google, et d’autres éditeurs pourraient prendre le même chemin.

Source : W3C

Et vous ?

Que pensez-vous de cette spécification ?

Discussion forum

3 commentaires

gifbengif
Futur Membre du Club

Bonjour,

Merci pour la news.

J'ai besoin d'une précision. Une spécification comme celle çi permet de normaliser les appels à de tels API. Mais qu'en est-il des moteurs eux mêmes, je pense notamment au moteur de reconnaissance vocal, chaque navigateur implémente sa technologie? La spécification ne concerne pas le coeur même de la techno mais seulement la façon dont on interagie avec cette dernière ?

gifbengif.

le 26/11/2012 à 18:41
SylvainPV
Rédacteur/Modérateur

D'après le dessin, le service de reconnaissance vocale est "author selected", donc choisi par l'utilisateur. Par exemple sur smartphone s'il a plusieurs softs de reconnaissance vocale installés, il pourra choisir lequel utiliser (comme l'écran de sélection de navigateur sur Android). L'API prévoit aussi l'utilisation d'un service distant (remote speech service).

le 26/11/2012 à 18:51
gifbengif
Futur Membre du Club

Merci, c'est vraiment génial.

le 26/11/2012 à 19:15