Developpez.com

Le Club des Développeurs et IT Pro

Windows Phone 7 mise sur la reconnaissance vocale

Avec son service Cloud « Tellme » pour défier Android et Apple

Le 2010-08-05 11:40:39, par Idelways, Expert éminent sénior
Windows Phone 7, dont la sortie est attendue pour octobre prochain pourrait intégrer des possibilités avancées et innovantes de reconnaissances vocale du langage naturel.

Le but affiché est clairement de présenter l'OS comme très innovant par rapport à l'iPhone et à Android.

Lors de la conférence SpeechTEK 2010 qui s'est déroulé le week-end dernier à New-York, un cadre de Microsoft a laissé entendre que la société considérait le vocal comme une partie intégrante de l'expérience utilisateur et pas comme une simple application séparée.

Pour améliorer la reconnaissance des commandes vocales sur Windows Phone 7, Microsoft conterait s'appuyer sur son service de reconnaissance vocale et de traitement de langage naturel basé-cloud « TellMe », que la société a racheté en 2007.

Microsoft considère le service TellMe comme l'offre la plus complète de traitement du langage vocale naturel. Pour mémoire, Microsoft propose actuellement ce service aux centres d'assistance des grandes entreprises et réalise environ 2.5 milliards d'appels client par an.

Zig Serafin, le directeur du département communication unifiée, a critiqué pour l'occasion les systèmes d'exploitation concurrents de n'être qu'une "grille d'icônes, un peu comme Windows 3.1".

Il juge que de parler à son téléphone est la manière la plus naturelle de lui demander quoi faire. Ce qui prend d'autant plus de sens en l'absence de grand clavier.

Pour Serafin, le vocal est l'une des parties de ce qu'il appelle « Interface Utilisateur Naturelle » (NUI) qui concerne en plus de la voix, le toucher et les mouvements comme des formes d'interaction avec la machine.

Toujours lors su SpeedTech, Ilya Bukshteyn, Directeur du département Marketing de Microsoft, a fait une démonstration des applications possibles de la reconnaissance vocale et du traitement du langage naturel sur Windows Phone 7.

Bukshteyn a par exemple demandé au téléphone "Paul", qui a répondu par la liste des contacts dont le prénom est Paul. Bukshteyn en a choisi un en spécifiant son nom de famille et l'appareil a appelé la personne.

Il a ensuite demandé au téléphone d'ouvrir l'album photo. L'appareil s'est exécuté en affichant les photos prises par l'utilisateur, mais aussi celles postées par les amis sur les réseaux sociaux.

Dans un troisième exemple, Bukshteyn a demandé une liste de restaurants chinois et l'appareil lui a fourni cette liste avec les emplacements sur un carte obtenue via Bing.

Selon Zig Serafin, l'usage de la reconnaissance vocale sur Windows Phone 7 se démarquera de ses concurrents en permettant le contrôle complet de l'appareil, et pas seulement un usage restreint à quelques applications.

Microsoft n'en est encore qu'aux premières étapes de l'intégration de la reconnaissance vocale sur Windows Phone 7. Zig Serafin le reconnaît.

Mais ces premières étapes semblent très prometteuses.


Postée par « mcgeesmith » sur Youtube

Lire aussi :

Windows Phone 7 débarquera en octobre : « la partie n'est pas finie ! », déclare le Directeur Générale de Microsoft

Android : bientôt la reconnaissance des mouvements, une fonction qui permet de se passer des écrans tactiles des smartphones

Windows Phone 7 passe en Technical Preview, ses outils de développement rendrait très simple la création d'applications, qu'en pensez-vous ?

Les rubriques (actu, forums, tutos) de Développez :

Mobile
Windows
Systèmes

Et vous ?

Que pensez-vous de l'utilité des commandes vocales sur les smartphones : fonctionnalités déjà dépassées ou prémisses de futures innovations prometteuses ?

En collaboration avec Gordon Fowler
  Discussion forum
13 commentaires
  • Moué... Même si l'algorithme de reconaissance vocale est très bon, ca me semble pas naturel de parler à une machine...
  • _skip
    Expert éminent
    Pouvoir prononcer le nom du contact pour le chercher et l'appeler c'est quand même chouette si on est occupé au volant et qu'on a qu'une main à dispo.
  • sinople
    Membre chevronné
    Moué... Même si l'algorithme de reconaissance vocale est très bon, ca me semble pas naturel de parler à une machine...
    Si ça te semble pas naturel d'utiliser un telephone pour parler tu peux te tourner vers les solutions d'Apple.

    Non blague à part, si le système est bien foutu, ça peut franchement être sympa. Parce que écrire des mails ou des sms avec ces claviers à ces pseudo clavier c'est franchement galère (et surtout requis une énorme attention qui rend l'utilisation en déplacement dangereuse).
  • orochimaru86
    Futur Membre du Club
    il me semble ici que Microsoft se distinguera reellement face à apple et google, l'idée n'est pas originale, mais elle a été curieusement ignorée par les concurrents, de quoi redonner un élan à microsoft dans cette nouvelle aventure des smartphones.

    On est toujours retardé sur l'interaction homme machine, il ne faut plus avoir besoin de taper du code complexes ou faire des manipulations difficiles afin que la machine nous comprenne et execute nos requettes.

    avec kinect et ce nouveau projet, Microsoft tient le lead vers une veritable nouvelle technologie.
  • Hinault Romaric
    Responsable .NET
    L'intégration de la reconnaissance vocale dans Windows Phone 7 est une belle initiative de la part de microsoft, mais malgré cela je doute que Windows Phone 7 puisse réellement concurrencer ces rivales direct.
    En tout cas wait and see...
  • umeboshi
    Membre actif
    Que pensez-vous de l'utilité des commandes vocales sur les smartphones : fonctionnalités déjà dépassées ou prémisses de futures innovations prometteuses ?

    Pour l'instant tout ce que j'ai pu tester (smartphones) semble fonctionner assez bien au niveau de la reconnaissance, mais à l'utilisation c'est pas génial, voire pas pratique. Mais j'avoue que s'ils arrivent à faire un système qui fonctionne vraiment du genre : "Ou est ce fichier ?" et qu'il trouve ou "Affiche mois cette photo" et qu'il ouvre la visionneuse pour afficher l'image demandée alors là, j'avoue que ça risque d'être cool.
  • Sarawyn
    Membre régulier
    Ca peut être sympa si on est concentré/occupé sur autre chose ( volant, extérieur etc...) mais comment cela régira au bruit de fond ?

    Ça peut être bien pratique pour les mals voyants ou les gens qui ont des moignons à la place des mains
    Un téléphone Windows utilisable par un manchot

    Maintenant faut pas qu'ils n'utilisent que ça comme arme. La bataille est rude.
  • MrDuChnok
    Rédacteur
    Juste pour information, sous Android, il y a déjà la reconnaissance vocale pour la recherche d'informations sur le portable, et plus généralement pour "remplacer" le clavier :
    http://img687.imageshack.us/img687/9...dkjeyboard.jpg

    Après le système n'est pas parfait (surtout pour le français), mais est déjà pas trop mal (surtout combiné à l'application traduction).
    Il reste encore des manip tactile a effectuer.
    A voir comment microsoft inclut ça sur leurs téléphones, et à quel niveau ça sera intégré.
  • Traroth2
    Membre émérite
    "Que pensez-vous de l'utilité des commandes vocales sur les smartphones : fonctionnalités déjà dépassées ou prémisses de futures innovations prometteuses ?" : Tout dépend à quel point ça marche bien. Si le téléphone est vraiment smart et est capable non seulement de bien comprendre ce qu'on lui dit, au niveau de la prosodie comme au niveau du langage naturel, mais surtout d'agir de manière efficace et autonome en fonction de ce qu'on lui demande, ça peut être révolutionnaire. Si c'est simplement la dictée magique sur téléphone, bof...

    Exemple : si je dis simplement à mon téléphone "trouve-moi un resto chinois dans le quartier" et que tout seul, il commence à me guider vers un restaurant chinois ayant des places disponibles (peut-être même qu'il pourrait faire une réservation tout seul ?), bien noté et proche, c'est balèze. Si ça me permet simplement de chercher un resto en dictant les paramètres de recherche au lieu de les saisir, voire en se plantant tous les 3 mots, c'est pas grand-chose, et ça va même être vite plus pénible qu'un clavier tactile.
  • Sarawyn
    Membre régulier
    Envoyé par Traroth2
    Exemple : si je dis simplement à mon téléphone "trouve-moi un resto chinois dans le quartier" et que tout seul, il commence à me guider vers un restaurant chinois ayant des places disponibles (peut-être même qu'il pourrait faire une réservation tout seul ?), bien noté et proche, c'est balèze. Si ça me permet simplement de chercher un resto en dictant les paramètres de recherche au lieu de les saisir, voire en se plantant tous les 3 mots, c'est pas grand-chose, et ça va même être vite plus pénible qu'un clavier tactile.
    Pareil pour les kébab avec le passage par la pharmacie pour acheter le laxatif

    De là à arriver à un tel niveau d'intélligence, contrôler les accents et jargons de chacuns ...

    C'est un coup à ce que les gens deviennent encore plus dépendants ( chiants ? )