Developpez.com

Le Club des Développeurs et IT Pro

Microsoft publie une nouvelle version open source du Microsoft Cognitive Toolkit

La firme veut démocratiser l'apprentissage automatique

Le 2016-10-26 15:34:19, par Coriolan, Expert éminent sénior
La semaine dernière, Microsoft a annoncé avoir développé un système de reconnaissance vocale capable de transcrire les mots d’une conversation aussi efficacement qu’un transcripteur professionnel, avec un taux d’erreurs de transcription de 5,9 %. Ce système a été développé avec une bibliothèque open source déjà mis en place auparavant par Microsoft (CNTK).


La firme de Redmond a publié une nouvelle version du Microsoft Cognitive Toolkit, un système d’apprentissage profond utilisé dans des domaines comme la reconnaissance d’images et de voix ou encore l'analyse de la pertinence des recherches, en exploitant des processeurs traditionnels et les processeurs graphiques de NVIDIA. Cette bibliothèque, connue auparavant sous le nom CNTK, a été développée par des informaticiens et chercheurs de Microsoft afin d’avoir un outil pour mener leur recherche plus efficacement.

Le Computational Network Toolkit a été conçu initialement pour les applications de parole ; plus tard, il s’est accommodé d’autres cas d’utilisation. L’équipe de Bing l’exploite pour faire des inférences sur les termes de recherche. Ce projet, hébergé sur GitHub, fournit également aux chercheurs des outils comme l'apprentissage des réseaux de neurones profonds pour développer leurs propres systèmes d’apprentissage automatique.

La nouvelle version, toujours disponible en open source, inclut une fonctionnalité qui laisse les développeurs utiliser les langages de programmation Python ou C++. Les utilisateurs peuvent aussi profiter d’un nouveau type d’intelligence artificielle appelé “consolidation d’apprentissage”.

Microsoft a indiqué dans un billet de blog que la bibliothèque est plus performante qu’auparavant et plus rapide que la concurrence, surtout lorsqu’il s’agit de travailler avec de grands volumes de données, notamment en s'appuyant sur plusieurs processeurs graphiques. Les entreprises en font un usage intensif lors du développement de produits pour le grand public et des solutions pour entreprise.

Les systèmes d’apprentissage automatique deviennent de plus en plus populaires, avec des produits, tant pour les entreprises que le grand public, qui s’appuient sur l’intelligence artificielle : par exemple, Cortana et Skype Translator chez Microsoft, deux produits très utilisés. Avec ce Cognitive Toolkit, Microsoft cherche à démocratiser l’IA et transformer les projets de recherche en de véritables applications ayant une valeur ajoutée réelle pour les utilisateurs. Il faut noter néanmoins que les ressources requises pour tirer profit de ces outils sont considérables.

Source : Microsoft

Et vous ?

Qu'en pensez-vous ?

Voir aussi :

La reconnaissance vocale de Microsoft peut maintenant rivaliser avec des humains avec un taux d'erreurs de transcription comparable ou inférieur
Microsoft forme une nouvelle division pour le développement de l'intelligence artificielle regroupant 5 000 chercheurs et ingénieurs dédiés
  Discussion forum
5 commentaires
  • SaiRictus
    Membre régulier
    C'est toujours une bonne nouvelle de voir un grand éditeur contribuer à l'open source.
    Par contre je suis surpris qu'il n'y ait pas de support de C#.
    Espérons que cela arrive rapidement car c'est vraiment un sujet qui m'intéresse
  • joublie
    Membre confirmé
    L'article signale : " il faut noter néanmoins que les ressources requises pour tirer profit de ces outils sont considérables. " Bémol : quand on apprend que Microsoft a utilisé 8 GPU Pascal, la " démocratisation " annoncée n'est pas pour tout de suite...
    Autre chose : apparemment Microsoft n'indique pas le taux de fautes de grammaire (en français ce serait des fautes d'accord en nombre ou genre, etc.). Trop de fautes à corriger peut plomber l'intérêt d'un logiciel. Au fil des versions NaturallySpeaking est devenu très bon en la matière (j'en ai fait l'expérience), néanmoins il commet parfois des fautes grosses comme des maisons... J'espère que les développeurs reprenant l'outil de Microsoft feront encore mieux.
  • Veovis
    Membre du Club
    consolidation d’apprentissage -> apprentissage par renforcement
  • Veovis
    Membre du Club
    Envoyé par joublie
    Autre chose : apparemment Microsoft n'indique pas le taux de fautes de grammaire
    Quand Microsoft indique qu'il a un taux d'erreur mots à moins de 6%, c'est en tenant compte de tous : fautes de grammaire, d'accord, etc...