Newsletter Developpez.com

Inscrivez-vous gratuitement au Club pour recevoir
la newsletter hebdomadaire des développeurs et IT pro

Microsoft publie une nouvelle version open source du Microsoft Cognitive Toolkit
La firme veut démocratiser l'apprentissage automatique

Le , par Coriolan, Chroniqueur Actualités
La semaine dernière, Microsoft a annoncé avoir développé un système de reconnaissance vocale capable de transcrire les mots d’une conversation aussi efficacement qu’un transcripteur professionnel, avec un taux d’erreurs de transcription de 5,9 %. Ce système a été développé avec une bibliothèque open source déjà mis en place auparavant par Microsoft (CNTK).


La firme de Redmond a publié une nouvelle version du Microsoft Cognitive Toolkit, un système d’apprentissage profond utilisé dans des domaines comme la reconnaissance d’images et de voix ou encore l'analyse de la pertinence des recherches, en exploitant des processeurs traditionnels et les processeurs graphiques de NVIDIA. Cette bibliothèque, connue auparavant sous le nom CNTK, a été développée par des informaticiens et chercheurs de Microsoft afin d’avoir un outil pour mener leur recherche plus efficacement.

Le Computational Network Toolkit a été conçu initialement pour les applications de parole ; plus tard, il s’est accommodé d’autres cas d’utilisation. L’équipe de Bing l’exploite pour faire des inférences sur les termes de recherche. Ce projet, hébergé sur GitHub, fournit également aux chercheurs des outils comme l'apprentissage des réseaux de neurones profonds pour développer leurs propres systèmes d’apprentissage automatique.

La nouvelle version, toujours disponible en open source, inclut une fonctionnalité qui laisse les développeurs utiliser les langages de programmation Python ou C++. Les utilisateurs peuvent aussi profiter d’un nouveau type d’intelligence artificielle appelé “consolidation d’apprentissage”.

Microsoft a indiqué dans un billet de blog que la bibliothèque est plus performante qu’auparavant et plus rapide que la concurrence, surtout lorsqu’il s’agit de travailler avec de grands volumes de données, notamment en s'appuyant sur plusieurs processeurs graphiques. Les entreprises en font un usage intensif lors du développement de produits pour le grand public et des solutions pour entreprise.

Les systèmes d’apprentissage automatique deviennent de plus en plus populaires, avec des produits, tant pour les entreprises que le grand public, qui s’appuient sur l’intelligence artificielle : par exemple, Cortana et Skype Translator chez Microsoft, deux produits très utilisés. Avec ce Cognitive Toolkit, Microsoft cherche à démocratiser l’IA et transformer les projets de recherche en de véritables applications ayant une valeur ajoutée réelle pour les utilisateurs. Il faut noter néanmoins que les ressources requises pour tirer profit de ces outils sont considérables.

Source : Microsoft

Et vous ?

Qu'en pensez-vous ?

Voir aussi :

La reconnaissance vocale de Microsoft peut maintenant rivaliser avec des humains avec un taux d'erreurs de transcription comparable ou inférieur
Microsoft forme une nouvelle division pour le développement de l'intelligence artificielle regroupant 5 000 chercheurs et ingénieurs dédiés


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de SaiRictus SaiRictus - Membre du Club https://www.developpez.com
le 26/10/2016 à 17:50
C'est toujours une bonne nouvelle de voir un grand éditeur contribuer à l'open source.
Par contre je suis surpris qu'il n'y ait pas de support de C#.
Espérons que cela arrive rapidement car c'est vraiment un sujet qui m'intéresse
Avatar de joublie joublie - Membre actif https://www.developpez.com
le 26/10/2016 à 18:57
L'article signale : " il faut noter néanmoins que les ressources requises pour tirer profit de ces outils sont considérables. " Bémol : quand on apprend que Microsoft a utilisé 8 GPU Pascal, la " démocratisation " annoncée n'est pas pour tout de suite...
Autre chose : apparemment Microsoft n'indique pas le taux de fautes de grammaire (en français ce serait des fautes d'accord en nombre ou genre, etc.). Trop de fautes à corriger peut plomber l'intérêt d'un logiciel. Au fil des versions NaturallySpeaking est devenu très bon en la matière (j'en ai fait l'expérience), néanmoins il commet parfois des fautes grosses comme des maisons... J'espère que les développeurs reprenant l'outil de Microsoft feront encore mieux.
Avatar de Veovis Veovis - Membre du Club https://www.developpez.com
le 26/10/2016 à 20:04
consolidation d’apprentissage -> apprentissage par renforcement
Avatar de Veovis Veovis - Membre du Club https://www.developpez.com
le 26/10/2016 à 20:11
Citation Envoyé par joublie Voir le message
Autre chose : apparemment Microsoft n'indique pas le taux de fautes de grammaire
Quand Microsoft indique qu'il a un taux d'erreur mots à moins de 6%, c'est en tenant compte de tous : fautes de grammaire, d'accord, etc...
Avatar de Stéphane le calme Stéphane le calme - Chroniqueur Actualités https://www.developpez.com
le 06/06/2017 à 17:12
Microsoft annonce que la version 2.0 de Cognitive Toolkit, sa boîte à outils dédiée au Deep Learning,
est disponible en version finale

Microsoft a publié la version 2 de Cognitive Toolkit (CNTK) une boîte à outils dédiée au Deep Learning et à l'intelligence artificielle. Microsoft explique que Cognitive Toolkit permet de disposer d’une IA de qualité prête pour l’entreprise en permettant aux utilisateurs de créer, de former et d'évaluer leurs propres réseaux de neurones, qui peuvent ensuite varier efficacement sur plusieurs GPU et plusieurs machines sur des ensembles de données massives.

La version 2.0 de la boîte à outils, connue sous le nom de CNTK, a commencé en version bêta en octobre 2016, a atteint le stade de Release Candidate le 3 avril et est maintenant disponible pour la production des charges de travail. Cette nouvelle version s’accompagne également de trois nouvelles fonctionnalités, notamment :
  • la prise en charge de Keras (préversion publique) : l'API Keras a été conçue pour que les utilisateurs développent des applications AI et est optimisée pour l'expérience de l'utilisateur. Microsoft assure que Keras suit les meilleures pratiques pour réduire la charge cognitive : elle offre des API uniformes et cohérentes, elle minimise le nombre d'actions utilisateur requises pour les cas d'usage courant et fournit des commentaires clairs et utiles sur l'erreur de l'utilisateur. Keras a ouvert un apprentissage approfondi à des milliers de personnes sans expérience préalable d'apprentissage machine ;
  • le support de Java Bindings et Spark : après avoir formé un modèle utilisant Python ou BrainScript, Cognitive Toolkit a toujours fourni de nombreuses façons d'évaluer le modèle Python, BrainScript ou C #. Maintenant, avec la version finale, les utilisateurs peuvent évaluer les modèles de kits d'outils cognitifs avec une nouvelle API Java. Cela le rend idéal pour les utilisateurs souhaitant intégrer des modèles d'apprentissage en profondeur dans leurs applications basées sur Java ou pour une évaluation à l'échelle sur des plateformes telles que Spark ;
  • un modèle de compression : l'évaluation d'un modèle qualifié sur les CPU inférieurs trouvés dans les produits mobiles peut rendre les performances en temps réel difficile à réaliser. Ceci est particulièrement vrai en essayant d'évaluer les modèles formés pour l'apprentissage d'images sur la vidéo en temps réel provenant d'une caméra. Avec la version finale Cognitive Toolkit, Microsoft a inclus des extensions qui permettent des implémentations quantifiées de plusieurs opérations FP, qui sont plusieurs fois plus rapides que leurs homologues de précision complète. L'accélération est assez grande pour permettre l'évaluation des modèles Cognitive Toolkit beaucoup plus rapidement sur le serveur et les périphériques embarqués à faible puissance avec peu de perte de précision d'évaluation.

La boîte à outils open source peut être trouvée sur GitHub. Des centaines de nouvelles fonctionnalités, des améliorations de performances et des correctifs ont été ajoutés depuis la création de la version bêta.

Microsoft assure que sur les GPU multiples, la performance est encore meilleure avec l'évolutivité. Par exemple, avec le dernier GPU Volta de NVIDIA, le V100, les projections de performance s’améliorent progressivement jusqu'à 64x V100.


Source : Microsoft
Offres d'emploi IT
Architecte / concepteur électronique analogique H/F
Safran - Ile de France - Éragny (95610)
Responsable de projet (calculateur moteur) H/F
Safran - Ile de France - Massy (91300)
Architecte systèmes externes TP400 H/F
Safran - Ile de France - Moissy-Cramayel (77550)

Voir plus d'offres Voir la carte des offres IT
Contacter le responsable de la rubrique Accueil