Envoyé par Venky Veeraraghavan
Pour simplifier et accélérer l'apprentissage automatique, Azure Machine Learning a été construit sur les principes de conception suivants :
- Permettre aux scientifiques de données d'utiliser un ensemble riche et familier d'outils de science des données
- Simplifier l'utilisation des structures populaires d'apprentissage par machine et d'apprentissage en profondeur
- Accélérez le retour sur investissement en offrant des fonctionnalités de cycle de vie d'apprentissage machine de bout en bout
Outils familiers de science des données
Les scientifiques de données s'attendent à utiliser tout l'écosystème Python de bibliothèques et de frameworks, ainsi que la possibilité de se former localement sur leur ordinateur portable ou leur station de travail. Il existe une grande variété d'outils utilisés dans l'industrie, mais ils relèvent généralement des interfaces de ligne de commande, des éditeurs et des IDE et des ordinateurs portables. Le service Azure Machine Learning a été conçu pour prendre en charge tous ces problèmes. Son SDK Python est accessible à partir de n’importe quel environnement Python, d’EDI comme Code Visual Studio (Code VS) ou PyCharm, ou de blocs-notes tels que Jupyter et Azure Databricks.
Support des frameworks populaires
Les frameworks sont les bibliothèques les plus importantes qu'un chercheur de données utilise pour construire ses modèles. Le service Azure Machine Learning prend en charge tous les frameworks basés sur Python. Les plus populaires, scikit-learn, PyTorch et TensorFlow, ont été transformés en une classe Estimator afin de simplifier la soumission du code de formation à un calcul à distance, que ce soit sur un seul nœud ou sur plusieurs groupes de GPU. En outre, cela ne se limite pas aux frameworks d’apprentissage automatique. Tous les packages du vaste écosystème Python peuvent être utilisés.
Envoyé par Venky Veeraraghavan
Azure Machine Learning s'intègre de manière transparente aux services Azure pour fournir des fonctionnalités de bout en bout pour le cycle de vie de l'apprentissage automatique, notamment la préparation des données, l'expérimentation, la formation de modèles, le déploiement des modèles ainsi que leur gestion.
Préparation des données
Les clients peuvent utiliser les capacités de la plateforme de données enrichie d’Azure, telles que Azure Databricks, pour gérer et préparer leurs données pour l’apprentissage automatique. Le SDK DataPrep est disponible en complément du SDK Azure Machine Learning Python pour simplifier les transformations de données.
Formation des modèles
Le service Azure Machine Learning fournit des fonctionnalités de calcul distribuées transparentes qui permettent aux scientifiques de données d’étendre la formation des modèles, que ce soit sur leur ordinateur portable en local ou sur leur station de travail sur le cloud. Le calcul est à la demande. Les utilisateurs ne paient que pour le temps de calcul et n'ont pas à gérer et à entretenir des clusters de GPU et de CPU.
Les professionnels des données, qui ont déjà investi dans Apache Spark, devraient suivre une formation sur les clusters Azure Databricks. Le SDK du service Azure Machine Learning est intégré à l'environnement Azure Databricks et peut être étendu de manière transparente pour l'expérimentation, le déploiement de modèles et la gestion.
Expérimentation
Les scientifiques de données créent leur modèle à travers un processus d’expérimentation, en parcourant leurs données et leur code d’entraînement à plusieurs reprises, jusqu’à ce qu’ils obtiennent les résultats souhaités du modèle. Le service Azure Machine Learning fournit des fonctionnalités puissantes pour améliorer la productivité des scientifiques de données.
Déploiement et gestion des modèles
Une fois que les scientifiques de données ont terminé le développement du modèle, il doivent les mettre en production et les gérer. Le registre de modèles de service Azure Machine Learning conserve une trace des modèles et de l'historique de leurs versions.
En somme
L’automatisation de sélection de modèle et de réglage des hyperparamètres permet d’éliminer les tâches les plus fastidieuses du Data Modeling. Ceci permet au modèle de s’adapter de manière autonome. Cet ajustement automatisé peut s’avérer très pratique pour les cas d’opérations reposant sur des centaines ou des milliers de pièces d’équipement situées dans différents endroits afin de régler les modèles prédictifs pour chaque machine.
Le service de Microsoft inclut un kit de développement logiciel pour le langage de programmation Python, et des environnements de développement pour Visual Studio Code, PyCharm, et les notebooks Azure Databrick et Jupyter. En outre, les fonctionnalités de Deep Learning distribué permettent aux développeurs d’entraîner des modèles avec des clusters massifs d’unités de traitement graphique (GPU) et d’accéder à des circuits logiques programmables pour la classification et la reconnaissance d’image sur Azure.
Source : Microsoft
Voir aussi :
Des services Azure cloud de Microsoft inaccessibles en Europe, Asie et Amérique pendant 14 h à cause de 3 bogues dans son service d'authentification
Microsoft va ouvrir une région Azure en Afrique « d'ici quelques semaines », les datacenters seront à Johannesburg et Cape Town
Microsoft veut qu'Azure devienne la solution serveur multijoueur pour toutes les plateformes, grâce à PlayFab Multiplayer Servers
Microsoft lance un kit de développement blockchain sur sa plateforme cloud Azure pour permettre aux développeurs de créer des applications plus vite
Microsoft Azure serait supérieur à Google Cloud Platform et à AWS en termes de performances réseau, d'après un rapport de ThousandEyes