Microsoft rebaptise Revolution R Open qui devient Microsoft R Open
Une version gratuite est disponible pour les développeurs et les étudiants

Le , par Stéphane le calme, Chroniqueur Actualités
Votre avis sur Microsoft R Open
Le 6 avril dernier, Microsoft a annoncé avoir finalisé son acquisition de Revolution Analytics, une entreprise qui développe des solutions autour de R, un langage de programmation libre utilisé pour le traitement des données, l'analyse statistique des données ainsi que leur représentation à l'aide d'une grande variété de graphiques disponibles.

Revolution R Open est présenté par Microsoft comme l'une des implémentations phares de R, qui est désormais la propriété de Microsoft ("Revolution R", pas R), et donne un contrôle de facto sur la façon dont R est utilisé par une bonne partie de sa base. Mais comme avec les versions précédentes du produit, il est toujours offert aux termes de licence GPLv2.

Dans un billet de blog publié par Joseph Sirosh, vice-président du groupe Microsoft Data, Microsoft a expliqué que Revolution R Open va désormais s'appeler Microsoft R Open (MRO) et a vanté les avantages qu'a l'utilisation de Microsoft R Open sur d'autres implémentations du langage.

« Microsoft R Server est une plateforme analytique de classe entreprise largement déployable et basée sur R qui bénéficie d'un support, elle est scalable et sécurisée », a-t-il expliqué. Il a également précisé qu'il « supporte une grande variété de statistiques relatives au Big Data, aux modèles prédictifs et possède également des capacités d'autoapprentissage. R Server supporte une large gamme d'outils d'analyse : l'exploration, l'analyse, la virtualisation et la modélisation. En se servant de R et en étendant son utilisation, Microsoft R Server est complètement compatible avec les scripts de R, à ses fonctions et ses packages CRAN, afin de pouvoir analyser les données à l'échelle de l'entreprise. Il corrige également les problèmes de limitation de mémoire en ajoutant des traitements de données parallèles, permettant aux utilisateurs d'effectuer des analyses sur des données bien plus importantes que celles qui peuvent tenir dans leur mémoire principale ».

Sirosh a exprimé le désir de Microsoft de voir R Server devenir la norme entreprise pour des analyses de données multiplateformes sur le Cloud comme en local. « Déployer Microsoft R Server sur de multiples plateformes permet à nos entreprises clients de standardiser les analyses avancées sur un outil de base, indépendamment du fait qu'ils se servent d'Hadoop (Hortonworks, Cloudera et MapR), Linux (Red Hat et SUSE) ou Teradata », a-t-il expliqué. « Pour Windows, Microsoft R Server sera inclus dans SQL Server 2016 comme étant SQL Server R Services - et la combinaison va s'avérer moins onéreuse qu'une version autonome de RRE. Jusqu'à ce que SQL Server 2016 soit disponible, Revolution R Entreprise pour Windows demeure disponible en tant que produit autonome », même si Sirosh n'a pas précisé de date de disponibilité de SQL Server 2016.

Une version développeur est également disponible gratuitement (Microsoft R Server Developer Edition, notons qu'il faut posséder un compte Microsoft) via Visual Studio Dev Essentials qui inclut toutes les fonctionnalités qui figurent dans la version commerciale.

Cette édition développeur sera également incluse dans la nouvelle machine virtuelle Microsoft Data Science comme un composant préinstallé et préconfiguré. Cette machine virtuelle est décrite comme étant « une image personnalisée de la machine virtuelle basée sur Windows Server 2012 sur le marché Azure contenant plusieurs outils populaires qui peuvent être utilisés par les scientifiques de données ainsi que les développeurs pour des analyses avancées ».

« Microsoft R Open améliore la performance de R avec des calculs optimisés pour les processeurs multi-thread fournis par Intel Math Kernel Libraries (MKL) qui apportent une grande vitesse, en particulier dans des calculs orientés matrice », a avancé Sirosh. « Il facilite également la conception d'applications R fiables sur Windows, Mac et Linux en simplifiant la gestion des packages de versions de R. Microsoft R Open est 100 pour cent compatible avec tous les scripts et package R et, tout comme R, il est open source, en téléchargement gratuit, libre d'utilisation et de partage ».

Microsoft R Server est également disponible pour les élèves pour un usage académique au travers du programme Microsoft DreamSpark. « Les analyses avancées et prédictives consistent à développer et tester de nouveaux modèles », a-t-il rappelé, citant ainsi l'analyste de l'IDC Dan Vesset. « Mais cela consiste également à leur intégration par les développeurs dans des déploiements de production des supports de décision et de solutions d'automation qui peuvent profiter à l'entreprise tout entière. Avec cette nouvelle offre de l'écosystème R, Microsoft joue un rôle important dans le rapprochement des outils de productivité et d'analyse de modélisation ainsi que les outils de déploiement d'un plus large public ».

Que pensez-vous de cette annonce de Microsoft ? Que pensez-vous de la valeur de cette implémentation par rapport aux autres implémentations ?

Guide d'installation de MRO

Source : blog Technet, blog Revolution Analytics

Voir Aussi :

le forum R


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse Signaler un problème

Avatar de Meseira Meseira - Membre habitué https://www.developpez.com
le 15/01/2016 à 20:49
Bonsoir,

je suis un utilisateur avancé et intensif de R de par mon activité professionnelle et j'ai été très surpris de lire cette annonce de Microsoft pour Revolution/Microsoft R. A ma connaissance, Revolution/Microsoft R n'est rien d'autre qu'une re-compilation du code de R agrémenté de quelques packages qui ne sont ni libres, ni open source. Contrairement a ce qui est avancé par Sirosh, je ne pense pas que Microsoft R Open améliore globalement quoi que ce soit à R lui-même. En tout cas, je n'ai jamais vu de benchmark objectif permettant de le penser en dehors de ceux proposés par Revolution Analytics ou Microsoft.

De plus, je trouve que cette annonce de Microsoft doit laisser un très mauvais goût dans la bouche de celles et ceux qui travaillent sur le logiciel libre R ou sur des packages R. Dire que Revolution Analytics est "le vendeur de R sur le marché" laisse à penser que R serait à vendre. Ce n'est absolument pas le cas puisqu'il s'agit d'un logiciel libre et que tout un chacun peut donc l'installer et l'utiliser gratuitement. De plus, dire que Revolution R est "une des implémentations phares de R" est totalement mensonger : je me répète mais ce produit n'est qu'une simple re-compilation de l'énorme et excellent travail des développeurs R légèrement agrémenté des quelques fioritures à peine notables. Enfin, il est fait plusieurs fois mention du fait que Microsoft R a un large spectre d'applications (Big Data, exploration, ...) et qu'il est totalement compatible avec les packages R ... Les bras m'en sont tombés! C'est bien évidemment le cas puisque Microsoft R n'est rien de plus que R lui-même et ce large spectre d'applications est justement fourni par la grande variété de packages écrits et mis à disposition librement par la communauté! Bref, Revolution Analytics essayait déjà de tirer la couverture à lui, Microsoft prend la relève à peu de frais puisqu'il lui suffit de se baser sur le travail de toute une communauté pour vendre un produit sans aucune valeur ajoutée!

Dernier point qui n'a pas de rapport mais l'expression "data scientistes" m'a fait saigner les yeux. L'expression anglaise "data scientists" a bien un sens mais, de grâce, ne francisez pas n'importe comment ou si vous voulez vraiment traduire cela, utiliser des mots qui conviennent comme "scientifiques des données".
Avatar de xavier-Pierre xavier-Pierre - Membre averti https://www.developpez.com
le 16/01/2016 à 9:13
bonjour,
merci à meseira pour ce commentaire explicatif
Avatar de MaitrePylos MaitrePylos - Responsable Livres https://www.developpez.com
le 16/01/2016 à 10:00
Citation Envoyé par Meseira

pour vendre un produit sans aucune valeur ajoutée!
Bien sur , qu'il a une énorme valeur ajouté, les administrations pourront acheté un produit qui à une société reconnue derrière elle.
Pourquoi utiliser un produit Open-Source, alors que l'on peut avoir la même chose pour une somme astronomique et du coup se dédouaner si le projet est un échec
Avatar de juliatheric juliatheric - Membre actif https://www.developpez.com
le 19/01/2016 à 19:53
Bonsoir,
Sans entrer dans le débat « pour ou contre MR », j'aimerais donner quelques clarifications.

Citation Envoyé par Meseira Voir le message
... A ma connaissance, Revolution/Microsoft R n'est rien d'autre qu'une re-compilation du code de R agrémenté de quelques packages qui ne sont ni libres, ni open source ...
MR est libre, sa licence est la GNU GENERAL PUBLIC LICENSE, Version 2. Il y a une version commerciale de MR, elle est certainement libre elle aussi (au sens GPL) sinon il y aurait une violation de la GPL. De même, sur le même dépôt, on peut constater que les packages propres à MR sont open source, tous ne sont pas libres mais ils sont open source. Sujet similaire : il y a du recouvrement entre le personnel de MR et de RStudio. Rien d'étonnant de constater que ce dernier a le même business model, i.e. un IDE libre et gratuit, un autre payant et probablement libre.

Les gens de MR contribuent beaucoup, depuis l'époque RR, à la fondation R. Sur cette page, leur boîte est listée parmi les «Benefactors» de la fondation. MR contribue également à la communauté des utilisateurs de GNU R, voici une sélection de quelques packages très intéressants (du moins de mon point de vue) qui sont sur le CRAN :


À disposition de la communauté, il y a également un miroir CRAN qui a quelques fonctionnalités plutôt bonnes. Par ailleurs, les choses qu'ils disent sur le Big Data ne sont pas des paroles en l'air, témoins le dépôt susmentionné et un package comme AzureML.

Citation Envoyé par Meseira Voir le message
... Contrairement a ce qui est avancé par Sirosh, je ne pense pas que Microsoft R Open améliore globalement quoi que ce soit à R lui-même. En tout cas, je n'ai jamais vu de benchmark objectif permettant de le penser en dehors de ceux proposés par Revolution Analytics ou Microsoft.
Si vous pensiez à ce benchmark, alors il ne s'agit pas uniquement de leurs tests. La page référence un benchmark assez vieux externe à MR.

Mais, plus intéressant, R peut être amélioré, c'est souhaitable et il y a des personnes qui se sont mis à le faire.
  1. projet parmi les précurseurs
  2. projet qui semble inactif depuis quelques années
  3. celui-ci est actif ; avertissement : il y a Oracle dans les parages puisque visiblement les mastodontes industriels ne sont pas bienvenus
  4. travail universitaire
  5. ce projet me semble le plus dynamique même s'il y a de l'aigreur ça et là dans les pages du site.


Bref, les implémentations alternatives et coopératives avec l'upstream, c'est plutôt très « esprit du libre ».
Avatar de faubry faubry - Membre confirmé https://www.developpez.com
le 22/01/2016 à 9:38
Pour complément sur cette implantation de R par Microsoft :

"As always, you can use the latest and greatest CRAN packages with MRO with the checkpoint package (and get reproducible R scripts with just one line of code, to boot). And to make it easier for you to pick a CRAN snapshot with the package versions you need, we have also introduced the CRAN Time Machine on MRAN where you can browse the contents of CRAN as they were on any date since September 17, 2014."
source : http://www.r-bloggers.com/microsoft-r-open-3-2-3-now-available/?utm_source=feedburner&utm_medium=email&utm_campaign=Feed%3A+RBloggers+%28R+bloggers%29

La question est de savoir combien de temps Microsoft assurera la compatibilité et s'il n'y a pas derrière cette initiative la même arrière pensée que quand Microsoft a essayé d'imposer sa propre machine virtuelle Java qui n'était qu'en partie compatible avec la machine standardisée. L'annonce de Microsoft sur ce sujet relayée par 'Stéphane le calme' peut faire craindre le pire, d'autant qu'il ne faut se faire d'illusion, intégrer RMO dans le SQL server a un coût, ce qui signifie qu'il faudra in fine payer pour utiliser un logiciel libre et ouvert.
Avatar de MaitrePylos MaitrePylos - Responsable Livres https://www.developpez.com
le 22/01/2016 à 9:42
Citation Envoyé par faubry Voir le message
ce qui signifie qu'il faudra in fine payer pour utiliser un logiciel libre et ouvert.
Piqure de rappel :

Open Source ne veut pas dire Gratuit.
Gratuit ne veut pas dire pas chère.
Je ne pense pas qu'il soit incompatible de "payer" pour un produit open source, si le service est là.
Avatar de faubry faubry - Membre confirmé https://www.developpez.com
le 22/01/2016 à 9:57
D'accord j'aurai du ajouter gratuit mais il me semblait que sur un forum dédié à R, tous les contributeurs savaient que R est gratuit. Me suis-je trompé et certains des contributeurs ont-ils payé une boîte de service pour charger R sur leur ordinateur. Je ne fais pas l'amalgame avec les boîtes de services qui organisent des cours sur R ou qui développent des solutions à partir de R. Il est normal de faire payer cette plus-value.

Pour terminer sur une note légèrement provocatrice, j'espère que la discussion sur ce fil se fait entre véritables utilisateurs de R et non entre utilisateurs et lobbyistes / communicants / commerciaux de Microsoft.
Avatar de DotNetMatt DotNetMatt - Modérateur https://www.developpez.com
le 22/01/2016 à 13:11
Citation Envoyé par faubry Voir le message
D'accord j'aurai du ajouter gratuit mais il me semblait que sur un forum dédié à R, tous les contributeurs savaient que R est gratuit. Me suis-je trompé et certains des contributeurs ont-ils payé une boîte de service pour charger R sur leur ordinateur.
Ne mélangeons pas tout, ici il s'agit d'intégrer R dans SQL Server, et de proposer un moyen simple de se mettre à disposition des serveurs R.

Dans mon équipe on a 95% de développeurs .NET et 5% des data scientists qui bossent avec R et Python, et c'est un vrai calvaire pour les outils ! On attend une chose, que Microsoft intègre R dans Visual Studio comme cela a déjà été fait pour Python (ah tient, on Python est gratuit mais intégré à un logiciel payant...). Cela nous permettra de rationnaliser le parc applicatif et dire dire au revoir à R Studio, aussi bien soit-il mais très peu intégré à l'écosystème .NET. On pourra mettre tous nos gars sur Visual Studio et on gagnera en simplicité.

De même aujourd'hui nos data scientists doivent coder leur accès aux bases SQL Server. Demain avec SQL Server 2016 ils pourront directement créer des procédures stockées dans SQL Server (= moins de trafic réseau, etc.). Bref, on ne peut que se réjouir de cette intégration.

Concernant les serveurs, on utilise Azure Machine Learning qui j'imagine tournent avec Microsoft R Open. Si demain on a besoin d'avoir des serveurs onprem, le déploiement en sera beaucoup plus simple par rapport à devoir se palucher l'installation de R de partout, répliquer les paramètres serveur par serveur, etc.
Avatar de faubry faubry - Membre confirmé https://www.developpez.com
le 22/01/2016 à 14:13
Je ne mélange pas tout mais je pose des questions manifestement sensibles vu les réactions qu'elles génèrent et notamment est-il vraiment nécessaire de développer sa propre version de R avec les risques de dérives ultérieures entre le R officiel et le R version Microsoft ou ne serait-ce pas plus rationnel que développer des API spécifiques comme cela a été fait avec RStudio ou avec SQL ? Et ne croyez pas que je cible spécifiquement Microsoft parce que les questions que je pose seraient identiques vis-à-vis des concurrents de Microsoft.
Avatar de DotNetMatt DotNetMatt - Modérateur https://www.developpez.com
le 22/01/2016 à 14:55
Citation Envoyé par faubry Voir le message
notamment est-il vraiment nécessaire de développer sa propre version de R avec les risques de dérives ultérieures entre le R officiel et le R version Microsoft ou ne serait-ce pas plus rationnel que développer des API spécifiques comme cela a été fait avec RStudio ou avec SQL ?
Justement, c'est exactement ce qui se passe avec ce logiciel, je cite :
Microsoft a annoncé avoir finalisé son acquisition de Revolution Analytics, une entreprise qui développe des solutions autour de R
Pour ne parler que de ce que je connais, sur Azure Machine Learning on utilise le même "R" que celui que l'on installe sur nos postes, il n'y a quasiment aucune différence (j'entends par là limitations, facon de programmer...). Les seules différences sont liées au fait d'être dans le cloud, donc par exemple certaines fonctionnalités réseau sont bridées pour le moment.

Demain, si je veux m'affranchir de ces limitations, je peux installer MRO sur mes serveurs et comme je suis dans le cloud, je pourrais certainement réaliser mon déploiement facilement sans avoir à passer sur chaque machine une par une comme je le ferais avec l'installateur basique de R. Et c'est probablement la scalabilité le principal objectif, je cite :
Microsoft R Server est une plateforme analytique de classe entreprise largement déployable et basée sur R qui bénéficie d'un support, elle est scalable et sécurisée
L'objectif n'est pas de créer un fork de R ou autre, et heureusement.

Aussi, les data scientists de mon équipe n'ayant pas forcément tous des connaissances très poussées en développement, admin serveur, et la plupart d'entre eux n'ayant probablement pas travaillé avec MRO avant de nous rejoindre, si on peut bénéficier d'un support pour se simplifier la vie, j'achète.
Contacter le responsable de la rubrique Accueil