Très apprécié par les statisticiens, les chercheurs et les analystes, le langage R souffrait jusqu’à présent d’un inconvénient majeur de ne s’exécuter que sous un seul processus. Or, l’utilisation de grandes masses de données est souvent requise pour les analyses prédictives ainsi que le Datamining. Dorénavant, ceci n’est plus un problème puisque la multinationale HP (Hewlett-Packard) vient de mettre au point un moyen un moyen d’exécuter des programmes écrits dans ce langage sur plusieurs serveurs simultanément, ce qui ouvre la voie à la mise à l’échelle et permet de tirer avantage de la puissance du Cloud pour développer des applications d’analyse en temps réel.
https://vimeo.com/86050634
Le nouveau projet, dénommé Distributed R et publié sous licence GPL v2, était au départ destiné à fonctionner sur le système de base de données HP Vertica (créé pour faciliter l’analyse de grandes masses de données). Toutefois, il supporte aussi d’autres plateformes et bases de données, citons par exemple Hadoop ainsi que le Cloud AWS (Amazon Web Services). Il est aussi compatible avec les outils de développements de R Studio et R console.
Selon l’index Tiobe, R est le langage ayant enregistré la plus forte progression annuelle en 2014, ce qui lui a permis de grimper à la 12e place alors qu’il n’était qu’à la 38e place en décembre 2013. Aussi, un billet de blog d’un enseignant américain avait fait remarquer que les publications scientifiques utilisant le langage R dans le domaine des Analytics étaient en constante progression durant la même année.
Télécharger Distributed R sur la page GitHub du projet
Source : HP
Et vous ?
Pensez-vous que Distributed R sera plus performant pour les applications Cloud temps réel que les autres langages déjà utilisés ?
Le langage R va-t-il gagner encore plus en popularité parmi les entreprises avec le lancement de ce projet ?