Developpez.com

Le Club des Développeurs et IT Pro

HP lance le « langage R distribué »

Capable de s'exécuter sur un environnement Cloud

Le 2015-02-20 13:01:42, par Amine Horseman, Expert éminent sénior
Le langage OpenSource R, développé au départ par les laboratoires Bell et conçu spécialement pour les statistiques et l’analyse prédictive, vient de se faire un chemin vers le Cloud.

Très apprécié par les statisticiens, les chercheurs et les analystes, le langage R souffrait jusqu’à présent d’un inconvénient majeur de ne s’exécuter que sous un seul processus. Or, l’utilisation de grandes masses de données est souvent requise pour les analyses prédictives ainsi que le Datamining. Dorénavant, ceci n’est plus un problème puisque la multinationale HP (Hewlett-Packard) vient de mettre au point un moyen un moyen d’exécuter des programmes écrits dans ce langage sur plusieurs serveurs simultanément, ce qui ouvre la voie à la mise à l’échelle et permet de tirer avantage de la puissance du Cloud pour développer des applications d’analyse en temps réel.

https://vimeo.com/86050634

Le nouveau projet, dénommé Distributed R et publié sous licence GPL v2, était au départ destiné à fonctionner sur le système de base de données HP Vertica (créé pour faciliter l’analyse de grandes masses de données). Toutefois, il supporte aussi d’autres plateformes et bases de données, citons par exemple Hadoop ainsi que le Cloud AWS (Amazon Web Services). Il est aussi compatible avec les outils de développements de R Studio et R console.

Selon l’index Tiobe, R est le langage ayant enregistré la plus forte progression annuelle en 2014, ce qui lui a permis de grimper à la 12e place alors qu’il n’était qu’à la 38e place en décembre 2013. Aussi, un billet de blog d’un enseignant américain avait fait remarquer que les publications scientifiques utilisant le langage R dans le domaine des Analytics étaient en constante progression durant la même année.

Télécharger Distributed R sur la page GitHub du projet

Source : HP

Et vous ?

Pensez-vous que Distributed R sera plus performant pour les applications Cloud temps réel que les autres langages déjà utilisés ?
Le langage R va-t-il gagner encore plus en popularité parmi les entreprises avec le lancement de ce projet ?
  Discussion forum
1 commentaire
  • robertledoux
    Membre averti
    Il existait déjà le module "Snowfall" qui met en place un cluster R. Le projet d'HP se doit d’être plus efficace ou proposer une "administration" plus simple que "Snowfall" pour se faire une place.