Science des données : Julia, R ou Python ?

Un petit aperçu des avantages et inconvénients du langage Julia

Le 16 janvier 2018 à 17:31, par dourouc05

1KPARTAGES

Le langage Python a été inventé dans les années 1990 pour des tâches d'administration système. Ces dernières années, il est devenu de plus en plus utilisé dans le contexte de la science des données : analyser des jeux de données, apprendre des modèles statistiques, créer des graphiques, etc. Ainsi, l'écosystème a évolué avec bon nombre de bibliothèques, d'outils et autres applications.

Peu après les débuts de Python, mais bien avant son utilisation pour en science des données, R a été développé spécifiquement pour les besoins de statisticiens. Avec les années, son écosystème s'est considérablement enrichi dans le domaine, au point où le langage est une référence en termes de fonctionnalités de haut niveau disponibles, tant pour l'analyse de données que la création de graphes.

Julia est un autre langage fort utilisé en science des données : moins populaire que les deux derniers, il prend néanmoins son envol. Ses premières versions ne datent que de 2012 (la 1.0 n'est toujours pas sortie). Ses objectifs sont proches de ceux de R (faciliter le calcul scientifique, notamment statistique), mais avec une excellente performance (là où tant Python et R pêchent).

Quels sont les avantages des uns et des autres ?

Avantages de Julia :

la performance par défaut : bien qu'il soit possible d'accélérer des programmes R ou Python (en réécrivant certaines parties en un autre langage, par exemple), Julia propose une excellente performance sans artéfact ;
une syntaxe plaisante pour les mathématiques, très proche des notations habituelles. Par exemple, un produit matriciel s'écrit avec * en Julia, mais avec %*% en R ou @ en Python (uniquement depuis la version 3.6) ;
le parallélisme facile, tant sur les différents cœurs d'une machine (ce qui est syntaxiquement plus difficile en Python), R proposant le même genre de facilités, que sur plusieurs machines (Julia propose des abstractions, alors que R et Python se contentent de bibliothèques comme MPI).

Inconvénients de Julia :

la jeunesse du langage, qui fait que sa syntaxe continue d'évoluer (probablement plus pour très longtemps) ;
le peu de paquets disponibles par rapport à R ou Python, même s'il est possible assez facilement d'utiliser les bibliothèques pour d'autres langages ;
une communauté en cours de création, un corollaire assez direct de la jeunesse du langage.

Points communs :

la gestion automatique de la mémoire, il est inutile d'allouer et de libérer la mémoire explicitement (même si on peut le faire pour gagner en performance).

Et vous, quel langage préférez-vous pour la science des données ?

Article inspiré de Julia vs. Python: Julia language rises for data science.

Vous avez lu gratuitement 666 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

1
2
3

val list = (1 to 10000).toList
list.map(_ + 42) // créer un nouvelle liste en ajoutant 42 à chaque élément de "list".
list.par.map(_ + 42) // créer un nouvelle liste en ajoutant 42 à chaque élément de "list", en parallèle.

from multiprocessing import Pool

def plus_42(a):
        return a+42

if __name__ == '__main__':
    my_list = list(range(1, 10000))

    with Pool() as p:
        #  impossible de faire: res = p.map(lambda x: x+42, my_list) 
        res = p.map(plus_42, my_list)

Identifiez-vous

Créer un compte

Science des données : Julia, R ou Python ?

Un petit aperçu des avantages et inconvénients du langage Julia

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

Science des données : Julia, R ou Python ? Un petit aperçu des avantages et inconvénients du langage Julia

Science des données : Julia, R ou Python ?

Un petit aperçu des avantages et inconvénients du langage Julia