Developpez.com

Le Club des Développeurs et IT Pro

Twitter libère Storm

Son système de traitement de flux de données et de calcul distribué en temps réel

Le 2011-08-08 16:11:51, par Hinault Romaric, Responsable .NET
Il y a de cela environ un mois, le célèbre site de micro-blogging Twitter avait acquis la société d’analyse des medias sociaux BlackType et l’ensemble de ses projets.

La firme vient d’annoncer que Storm, l’un des projets les plus importants de BlackType, serait développé et publié gratuitement sous licence open source.

Storm est un projet assez similaire à Hadoop, le système de traitement de données évolutif pour le stockage et le traitement par lots de très grandes quantités de données. Il peut être utilisé pour la résolution des plusieurs problèmes de calcul en temps réel, le traitement de flux de données, etc.

A la différence du framework Hadoop, qui utilise MapReduce avec des fils d’attentes, Storm utilise des "topologies » et traite les messages indéfiniment ou jusqu’à ce qu’ils soient désactivés. La solution est très adaptée pour analyser des flux de données comme des millions de flux provenant de Twitter.

L’application pourra donc être utilisée pour le traitement d’autres flux et bases de données mises à jour en temps réel, pour faire une requête en continu et fournir le flux des résultats, également en temps réel, aux clients. Il pourra également être utilisé pour le traitement des événements complexes (Complex event processing) distribués.

Le lancement de Storm par Twitter est prévu pour le mois prochain lors de la conférence Strange Loop qui se déroulera à Saint-Louis

Source : Twitter

Et vous ?

Que pensez-vous de Storm ? Intéressant ou préférez-vous Hadoop ?
  Discussion forum
4 commentaires
  • ValCapri
    Membre habitué
    Je ne suis pas sûr de bien comprendre ce qu'est Storm et Hadoop.

    Il s'agit d'une genre de base de donnée permettant la recherche rapide multi-critère sur un grand de nombre de flux de données?

    En fait, on utilise ce genre d'outils pour le data mining? En tiré des statistiques?
  • sedryk
    Membre habitué
    @ValCapri : non en faite, Storm et Hadoop sont des solutions de traitement de données massive, quelque soit l'origine des données. Pour mieux comprendre je te conseille de lire directement le post sur le blog de Twitter qui reste très simple et très compréhensible.

    Personnellement, j'attends le 19 septembre pour en savoir plus mais ce qui est présenté est très intéressant.
  • sedryk
    Membre habitué
    Envoyé par Traroth2
    Un système NoSQL en plus.
    Où as-tu lu qu'il s'agissait d'un système NoSQL ?

    Il s'agit d'un système pour effectuer des traitements sur des grandes quantités de données. Voici un article sur le blog de backtype qui présente succinctement Storm : http://tech.backtype.com/preview-of-storm-the-hadoop-of-realtime-proce
  • Traroth2
    Membre émérite
    Un système NoSQL en plus. C'est très bien, mais je ne suis pas sûr que ça soit une révolution...