Developpez.com

Le Club des Développeurs et IT Pro

Apache Cassandra en version 0.6.0

Est disponible : gain de performances de 30% pour la base de données NoSQL

Le 2010-04-15 16:46:24, par Gordon Fowler, Expert éminent sénior
Mise à jour du 12/01/2011 par Idelways

La fondation Apache vient d'annoncer la disponibilité de la version 0.7 de Cassandra, le système de gestion de base de donnée de type NoSQL conçu pour supporter des quantités massives de données.

Parmi les nouveautés de cette version, l'arrivée des Indexs Secondaires, une manière efficace d'exécuter des requêtes sur des nœud locaux de stockages côté client.

Autre nouveauté, le support des « Large Row », qui permettent d'avoir jusqu'à 2 milliards de colonnes par rangée de données.

Cette version intègre aussi « Online Schema Changes », qui permet des ajouts et des modifications des définitions des objets d'une manière automatisée, sans devoir redémarrer le Cluster.

En raison de ses capacités de Clustering et de scalabilité, Cassandra s'est imposé comme un SGBD de choix pour le Cloud Computing. Selon la fondation Apache, le plus grand Cluster de Cassandra actuellement déployé s'étend sur 400 machines.

En plus de son développeur initial (Facebook), Cassandra est utilisé par Twitter et Digg, parmi d'autres acteurs majeurs du Web social et participatif.

Apache Cassandra 0.7 est disponible en téléchargement sur le site officiel du projet

Source : Blog de la fondation Apache

Et vous ?

Que pensez-vous des nouveautés de cette version ?
Utilisez-vous Cassandra ou d'autres SGBD NoSQL ? Décrivez-nous vos projets et les raisons ayant motivé ce choix ?

Apache Cassandra en version 0.6.0
Est disponible avec un gain de performances de 30 %

Cassandra, le désormais système Open Source de stockage de données du mouvement NoSQL, soutenu par la Fondation Apache, connait une nouvelle étape de son développement avec l'arrivée de la version 0.6.

Le but de ce type de système de stockage est de fournir un modèle décentralisé susceptible de répondre à des besoins important de scalabilité. Un concept qui n'est pas sans créer un certain débat dans la communauté des bases de données.

Au menu de Apache Cassandra 0.6.0, on trouve :

  • le support d'Hadoop avec implémentation de MapReduce
  • intégration de sa propre couche de gestion de cache (Row Cache)
  • 30% de gain en performances


Apache Cassandra 0.6.0 est disponible sur le site officiel du projet.

Source : L'annonce sur le blog de la Apache Software Foundation

Lire aussi :

La rubrique (actu, forums, tutos) SGBD de Développez
Que pensez vous de la solution Open Source Hadoop et de son Distributed Filesystem (HDFS) ?

Et vous ?

Attendiez-vous cette nouvelle version de Cassandra ? Ou que lui manque-t-il pour qu'un tel système de stockage des données puisse vous séduire ?
  Discussion forum
10 commentaires
  • Tesing
    Membre confirmé
    Je n'ai pas encore été confronté à des problématiques de volumétrie de données et de trafic qui justifieraient le passage à une solution de ce type.

    Cependant il me parait bien de voir des alternatives aux bases de données relationnelles se développer.
  • deadalnix
    Membre émérite
    facebook, twitter, digger, . . .

    Mais pas de gros sites encore .
  • subzero82
    Membre régulier
    Envoyé par deadalnix
    facebook, twitter, digger, . . .

    Mais pas de gros sites encore .

    Si le volume (qui soit dit en passant est égale à celui de google ces derniers temps) n'est pas du gros pour toi, alors qu'est-ce que c'est ... ?!
  • jaimepaslesmodozélés
    Membre régulier
    C'était une plaisanterie hein, rhalala ces jeunes ça fonce sans réfléchir
  • Tesing
    Membre confirmé
    Envoyé par deadalnix
    facebook, twitter, digger, . . .

    Mais pas de gros sites encore .
    Je ne travaille pas pour eux mais je suis sûr que cassandra leur est très utile.

    Pour le développeur lambda c'est pas vraiment le quotidien ces systèmes NoSQL.
  • deadalnix
    Membre émérite
    Bien sur que non, puisque l'intérêt principal de cette solution, c'est la scalabilité.

    Donc, si tu n'es pas très gros, c'est même pas la peine d'y penser.
  • kaymak
    Membre émérite
    Ne pensez vous pas qu'entre le sgbdr, dont il y a cinquante solutions d'orm existantes à mettre par dessus, et le sgbdo disponible sur un nombre trop limité de langage, ce genre de solutions pourraient répondre à certains contextes ? (autres que la scalabilité)
    De plus les requêtes type sur un sgbdo, m'ont paru assez complexe par rapport à sql.
    Ce qui n'est du tout mon souvenir sur le nosql.

    Je me pose cette question car la normalisation puis l'utilisation d'un orm par dessus, ne me convient pas des masses, c'est une bonne solution qui fait ces preuves tous les jours, mais elle reste un peu "batardes".

    a+
  • Traroth2
    Membre émérite
    Pour ceux qui doutaient encore de l'apport d'Apache au monde Java...
  • Big Bug
    Futur Membre du Club
    On a aucun doute de l'apport de la fondation Apache à JAVA. Là où on a plus de doute, c'est l'apport d'Oracle à JAVA. Disons que c'est le contraire... Apache apporte à JAVA et JAVA apporte à Oracle, donc Apache apporte à Oracle... Donc l'Open Source permet à une grosse société privée de faire beaucoup de tunes... C'est donc ça l'iTunes