Developpez.com

Le Club des Développeurs et IT Pro

Google cherche des bêta-testeurs pour son nouveau moteur de recherche "Caffeine"

êtes-vous convaincus ?

Le 2009-08-11 11:02:33, par Katleen Erna, Expert éminent sénior
Mise à jour du 10.06.2010 par Katleen
Google indexe désormais le Web en temps réel, et dope ses recherches à la "Caffeine"


Google vient d'achever le développement de son nouveau moteur d'indexation : Caffeine. Cette évolution essentielle de son moteur de recherche devrait répondre aux préoccupations actuelles, à savoir que le guerre de la recherche en ligne se focalise actuellement sur l'immédiateté.

L'indexation en temps réel du plus de données possibles (images, vidéos, articles, statuts Facebook, etc.) est dans l'air du temps, comme le prouvent les dernières améliorations apportées par Microsoft à Bing (prise en compte des Tweets).

L'actuel moteur d'indexation de Google est basé sur un modèle de couches (chacune allouée à un type de contenu) qui se mettent à jour indépendamment les unes des autres.

Caffeine propose un mode de fonctionnement différent en analysant continuellement le web qu'il fragmente en petites cellules épluchées en quasi-permanence. Ainsi, les nouvelles entrées apparaissent-elles bien plus rapidement dans les résultats du moteur de recherche (dès qu'une nouvelle information est détectée, elle est immédiatement ajoutée à l'index).

L’infrastructure nécessaire à un tel système est titanesque.
Caffeine réunit près de 100 millions de gigaoctets de données, soit 100 000 To, au sein d’une unique base de données où Les nouvelles informations sont ajoutées au rythme de plusieurs centaines de milliers de gigaoctets par jour.
Il faudrait 625 000 des plus gros modèles d’iPod (160 Go) pour contenir toutes ces données, d'après Google.

Recherche sur Internet : Google a besoin de "power users" pour tester son nouveau moteur

Deux semaines après le rapprochement entre Yahoo! et Microsoft, Google réagit en demandant l'aide de ses utilisateurs.
En fait, le numéro 1 de la recherche sur Internet propose de tester en exclusivité son nouveau moteur de recherche, et chacun est invité à donner son avis sur la pertinence des résultats. Le moteur de recherche précise qu'il attend des retours de la part de "power users" comme des webmasters ou des spécialistes en recherche.
Pour cela, il faut se rendre sur cette page. Ensuite, saisissez votre requête puis lancez la recherche.
Tout en bas de la page, vous trouverez un lien "Non satisfait ? Aidez-nous à améliorer ce service". En cliquant sur ce lien, on accède à une page avec un champ pour rédiger un commentaire sur les différences entre l'actuel Google et le nouveau. Seule condition : intégrer le mot "caffeine" dans son message.
Il s'agit donc d'un véritable test grandeur nature, et les premiers tests sont plutôt concluants. L'affichage semble vraiment plus rapide, et les résultats mis à jour plus rapidement et plus fréquemment.
Et puis surtout, il n'y a pas de publicité dans cette version...


Source : blog officiel de Google (en anglais)


Qu'en pensez-vous et l'avez-vous testé ?
  Discussion forum
13 commentaires
  • Katleen Erna
    Expert éminent sénior
    Mise à jour du 10.06.2010 par Katleen
    Google indexe désormais le Web en temps réel, et dope ses recherches à la "Caffeine"


    Google vient d'achever le développement de son nouveau moteur d'indexation : Caffeine. Cette évolution essentielle de son moteur de recherche devrait répondre aux préoccupations actuelles, à savoir que le guerre de la recherche en ligne se focalise actuellement sur l'immédiateté.

    L'indexation en temps réel du plus de données possibles (images, vidéos, articles, statuts Facebook, etc.) est dans l'air du temps, comme le prouvent les dernières améliorations apportées par Microsoft à Bing (prise en compte des Tweets).

    L'actuel moteur d'indexation de Google est basé sur un modèle de couches (chacune allouée à un type de contenu) qui se mettent à jour indépendamment les unes des autres.

    Caffeine propose un mode de fonctionnement différent en analysant continuellement le web qu'il fragmente en petites cellules épluchées en quasi-permanence. Ainsi, les nouvelles entrées apparaissent-elles bien plus rapidement dans les résultats du moteur de recherche (dès qu'une nouvelle information est détectée, elle est immédiatement ajoutée à l'index).

    L’infrastructure nécessaire à un tel système est titanesque.
    Caffeine réunit près de 100 millions de gigaoctets de données, soit 100 000 To, au sein d’une unique base de données où Les nouvelles informations sont ajoutées au rythme de plusieurs centaines de milliers de gigaoctets par jour.
    Il faudrait 625 000 des plus gros modèles d’iPod (160 Go) pour contenir toutes ces données, d'après Google.
  • cherkaoui.j.e
    Membre actif
    C'est vrai que c'est rapide

    Tester avec le mot clé "sql"
    Dans l'actuel moteur :

    Résultats 1 - 10 sur un total d'environ 5 280 000 pages en français pour sql. (0,58 secondes)

    Dans le nouveau :

    Résultats 1 - 10 sur un total d'environ 148 000 000 pour sql (0,07 secondes)
  • nicocsgamer
    Membre averti
    En même temps il y a beaucoup moins de monde qui utilise le nouveau moteur.
  • bého32
    Membre habitué
    Pareil, il m'a l'air sacrément plus rapide.
    Et puis, c'est vraiment appréciable, cette absence de publicité sur la droite
  • afrodje
    Débutant
    Même si on ne fait pas de recherche sur http://www2.sandbox.google.com/ (par exemple www.google.fr), on retrouve quand même le lien Non satisfait ? Aidez-nous à améliorer ce service..

    Je me trompe?
  • atm0sfe4r
    Membre averti
    Envoyé par afrodje
    Même si on ne fait pas de recherche sur http://www2.sandbox.google.com/ (par exemple www.google.fr), on retrouve quand même le lien Non satisfait ? Aidez-nous à améliorer ce service..

    Je me trompe?
    C'est ce que j'allais dire... j'ai pas capté le principe m'enfin...
  • Leonhart
    Membre confirmé
    Les résultats ont l'air au moins aussi pertinent.
    Il faut voir si la rapidité subsiste avec un flot de recherche plus important !
  • lukeni2
    Membre actif
    j'ai testé avec ceci : hp proliant ml150 raid driver

    voici le résultat
    Pour l'ancienne version :
    Essai 1 : Results 1 - 10 of about 44,300 for hp proliant ml150 raid driver. (0.14 seconds)
    Essai 2 : Results 1 - 10 of about 44,300 for hp proliant ml150 raid driver. (0.23 seconds)
    Pour la nouvelle version :
    Essai 1 : Results 1 - 10 of about 48,100 for hp proliant ml150 raid driver. (0.31 seconds)
    Essai 2 :Results 1 - 10 of about 48,100 for hp proliant ml150 raid driver. (0.07 seconds)

    Le nouvelle version donne un peut plus des résultats que l'ancienne et semble donned les résultat de plus en plus vite quand on repète la même requête. Il est encore trop tôp pour tirer une conclusion.
  • ZeRevo
    Membre averti
    Il y a pas de pubs sur le nouveau moteur, ça doit jouer sur la vitesse de chargement
  • dvdbly
    Membre averti
    Envoyé par cherkaoui.j.e
    C'est vrai que c'est rapide

    Tester avec le mot clé "sql"
    Dans l'actuel moteur :

    Résultats 1 - 10 sur un total d'environ 5 280 000 pages en français pour sql. (0,58 secondes)

    Dans le nouveau :

    Résultats 1 - 10 sur un total d'environ 148 000 000 pour sql (0,07 secondes)
    C'est quand même à se demander qui tire le plus de profit de cette accélération d'un ordre de grandeur :
    Google ou l'utilisateur ?

    Je suis intimement persuadé que cela ne fait pas de différence pour l'utilisateur, à part - peut-être - psychologiquement : descendre en dessous de la demi-seconde est-il vraiment un gain sachant que cliquer sur un bouton, le voir s'enfoncer et remonter doit prendre, à vue de nez, entre 2 et 5 dixièmes de seconde !

    En revanche, pour Google, si cela se fait à nombre de machines constant, et éventuellement sur des serveurs plus récents et donc moins gourmands en électricité, alors la consommation doit chuter drastiquement, et la facture avec...