Google indexe désormais le Web en temps réel
Et dope ses recherches à la "Caffeine"

Le , par Katleen Erna, Expert éminent sénior
Mise à jour du 10.06.2010 par Katleen
Google indexe désormais le Web en temps réel, et dope ses recherches à la "Caffeine"


Google vient d'achever le développement de son nouveau moteur d'indexation : Caffeine. Cette évolution essentielle de son moteur de recherche devrait répondre aux préoccupations actuelles, à savoir que le guerre de la recherche en ligne se focalise actuellement sur l'immédiateté.

L'indexation en temps réel du plus de données possibles (images, vidéos, articles, statuts Facebook, etc.) est dans l'air du temps, comme le prouvent les dernières améliorations apportées par Microsoft à Bing (prise en compte des Tweets).

L'actuel moteur d'indexation de Google est basé sur un modèle de couches (chacune allouée à un type de contenu) qui se mettent à jour indépendamment les unes des autres.

Caffeine propose un mode de fonctionnement différent en analysant continuellement le web qu'il fragmente en petites cellules épluchées en quasi-permanence. Ainsi, les nouvelles entrées apparaissent-elles bien plus rapidement dans les résultats du moteur de recherche (dès qu'une nouvelle information est détectée, elle est immédiatement ajoutée à l'index).

L’infrastructure nécessaire à un tel système est titanesque.
Caffeine réunit près de 100 millions de gigaoctets de données, soit 100 000 To, au sein d’une unique base de données où Les nouvelles informations sont ajoutées au rythme de plusieurs centaines de milliers de gigaoctets par jour.
Il faudrait 625 000 des plus gros modèles d’iPod (160 Go) pour contenir toutes ces données, d'après Google.

Recherche sur Internet : Google a besoin de "power users" pour tester son nouveau moteur

Deux semaines après le rapprochement entre Yahoo! et Microsoft, Google réagit en demandant l'aide de ses utilisateurs.
En fait, le numéro 1 de la recherche sur Internet propose de tester en exclusivité son nouveau moteur de recherche, et chacun est invité à donner son avis sur la pertinence des résultats. Le moteur de recherche précise qu'il attend des retours de la part de "power users" comme des webmasters ou des spécialistes en recherche.
Pour cela, il faut se rendre sur cette page. Ensuite, saisissez votre requête puis lancez la recherche.
Tout en bas de la page, vous trouverez un lien "Non satisfait ? Aidez-nous à améliorer ce service". En cliquant sur ce lien, on accède à une page avec un champ pour rédiger un commentaire sur les différences entre l'actuel Google et le nouveau. Seule condition : intégrer le mot "caffeine" dans son message.
Il s'agit donc d'un véritable test grandeur nature, et les premiers tests sont plutôt concluants. L'affichage semble vraiment plus rapide, et les résultats mis à jour plus rapidement et plus fréquemment.
Et puis surtout, il n'y a pas de publicité dans cette version...


Source : blog officiel de Google (en anglais)


Qu'en pensez-vous et l'avez-vous testé ?


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de bého32 bého32 - Membre habitué http://www.developpez.com
le 11/08/2009 à 11:42
Pareil, il m'a l'air sacrément plus rapide.
Et puis, c'est vraiment appréciable, cette absence de publicité sur la droite
Avatar de afrodje afrodje - Débutant http://www.developpez.com
le 11/08/2009 à 11:46
Même si on ne fait pas de recherche sur http://www2.sandbox.google.com/ (par exemple www.google.fr), on retrouve quand même le lien Non satisfait ? Aidez-nous à améliorer ce service..

Je me trompe?
Avatar de atm0sfe4r atm0sfe4r - Membre averti http://www.developpez.com
le 11/08/2009 à 13:38
Citation Envoyé par afrodje  Voir le message
Même si on ne fait pas de recherche sur http://www2.sandbox.google.com/ (par exemple www.google.fr), on retrouve quand même le lien Non satisfait ? Aidez-nous à améliorer ce service..

Je me trompe?

C'est ce que j'allais dire... j'ai pas capté le principe m'enfin...
Avatar de Leonhart Leonhart - Membre confirmé http://www.developpez.com
le 11/08/2009 à 13:47
Les résultats ont l'air au moins aussi pertinent.
Il faut voir si la rapidité subsiste avec un flot de recherche plus important !
Avatar de lukeni2 lukeni2 - Membre habitué http://www.developpez.com
le 11/08/2009 à 19:18
j'ai testé avec ceci : hp proliant ml150 raid driver

voici le résultat
Pour l'ancienne version :
Essai 1 : Results 1 - 10 of about 44,300 for hp proliant ml150 raid driver. (0.14 seconds)
Essai 2 : Results 1 - 10 of about 44,300 for hp proliant ml150 raid driver. (0.23 seconds)
Pour la nouvelle version :
Essai 1 : Results 1 - 10 of about 48,100 for hp proliant ml150 raid driver. (0.31 seconds)
Essai 2 :Results 1 - 10 of about 48,100 for hp proliant ml150 raid driver. (0.07 seconds)

Le nouvelle version donne un peut plus des résultats que l'ancienne et semble donned les résultat de plus en plus vite quand on repète la même requête. Il est encore trop tôp pour tirer une conclusion.
Avatar de ZeRevo ZeRevo - Membre averti http://www.developpez.com
le 27/08/2009 à 0:55
Il y a pas de pubs sur le nouveau moteur, ça doit jouer sur la vitesse de chargement
Avatar de Katleen Erna Katleen Erna - Expert éminent sénior http://www.developpez.com
le 10/06/2010 à 6:30
Mise à jour du 10.06.2010 par Katleen
Google indexe désormais le Web en temps réel, et dope ses recherches à la "Caffeine"


Google vient d'achever le développement de son nouveau moteur d'indexation : Caffeine. Cette évolution essentielle de son moteur de recherche devrait répondre aux préoccupations actuelles, à savoir que le guerre de la recherche en ligne se focalise actuellement sur l'immédiateté.

L'indexation en temps réel du plus de données possibles (images, vidéos, articles, statuts Facebook, etc.) est dans l'air du temps, comme le prouvent les dernières améliorations apportées par Microsoft à Bing (prise en compte des Tweets).

L'actuel moteur d'indexation de Google est basé sur un modèle de couches (chacune allouée à un type de contenu) qui se mettent à jour indépendamment les unes des autres.

Caffeine propose un mode de fonctionnement différent en analysant continuellement le web qu'il fragmente en petites cellules épluchées en quasi-permanence. Ainsi, les nouvelles entrées apparaissent-elles bien plus rapidement dans les résultats du moteur de recherche (dès qu'une nouvelle information est détectée, elle est immédiatement ajoutée à l'index).

L’infrastructure nécessaire à un tel système est titanesque.
Caffeine réunit près de 100 millions de gigaoctets de données, soit 100 000 To, au sein d’une unique base de données où Les nouvelles informations sont ajoutées au rythme de plusieurs centaines de milliers de gigaoctets par jour.
Il faudrait 625 000 des plus gros modèles d’iPod (160 Go) pour contenir toutes ces données, d'après Google.
Avatar de dvdbly dvdbly - Membre averti http://www.developpez.com
le 10/06/2010 à 9:22
Citation Envoyé par cherkaoui.j.e  Voir le message
C'est vrai que c'est rapide

Tester avec le mot clé "sql"
Dans l'actuel moteur :

Résultats 1 - 10 sur un total d'environ 5 280 000 pages en français pour sql. (0,58 secondes)

Dans le nouveau :

Résultats 1 - 10 sur un total d'environ 148 000 000 pour sql (0,07 secondes)

C'est quand même à se demander qui tire le plus de profit de cette accélération d'un ordre de grandeur :
Google ou l'utilisateur ?

Je suis intimement persuadé que cela ne fait pas de différence pour l'utilisateur, à part - peut-être - psychologiquement : descendre en dessous de la demi-seconde est-il vraiment un gain sachant que cliquer sur un bouton, le voir s'enfoncer et remonter doit prendre, à vue de nez, entre 2 et 5 dixièmes de seconde !

En revanche, pour Google, si cela se fait à nombre de machines constant, et éventuellement sur des serveurs plus récents et donc moins gourmands en électricité, alors la consommation doit chuter drastiquement, et la facture avec...
Avatar de Kikohs Kikohs - Membre du Club http://www.developpez.com
le 10/06/2010 à 10:00
The requested URL /unavailable.html was not found on this server.
Le site a l'air down ...
Avatar de yezhouden yezhouden - Membre régulier http://www.developpez.com
le 10/06/2010 à 14:16
En même temps, le lien date de 10 mois...
Avatar de ijmouan ijmouan - Candidat au Club http://www.developpez.com
le 10/06/2010 à 20:38
J'ai testé avec des mots difficiles et ça marche mieux que précédemment.

Je pense que google ne cesse pas de se développer et c'est génial.
Offres d'emploi IT
(H/F) ADMINISTRATEUR SYSTEME LINUX
STUDIO RH - Nord Pas-de-Calais - Lille (59000)
DEVELOPPEUR SUPPORT INFORMATIQUE
AGENCE SUPPLAY - Basse Normandie - Condé-sur-Noireau (14110)
Technicien testeur
ReputationVIP - Rhône Alpes - Lyon (69000)

Voir plus d'offres Voir la carte des offres IT
Contacter le responsable de la rubrique Accueil