Un outil d'analyse et de traitement des données brutes, un pas de plus vers la recherche sémantique ?
Google vient de lancer « Refine 2.0 », un produit open-source conçu à partir de Freebase Gridworks que la société a acquit en rachetant la startup « MetaWeb » et sa base de donnée sémantique en juin dernier (lire par ailleurs : Google : un pas de plus vers la recherche sémantique avec le rachat de Metaweb)
Google Refine permet de "rafiner" des données brutes pour y mettre de l'ordre en vu d'une utilisation plus consistante.
Il permet donc d'effectuer de nombreuses manipulations, conversions et transformations et d'utiliser des sources de données externes pour étoffer les données initiales.
Refine est écrit en Java, il dispose de son propre langage pour manipuler les données mais d'autres langages comme Closure et Jython peuvent être utilisés.
Freebase Gridworks a déjà été très bien reçu par les agences de presse, les centres de recherche et les institutions gouvernementales comme le Chicago Tribune, ProPublica et data.gov.uk.
Google refine est disponible pour Windows, MacOX et Linux, son déploiement est facilité par un installable en un clic/commande pour chaque plateforme.
La mise à jour à partir de Gridworks est aussi possible.

Source : blog Google Opensource
Et vous ?

Vous avez lu gratuitement 8 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.