Google vient de lancer « Refine 2.0 », un produit open-source conçu à partir de Freebase Gridworks que la société a acquit en rachetant la startup « MetaWeb » et sa base de donnée sémantique en juin dernier (lire par ailleurs : Google : un pas de plus vers la recherche sémantique avec le rachat de Metaweb)
Google Refine permet de "rafiner" des données brutes pour y mettre de l'ordre en vu d'une utilisation plus consistante.
Il permet donc d'effectuer de nombreuses manipulations, conversions et transformations et d'utiliser des sources de données externes pour étoffer les données initiales.
Refine est écrit en Java, il dispose de son propre langage pour manipuler les données mais d'autres langages comme Closure et Jython peuvent être utilisés.
Freebase Gridworks a déjà été très bien reçu par les agences de presse, les centres de recherche et les institutions gouvernementales comme le Chicago Tribune, ProPublica et data.gov.uk.
Google refine est disponible pour Windows, MacOX et Linux, son déploiement est facilité par un installable en un clic/commande pour chaque plateforme.
La mise à jour à partir de Gridworks est aussi possible.
Télécharger Google Refine sur cette page
Source : blog Google Opensource
Et vous ?
Avez-vous essayé Google Refine ou Freebase Gridworks ? Qu'en pensez-vous ?
Google lance en open-source « Refine 2.0 »
Un outil d'analyse et de traitement des données brutes
Google lance en open-source « Refine 2.0 »
Un outil d'analyse et de traitement des données brutes
Le , par Idelways
Une erreur dans cette actualité ? Signalez-nous-la !