Google Refine permet de "rafiner" des données brutes pour y mettre de l'ordre en vu d'une utilisation plus consistante.
Il permet donc d'effectuer de nombreuses manipulations, conversions et transformations et d'utiliser des sources de données externes pour étoffer les données initiales.
Refine est écrit en Java, il dispose de son propre langage pour manipuler les données mais d'autres langages comme Closure et Jython peuvent être utilisés.
Freebase Gridworks a déjà été très bien reçu par les agences de presse, les centres de recherche et les institutions gouvernementales comme le Chicago Tribune, ProPublica et data.gov.uk.
Google refine est disponible pour Windows, MacOX et Linux, son déploiement est facilité par un installable en un clic/commande pour chaque plateforme.
La mise à jour à partir de Gridworks est aussi possible.

Source : blog Google Opensource
Et vous ?
