IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Microsoft annonce la préversion publique d'Azure Data Catalog
Un catalogue de métadonnées d'entreprise

Le , par Stéphane le calme

28PARTAGES

0  0 
Dans un billet de blog publié hier, Joseph Sirosh, Corporate vice-président de la gestion de l’information et du Machine Learning chez Microsoft, a annoncé que la première publique d’Azure Data Catalog, un catalogue de métadonnées d'entreprise mais aussi un portail pour la découverte en libre-service de sources de données en interne, sera disponible dès lundi prochain, soit le 13 juillet 2015.

En février dernier, Microsoft lançait Azure ML, sa plateforme Machine Learning. Tandis que les entreprises créent divers référentiels de données, il devient plus difficile pour les parties intéressées telles que les analystes et les data scientistes de comprendre quelles sont les sources de données existant dans une grande organisation qui peuvent être adéquates face à un problème spécifique.

« Les entreprises de toutes tailles sont confrontées au défi de passer au crible leurs sources de données et découvrir celles qui répondent à un problème donné. Bien que les entreprises recueillent et stockent des tonnes de données dans le cadre de leurs activités quotidiennes, trop souvent, elles n’arrivent pas à tirer pleinement partie de toutes les données qui sont recueillies. Les employés finissent la plupart du temps par chercher des données au lieu de travailler avec les données elle-même », a expliqué Sirosh.

« Pour répondre à ce problème, Azure Data Catalog s’inspirent de l’approche crowdsourcing. Tout utilisateur, par exemple un analyste, un data scientiste ou un data développeur, peut enregistrer, enrichir, découvrir, comprendre et consommer des sources de données. Chaque utilisateur est habilité à enregistrer des sources de données dont il se sert. L’enregistrement extrait la métadonnée structurelle de la source de donnée et la stocke dans le Catalog sur le Cloud, tandis que la donnée elle-même demeure dans la source de données » a-t-il continué.


En clair, le but du catalogue de données, qui est un service Cloud, est de fournir un moyen d'identifier les sources, et ensuite les rechercher d'une manière plus organisée. L’utilisateur enregistre ses sources avec l'outil d'enregistrement de source de données du service. Il extrait les métadonnées structurelles (des données sur la source de données telles que les noms d'attributs et de types de données). Les métadonnées sont alors copiées dans le catalogue sur le Cloud tandis que la donnée n’est pas déplacée de la source.

Une fois qu'elle figure dans le catalogue, les autres employés peuvent la trouver à l'aide d’une recherche par des mots clés ou par une technique de filtrage par exemple. Les utilisateurs peuvent se connecter à la source de données en utilisant l’outil de leur convenance. Les annotations crowdsourcing permettent aux utilisateurs qui sont bien informés sur les actifs des données enregistrées dans le catalogue d’enrichir le système à tout moment, ceci afin d’aider les autres à comprendre les données plus facilement, mais aussi savoir quel est son objectif et comment elle est utilisée en entreprise.

Microsoft propose ce service pour faciliter la recherche et la découverte des sources de données, mais il y aura des cas où certaines d'entre elles ne devraient pas être disponibles publiquement pour tous les employés. Il offre une version améliorée du catalogue, qui permet aux entreprises de contrôler l'accès aux catalogues de données sensibles.

Source : Microsoft

Une erreur dans cette actualité ? Signalez-nous-la !