IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Google lance l'API Cloud Vision
Pour permettre aux développeurs d'intégrer la reconnaissance d'images dans leurs applications

Le , par Michael Guilloux

503PARTAGES

7  0 
Le cloud n’est plus cette plateforme traditionnelle qu’il fut à ses débuts, en servant de lieu de stockage des données ou d’hébergement de certains services basiques. Aujourd’hui, c’est la plateforme idéale pour les éditeurs de technologies, pour publier des outils et offrir des services innovants aux entreprises et développeurs.

Chez les grands acteurs du marché, les plateformes de cloud computing ne cessent de s’enrichir en accueillant de nouveaux services et outils pour le développement d’applications, le développement web, le développement mobile, l’internet des objets, les analyses, l’intelligence artificielle, le machine learning, etc.

En ce qui concerne l’intelligence artificielle et le machine learning, Google vient de lancer une nouvelle API baptisée Cloud Vision qui vient compléter les services et outils fournis par sa plateforme Google Cloud. D’après la firme de Mountain View, l’API Cloud Vision permet aux développeurs d’exploiter le machine learning et la reconnaissance d’images dans leurs applications. « Les développeurs peuvent désormais créer des applications puissantes qui peuvent voir et le plus important, comprendre le contenu des images », a écrit Ram Ramanathan, Product Manager chez Google. « L’API Cloud Vision classifie rapidement les images dans des milliers de catégories, détecte les visages avec les émotions associées, et reconnaît les mots imprimés dans de nombreuses langues. Avec l’API Cloud Vision, vous pouvez construire des métadonnées sur votre catalogue d’images, modérer du contenu offensant, ou permettre de nouveaux scénarios marketing par le biais de l’analyse d’images de sentiment. »

D’après Ramanathan, l’API est le résultat des progrès de Google dans le domaine du machine learning. Ces progrès seraient alimentés par des plateformes telles que TensorFlow, le tout dernier système de machine learning que la société a également rendu open source. Ces plateformes ont permis de construire des modèles sophistiqués capables d’apprendre et d’identifier le contenu des images. Lesquels modèles ont été encapsulés dans l’API Cloud Vision comme une API REST facile à utiliser.

Pour en venir aux fonctionnalités de l’API de Google, il faut noter :

  • la détection Étiquette/Entité : elle permet de choisir l’entité dominante dans une image, à partir d’un large éventail de catégories d’objets. Avec l’API, vous pouvez aussi créer facilement des métadonnées sur votre catalogue d’images, permettant de nouveaux scénarios comme les recherches basées sur les images ou des recommandations ;
  • la reconnaissance optique des caractères : elle permet d’extraire du texte à partir d’une image. L’API Cloud Vision peut en plus détecter automatiquement la langue du texte, et elle prend en charge une variété de langues ;
  • « Safe Search Detection » : alimentée par Google SafeSearch, cette fonctionnalité vous permet de modérer facilement les contenus, grâce à sa capacité à détecter un élément inapproprié au sein d’une image ;
  • la détection faciale : cette fonctionnalité permet de détecter l’apparition d’un visage sur des photos, avec les traits du visage associés tels que le placement des yeux, du nez et de la bouche, et quelques attributs comme la joie et la tristesse ;
  • la détection des points de repère : la fonctionnalité permet d’identifier les structures naturelles et artificielles populaires, qui se démarquent dans leur environnement proche et qui peuvent donc servir de point de repère dans cet environnement. Pour un point de repère détecté, l’API Cloud Vision fournit également la latitude et la longitude associées ;
  • la détection de logo : la fonctionnalité permet d’identifier les logos de produits au sein d’une image.

L’API Cloud Vision est actuellement disponible en préversion limitée via la plateforme Google Cloud. Pour ceux qui sont désireux de la tester, en plus de disposer d’un compte Google Cloud Platform, ils doivent s’enregistrer sur une page dédiée.

S’enregistrer pour essayer l’API Cloud Vision

Source : Blog Google Cloud Platform

Et vous ?

Qu’en pensez-vous ?

Voir aussi

Forum Cloud Computing

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de amine.hirri
Membre habitué https://www.developpez.com
Le 07/12/2015 à 14:20
Cela dit, on peut s'en servir pour lecture des captcha... enfin, il me semble
0  0 
Avatar de IronBibs
Membre habitué https://www.developpez.com
Le 26/02/2016 à 8:05
Cette API a l'air tout de même très prometteuse.
Cela fait quelques temps que j'ai ce besoin de détection d'images "poussée" pour un projet en tête.

La grille tarifaire ne me paraît pas déconnant du tout. Toute fois, ce n'est pas assez clair. Il faut préciser que le prix pour chaque feature est calculé sur la base de 1000 unités dégressif (5$ toutes les 1000 détection OCR jusqu'à 1 Million, puis 4 entre 1M et 5M d'unités etc..).

Qu'en est-il des conditions d'utilisations sur la sécurité/réutilisation possible des images envoyées à l'API Google?
0  0 
Avatar de
https://www.developpez.com
Le 03/12/2015 à 14:12
L'hôtesse d'accueille (robot humanoïde) de l'entreprise Toshiba au japon est sur la même base cognitive?
0  1