Google lance l'API Cloud Vision
Pour permettre aux développeurs d'intégrer la reconnaissance d'images dans leurs applications

Le , par Michael Guilloux, Chroniqueur Actualités
Le cloud n’est plus cette plateforme traditionnelle qu’il fut à ses débuts, en servant de lieu de stockage des données ou d’hébergement de certains services basiques. Aujourd’hui, c’est la plateforme idéale pour les éditeurs de technologies, pour publier des outils et offrir des services innovants aux entreprises et développeurs.

Chez les grands acteurs du marché, les plateformes de cloud computing ne cessent de s’enrichir en accueillant de nouveaux services et outils pour le développement d’applications, le développement web, le développement mobile, l’internet des objets, les analyses, l’intelligence artificielle, le machine learning, etc.

En ce qui concerne l’intelligence artificielle et le machine learning, Google vient de lancer une nouvelle API baptisée Cloud Vision qui vient compléter les services et outils fournis par sa plateforme Google Cloud. D’après la firme de Mountain View, l’API Cloud Vision permet aux développeurs d’exploiter le machine learning et la reconnaissance d’images dans leurs applications. « Les développeurs peuvent désormais créer des applications puissantes qui peuvent voir et le plus important, comprendre le contenu des images », a écrit Ram Ramanathan, Product Manager chez Google. « L’API Cloud Vision classifie rapidement les images dans des milliers de catégories, détecte les visages avec les émotions associées, et reconnaît les mots imprimés dans de nombreuses langues. Avec l’API Cloud Vision, vous pouvez construire des métadonnées sur votre catalogue d’images, modérer du contenu offensant, ou permettre de nouveaux scénarios marketing par le biais de l’analyse d’images de sentiment. »

D’après Ramanathan, l’API est le résultat des progrès de Google dans le domaine du machine learning. Ces progrès seraient alimentés par des plateformes telles que TensorFlow, le tout dernier système de machine learning que la société a également rendu open source. Ces plateformes ont permis de construire des modèles sophistiqués capables d’apprendre et d’identifier le contenu des images. Lesquels modèles ont été encapsulés dans l’API Cloud Vision comme une API REST facile à utiliser.

Pour en venir aux fonctionnalités de l’API de Google, il faut noter :

  • la détection Étiquette/Entité : elle permet de choisir l’entité dominante dans une image, à partir d’un large éventail de catégories d’objets. Avec l’API, vous pouvez aussi créer facilement des métadonnées sur votre catalogue d’images, permettant de nouveaux scénarios comme les recherches basées sur les images ou des recommandations ;
  • la reconnaissance optique des caractères : elle permet d’extraire du texte à partir d’une image. L’API Cloud Vision peut en plus détecter automatiquement la langue du texte, et elle prend en charge une variété de langues ;
  • « Safe Search Detection » : alimentée par Google SafeSearch, cette fonctionnalité vous permet de modérer facilement les contenus, grâce à sa capacité à détecter un élément inapproprié au sein d’une image ;
  • la détection faciale : cette fonctionnalité permet de détecter l’apparition d’un visage sur des photos, avec les traits du visage associés tels que le placement des yeux, du nez et de la bouche, et quelques attributs comme la joie et la tristesse ;
  • la détection des points de repère : la fonctionnalité permet d’identifier les structures naturelles et artificielles populaires, qui se démarquent dans leur environnement proche et qui peuvent donc servir de point de repère dans cet environnement. Pour un point de repère détecté, l’API Cloud Vision fournit également la latitude et la longitude associées ;
  • la détection de logo : la fonctionnalité permet d’identifier les logos de produits au sein d’une image.

L’API Cloud Vision est actuellement disponible en préversion limitée via la plateforme Google Cloud. Pour ceux qui sont désireux de la tester, en plus de disposer d’un compte Google Cloud Platform, ils doivent s’enregistrer sur une page dédiée.

S’enregistrer pour essayer l’API Cloud Vision

Source : Blog Google Cloud Platform

Et vous ?

Qu’en pensez-vous ?

Voir aussi

Forum Cloud Computing


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de MikeRowSoft MikeRowSoft - Provisoirement toléré https://www.developpez.com
le 03/12/2015 à 14:12
L'hôtesse d'accueille (robot humanoïde) de l'entreprise Toshiba au japon est sur la même base cognitive?
Avatar de amine.hirri amine.hirri - Membre habitué https://www.developpez.com
le 07/12/2015 à 14:20
Cela dit, on peut s'en servir pour lecture des captcha... enfin, il me semble
Avatar de Michael Guilloux Michael Guilloux - Chroniqueur Actualités https://www.developpez.com
le 23/02/2016 à 9:16
L’API Cloud Vision de Google entre en phase bêta
Elle permet aux développeurs d'intégrer la reconnaissance d'images dans leurs applications

Après une phase de préversion limitée lancée au début du mois de décembre dernier, l’API Cloud Vision de Google passe maintenant en version bêta et est désormais ouvert à un public plus large. « Maintenant, tout le monde peut soumettre des images à l'API Cloud Vision pour comprendre le contenu de ces images - de la détection d'objets de tous les jours à la lecture de texte à l’intérieur de l'image ou l'identification de logos de produits », explique Google dans un billet de blog.

Il faut en effet rappeler que l’API Cloud Vision permet aux développeurs d’intégrer la reconnaissance d’images dans leurs applications. Cette API permettra par exemple à ces derniers de détecter des entités ou étiquettes dominantes dans des images, extraire du texte dans une image et en détecter la langue, détecter des images inappropriées dans le cadre de la modération de contenus imagés. Entre autres fonctionnalités, l’API Cloud Vision de Google permet encore de détecter l’apparition d’un visage sur des photos, avec les traits du visage associés tels que le placement des yeux, du nez et de la bouche, mais aussi avec les attributs comme la joie et la tristesse.

Le lancement de la préversion limitée a suscité de l’engouement chez de nombreuses entreprises qui ont été impressionnées par la précision des résultats d’analyse d’images livrés par l’API. Google ouvre donc son outil à tout le monde avec des fonctionnalités supplémentaires notamment la possibilité de détecter la couleur dominante dans une image.

Ce passage en version bêta s’accompagne également d’un modèle de tarification qui entrera en vigueur à partir du 1er mars. Mais il existera toujours un plan gratuit pour les utilisateurs les moins gourmands. Pour chaque fonctionnalité de l’API qui sera appliquée (détection étiquette/entité, reconnaissance optique des caractères, détection faciale, détection des points de repère, détection de logo, détection de contenu inapproprié, propriétés d'images), les mille premières unités seront gratuites. Une unité correspond à une utilisation d’une fonctionnalité précise de l’API sur une image donnée. Il faut noter que sur une image, pourront être appliquées plusieurs fonctionnalités. Dans ce cas, chaque fonctionnalité sera facturée individuellement. Le tableau suivant donne les tarifs fixés pour chaque fonctionnalité en fonction du nombre d’unités par mois.


Il faut également préciser que durant la période bêta, chaque utilisateur aura un quota de 20 millions d’images par mois. Google met encore à la disposition des utilisateurs de la documentation, des échantillons et des tutoriels montrant l’utilisation de son API en Python et en Java, ainsi que des échantillons d’applications mobiles pour Android et iOS.

Essayer gratuitement Cloud Vision API Beta
Documentation sur l’API Cloud Vision

Source : Blog Google Cloud Platform

Et vous ?

Comptez-vous tester cette API ? Qu’en pensez-vous ?

Voir aussi :

Google lance l'API Cloud Vision pour permettre aux développeurs d'intégrer la reconnaissance d'images dans leurs applications
TensorFlow Serving : un outil open source de Google pour faciliter la mise en production des modèles de machine learning
Avatar de IronBibs IronBibs - Membre habitué https://www.developpez.com
le 26/02/2016 à 8:05
Cette API a l'air tout de même très prometteuse.
Cela fait quelques temps que j'ai ce besoin de détection d'images "poussée" pour un projet en tête.

La grille tarifaire ne me paraît pas déconnant du tout. Toute fois, ce n'est pas assez clair. Il faut préciser que le prix pour chaque feature est calculé sur la base de 1000 unités dégressif (5$ toutes les 1000 détection OCR jusqu'à 1 Million, puis 4 entre 1M et 5M d'unités etc..).

Qu'en est-il des conditions d'utilisations sur la sécurité/réutilisation possible des images envoyées à l'API Google?
Contacter le responsable de la rubrique Accueil