Developpez.com

Le Club des Développeurs et IT Pro

Une intelligence artificielle de NVIDIA transforme des croquis en paysages photoréalistes en quelques secondes

Lors de la GPU Technology Conference

Le 2019-03-19 16:22:01, par Patrick Ruiz, Chroniqueur Actualités
On poursuit avec les nouvelles de la GPU Technology Conference après celle de l’ordinateur à 99 $ de Nvidia dédié à l’implémentation d’applications en intelligence artificielle pour développeurs, chercheurs et hobbyistes. Il y a peu lors de la GTC 2019, Nvidia, le fournisseur mondial de processeurs et puces graphiques, a dévoilé un créateur d’images animé par une intelligence artificielle.

Le logiciel baptisé GauGAN par ses concepteurs offre un aperçu des possibilités offertes par les plateformes de réseaux de neurones de Nvidia. Il est conçu pour prendre un croquis et le transformer en image photoréaliste en quelques secondes. GauGAN offre trois outils : un seau à peinture, un stylo et un crayon. Au bas de l'écran se trouve une série d'objets. Sélectionnez l'objet nuage et tracez une ligne avec le crayon et le logiciel produit un soupçon de nuages photoréalistes. Dessinez un cercle et remplissez-le avec le seau de peinture et le logiciel fera gonfler les nuages. Ce qu’on note d’intéressant est que le logiciel produit des résultats uniques en fonction de l’entrée. Un visuel dans le contenu vidéo proposé dans la suite ...


La démo de GauGAN lors de l’édition en cours de la GPU Technology Conference fait suite au lancement, à mi-parcours du mois précédent, d’un site qui montre des portraits de visages humains générés par une intelligence artificielle. Il faut même souligner qu’au sortir de l’année précédente, l’entreprise avait déjà présenté une intelligence artificielle capable de générer des visages humains d’une réalité troublante. Le dénominateur commun de ces initiatives avec le logiciel GauGAN est le concept de GAN.

Un GAN est un modèle génératif où deux réseaux sont placés en compétition dans un scénario de théorie des jeux. Le premier réseau est le générateur, il génère un échantillon (ex. une image), tandis que son adversaire, le discriminateur essaie de détecter si un échantillon est réel ou bien s'il est le résultat du générateur. L'apprentissage peut être modélisé comme un jeu à somme nulle. Ces programmes informatiques se font concurrence des millions de fois afin d’affiner leurs compétences en matière de génération d’images jusqu’à ce qu’ils aient la capacité de créer des images complètes. Pour faire simple, on peut dire que le GAN implique que deux réseaux travaillent l’un contre l’autre. Le premier est nourri en données brutes qu’il décompose. À partir de ces dernières, il tente de créer une image. Il la soumet ensuite à un autre réseau qui, lui, n’a que des photos ou images réelles dans sa base de données. Ce deuxième réseau va alors émettre un jugement de l’image et en informer le premier. Si l’image ne ressemble pas au résultat attendu, le premier algorithme reprend le processus. S’il y a correspondance, il est informé de ce qu’il est sur la bonne voie et finit par comprendre ce qu’est une bonne image. Une fois qu’il est suffisamment entraîné, il peut produire des images à la chaîne. D’après les données publiées par Nvidia, le discriminateur qui tourne en toile de fond du logiciel GauGAN dispose d’une base de données d’un million d’images de la nature.

Envoyé par Nvidia
GauGAN pourrait offrir un outil puissant pour créer des mondes virtuels à tous ; des architectes et urbanistes aux concepteurs paysagistes et aux développeurs de jeux. Avec une intelligence artificielle qui comprend à quoi ressemble le monde réel, ces professionnels pourraient mieux créer des prototypes de leurs idées et apporter des changements rapides à une scène synthétique.
Au travers de la démo du logiciel GauGAN, Nvidia met en avant les bons côtés de l’utilisation des technologies qui s’appuient sur les GAN, mais il faut dire que cet ensemble de techniques peut aussi être utilisé à des fins sinistres. Les deepfakes – des images générées par ordinateur et superposées à d’autres ou à des vidéos existantes – rentrent dans ce lot et les tiers malveillants s’appuient sur ces dernières pour diffuser de faux récits d’actualités et autres canulars. Donc, attention au moment de tirer une conclusion sur une image ou sur une vidéo trouvée quelque part sur la toile.

Nvidia maintient la plateforme en ligne AI Playground. Elle liste les projets sur lesquels l’entreprise est lancée en matière d’intelligence artificielle et les internautes ont la possibilité de lancer des démos. L’application GauGAN devrait être disponible sur cette dernière sous peu.

Sources : Nvidia

Et vous ?

Que pensez-vous de cette intelligence artificielle ?

Les artistes (peintres, …) devraient-ils s’inquiéter de la disponibilité d’applications de ce type ?

Voir aussi :

Une IA aurait permis de commencer à percer les mystères entourant le manuscrit de Voynich considéré comme le plus important cryptogramme non résolu

Des experts prédisent que l'IA va dominer les humains dans moins de 50 ans selon une étude menée par les deux universités Harvard et Yale

Intelligence artificielle : Facebook publie en open source ELF OpenGo, son IA qui a battu d'autres IA au jeu de Go, ainsi que des professionnels

Des experts en IA boycottent un projet de robots tueurs d'une université en Corée du Sud en partenariat avec le fabricant d'armes Hanwha Systems

IA : pourquoi la France aurait-elle du mal à concurrencer les GAFA ? Un entretien avec Noël Paganelli, cofondateur de l'école de code La Capsule
  Discussion forum
9 commentaires
  • micka132
    Expert confirmé
    Franchement pas mal !
    Puisque les artistes d'aujourd'hui ne veulent plus produire des choses agréables visuellement, on pourra toujours transformer tout "l'art" contemporain en quelque chose de joli !
  • hotcryx
    Membre extrêmement actif
    Au niveau du concept, c'est balaise et pourrait être utile pour les adultes peu doués en dessin ou ayant des problèmes psycho-moteur mais le gros point négatif est qu'il ne demande aucun effort!

    Beaucoup de choses arrivent sur le marché pour nous faciliter la vie (comme les outils de traduction instantanées), mais ne demandent en contre partie aucun effort de réflection.

    Je trouve cela dangereux à long terme.

    On ne doit plus réflechir, on ne doit plus prendre de décision...
  • clorr
    Membre averti
    Bob Ross tremble déjà !
  • bouye
    Rédacteur/Modérateur
    En plus des exemples listes dans la vidéo, il est clair que ca serait aussi utile pour faire des matte painting ou image de fond pour des films et séries ou encore la pub (qu'elle soit vidéo ou fixe) mais bien sur l'autre revers non-mentionné est tout le cote fake, arnaques, escroqueries et autre canulars que pointe a juste titre l'article.
  • younesky
    Membre régulier
    artists killer
  • Matthieu Vergne
    Expert éminent
    Envoyé par Patrick Ruiz
    Ce lien m'amène à la page d'accueil de DVP. J'avais vu passer cet article dans le fil RSS de DVP aussi mais même problème. Du coup je n'ai toujours pas pu le lire. Quelqu'un pourrait me dire si je suis le seul à avoir ce problème ou si le lien est effectivement corrompu ?
  • bouye
    Rédacteur/Modérateur
    Le lien fonctionne pour moi et je peux lire l'article sur l'ordi à $99.

    L'ordinateur en question est le Jetson Nano. La carte de 70 mm par 45 mm a fait l’objet d’une présentation il y a peu lors de GPU Technology Conference – un événement annuel que Nvidia, le fournisseur mondial de processeurs et puces graphiques, organise. [...]
  • Matthieu Vergne
    Expert éminent
    Ça marche pour moi aussi maintenant. Ça a du être corrigé. Merci.
  • Manucyan
    Candidat au Club
    Franchement toutes mes félicitations aux développeurs
    J'ai essayé, c'est le genre de chose qu'on j'aurais bien voulu avoir ado pour faire des paysages dans des petits projets de jeux vidéo