Un GAN est un model génératif où deux réseaux sont placés en compétition dans un scénario de théorie des jeux (un domaine des mathématiques qui s'intéresse aux interactions des choix d'individus, appelés joueurs qui sont conscients de l'existence de ces interactions.). Le premier réseau est le générateur, il génère un échantillon (ex. une image), tandis que son adversaire, le discriminateur essaie de détecter si un échantillon est réel ou bien s'il est le résultat du générateur.
Dans un rapport publié 12 décembre dernier avec une vidéo à l’appui, NVIDIA expose sa façon de générer des images grâce à une architecture de générateur basée sur le style pour des réseaux contradictoires génératifs. Les GAN de NVIDIA se basent sur un concept dit de ‘’transfert de style’’. Plus tôt ce mois, Nvidia avait publié les résultats d’une étude qui montrait comment combiner des visuels générés par l'IA avec un moteur de jeu vidéo traditionnel. Le résultat est un système graphique hybride qui pourrait un jour être utilisé dans les jeux vidéo, la réalité virtuelle, voire même des films.
Les chercheurs de NVIDIA indiquent dans ce rapport que le transfert de style permet de générer des images qui peuvent copier les techniques de pinceau d’un peintre et les cartographier sur la photo d’un paysage urbain pour créer une nouvelle image avec le même style que l’artiste. NVIDIA n’utilise pas la méthode de copier-coller des éléments de différents visages dans un personnage franc. Il s’appuie plutôt sur trois styles de base : le style grossier, moyen et fin, les fusionne pour obtenir un personnage nouveau.
Dans la représentation d’un humain, les styles de haut niveau (grossiers) concernent par exemple la pose, la forme du visage ou le style de cheveux.
Les styles moyens incluent les traits du visage, comme la forme du nez, des joues ou de la bouche. Enfin, les styles fins affectent la couleur des traits du visage comme la peau et les cheveux. « Nous proposons une architecture de générateur alternatif pour réseaux accusatoires génératifs empruntée au style de transfert de la littérature. La nouvelle architecture conduit à une séparation non supervisée et automatiquement apprise des données de haut niveau (par exemple, la pose et l’identité d’un visage) et la variation stochastique des images générées (par exemple, les tâches de rousseur, les cheveux), permet une évaluation intuitive et contrôlée de la synthèse », indique le rapport. L’IA de NVIDIA a généré des images de visages humains très impressionnantes, des images d’animaux (le chat) et des images de chambres qui sont tous facilement personnalisables.
Les images comportant des visages de personnes et ceux comportant des chambres sont pour la plupart réussies mais les images de chats présentent des défauts fort remarquables. Selon le rapport, les modifications apportées par NVIDIA à ses GAN ont contribué à améliorer la qualité des images et le générateur est capable de distinguer les variations sans conséquences des variations de haut niveau afin d’obtenir de nouvelles faces synthétiques plus remarquables. Pour certains internautes, il s’agit d’une avancée incroyable. Ils espèrent une amélioration de l’outil pour en faire une utilisation grand public.
Cependant d’autre y voir un regrettable accident et estiment que cela ne va faire qu’augmenter le nombre de faux personnages dans le monde. Ils continuent en disant que si ce genre de techniques venait à être déployée, on saurait plus qui est réel ou qui ne l’est pas. Un autre voit également un problème sérieux dans cette technologie et supposant que déjà la présence des réseaux sociaux ne permet plus de savoir si les informations sur une personnes et ses images sont vraie ou pas. « Une conséquence de niche est que tout le monde peut simuler certains profiles (Facebook, Tinder, etc.) avec ces visages aléatoires et réalistes et la recherche d’images inversées ne vous apportera rien, ce qui vous fera croire que le profil est réel », a-t-il déclaré.
Source : Résultat de la recherche
Et vous ?
Qu'en pensez-vous ?
Cette technologie est-elle, selon vous, une menace ou une aubaine ? Pourquoi ?
Voir aussi
Conférence NeurIPS AI : une IA de Nvidia se sert d'images réelles qu'elle convertit en paysage numérique qui a pu être utilisé pour un jeu
Nvidia publie un CA trimestriel inférieur aux attentes des analystes, l'entreprise est touchée par la baisse de la demande pour les cryptomonnaies
NVIDIA dévoile RAPIDS, sa suite logicielle pour l'apprentissage automatique (pas forcément profond) sur carte graphique
Sortie de CUDA 10, l'API de calcul sur processeur graphique de NVIDIA, avec la possibilité de définir ses calculs comme un graphe de dépendances
Microsoft Azure prend en charge NVIDIA GPU Cloud pour les projets de Deep Learning et HPC, une solution qui permet d'exploiter la puissance des GPU