Ces artistes ont découvert que leur travail était utilisé pour entraîner l'IA

Et maintenant ils sont furieux

Le 23 octobre 2022 à 13:02, par Nancy Rey

6.3KPARTAGES

Autrefois réservés à un groupe restreint d'initiés de la technologie, les systèmes d'IA texte-image sont de plus en plus populaires et puissants. Ces outils, qui offrent généralement quelques crédits gratuits avant d'être facturés, peuvent créer toutes sortes d'images avec seulement quelques mots, y compris celles qui évoquent clairement les œuvres de très nombreux artistes (si elles ne semblent pas avoir été créées par le même artiste). Les utilisateurs peuvent désigner ces artistes par des mots tels que "dans le style de" ou "par", accompagnés d'un nom spécifique. Et les utilisations actuelles de ces outils peuvent aller de l'amusement personnel à des cas plus commerciaux. Mais la découverte par des artistes que leur travail est utilisé pour entraîner l'IA soulève une préoccupation fondamentale : leur propre art est effectivement utilisé pour entraîner un programme informatique qui pourrait un jour s'attaquer à leur gagne-pain.

En quelques mois seulement, des millions de personnes se sont ruées sur les systèmes d'IA de conversion de texte en image et ils sont déjà utilisés pour créer des films expérimentaux, des couvertures de magazine et des images pour illustrer des articles de presse. Une image générée par un système d'IA appelé Midjourney a récemment remporté un concours d'art à la foire d'État du Colorado et a provoqué un tumulte parmi les artistes.

Mais la découverte par des artistes que leur travail est utilisé pour entraîner l'IA soulève une préoccupation encore plus fondamentale : leur propre art est effectivement utilisé pour entraîner un programme informatique qui pourrait un jour s'attaquer à leur gagne-pain. Quiconque génère des images avec des systèmes tels que Stable Diffusion ou DALL-E peut ensuite les vendre, les conditions spécifiques concernant le droit d'auteur et la propriété de ces images varient. « Je ne veux pas du tout participer à la machine qui va dévaloriser ce que je fais », a déclaré Daniel Danger, un illustrateur et graveur qui a appris qu'un certain nombre de ses œuvres avaient été utilisées pour entraîner Stable Diffusion.

Quand les beaux-arts deviennent des données

Les machines sont loin d'être magiques. Pour qu'un de ces systèmes puisse ingérer vos mots et produire une image, il doit être entraîné sur des montagnes de données, qui peuvent comprendre des milliards d'images extraites d'Internet, associées à des descriptions écrites.

Certains services, dont le système DALL-E d'OpenAI, ne divulguent pas les ensembles de données sur lesquels reposent leurs systèmes d'IA. Mais avec Stability Diffusion, Stability AI est clair sur ses origines. Son jeu de données de base a été entraîné sur des paires d'images et de textes sélectionnés pour leur aspect à partir d'un cache encore plus massif d'images et de textes provenant d'Internet. L'ensemble de données complet, connu sous le nom de LAION-5B, a été créé par l'association allemande d'intelligence artificielle LAION : "large-scale artificial intelligence open network" (réseau ouvert d'intelligence artificielle à grande échelle).

Cette pratique consistant à récupérer des images ou d'autres contenus sur Internet pour former des ensembles de données n'est pas nouvelle et relève traditionnellement de ce que l'on appelle le "fair use", principe juridique de la loi américaine sur le droit d'auteur qui autorise l'utilisation d'œuvres protégées par le droit d'auteur dans certaines situations. En effet, ces images, dont beaucoup peuvent être protégées par des droits d'auteur, sont utilisées d'une manière très différente, par exemple pour apprendre à un ordinateur à identifier des chats.

Mais les ensembles de données sont de plus en plus grands et forment des systèmes d'IA de plus en plus puissants, y compris, récemment, ces systèmes génératifs que n'importe qui peut utiliser pour créer des images remarquables en un instant.

Quelques outils permettent de faire des recherches dans l'ensemble de données LAION-5B, et un nombre croissant d'artistes professionnels découvrent que leur travail en fait partie. L'un de ces outils de recherche, conçu par l'écrivain et technologue Andy Baio et le programmeur Simon Willison, se distingue. Bien qu'il ne puisse être utilisé que pour rechercher une petite fraction des données d'apprentissage de Stable Diffusion (plus de 12 millions d'images), ses créateurs ont analysé les images d'art qu'il contient et ont déterminé que, sur les 25 premiers artistes dont le travail était représenté, Erin Hanson est l'un des trois seuls à être encore en vie. Ils ont trouvé 3 854 images de son art dans ce petit échantillon.

Erin Hanson est l'une des nombreuses artistes professionnelles dont le travail a été inclus dans l'ensemble de données utilisé pour former Stable Diffusion, qui a été lancé en août par la société londonienne Stability AI. Elle fait partie des nombreux artistes qui ont été mécontents d'apprendre que des photos de leurs œuvres ont été utilisées sans qu'ils en soient informés, sans qu'on leur demande leur consentement ou sans qu'ils paient pour leur utilisation.

Le fondateur et PDG de Stability AI, Emad Mostaque, a déclaré que l'art ne représente qu'une infime partie des données d'entraînement LAION sur lesquelles repose Stable Diffusion. « L'art représente bien moins de 0,1 % de l'ensemble de données et n'est créé que lorsque l'utilisateur le demande délibérément », a-t-il déclaré. Mais c'est un maigre réconfort pour certains artistes.

Des artistes en colère

Danger, dont les œuvres d'art comprennent des affiches pour des groupes comme Phish et Primus, est l'un des nombreux artistes professionnels qui ont déclaré qu'ils craignaient que les générateurs d'images IA ne menacent leur gagne-pain. Il craint que les images que les gens produisent avec les générateurs d'images IA ne remplacent certains de ses travaux plus "utilitaires", qui comprennent des supports comme des couvertures de livres et des illustrations pour des articles publiés en ligne. « Pourquoi allons-nous payer un artiste 1 000 dollars alors que nous pouvons avoir 1 000 images à choisir gratuitement ? », a-t-il demandé.

Tara McPherson, une artiste basée à Pittsburgh dont les œuvres figurent sur des jouets, des vêtements et dans des films comme le film oscarisé "Juno", s'inquiète également de la possibilité de perdre certains travaux au profit de l'IA. Elle se sent déçue et "exploitée" du fait que son travail a été inclus dans l'ensemble de données à l'origine de Stable Diffusion sans qu'elle en soit informée, a-t-elle déclaré. « À quel point cela va-t-il être facile ? À quel point cet art va-t-il devenir élégant ?Pour l'instant, c'est parfois un peu bancal, mais ça ne fait que commencer », s’est-elle interrogée.

Si les inquiétudes sont réelles, les recours ne sont pas clairs. Même si les images générées par l'IA ont un impact généralisé (par exemple en changeant les modèles commerciaux) cela ne signifie pas nécessairement qu'elles violent les droits d'auteur des artistes, selon Zahr Said, professeur de droit à l'Université de Washington. Et il serait prohibitif d'accorder une licence à chaque image d'un ensemble de données avant de l'utiliser, a-t-elle ajouté. « On peut avoir de la sympathie pour les communautés artistiques et vouloir les soutenir, mais aussi se dire qu'il n'y a pas moyen de le faire. Si nous faisions cela, cela reviendrait à dire que l'apprentissage automatique est impossible, a-t-elle conclu.

McPherson et Danger ont envisagé la possibilité d'apposer des filigranes sur leurs œuvres lors de leur mise en ligne afin de protéger les images (ou du moins de les rendre moins attrayantes). Mais McPherson a déclaré que lorsqu'elle a vu des amis artistes mettre des filigranes sur leurs images en ligne, cela « ruine l'art, et la joie des gens qui le regardent et y trouvent de l'inspiration ».

S'il le pouvait, Danger a déclaré qu'il retirerait ses images des ensembles de données utilisés pour former les systèmes d'IA. Mais le fait de retirer les images de l'œuvre d'un artiste d'un ensemble de données n'empêcherait pas Stable Diffusion de générer des images dans le style de cet artiste.

Pour commencer, le modèle d'IA a déjà été formé. Mais aussi, comme l'a dit Mostaque, des styles artistiques spécifiques pourraient toujours être sollicités par les utilisateurs grâce au modèle CLIP d'OpenAI, qui a été utilisé pour entraîner la diffusion stable à comprendre les connexions entre les mots et les images.

Christoph Schuhmann, l'un des fondateurs de LAION, a déclaré par courrier électronique que son groupe pense que la possibilité de choisir d'entrer ou de sortir des ensembles de données ne fonctionnera que si toutes les parties des modèles d'IA (qui peuvent être nombreuses) respectent ces choix. « Une approche unilatérale du traitement du consentement ne suffira pas dans le monde de l'IA ; nous avons besoin d'un système interprofessionnel pour gérer cela », a-t-il déclaré.

Offrir aux artistes un meilleur contrôle

Les partenaires Mathew Dryhurst et Holly Herndon, des artistes basés à Berlin qui expérimentent l'IA dans leur travail collaboratif, s'efforcent de relever ces défis. Avec deux autres collaborateurs, ils ont lancé Spawning, un outil destiné aux artistes qui, espèrent-ils, leur permettra de mieux comprendre et contrôler la manière dont leur art en ligne est utilisé dans les ensembles de données.

En septembre, Spawning a lancé un moteur de recherche capable de passer au peigne fin l'ensemble de données LAION-5B, haveibeentrained.com, et dans les semaines à venir, il a l'intention d'offrir un moyen pour les gens de se retirer ou d'entrer dans les ensembles de données utilisés pour la formation. Au cours du dernier mois, Dryhurst a rencontré des organisations qui forment de grands modèles d'IA. Il veut leur faire accepter que si Spawning rassemble des listes d'œuvres d'artistes qui ne veulent pas être inclus, ils respecteront ces demandes.

Selon Dryhurst, l'objectif de Spawning est de faire comprendre que la collecte consensuelle de données profite à tous. Et Mostaque est d'accord pour dire que les gens devraient pouvoir se retirer. Il a déclaré que Stability AI travaille avec de nombreux groupes sur les moyens de « permettre un meilleur contrôle du contenu des bases de données par la communauté » à l'avenir.

Dans un fil de discussion sur Twitter en septembre, il a déclaré que Stability est ouvert à la contribution aux moyens permettant aux gens de se retirer des ensembles de données, « par exemple en soutenant le travail de Herndon sur ce point avec de nombreux autres projets à venir ». « Je comprends personnellement les émotions que cela suscite, car les systèmes deviennent suffisamment intelligents pour comprendre les styles », a-t-il déclaré.

Schuhmann a déclaré que LAION travaillait également avec "divers groupes" pour déterminer comment permettre aux gens d'accepter ou de refuser d'inclure leurs images dans l'entraînement des modèles d'IA texte-image. "Nous prenons les sentiments et les préoccupations des artistes très au sérieux", a déclaré Schuhmann.

Hanson, pour sa part, ne voit aucun inconvénient à ce que ses œuvres soient utilisées pour l'apprentissage de l'IA, mais elle veut être payée. Si des images sont vendues qui ont été réalisées avec les systèmes d'IA entraînés sur leur travail, les artistes doivent être indemnisés, dit-elle même si ce sont « des fractions de centimes ».

Cela pourrait être à l'horizon. Selon Mostaque, Stability AI étudie la manière dont « les créatifs peuvent être récompensés pour leur travail », notamment parce que Stability AI publie elle-même des modèles d'IA, plutôt que d'utiliser ceux construits par d'autres. L'entreprise annoncera bientôt un plan visant à recueillir les commentaires de la communauté sur les "moyens pratiques" d'y parvenir, a-t-il ajouté.

Sources : Spawning, Twitter

Et vous ?

Quel est votre avis sur le sujet ?

Voir aussi :

Les artistes commencent à vendre des œuvres d'art générées par IA sur des sites Web de photos, en utilisant un logiciel qui crée de l'art à la demande, certains artistes tentent d'en tirer profit

Une œuvre d'art générée par l'IA a remporté la première place à un concours de beaux-arts à une foire d'État et les artistes sont furieux

Dall-E 2 permet de générer des images à partir de quelques mots, mais le produit est-il votre ? Votre illustration numérique générée par l'IA pourrait ne pas être protégée par le droit d'auteur

Une intelligence artificielle a recomposé des photos "réalistes" de personnages historiques comme Napoléon Bonaparte et Jules César, à l'aide de réseaux adverses génératifs

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Ces artistes ont découvert que leur travail était utilisé pour entraîner l'IA

Et maintenant ils sont furieux

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

Ces artistes ont découvert que leur travail était utilisé pour entraîner l'IA Et maintenant ils sont furieux

Ces artistes ont découvert que leur travail était utilisé pour entraîner l'IA

Et maintenant ils sont furieux