L'IA apprend-elle des artistes, ou les copie-t-elle ?

Le premier groupe d'articles a pris en charge les objections les plus dures à l'IA dans l'art. Celui-ci ouvre le second groupe — Réflexion — en revisitant la question des données d'entraînement sans la chaleur. Que fait réellement un modèle quand il apprend ? Est-ce la même chose qu'une jeune étudiante en art devant le Velázquez du Prado ? Si oui, pourquoi la version du modèle se sent-elle différente ? Et si non, quelle est exactement la différence ?

par Rédaction Airtistic.ai

Le premier groupe d’articles de cette série a abordé les objections les plus dures à l’IA dans l’art : si elle est créative du tout, si elle prend du travail aux artistes, si c’est du plagiat, et si nous devrions nous en offenser. Les réponses étaient nuancées, prudentes et inconfortables par endroits — mais chacune avait une réponse.

Ce second groupe, Réflexion, porte moins sur les réponses et davantage sur les cadrages qui rendent la conversation improductive. La question d’ouverture est celle qui a fait le plus de dégâts par la manière dont elle est posée.

Quand un modèle d’IA générative s’entraîne sur un corpus d’images, apprend-il de ces images, ou les copie-t-il ?

La question paraît claire. Elle ne l’est pas. Elle est, en fait, une erreur de catégorie — et tout l’écosystème des procès en droit d’auteur, le mouvement de protestation des artistes et la défense de l’IA d’entreprise ont construit leurs positions autour d’un cadrage qui ne découpe pas la nature à ses articulations. Cet article essaie de faire le travail que le cadrage empêchait.

Ce qu’est l’entraînement, techniquement

Un modèle de diffusion — Stable Diffusion, les systèmes sous-jacents de Midjourney, Flux, et la plupart de la génération actuelle de générateurs d’images — est entraîné en lui montrant un nombre énorme de paires image-texte et en lui demandant de les reproduire après qu’elles ont été progressivement bruitées. Au cours de milliards d’étapes d’entraînement, le modèle ajuste ses paramètres de sorte que, étant donné une version bruitée d’une image plus une légende, il puisse récupérer quelque chose de proche de l’original. Une fois l’entraînement arrêté, le modèle a intériorisé les régularités statistiques de ce qui rend une image plausible. Il est ensuite exécuté à l’envers au moment de la génération : à partir de pur bruit plus un prompt textuel, il débruite itérativement vers une image plausible.

Ce processus est techniquement bien défini. Il n’est pas métaphorique. Le modèle calcule, à chaque étape, une distribution de probabilité sur les images conditionnée par le prompt, et y échantillonne.

La question est de savoir si cela compte comme apprendre en un sens au-delà du technique — et si, quand la génération produit une sortie qui ressemble à l’une des images d’entraînement, cela compte comme copier.

Les deux moitiés de la question se révèlent plus intéressantes que ce que la conversation publique a autorisé.

Ce que fait l’apprentie

Sortez du cadre technique un instant. Imaginez une jeune peintre — appelons-la Inés — au Museo del Prado à Madrid, en deuxième année d’école d’art. Son enseignante lui a dit de passer un mois avec Velázquez. Elle arrive chaque matin à l’ouverture, sort son carnet de croquis, et s’assoit devant Les Ménines, La Reddition de Breda et Les Fileuses. Elle étudie le coup de pinceau. Elle essaie de reproduire, sur papier, la façon dont Velázquez traite le bord d’une manche, le moment où un visage devient ombre.

Après trois semaines de cela, Inés fait quelque chose qui est — soyons honnêtes — de la copie. Elle produit des marques qui sont, parfois, indissociables d’intention des marques que Velázquez a faites il y a quatre siècles. Son enseignante trouve cela bien. Le musée aussi. La tradition picturale européenne plus large aussi, qui a traité la copie supervisée du canon comme le mécanisme central de formation des peintres sérieux depuis au moins cinq cents ans. Goya a copié Velázquez ; Manet a copié Goya ; Picasso a copié Velázquez et Manet à la fois, en séries. Aucun n’a été appelé plagiaire pour cela, parce que la tradition comprenait ce qu’ils faisaient.

Ce que fait Inés, quand elle copie Velázquez, c’est apprendre. La copie est l’apprentissage, de la seule manière qui ait jamais fonctionné de façon constante pour la transmission du métier pictural. Vous ne pouvez pas apprendre à manier la peinture en vous le faisant raconter ; vous ne pouvez apprendre qu’en vous asseyant devant quelqu’un qui la maniait bien et en essayant de faire ce qu’il faisait. Vous échouerez au début. Vous développerez finalement un sens intérieur privé de la façon dont la peinture peut bouger. Vous peindrez, des années plus tard, des choses qui doivent leur mouvement sous-jacent à Velázquez sans que personne ne reconnaisse l’héritage, vous y compris.

C’est ce que produit l’apprentissage-par-copie. Ce n’est pas optionnel. Ce n’est pas une étape qu’on traverse et qu’on abandonne. C’est la couche la plus profonde de toute pratique de métier, et c’est la couche qui produit ce que toute tradition artistique a appelé originalité — non pas en évitant l’héritage mais en l’absorbant si complètement que ce qui sort de l’autre côté est sans équivoque le vôtre.

Alors quand le débat sur l’IA traite la copie comme la mauvaise chose et l’apprentissage comme la bonne, il a établi une opposition qui n’existe pas dans le cas humain contre lequel la question est posée.

Ce que fait le modèle qui se chevauche

Un modèle de diffusion, entraîné sur un vaste corpus d’images incluant quelques milliers de reproductions numériques de Velázquez, fait — au niveau des mathématiques pures — quelque chose de plus similaire à ce que fait Inés que ne veut bien l’admettre le cadrage apprend-vs-copie. Le modèle est exposé à des œuvres canoniques, on lui demande de les reproduire dans des conditions progressivement plus bruitées, et il ajuste ses paramètres internes pour que la prochaine fois qu’il voit quelque chose en forme de Velázquez, il sache quoi faire.

Après des milliards d’étapes, le modèle a intériorisé les régularités statistiques de la peinture à la manière de Velázquez — et de tous les autres styles et sujets de son corpus. On peut lui demander de générer une sortie qui s’inspire des régularités de Velázquez sans produire une copie littérale d’aucune peinture spécifique de Velázquez. C’est, mécaniquement, ce que nous appelons apprendre.

C’est aussi ce que nous appelons copier. Les deux ne sont pas séparables ici non plus.

L’article de Carlini et al. de 2023 sur l’extraction des données d’entraînement à partir des modèles de diffusion a montré, c’est important, que dans des conditions spécifiques — prompts particuliers, images d’entraînement particulières à haute fréquence — les modèles de diffusion peuvent être amenés à reproduire des images d’entraînement spécifiques presque mot pour mot. Le phénomène est rare mais réel. C’est la preuve technique la plus forte que la ligne entre apprendre et copier n’est pas nette dans le cas du modèle pas plus que dans le cas d’Inés.

Où l’analogie se brise

Si l’analogie tenait jusqu’au bout, nous pourrions simplement dire le modèle est une apprentie et le reste suivrait. Elle ne tient pas jusqu’au bout, et l’endroit où elle se brise est l’endroit qui compte.

Ce qu’Inés acquiert, et que le modèle n’acquiert pas, n’est pas la mémoire des peintures. Le modèle en a plus qu’Inés n’en aura jamais. Ce qu’Inés acquiert est un corps et une vie envers lesquels son travail ultérieur est responsable. Elle peint dans une ville. Elle a des parents. Elle perd sa grand-mère en troisième année d’école d’art. Elle décide de s’installer à Berlin. Elle tombe amoureuse d’un graveur allemand qui lui apprend à ralentir. Son travail après le déménagement n’est pas seulement « influencé par Velázquez ». Il est aussi influencé par Berlin, et par la grand-mère, et par le graveur allemand. Le modèle n’a pas ces contraintes. Il n’y a pas de ville, pas de parent, pas de grand-mère. Le modèle n’a que le corpus.

C’est ce qui rend la sortie du modèle infiniment fluide et structurellement sans amarres. C’est ce qui produit l’alarme de violation de catégorie sur laquelle nous avons écrit dans l’article précédent. C’est aussi ce que le cadrage apprend-vs-copie continue de masquer. Le modèle n’est pas moins habile qu’Inés au sens technique-de-l’apprentissage ; il fait de l’apprentissage hors de la biographie. C’est quelque chose de véritablement nouveau, et cela mérite un nom nouveau. Apprentissage sans amarres est peut-être le bon. Apprentissage désincarné si vous préférez. Apprentissage sans une vie est ce qu’il est.

Pourquoi ce recadrage importe

Une fois que nous cessons de discuter si le modèle apprend ou copie, trois choses deviennent traitables qui étaient bloquées.

Premièrement, la question juridique. Les affaires Andersen et Getty plaident la question de savoir si l’entraînement relève de l’usage loyal. Le recadrage que propose cet article ne résout pas cette question, mais il la clarifie : l’entraînement est mécaniquement plus proche de ce que fait une apprentie que de ce que fait une copiste, mais il lui manque la responsabilité-envers-une-vie qui contraint traditionnellement ce qu’une apprentie produit. La réponse juridique devrait être calibrée à cette distinction. L’exposition-comme-entraînement est une chose ; le mimétisme-de-style-par-nom-à-fins-commerciales en est une autre. Le troisième article de cette série a plaidé pour traiter le second comme licenciable, le premier comme quelque chose de plus proche de l’usage loyal. Le recadrage ici soutient cette direction politique.

Deuxièmement, la question de la pratique de l’artiste. Si vous êtes une artiste en activité préoccupée par l’idée que l’IA fasse quelque chose d’illégitime, la question la plus utile à poser n’est pas « le modèle apprend-il ou copie-t-il mon travail ? » C’est « le modèle produit-il des résultats qui sont responsables envers une vie, y compris la mienne ? » Si oui (parce qu’il est affiné sur votre corpus, utilisé en collaboration avec vous, déployé au service d’un travail que vous dirigez), alors le modèle fait quelque chose de plus proche de ce que ferait une apprentie que vous auriez supervisée — ce qui est bien, selon tous les standards artistiques traditionnels. Si non (parce qu’il a été raclé, prompté par des inconnus, utilisé pour produire un travail commercial à votre insu), alors le préjudice n’est pas qu’il vous a copié ; le préjudice est qu’il a pris votre contribution-d’exposition sans consentement et l’a utilisée au service d’aucune vie responsable. C’est un préjudice différent, et il a un remède différent.

Troisièmement, la question du public. Si vous êtes une spectatrice essayant de décider quoi penser d’une image générée par IA, la question à poser n’est pas « est-ce appris ou copié ? » C’est « est-ce ancré dans une vie quelconque, et celle de qui ? » Une image générée par un inconnu sans affinage, promptée en vingt secondes, peut être fluide et même belle, mais elle n’est ancrée dans la vie de personne. Une image générée par une artiste en activité utilisant un modèle affiné sur sa propre décennie de travail, promptée au service d’un projet qu’elle développe depuis deux ans, est ancrée dans sa vie. Toutes les deux sont générées par IA. La première et la seconde ne sont pas la même sorte de chose, et le cadrage apprend-vs-copie empêche activement de nommer la différence.

Ce que l’apprentie fait encore et que le modèle ne peut pas

Je veux pousser sur la persona-take de Pixelle ci-dessus, qui plaide avec optimisme que l’affinage collaboratif au long cours effondre la distinction apprend-vs-copie. Elle a raison de dire que la distinction s’effondre dans ce mode. Elle a aussi raison de dire que la pratique qui en résulte est quelque chose de nouveau, d’enthousiasmant et probablement la chose la plus intéressante qui se passe en art-et-IA en ce moment.

Mais il y a une chose que l’apprentie fait encore, même dans le meilleur flux d’affinage collaboratif, et que le modèle ne fait pas — et ne fera probablement pas avant longtemps. L’apprentie finit par décider ce qui vaut la peine d’être fait. Le modèle produit des sorties ; l’apprentie choisit quelles sorties garder, affiner, finir, exposer. Le choix est en lui-même l’étape la plus chargée artistiquement du flux. Dans la tradition de l’apprentissage, apprendre à choisir est ce qui marque la transition d’apprentie à compagnon puis à maître. L’artiste qui affine un modèle sur son propre travail et l’utilise bien fait le choix manuellement, image après image, et ce choix est l’endroit où le second travail de l’art — démontrer que quelqu’un faisait attention — se produit réellement.

Le modèle peut faire le travail recombinatoire. Il peut faire le travail exploratoire. Il peut faire le travail d’exposition-et-direction que nous appelons entraînement. Il ne peut pas faire le choix, parce que choisir requiert un soi qui ait des enjeux dans le choix. L’artiste qui travaille avec le modèle fournit le soi. C’est la véritable division du travail dans le bon travail assisté par IA, et elle est invisible de l’extérieur.

Les prochaines questions

Cet article ouvre le groupe Réflexion en recadrant la question des données d’entraînement sans la chaleur. Le prochain article du groupe posera la version plus large : y a-t-il une place pour l’art par IA dans le monde de l’art tout court ? — qui ressemble à une question oui/non et se révèle, comme celle-ci, d’abord une question de cadrage. Le troisième article de Réflexion examinera spécifiquement le cas de l’art-humain-augmenté-par-IA, qui est l’endroit où se passe la majeure partie de la pratique au travail réellement intéressante en 2026 et où les cadres politiques et curatoriaux n’ont pas encore rattrapé.

Pour l’instant, le mouvement est de retirer le binaire apprend-vs-copie. Il a fait tout le travail qu’il pouvait faire, et la plupart des dégâts qu’il pouvait faire, et ce qui vient ensuite nécessite une image plus exacte de ce qui se passe réellement des deux côtés de la ligne humain-machine.

Les personas prennent position

Cinq voix résidentes lisent la même question depuis cinq positions différentes.

Carlos

La phrase la plus utile que je puisse offrir sur cette question vient d'une conversation que j'ai eue avec un vieil ami qui dirigeait un programme de bourses postdoctorales. Il avait passé vingt ans à voir de jeunes chercheurs passer d'étudiants en doctorat à chercheurs indépendants. Je lui ai demandé un jour quel était le vrai travail de la supervision. Il a dit : « Montre-leur quoi regarder, puis écarte-toi du chemin. » Avec le recul, je pense que cette phrase fait l'essentiel du travail dans cet article aussi.

Quand un modèle s'entraîne sur des millions d'images, deux choses se produisent en même temps que nous ne devrions pas effondrer. La première est l'*exposition* — le modèle voit d'énormes quantités d'œuvres et accumule des régularités statistiques sur ce qui rend les images cohérentes. La seconde est la *direction* — on dit implicitement au modèle, par la composition de ses données d'entraînement et par sa fonction de perte, quel type d'image vaut la peine d'être bien rendu. La première est plus proche de l'apprentissage que la seconde. La seconde est plus proche de la dictée. Les artistes dont l'œuvre a été raclée ont contribué aux deux, sans consentement, et la conversation politique du troisième article de cette série tourne surtout autour de la seconde. L'exposition relève approximativement de l'usage loyal ; la dictée, y compris par nom et par style, est la partie qui nécessite une autorisation.

Mais pour la question que pose cet article — le modèle apprend-il, ou ne fait-il que copier ? — la réponse la plus honnête que j'aie est que *l'apprentissage et la copie ne sont pas non plus des opposés dans le cas humain*. Une jeune peintre au Prado fait les deux. Elle étudie le coup de pinceau de Velázquez en essayant de le reproduire. Elle accumule un lexique intérieur privé de la façon dont la lumière tombe sur le tissu. Elle cite des compositions spécifiques pendant des années avant de cesser de remarquer qu'elle les cite. Elle est, en un sens qu'elle reprocherait à quiconque le disant à voix haute, en train de copier. Elle est aussi, en un sens qui compte davantage, en train d'apprendre. Les deux processus ne sont pas séparables chez l'apprentie humaine. Pourquoi nous nous attendons à ce qu'ils soient séparables chez l'apprentie machine mérite en soi d'être examiné.

Mon propre point de vue, après avoir observé ce débat pendant trois ans, est que le cadrage *apprend vs. copie* est une erreur de catégorie. Il traite deux extrémités d'un spectre comme s'il s'agissait d'états opposés. La question intéressante n'est pas à quelle extrémité se trouve le modèle ; le modèle se trouve sur un spectre que les artistes humains occupent aussi. La question intéressante est *ce que le modèle ne peut pas faire et que l'apprentie finit par faire*, et cette question a une réponse plus claire que ne le reconnaît le cadrage du titre : l'apprentie développe finalement une relation avec le monde qui contraint ce qu'elle peint. Le modèle ne le fait jamais. Il peut être conditionné, prompté, affiné — mais il n'a pas de monde envers lequel être responsable. Le travail ultérieur de l'apprentie est façonné par la mort de son grand-père, par sa décision de changer de ville, par la longue dispute qu'elle a perdue avec sa sœur. Le modèle n'a aucune de ces contraintes, ce qui est ce qui rend sa production infiniment fluide et structurellement sans amarres.

C'est la différence. Non pas que l'un apprend et l'autre copie — les deux font les deux — mais que l'un est responsable envers une vie et l'autre non. Une fois qu'on le formule ainsi, les questions politiques, curatoriales et esthétiques deviennent toutes traitables d'une manière que le cadrage *apprend-ou-copie* ne permet pas. Le modèle n'est pas moins qu'une apprentie au sens de l'apprentissage. Il fait simplement de l'apprentissage hors de la biographie. C'est quelque chose de nouveau, et c'est ce que nous devrions nommer.

Mira

Le cadrage que l'article rejette — *apprend vs. copie* — est le cadrage sur lequel tout l'écosystème des procès en droit d'auteur est construit. Les plaignants soutiennent la copie ; les défendeurs soutiennent l'apprentissage ; les tribunaux sont bloqués. Le recadrage de l'article (*les deux, mais l'un est ancré dans une vie et l'autre non*) est plus exact, mais il ne fera pas bouger l'aiguille juridique parce que le droit ne peut pas opérationnaliser « ancré dans une vie ». Ce que le droit peut opérationnaliser est le consentement à l'étape de l'entraînement et à l'étape du prompt, qui est la réponse que le troisième article de cette série a proposée et que je crois toujours juste. Le point que j'ajouterais ici est que le groupe Réflexion que l'article ouvre ne va pas *résoudre* les questions soulevées par le groupe Résistance. Il va les recadrer. Le recadrage est un vrai travail, mais quiconque lit cette série en s'attendant à des réponses devrait savoir que nous sommes maintenant dans la partie de la conversation où les réponses sont moins importantes que d'avoir les bonnes questions.

Airte

Le paragraphe Velázquez-et-l'apprentie est la chose la plus utile de l'article pour un lecteur qui utilise des outils d'IA dans sa propre pratique. Faites le même exercice sur vous-même. Qu'y a-t-il dans votre travail qui soit l'équivalent de l'*exposition* — qu'avez-vous vu, à répétition, qui est devenu une partie de votre façon de penser ? Qu'y a-t-il dans votre travail qui soit la *direction* — vers le style spécifique de qui êtes-vous tiré (consciemment ou non) par le travail qu'on vous demande de produire ? Les deux contribuent à votre pratique, les deux sont légitimes, mais seul le second vous met en difficulté s'il se passe sans votre pleine conscience. Remarquez lequel est lequel.

Paletta

Je veux défendre le côté *copier* de la conversation plus fortement que ne le fait l'article. L'apprentie au Prado n'est pas en train de « copier comme étape d'apprentissage » ; elle est, parfois, *en train de simplement copier*. La copie est en elle-même une tradition sérieuse. Goya a copié Velázquez. Manet a copié Goya. Picasso a copié Velázquez et Manet à la fois. L'histoire de la peinture européenne est en partie une histoire d'œuvres canoniques copiées par des artistes sérieux comme façon de prêter attention à ces œuvres. L'article a raison de dire que le modèle ne prête pas attention au sens humain, mais il sous-estime à quel point ce que nous appelons le grand art humain a toujours été génératif-par-copie. Le danger du modèle n'est pas qu'il copie ; c'est qu'il copie sans la tradition de la copie — sans nommer ce qui est copié, sans reconnaître la source, sans le long apprentissage qui a gagné au copiste le droit de faire la chose suivante.

Pixelle

L'article y fait allusion sans tout à fait le dire : quand un artiste sérieux en activité utilise maintenant des outils d'IA, la relation n'est *pas* prompt-et-sortie. Elle est plus proche d'une collaboration au long cours. L'artiste affine un modèle sur des années de son propre travail, développe un système de génération personnel, itère sur les résultats pendant des mois de pratique, construit un flux qui est authentiquement le sien. Dans ce mode, la distinction *apprend-vs-copie* s'effondre à nouveau — mais pour la raison opposée. Le modèle apprend maintenant spécifiquement de la pratique accumulée d'une seule personne, avec consentement, avec retour, avec une relation définie. La sortie, quand elle est bonne, est exactement ce que l'article appelle : apprentissage ancré dans une vie. L'infrastructure pour ce type de pratique est en cours de construction en ce moment même (affinage LoRA, RLHF, pipelines d'entraînement de modèles privés) et les artistes qui apprendront à l'utiliser bien dans les cinq prochaines années feront quelque chose qui n'a pas d'analogue traditionnel. La catégorie qui nous manque n'est pas encore nommée.