Le premier groupe d’articles de cette série a abordé les objections les plus dures à l’IA dans l’art : si elle est créative du tout, si elle prend du travail aux artistes, si c’est du plagiat, et si nous devrions nous en offenser. Les réponses étaient nuancées, prudentes et inconfortables par endroits — mais chacune avait une réponse.
Ce second groupe, Réflexion, porte moins sur les réponses et davantage sur les cadrages qui rendent la conversation improductive. La question d’ouverture est celle qui a fait le plus de dégâts par la manière dont elle est posée.
Quand un modèle d’IA générative s’entraîne sur un corpus d’images, apprend-il de ces images, ou les copie-t-il ?
La question paraît claire. Elle ne l’est pas. Elle est, en fait, une erreur de catégorie — et tout l’écosystème des procès en droit d’auteur, le mouvement de protestation des artistes et la défense de l’IA d’entreprise ont construit leurs positions autour d’un cadrage qui ne découpe pas la nature à ses articulations. Cet article essaie de faire le travail que le cadrage empêchait.
Ce qu’est l’entraînement, techniquement
Un modèle de diffusion — Stable Diffusion, les systèmes sous-jacents de Midjourney, Flux, et la plupart de la génération actuelle de générateurs d’images — est entraîné en lui montrant un nombre énorme de paires image-texte et en lui demandant de les reproduire après qu’elles ont été progressivement bruitées. Au cours de milliards d’étapes d’entraînement, le modèle ajuste ses paramètres de sorte que, étant donné une version bruitée d’une image plus une légende, il puisse récupérer quelque chose de proche de l’original. Une fois l’entraînement arrêté, le modèle a intériorisé les régularités statistiques de ce qui rend une image plausible. Il est ensuite exécuté à l’envers au moment de la génération : à partir de pur bruit plus un prompt textuel, il débruite itérativement vers une image plausible.
Ce processus est techniquement bien défini. Il n’est pas métaphorique. Le modèle calcule, à chaque étape, une distribution de probabilité sur les images conditionnée par le prompt, et y échantillonne.
La question est de savoir si cela compte comme apprendre en un sens au-delà du technique — et si, quand la génération produit une sortie qui ressemble à l’une des images d’entraînement, cela compte comme copier.
Les deux moitiés de la question se révèlent plus intéressantes que ce que la conversation publique a autorisé.
Ce que fait l’apprentie
Sortez du cadre technique un instant. Imaginez une jeune peintre — appelons-la Inés — au Museo del Prado à Madrid, en deuxième année d’école d’art. Son enseignante lui a dit de passer un mois avec Velázquez. Elle arrive chaque matin à l’ouverture, sort son carnet de croquis, et s’assoit devant Les Ménines, La Reddition de Breda et Les Fileuses. Elle étudie le coup de pinceau. Elle essaie de reproduire, sur papier, la façon dont Velázquez traite le bord d’une manche, le moment où un visage devient ombre.
Après trois semaines de cela, Inés fait quelque chose qui est — soyons honnêtes — de la copie. Elle produit des marques qui sont, parfois, indissociables d’intention des marques que Velázquez a faites il y a quatre siècles. Son enseignante trouve cela bien. Le musée aussi. La tradition picturale européenne plus large aussi, qui a traité la copie supervisée du canon comme le mécanisme central de formation des peintres sérieux depuis au moins cinq cents ans. Goya a copié Velázquez ; Manet a copié Goya ; Picasso a copié Velázquez et Manet à la fois, en séries. Aucun n’a été appelé plagiaire pour cela, parce que la tradition comprenait ce qu’ils faisaient.
Ce que fait Inés, quand elle copie Velázquez, c’est apprendre. La copie est l’apprentissage, de la seule manière qui ait jamais fonctionné de façon constante pour la transmission du métier pictural. Vous ne pouvez pas apprendre à manier la peinture en vous le faisant raconter ; vous ne pouvez apprendre qu’en vous asseyant devant quelqu’un qui la maniait bien et en essayant de faire ce qu’il faisait. Vous échouerez au début. Vous développerez finalement un sens intérieur privé de la façon dont la peinture peut bouger. Vous peindrez, des années plus tard, des choses qui doivent leur mouvement sous-jacent à Velázquez sans que personne ne reconnaisse l’héritage, vous y compris.
C’est ce que produit l’apprentissage-par-copie. Ce n’est pas optionnel. Ce n’est pas une étape qu’on traverse et qu’on abandonne. C’est la couche la plus profonde de toute pratique de métier, et c’est la couche qui produit ce que toute tradition artistique a appelé originalité — non pas en évitant l’héritage mais en l’absorbant si complètement que ce qui sort de l’autre côté est sans équivoque le vôtre.
Alors quand le débat sur l’IA traite la copie comme la mauvaise chose et l’apprentissage comme la bonne, il a établi une opposition qui n’existe pas dans le cas humain contre lequel la question est posée.
Ce que fait le modèle qui se chevauche
Un modèle de diffusion, entraîné sur un vaste corpus d’images incluant quelques milliers de reproductions numériques de Velázquez, fait — au niveau des mathématiques pures — quelque chose de plus similaire à ce que fait Inés que ne veut bien l’admettre le cadrage apprend-vs-copie. Le modèle est exposé à des œuvres canoniques, on lui demande de les reproduire dans des conditions progressivement plus bruitées, et il ajuste ses paramètres internes pour que la prochaine fois qu’il voit quelque chose en forme de Velázquez, il sache quoi faire.
Après des milliards d’étapes, le modèle a intériorisé les régularités statistiques de la peinture à la manière de Velázquez — et de tous les autres styles et sujets de son corpus. On peut lui demander de générer une sortie qui s’inspire des régularités de Velázquez sans produire une copie littérale d’aucune peinture spécifique de Velázquez. C’est, mécaniquement, ce que nous appelons apprendre.
C’est aussi ce que nous appelons copier. Les deux ne sont pas séparables ici non plus.
L’article de Carlini et al. de 2023 sur l’extraction des données d’entraînement à partir des modèles de diffusion a montré, c’est important, que dans des conditions spécifiques — prompts particuliers, images d’entraînement particulières à haute fréquence — les modèles de diffusion peuvent être amenés à reproduire des images d’entraînement spécifiques presque mot pour mot. Le phénomène est rare mais réel. C’est la preuve technique la plus forte que la ligne entre apprendre et copier n’est pas nette dans le cas du modèle pas plus que dans le cas d’Inés.
Où l’analogie se brise
Si l’analogie tenait jusqu’au bout, nous pourrions simplement dire le modèle est une apprentie et le reste suivrait. Elle ne tient pas jusqu’au bout, et l’endroit où elle se brise est l’endroit qui compte.
Ce qu’Inés acquiert, et que le modèle n’acquiert pas, n’est pas la mémoire des peintures. Le modèle en a plus qu’Inés n’en aura jamais. Ce qu’Inés acquiert est un corps et une vie envers lesquels son travail ultérieur est responsable. Elle peint dans une ville. Elle a des parents. Elle perd sa grand-mère en troisième année d’école d’art. Elle décide de s’installer à Berlin. Elle tombe amoureuse d’un graveur allemand qui lui apprend à ralentir. Son travail après le déménagement n’est pas seulement « influencé par Velázquez ». Il est aussi influencé par Berlin, et par la grand-mère, et par le graveur allemand. Le modèle n’a pas ces contraintes. Il n’y a pas de ville, pas de parent, pas de grand-mère. Le modèle n’a que le corpus.
C’est ce qui rend la sortie du modèle infiniment fluide et structurellement sans amarres. C’est ce qui produit l’alarme de violation de catégorie sur laquelle nous avons écrit dans l’article précédent. C’est aussi ce que le cadrage apprend-vs-copie continue de masquer. Le modèle n’est pas moins habile qu’Inés au sens technique-de-l’apprentissage ; il fait de l’apprentissage hors de la biographie. C’est quelque chose de véritablement nouveau, et cela mérite un nom nouveau. Apprentissage sans amarres est peut-être le bon. Apprentissage désincarné si vous préférez. Apprentissage sans une vie est ce qu’il est.
Pourquoi ce recadrage importe
Une fois que nous cessons de discuter si le modèle apprend ou copie, trois choses deviennent traitables qui étaient bloquées.
Premièrement, la question juridique. Les affaires Andersen et Getty plaident la question de savoir si l’entraînement relève de l’usage loyal. Le recadrage que propose cet article ne résout pas cette question, mais il la clarifie : l’entraînement est mécaniquement plus proche de ce que fait une apprentie que de ce que fait une copiste, mais il lui manque la responsabilité-envers-une-vie qui contraint traditionnellement ce qu’une apprentie produit. La réponse juridique devrait être calibrée à cette distinction. L’exposition-comme-entraînement est une chose ; le mimétisme-de-style-par-nom-à-fins-commerciales en est une autre. Le troisième article de cette série a plaidé pour traiter le second comme licenciable, le premier comme quelque chose de plus proche de l’usage loyal. Le recadrage ici soutient cette direction politique.
Deuxièmement, la question de la pratique de l’artiste. Si vous êtes une artiste en activité préoccupée par l’idée que l’IA fasse quelque chose d’illégitime, la question la plus utile à poser n’est pas « le modèle apprend-il ou copie-t-il mon travail ? » C’est « le modèle produit-il des résultats qui sont responsables envers une vie, y compris la mienne ? » Si oui (parce qu’il est affiné sur votre corpus, utilisé en collaboration avec vous, déployé au service d’un travail que vous dirigez), alors le modèle fait quelque chose de plus proche de ce que ferait une apprentie que vous auriez supervisée — ce qui est bien, selon tous les standards artistiques traditionnels. Si non (parce qu’il a été raclé, prompté par des inconnus, utilisé pour produire un travail commercial à votre insu), alors le préjudice n’est pas qu’il vous a copié ; le préjudice est qu’il a pris votre contribution-d’exposition sans consentement et l’a utilisée au service d’aucune vie responsable. C’est un préjudice différent, et il a un remède différent.
Troisièmement, la question du public. Si vous êtes une spectatrice essayant de décider quoi penser d’une image générée par IA, la question à poser n’est pas « est-ce appris ou copié ? » C’est « est-ce ancré dans une vie quelconque, et celle de qui ? » Une image générée par un inconnu sans affinage, promptée en vingt secondes, peut être fluide et même belle, mais elle n’est ancrée dans la vie de personne. Une image générée par une artiste en activité utilisant un modèle affiné sur sa propre décennie de travail, promptée au service d’un projet qu’elle développe depuis deux ans, est ancrée dans sa vie. Toutes les deux sont générées par IA. La première et la seconde ne sont pas la même sorte de chose, et le cadrage apprend-vs-copie empêche activement de nommer la différence.
Ce que l’apprentie fait encore et que le modèle ne peut pas
Je veux pousser sur la persona-take de Pixelle ci-dessus, qui plaide avec optimisme que l’affinage collaboratif au long cours effondre la distinction apprend-vs-copie. Elle a raison de dire que la distinction s’effondre dans ce mode. Elle a aussi raison de dire que la pratique qui en résulte est quelque chose de nouveau, d’enthousiasmant et probablement la chose la plus intéressante qui se passe en art-et-IA en ce moment.
Mais il y a une chose que l’apprentie fait encore, même dans le meilleur flux d’affinage collaboratif, et que le modèle ne fait pas — et ne fera probablement pas avant longtemps. L’apprentie finit par décider ce qui vaut la peine d’être fait. Le modèle produit des sorties ; l’apprentie choisit quelles sorties garder, affiner, finir, exposer. Le choix est en lui-même l’étape la plus chargée artistiquement du flux. Dans la tradition de l’apprentissage, apprendre à choisir est ce qui marque la transition d’apprentie à compagnon puis à maître. L’artiste qui affine un modèle sur son propre travail et l’utilise bien fait le choix manuellement, image après image, et ce choix est l’endroit où le second travail de l’art — démontrer que quelqu’un faisait attention — se produit réellement.
Le modèle peut faire le travail recombinatoire. Il peut faire le travail exploratoire. Il peut faire le travail d’exposition-et-direction que nous appelons entraînement. Il ne peut pas faire le choix, parce que choisir requiert un soi qui ait des enjeux dans le choix. L’artiste qui travaille avec le modèle fournit le soi. C’est la véritable division du travail dans le bon travail assisté par IA, et elle est invisible de l’extérieur.
Les prochaines questions
Cet article ouvre le groupe Réflexion en recadrant la question des données d’entraînement sans la chaleur. Le prochain article du groupe posera la version plus large : y a-t-il une place pour l’art par IA dans le monde de l’art tout court ? — qui ressemble à une question oui/non et se révèle, comme celle-ci, d’abord une question de cadrage. Le troisième article de Réflexion examinera spécifiquement le cas de l’art-humain-augmenté-par-IA, qui est l’endroit où se passe la majeure partie de la pratique au travail réellement intéressante en 2026 et où les cadres politiques et curatoriaux n’ont pas encore rattrapé.
Pour l’instant, le mouvement est de retirer le binaire apprend-vs-copie. Il a fait tout le travail qu’il pouvait faire, et la plupart des dégâts qu’il pouvait faire, et ce qui vient ensuite nécessite une image plus exacte de ce qui se passe réellement des deux côtés de la ligne humain-machine.
Commentaires
Connectez-vous pour commenter