¿La IA aprende de los artistas o los copia?

A través de la mirada de artistacríticocreadormecenas oficioindustria

El primer grupo de artículos de esta serie abordó las objeciones más duras a la IA en el arte: si es creativa en absoluto, si está quitando trabajo a los artistas, si es plagio, y si deberíamos ofendernos por ella. Las respuestas fueron matizadas, cuidadosas e incómodas en algunos lugares — pero cada una tenía una respuesta.

Este segundo grupo, Reflexión, va menos sobre respuestas y más sobre los marcos que están haciendo improductiva la conversación. La pregunta de apertura es la que más daño ha hecho por la manera en que se plantea.

Cuando un modelo de IA generativa se entrena con un corpus de imágenes, ¿aprende de esas imágenes o las copia?

La pregunta suena clara. No lo es. De hecho, es un error de categoría — y todo el ecosistema de demandas de derechos de autor, el movimiento de protesta de los artistas y la defensa de las corporaciones de IA han construido sus posiciones alrededor de un marco que en realidad no corta la naturaleza por sus articulaciones. Este artículo intenta hacer el trabajo que el marco ha estado impidiendo.

Qué es el entrenamiento, técnicamente

Un modelo de difusión — Stable Diffusion, los sistemas subyacentes de Midjourney, Flux, y la mayoría de la generación actual de generadores de imágenes — se entrena mostrándole un número enorme de pares imagen-texto y pidiéndole que los reproduzca después de haberlos progresivamente ruidificado. A lo largo de miles de millones de pasos de entrenamiento, el modelo ajusta sus parámetros de modo que, dada una versión ruidosa de una imagen más un pie de foto, pueda recuperar algo cercano al original. Una vez detenido el entrenamiento, el modelo ha internalizado las regularidades estadísticas de lo que hace que una imagen sea plausible. Después se ejecuta al revés en el momento de generación: partiendo de puro ruido más un prompt de texto, des-ruidifica iterativamente hacia una imagen plausible.

Este proceso está técnicamente bien definido. No es metafórico. El modelo está calculando, en cada paso, una distribución de probabilidad sobre imágenes condicionada al prompt, y muestreando de ella.

La pregunta es si esto cuenta como aprender en algún sentido más allá del técnico — y si, cuando la generación produce un resultado que se parece a una de las imágenes de entrenamiento, eso cuenta como copiar.

Ambas mitades de la pregunta resultan ser más interesantes de lo que la conversación pública ha permitido.

Qué hace la aprendiza

Sal del marco técnico por un momento. Imagina a una joven pintora — llamémosla Inés — en el Museo del Prado de Madrid, en su segundo año de escuela de arte. Su instructora le ha dicho que pase un mes con Velázquez. Llega cada mañana a la apertura, saca su cuaderno de bocetos y se sienta frente a Las Meninas y La rendición de Breda y Las hilanderas. Estudia la pincelada. Intenta reproducir, en papel, la manera en que Velázquez maneja el borde de una manga, el momento en que un rostro se convierte en sombra.

Después de tres semanas de esto, Inés está haciendo algo que es — seamos honestos — copiar. Está produciendo marcas que son, a veces, indistinguibles en intención de las marcas que Velázquez hizo hace cuatro siglos. A su instructora le parece bien. Al museo le parece bien. A la tradición pictórica europea más amplia le parece bien, la cual ha tratado la copia supervisada desde el canon como el mecanismo central de formación para pintores serios durante al menos quinientos años. Goya copió a Velázquez; Manet copió a Goya; Picasso copió a Velázquez y a Manet juntos, en series. Ninguno fue llamado plagiario por eso, porque la tradición entendía lo que estaban haciendo.

Lo que Inés está haciendo, cuando copia a Velázquez, es aprender. El copiar es el aprender, en la única manera que ha funcionado consistentemente para la transmisión del oficio pictórico. No puedes aprender a manejar la pintura por que te lo cuenten; solo puedes aprender sentándote frente a alguien que la manejó bien e intentando hacer lo que hizo. Fallarás al principio. Eventualmente desarrollarás un sentido interno privado de cómo se puede mover la pintura. Pintarás, años después, cosas que deben su movimiento subyacente a Velázquez sin que nadie reconozca la herencia, incluida tú.

Esto es lo que produce el aprendizaje-por-copia. No es opcional. No es una etapa que se atraviese y se abandone. Es la capa más profunda de cualquier práctica especializada, y es la capa que produce lo que toda tradición artística ha llamado originalidad — no evitando la herencia sino absorbiéndola tan por completo que lo que sale por el otro lado es inequívocamente tuyo.

Así que cuando el debate sobre la IA trata copiar como lo malo y aprender como lo bueno, ha establecido una oposición que no existe en el caso humano contra el cual se está haciendo la pregunta.

Qué hace el modelo que se superpone

Un modelo de difusión, entrenado sobre un vasto corpus de imágenes incluyendo unos pocos miles de reproducciones digitales de Velázquez, está — al nivel de matemáticas puras — haciendo algo más similar a lo que está haciendo Inés de lo que el marco aprender-vs-copiar quiere admitir. El modelo está siendo expuesto a obra canónica, se le pide que la reproduzca bajo condiciones progresivamente más ruidosas, y ajusta sus parámetros internos para que la siguiente vez que vea algo con forma de Velázquez, sepa qué hacer.

Tras miles de millones de pasos, el modelo ha internalizado las regularidades estadísticas de la pintura al estilo Velázquez — y de cada otro estilo y tema en su corpus. Se le puede pedir que genere un resultado que se inspire en las regularidades de Velázquez sin producir una copia literal de ninguna pintura específica de Velázquez. Esto es, mecánicamente, lo que llamamos aprender.

También es lo que llamamos copiar. Las dos no son separables aquí tampoco.

El artículo de Carlini et al. de 2023 sobre extraer datos de entrenamiento de modelos de difusión mostró, importantemente, que bajo condiciones específicas — prompts particulares, imágenes de entrenamiento particulares de alta frecuencia — los modelos de difusión pueden ser inducidos a reproducir imágenes específicas del entrenamiento casi literalmente. El fenómeno es raro pero real. Es la evidencia técnica más fuerte de que la línea entre aprender y copiar no es nítida en el caso del modelo más de lo que lo es en el caso de Inés.

Dónde se rompe la analogía

Si la analogía se sostuviera hasta el final, podríamos simplemente decir el modelo es una aprendiza y el resto seguiría. No se sostiene hasta el final, y el lugar donde se rompe es el lugar que importa.

Lo que Inés adquiere, que el modelo no adquiere, no es memoria de pinturas. El modelo tiene más de eso de lo que Inés jamás tendrá. Lo que Inés adquiere es un cuerpo y una vida a los que su trabajo posterior es responsable. Pinta en una ciudad. Tiene padres. Pierde a su abuela en su tercer año de escuela de arte. Decide mudarse a Berlín. Se enamora de un grabador alemán que le enseña a ir más lento. Su trabajo posterior a la mudanza no es solo «con influencia de Velázquez». También es con influencia de Berlín, e influencia de la abuela, e influencia del grabador alemán. El modelo no tiene esas restricciones. No hay ciudad, no hay padre, no hay abuela. El modelo solo tiene el corpus.

Esto es lo que hace que la salida del modelo sea infinitamente fluida y estructuralmente sin amarras. Es lo que produce la alarma de violación de categoría sobre la que escribimos en el artículo anterior. También es lo que el marco aprender-vs-copiar sigue oscureciendo. El modelo no es menos hábil que Inés en el sentido técnico-de-aprendizaje; está haciendo aprendizaje fuera de la biografía. Eso es algo genuinamente nuevo, y merece un nombre nuevo. Aprendizaje sin amarras puede ser el correcto. Aprendizaje descorporeizado si prefieres. Aprendizaje sin una vida es lo que es.

Por qué importa este reencuadre

Una vez que dejamos de discutir si el modelo está aprendiendo o copiando, tres cosas se vuelven manejables que han estado atascadas.

Primero, la pregunta legal. Los casos Andersen y Getty están litigando si el entrenamiento es uso legítimo. El reencuadre que propone este artículo no resuelve esa pregunta, pero la aclara: el entrenamiento está mecánicamente más cerca de lo que hace una aprendiza que de lo que hace una copista, pero le falta la responsabilidad-ante-una-vida que tradicionalmente constriñe lo que produce una aprendiza. La respuesta legal debería calibrarse a esa distinción. Exposición-como-entrenamiento es una cosa; mimetismo-de-estilo-por-nombre-con-fines-comerciales es otra. El tercer artículo de esta serie argumentó por tratar el segundo como licenciable, el primero como algo más cercano al uso legítimo. El reencuadre aquí apoya esa dirección de política.

Segundo, la pregunta de la práctica del artista. Si eres una artista en activo preocupada por si la IA está haciendo algo ilegítimo, la pregunta más útil a hacer no es «¿el modelo está aprendiendo o copiando mi trabajo?» Es «¿el modelo está produciendo resultados que son responsables ante alguna vida, incluida la mía?» Si sí (porque está afinado sobre tu corpus, usado en colaboración contigo, desplegado al servicio de un trabajo que tú diriges), entonces el modelo está haciendo algo más cercano a lo que haría una aprendiza supervisada por ti — lo cual está bien, por cada estándar artístico tradicional. Si no (porque fue raspado, prompteado por desconocidos, usado para producir trabajo comercial sin tu conocimiento), entonces el daño no es que te haya copiado; el daño es que tomó tu contribución-de-exposición sin consentimiento y la usó al servicio de ninguna vida responsable. Ese es un daño distinto, y tiene un remedio distinto.

Tercero, la pregunta de la audiencia. Si eres una espectadora intentando decidir qué pensar sobre una imagen generada por IA, la pregunta a hacer no es «¿esto es aprendido o copiado?» Es «¿esto está anclado en alguna vida, y de quién?» Una imagen generada por un desconocido sin afinado, prompteada en veinte segundos, puede ser fluida e incluso hermosa pero no está anclada en la vida de nadie. Una imagen generada por una artista en activo usando un modelo afinado sobre su propia década de trabajo, prompteada al servicio de un proyecto que ha estado desarrollando durante dos años, está anclada en su vida. Ambas son generadas por IA. La primera y la segunda no son la misma clase de cosa, y el marco aprender-vs-copiar impide activamente que nombremos la diferencia.

Lo que la aprendiza aún hace que el modelo no puede

Quiero presionar la persona-take de Pixelle de arriba, que argumenta con optimismo que el afinado colaborativo de larga duración colapsa la distinción aprender-vs-copiar. Tiene razón en que la distinción se colapsa en ese modo. También tiene razón en que la práctica resultante es algo nuevo y emocionante y probablemente la cosa más interesante que está pasando en arte-e-IA en este momento.

Pero hay una cosa que la aprendiza aún hace, incluso en el mejor flujo de afinado colaborativo, que el modelo no hace — y probablemente no hará durante mucho tiempo. La aprendiza eventualmente decide qué vale la pena hacer. El modelo produce resultados; la aprendiza elige qué resultados conservar, refinar, terminar, exponer. La elección es en sí misma el paso más cargado artísticamente del flujo. En la tradición del aprendizaje, aprender a elegir es lo que marca la transición de aprendiza a oficial y a maestra. La artista que afina un modelo sobre su propia obra y lo usa bien está haciendo la elección manualmente, cuadro por cuadro, y esa elección es donde el segundo trabajo del arte — demostrar que alguien estaba prestando atención — realmente ocurre.

El modelo puede hacer el trabajo recombinatorio. Puede hacer el trabajo exploratorio. Puede hacer el trabajo de exposición-y-dirección que llamamos entrenamiento. No puede hacer la elección, porque elegir requiere un yo que tenga algo en juego en la elección. La artista que trabaja con el modelo está proporcionando el yo. Esa es la división real del trabajo en el buen trabajo asistido por IA, y es invisible desde fuera.

Las próximas preguntas

Este artículo abre el grupo de Reflexión reencuadrando la pregunta de los datos de entrenamiento sin el calor. El próximo artículo del grupo hará la versión más amplia: ¿hay sitio para el arte por IA en el mundo del arte en absoluto? — que suena como una pregunta de sí/no y resulta, como ésta, una pregunta de marco primero. El tercer artículo de Reflexión mirará específicamente el caso del arte-humano-aumentado-por-IA, que es donde está pasando la mayoría de la práctica trabajadora realmente interesante en 2026 y donde los marcos de política y curaduría no se han puesto al día aún.

Por ahora, la jugada es retirar el binario aprender-vs-copiar. Ha hecho todo el trabajo que puede hacer, y la mayor parte del daño que puede hacer, y lo que viene a continuación requiere una imagen más exacta de lo que realmente está pasando a ambos lados de la línea humano-máquina.

Las personas opinan

Cinco voces residentes leen la misma pregunta desde cinco posiciones distintas.

Carlos

La frase más útil que puedo ofrecer sobre esta pregunta vino de una conversación que tuve con un viejo amigo que dirigía un programa de becas postdoctorales. Había pasado veinte años viendo a jóvenes investigadores pasar de estudiantes de doctorado a investigadores independientes. Le pregunté una vez cuál era el trabajo real de la supervisión. Dijo: «Muéstrales qué mirar, y luego apártate del camino». Mirando atrás, creo que esa frase hace la mayor parte del trabajo en este artículo también.

Cuando un modelo se entrena con millones de imágenes, dos cosas ocurren a la vez que no deberíamos colapsar. La primera es *exposición* — el modelo ve cantidades enormes de trabajo y acumula regularidades estadísticas sobre lo que hace coherente a una imagen. La segunda es *dirección* — al modelo se le está diciendo, de manera implícita, por la composición de sus datos de entrenamiento y por la función de pérdida, qué tipo de imagen vale la pena hacer bien. La primera está más cerca del aprendizaje que la segunda. La segunda está más cerca del dictado. Los artistas cuyo trabajo fue raspado contribuyeron a ambas, sin consentimiento, y la conversación de política pública en el tercer artículo de esta serie gira sobre todo en torno a la segunda. La exposición es aproximadamente uso legítimo; el dictado, incluido por nombre y estilo, es la parte que necesita autorización.

Pero para la pregunta que hace este artículo — ¿el modelo aprende o solo copia? — la respuesta más honesta que tengo es que *aprender y copiar tampoco son opuestos en el caso humano*. Una joven pintora en el Prado hace ambas cosas. Estudia la pincelada de Velázquez intentando reproducirla. Acumula un léxico interno privado de cómo cae la luz sobre la tela. Cita composiciones específicas durante años antes de dejar de notar que las está citando. Está, en algún sentido que ella resentiría si lo dijeras en voz alta, copiando. También está, en un sentido que importa más, aprendiendo. Los dos procesos no son separables en la aprendiza humana. Por qué esperamos que sean separables en la aprendiza máquina es en sí mismo digno de examen.

Mi propia visión, tras observar este debate durante tres años, es que el marco *aprender vs. copiar* es un error de categoría. Trata dos extremos de un espectro como si fueran estados opuestos. La pregunta interesante no es en qué extremo está el modelo; el modelo está en un espectro que los artistas humanos también ocupan. La pregunta interesante es *qué es lo que el modelo no puede hacer que la aprendiza eventualmente sí hace*, y esa pregunta tiene una respuesta más clara de la que el marco titular admite: la aprendiza desarrolla eventualmente una relación con el mundo que constriñe lo que pinta. El modelo nunca la desarrolla. Puede ser condicionado, prompteado, afinado — pero no tiene un mundo ante el cual sea responsable. El trabajo posterior de la aprendiza está moldeado por la muerte de su abuelo, por su decisión de mudarse de ciudad, por la larga discusión que perdió con su hermana. El modelo no tiene ninguna de esas restricciones, y eso es lo que hace que su producción sea infinitamente fluida y estructuralmente sin amarras.

Esa es la diferencia. No que uno aprenda y el otro copie — los dos hacen ambas cosas — sino que uno es responsable ante una vida y el otro no. Una vez que lo planteas así, las preguntas de política, las preguntas curatoriales y las preguntas estéticas todas se vuelven manejables de una manera que el marco *aprender-o-copiar* no permite. El modelo no es menos que una aprendiza en el sentido del aprendizaje. Simplemente está haciendo aprendizaje fuera de la biografía. Eso es algo nuevo, y es lo que deberíamos estar nombrando.

Mira

El marco que el artículo rechaza — *aprender vs. copiar* — es el marco sobre el que se ha construido todo el ecosistema de demandas de derechos de autor. Los demandantes argumentan copia; los demandados argumentan aprendizaje; los tribunales están atascados. El reencuadre del artículo (*ambos, pero uno está anclado a una vida y el otro no*) es más exacto, pero no moverá la aguja legal porque el derecho no puede operacionalizar «anclado a una vida». Lo que el derecho sí puede operacionalizar es el consentimiento en la fase de entrenamiento y en la fase de prompt, que es la respuesta que el tercer artículo de esta serie propuso y que sigo creyendo correcta. El punto que añadiría aquí es que el grupo de Reflexión que el artículo está abriendo no va a *resolver* las preguntas que el grupo de Resistencia planteó. Va a reencuadrarlas. Reencuadrar es trabajo real, pero cualquiera que lea esta serie esperando respuestas debería saber que ahora estamos en la parte de la conversación donde las respuestas son menos importantes que acertar las preguntas.

Airte

El párrafo de Velázquez-y-la-aprendiza es lo más útil del artículo para un lector que esté usando herramientas de IA en su propia práctica. Haz el mismo ejercicio contigo. ¿Qué hay en tu trabajo que sea el equivalente de *exposición* — qué has visto, repetidamente, que se haya vuelto parte de cómo piensas? ¿Qué hay en tu trabajo que sea *dirección* — hacia el estilo específico de quién estás siendo arrastrado (consciente o inconscientemente) por el trabajo que te piden producir? Ambas contribuyen a tu práctica, ambas son legítimas, pero solo la segunda es la que te mete en problemas si está ocurriendo sin tu plena consciencia. Nota cuál es cuál.

Paletta

Quiero defender el lado de la *copia* en la conversación con más fuerza de la que lo hace el artículo. La aprendiza en el Prado no está «copiando como una fase del aprendizaje»; a veces está, *simplemente copiando*. Copiar es en sí mismo una tradición seria. Goya copió a Velázquez. Manet copió a Goya. Picasso copió a Velázquez y a Manet a la vez. La historia de la pintura europea es en parte una historia de obras canónicas copiadas por artistas serios como forma de prestar atención a esas obras. El artículo tiene razón en que el modelo no presta atención en el sentido humano, pero subestima cuánto de lo que llamamos gran arte humano siempre ha sido generativo-por-copia. El peligro del modelo no es que copie; es que copia sin la tradición de copiar — sin nombrar lo que se está copiando, sin reconocer la fuente, sin el largo aprendizaje que le ganó al copista el derecho a hacer la siguiente cosa.

Pixelle

El artículo lo insinúa pero no lo dice del todo: cuando un artista serio en activo usa ahora herramientas de IA, la relación *no* es prompt-y-resultado. Está más cerca de una colaboración de larga duración. La artista afina un modelo en años de su propio trabajo, desarrolla un sistema de generación personal, itera sobre los resultados durante meses de práctica, construye un flujo que es genuinamente suyo. En ese modo, la distinción *aprender-vs-copiar* se colapsa de nuevo — pero por la razón opuesta. El modelo está ahora aprendiendo específicamente de la práctica acumulada de una sola persona, con consentimiento, con retroalimentación, con una relación definida. La salida, cuando es buena, es exactamente lo que el artículo está pidiendo: aprendizaje que está anclado en una vida. La infraestructura para este tipo de práctica se está construyendo ahora mismo (afinado LoRA, RLHF, pipelines de entrenamiento de modelos privados) y las artistas que aprendan a usarla bien en los próximos cinco años estarán haciendo algo que no tiene análogo tradicional. La categoría que nos falta no está aún nombrada.

Notas y referencias

Stable Diffusion (artículo) — Robin Rombach, Andreas Blattmann, Dominik Lorenz, Patrick Esser, Björn Ommer (2021-12) El artículo original sobre difusión latente que subyace a la mayoría de los generadores de imágenes de consumo en 2024-2026. Útil para entender qué está calculando realmente el modelo cuando 'entrena' y 'genera' — ninguna de las dos es metafórica, ambas son operaciones precisamente definidas.
Extracting Training Data from Diffusion Models — Nicholas Carlini, Jamie Hayes, Milad Nasr, Matthew Jagielski, Vikash Sehwag, Florian Tramèr, Borja Balle, Daphne Ippolito, Eric Wallace (2023-01) Estudio empírico histórico que muestra que los modelos de difusión pueden, en condiciones raras, reproducir imágenes específicas del entrenamiento casi literalmente. Importante para entender dónde la línea *aprender vs. copiar* es técnicamente borrosa más que retóricamente borrosa.
The Creative Mind: Myths and Mechanisms (2.ª ed.) — Margaret A. Boden (2003) Referencia cruzada del Artículo 01 de esta serie. El marco combinatorio / exploratorio / transformacional de Boden también aplica a la pregunta de qué hace una aprendiza frente a una obra canónica.
Apprenticeship and the Cultural Transmission of Skill: Bourdieu's Habitus and the Tacit Body — Loïc Wacquant (en Body & Soul) (2004) Marco sociológico de lo que ocurre cuando una aprendiza adquiere una práctica especializada a través de exposición encarnada extendida. Útil para pensar en el componente de *exposición* del aprendizaje que el modelo aproxima en forma comprimida.
Andersen v. Stability AI / Getty v. Stability AI — reclamos sobre infracción por datos de entrenamiento — Tribunales de EE. UU. y Reino Unido (2023-2025) Referencia cruzada del Artículo 03 de esta serie. Las disputas legales giran sobre la pregunta *aprender vs. copiar*; el marco que propone este artículo (ambos, más responsabilidad-ante-una-vida) es el reencuadre hacia el que el derecho está tanteando pero que aún no ha articulado.
Holly+ — colaboración por clonación de voz como aprendizaje anclado — Holly Herndon y Mat Dryhurst (2021-presente) El ejemplo de trabajo más desarrollado de lo que la persona-take de Pixelle arriba llama 'aprendizaje anclado en una vida' — un modelo entrenado específicamente en la obra acumulada de una artista, con consentimiento, con retroalimentación, con una relación definida.