Fabricar el dato

Cuando el excedente no está en la salida, sino en el sustrato

En el texto anterior de esta línea sostuve que el artista que trabaja con datos masivos no produce el contenido ni ejecuta la forma: modula. Decide el umbral, la fricción, la taxonomía, la regla. El trabajo era una operación sobre un flujo externo que el artista no había generado —datos del CERN, registros personales, archivos de un periódico—. La decisión llegaba después del dato, sobre él.

Este texto examina el caso que invierte ese esquema, y lo invierte de una manera que obliga a reformular la pregunta. ¿Qué ocurre cuando el artista no recibe el dato, sino que lo fabrica? ¿Cuándo el dataset no es materia prima encontrada, sino obra en sí misma, producida a mano, antes de que ningún algoritmo intervenga? Si en el primer texto el excedente aparecía al final de la cadena —en la modulación de la salida—, aquí aparece al principio, sellado en el sustrato. Y eso cambia el estatuto de todo lo que viene después, incluido el algoritmo.

1. Diez mil tulipanes

El caso es Myriad (Tulips) y Mosaic Virus, de Anna Ridler, de 2018. Y conviene contarlo por su procedimiento, porque el procedimiento es la tesis.

Ridler quería entrenar un sistema generativo con tulipanes. La vía estándar habría sido descargar miles de imágenes de la web, o pagar a trabajadores precarizados para etiquetarlas en masa. Hizo lo contrario. Compró, manipuló y fotografió ella misma diez mil tulipanes, uno a uno, a lo largo de tres meses —la duración exacta de una temporada de floración—. Y luego etiquetó las diez mil imágenes a mano, con una taxonomía propia, escribiendo bajo cada una sus categorías: el tono exacto, la fase de degradación, el grado de estriado en los pétalos causado por la infección del virus del mosaico.

Ese dataset —diez mil fotografías etiquetadas a mano— es Myriad: se expone como instalación, una cuadrícula física de cincuenta metros cuadrados. Solo después introduce ese material en una red generativa para producir Mosaic Virus, un vídeo de tulipanes que mutan, cuyas floraciones se vinculan al precio en tiempo real de una criptomoneda —un guiño a la tulipomanía del siglo XVII, primera burbuja especulativa de la historia—.

Lo decisivo es el orden de las operaciones. Ridler no modula la salida de un sistema entrenado con datos ajenos. Determina, desde la raíz, qué puede llegar a generar el sistema, porque ella ha producido y clasificado cada elemento del que el sistema aprenderá. El algoritmo no descubre tulipanes en internet: interpola entre los tulipanes que Ridler fotografió y nombró. La máquina no concibe nada que escape al marco físico y conceptual que ella sembró a mano.

2. La inversión de la cadena

Conviene formular la diferencia con precisión, porque es estructural.

La cadena estándar del arte de datos va así: un dato masivo y externo, normalmente extraído por scraping de la web, alimenta un algoritmo, y el artista interviene modulando la salida —filtrando, recortando, dando forma al resultado—. La decisión humana está al final. Es el esquema de los cuatro casos del texto anterior, y es el dominante en la teoría: Manovich, Christiane Paul y la mayoría de los teóricos de los nuevos medios asumen que la materia prima del arte de datos es, por definición, un flujo preexistente, masivo, automatizado e incorpóreo. El artista es un coreógrafo de flujos que no produjo.

La cadena de Ridler va al revés: construcción manual del dataset, luego algoritmo, luego obra. La decisión humana está al principio, y es de otra naturaleza. No es modulación de una salida; es fabricación del sustrato. Y eso tiene una consecuencia que degrada el estatuto del algoritmo: si cada dato de entrada es una decisión humana —qué flor, qué luz, qué etiqueta, qué categoría—, entonces la red generativa pierde su aura de agente creador autónomo. Queda reducida a lo que técnicamente siempre fue: un motor de interpolación que calcula promedios y transiciones entre un conjunto de decisiones humanas previas. El algoritmo no añade; promedia lo que ya estaba sembrado.

Aquí el excedente —la diferencia que reorganiza el sistema sin dejarse absorber por su función— no aparece, como en el primer texto, modulando la salida. Aparece encriptado en la entrada. Está en el gesto de haber fabricado a mano cada gota del cauce, de modo que la máquina no pueda computar nada fuera de la experiencia física y conceptual de quien lo hizo. El tiempo biológico de una temporada de floración, el trabajo muscular de fotografiar diez mil flores, el criterio subjetivo de cada etiqueta: todo eso queda sellado en el dato, y el algoritmo no puede sino reproducirlo, transformado.

3. Tres variaciones sobre la decisión en el sustrato

Ridler es el caso más radical, pero no el único que desplaza la decisión hacia el origen. Otros tres artistas operan sobre el sustrato, cada uno de un modo.

Memo Akten, en Learning to See, no fabrica el dato pero diseña el sesgo. Toma un flujo de vídeo en vivo de objetos cotidianos —una sábana, unos cables, unas manos— y lo hace interpretar por una red entrenada con datasets temáticos ajenos: olas, fuego, nubes, flores. La sábana roja en movimiento se convierte en el avance de un incendio. La decisión de Akten está en el acoplamiento deliberadamente disonante entre el estímulo físico y el prejuicio del modelo. No modula la salida: configura de antemano cómo la máquina malinterpretará, y con ello expone que la visión algorítmica nunca es neutral, que es un reflejo estricto de la memoria visual que le impusieron. El excedente está en el diseño del sesgo, no en el retoque del resultado.

Mario Klingemann, en Memories of Passersby I —su obra propia, un sistema autónomo alojado en una consola de madera que genera rostros que nunca se repiten—, interviene en el entrenamiento. Construyó una interfaz binaria, tipo Tinder, para revisar a mano miles de variantes generadas por las redes y seleccionar las que se alineaban con su criterio, fuertemente marcado por el surrealismo de Max Ernst y la “belleza convulsiva” de Breton. No toca el píxel en tiempo real: actúa como criador de la genética matemática del sistema, sembrando un desvío estético hacia la deformación para evitar que la red converja en retratos fotorrealistas perfectos y estériles. El excedente está en la selección que orienta la evolución del sistema.

Trevor Paglen, en ImageNet Roulette —con Kate Crawford—, hace el movimiento inverso a todos los demás: no esculpe el dato para producir una imagen, lo desmantela para exponerlo. Su instalación procesaba los rostros del público con el motor de ImageNet y estampaba sobre ellos las categorías que los desarrolladores habían asignado de forma invisible a esos patrones —con frecuencia racistas, misóginas, herederas de la frenología decimonónica—. La decisión de Paglen está en el encuadre epistémico: desclasificar visualmente el sustrato ideológico del dato, forzar a mirar los sesgos políticos fosilizados en la materia prima que la infraestructura militar-comercial usa para categorizar a las personas. No produce excedente estético: produce transparencia crítica. Es el reverso necesario de esta línea —recuerda que el dato nunca es neutral, y que trabajar con él es trabajar con su política—.

Fabricar (Ridler), sesgar (Akten), seleccionar (Klingemann), desmantelar (Paglen). Cuatro maneras de que la decisión humana resida en el sustrato, no en la salida. Cuatro maneras de que el algoritmo deje de ser agente creador y vuelva a ser lo que es: un motor que opera sobre lo que un humano ya decidió.

4. El dato corpóreo: una laguna y un programa

Lo que el caso de Ridler abre, y la teoría todavía no ha pensado, es el estatuto del dato cuando se fabrica a mano.

La teoría del arte de datos asume, casi sin excepción, que el dato es un flujo incorpóreo: algo que se extrae, se descarga, se procesa, pero que existe antes y fuera del artista. Bajo ese supuesto, el dato no tiene cuerpo, no tiene autor, no tiene tiempo biológico. Es pura información disponible. Y la práctica de Ridler refuta ese supuesto en acto: su dataset tiene cuerpo —diez mil fotografías físicas—, tiene tiempo —una temporada de floración—, tiene trabajo muscular y tiene una autoría tan deliberada como la de cualquier obra. El dato, aquí, no es abstracción informática: es materia condicionada por el trabajo físico, el tiempo y el criterio de quien lo produjo.

No existe, hasta donde he podido rastrear, una teoría estética del dato corpóreo o del slow data: del dataset producido como una escultura o un grabado, lentamente, a mano, como obra antes que como insumo. La teoría de los nuevos medios teoriza el dato encontrado; no el dato fabricado. Y esa laguna no es menor, porque toca el corazón de la pregunta de esta línea. Si el excedente humano puede residir en el sustrato —si está en cómo se fabrica el dato y no solo en cómo se modula la salida—, entonces buena parte del debate sobre la autonomía creativa de los sistemas generativos está mal planteado. No se trata de cuánta libertad tiene el algoritmo, sino de cuánto de la obra ya estaba decidido antes de que el algoritmo se encendiera.

Ese es el eje que Cosmic Data LAB quiere desarrollar. El primer texto situó el excedente en la modulación de la salida. Este lo sitúa en la fabricación del sustrato. Entre los dos, una hipótesis que recorre la línea: que en el arte de datos, como en cualquier arte, lo decisivo no es quién o qué ejecuta la forma final, sino dónde se produce la diferencia que el sistema no puede reabsorber. A veces al final de la cadena. A veces, como en los diez mil tulipanes de Ridler, mucho antes de que la cadena empiece.

Este cuaderno queda abierto, como siempre, a quien quiera intervenir —desde el arte de datos, los estudios de software, la estética computacional o la práctica.

Fuentes

Ridler, A. (2018). Myriad (Tulips) y Mosaic Virus. Documentación de proyecto y declaraciones metodológicas de la artista. https://annaridler.com/works/myriad-tulips

Akten, M., Fiebrink, R., & Grierson, M. (2019). Learning to See: You Are What You See. arXiv:2003.00902. https://arxiv.org/abs/2003.00902

Klingemann, M. (2018). Memories of Passersby I. Sotheby’s, Contemporary Art Day Auction (Lot 109, 2019), nota de catálogo y documentación técnica. Onkaos.

Crawford, K., & Paglen, T. (2019). Excavating AI: The Politics of Images in Machine Learning Training Sets. AI Now Institute, New York University. https://excavating.ai

Manovich, L. (2001). The Language of New Media. Cambridge, MA: MIT Press.

Esteban Ruiz, J. A. Lo que el artista hace cuando ya no hace la obra. Cuaderno público en juanesteban.art, 2026.

Esteban Ruiz, J. A. Art as Structural Surplus: Toward a Relational Ontology Beyond Human Authorship (V2.3). PhilArchive y Zenodo, 2026.