
https://content.magnumphotos.com/wp-content/uploads/2021/08/MG172466-1280×853.jpg
Jonas Bendiksen. Veles, 2019. | Magnum Photos
En su apariencia más inmediata, fotografía y sintografía comparten un territorio engañosamente común: el de las representaciones visuales estáticas, monocópicas, formal y estéticamente muy próximas en no pocos casos, hasta el punto de confundirse en una primera mirada distraída.
En su apariencia más inmediata, fotografía y sintografía comparten un territorio engañosamente común: el de las representaciones visuales estáticas, monocópicas, formal y estéticamente muy próximas en no pocos casos, hasta el punto de confundirse en una primera mirada distraída. Ambas se presentan como superficies organizadas según convenciones ópticas heredadas y participan de una misma economía de la imagen que privilegia la claridad, la coherencia y la ilusión de profundidad. Se trata, en ambos casos, de imágenes bidimensionales que pueden materializarse o visualizarse en infinitas pantallas y soportes; sin embargo, esta coincidencia superficial exige una reflexión más profunda sobre las condiciones de posibilidad de su existencia.
Y es que, antes de cualquier disputa estética, el conflicto entre fotografía y sintografía —o fotografía generativa, como también proponen algunos denominar a las imágenes de origen algorítmico que emulan los rasgos formales de la fotografía convencional— es un choque entre regímenes de existencia. Por un lado, la imagen nacida del bombardeo fotónico que hiere la superficie del mundo y erosiona dulcemente el soporte fotosensible, huella material de un encuentro irrepetible; por el otro, la imagen generada por una entelequia maquinal que no ha visto ni tocado nada, pero que calcula como si recordara. La cámara registra porque algo fue; la IA produce porque algo podría haber sido. En esa asimetría se abre una grieta ontológica imposible de suturar: la fotografía se ancla en el encuentro entre luz, tiempo y materia, mientras la imagen sintética flota en un espacio sin cuerpos, donde la verosimilitud sustituye a la experiencia y la apariencia suplanta al acontecimiento.
La cámara fotográfica captura una astilla de lo sensible y congela un instante que, por naturaleza, pertenece al flujo continuo del tiempo. Toda imagen resultante de un acto fotográfico se sostiene sobre una tríada elemental: un tiempo irrepetible que acontece en la realidad física; un espacio tridimensional donde los cuerpos ocupan lugar; y una luz que los vuelve visibles y registrables. Cuerpo, espacio y luz configuran —utilizando la terminología propuesta por Roland Barthes— el spectrum, ese contenido visual que testimonia un fragmento del mundo.
Por el contrario, las imágenes generadas de forma artificial emergen de un proceso radicalmente distinto. Las unidades de procesamiento gráfico que las urden operan mediante una enorme potencia de cálculo distribuida, estimando probabilidades de color y forma en millones de píxeles de manera simultánea. Este prodigio computacional, sustentado en arquitecturas de tensor processors y matrices matemáticas de alta dimensión, da lugar a imágenes que no derivan de una captación del mundo, sino de una inferencia estadística. Sus referentes no son acontecimientos, sino conjuntos masivos de datos: el dataset de entrenamiento, compuesto por miles de millones de imágenes previamente parametrizadas. El modelo ajusta pesos y sesgos, aprendiendo correlaciones entre formas, estilos y descripciones lingüísticas. Así, lo que la IA modeliza no es el mundo, sino la distribución de sus representaciones. En muchos sistemas, este proceso adopta la forma de modelos de difusión: la imagen se origina a partir de un campo de ruido aleatorio que, guiado por un prompt, es progresivamente refinado. En cada iteración, el sistema reduce la incertidumbre hasta hacer emerger una configuración visual coherente con la descripción solicitada. La imagen final no es, por tanto, la huella de una presencia, sino la resolución de una probabilidad bajo demanda.
Los motores de generación de imágenes sintéticas recomponen un espejo hecho añicos: ensamblan esquirlas de reflejos pretéritos y amalgaman fragmentos de mundos que alguna vez comparecieron en una imagen. La sintografía opera de forma mecánica —si x, entonces y—, predecible y replicable, como una cadena de montaje de verosimilitudes sin memoria. Ahí reside la diferencia radical respecto a la fotografía: las imágenes generadas mediante algoritmos no requieren ningún referente autónomo, tridimensional y físico como condición de existencia, así como tampoco precisan de una mirada encarnada que registre esa conjunción irrepetible.
Pero no por ello la fotografía queda automáticamente investida de verdad. Quienes, ante el auge de herramientas como Nano Banana, DALL·E o Midjourney, apelan con candidez —y cierta nostalgia mal disimulada— a la supuesta ecuanimidad y veracidad de la imagen fotográfica, pasan por alto la constitutiva parcialidad, la latente mentira, la inevitable traición del medio. El hecho es que la cámara —ese dispositivo ciclópeo de captación, siempre manejado por un sujeto situado— no traduce la realidad: la negocia. Se interpone entre mundo y representación, filtrando, parcelando y transformando. Toda fotografía queda atravesada por una doble mediación: la del aparato y la de quien lo opera.
Cada decisión técnica implica, en efecto, la construcción de una mirada: no hay ajuste inocente, solo elecciones que recortan, jerarquizan y fijan sentido. Joan Fontcuberta lee estas operaciones como microintervenciones consustanciales al gesto fotográfico, pequeñas inflexiones donde ya se decide el sentido de la imagen:
La elección entre diversas posibilidades representa una pequeña ‘manipulación’: encuadrar es una manipulación, enfocar es una manipulación, seleccionar el momento del disparo es una manipulación… La suma de todos esos pasos se concreta en la imagen resultante, una ‘manipulación’ sin paliativos. Crear equivale a manipular, y el mismo término de ‘fotografía manipulada’ constituye una flagrante tautología. La noción de manipulación quedaba así rehabilitada, desprovista así de intención perversa, pasaba a adoptar un tono ostensiblemente neutro. En definitiva la manipulación se presentaba como una condición sine qua non de la creación.1
La técnica fotográfica no genera, por tanto, un reflejo mimético de la realidad, sino una interpretación de ella, filtrada por la cultura y el tiempo en que se inscribe el acto fotográfico. Cada decisión, desde la elección de la distancia focal hasta el ajuste de la exposición, está impregnada de las convenciones visuales de una época y de la idiosincrasia personal del fotógrafo. Los procesos de encuadrado, exposición, enfoque y procesado desmontan la idea de la fotografía como medio neutro de registro, desvelándola como un instrumento contundente para la construcción de relatos, identidades e imaginarios visuales.
Si algo persiste como núcleo irreductible de lo fotográfico es precisamente esa fricción con lo real que, aun mediada, no puede abolirse: la fotografía sigue siendo una tecnificación de la ventana albertiana, heredera de un dispositivo perspectivo que ya nació como artificio, como ilusión ordenada del mundo, pero que exige todavía un afuera que la sostenga, un acontecimiento que la provoque. Su carácter falsario no la invalida; al contrario, la define como una ficción con anclaje, una ilusión que ha rozado la materia. La sintografía, en cambio, ensaya otra lógica: la de un imposible kintsugi que recompone un espejo roto cuyos fragmentos nunca pertenecieron a una totalidad previa, cuyas grietas no remiten a ninguna caída original. Donde la fotografía transforma lo que ha sido, la imagen algorítmica fabrica lo que nunca ha ocurrido, ensamblando discontinuidades con la precisión fría de lo estadístico. Entre ambas no media solo una diferencia de grado, sino de naturaleza: una todavía negocia con el mundo; la otra lo suplanta sin haberlo conocido.
1 Joan Fontcuberta, El beso de Judas. Fotografía y verdad (Barcelona: Gustavo Gili, 1996): 126-127.
Juan José Mateos
