Espacios latentes

Las redes generativas adversarias –o GAN, según su acrónimo inglés– utilizan las posibilidades de las redes neuronales profundas –su capacidad de autoconfigurarse para realizar tareas concretas a partir de un corpus de ejemplos (el denominado dataset de entrenamiento)– para la generación de imágenes (también se pueden aplicar a la generación de textos o sonidos). Su Arquitectura interna se compone de dos redes, una que produce imágenes (la red generadora) y una que las valora como pertenecientes a la categoría del dataset de entrenamiento o no (la red discriminadora). Se trata de un juego en el cual ambas redes se van autoconfigurando una para conseguir imágenes que la otra juzgue como pertenecientes a las imágenes de entrenamiento y la otra para conseguir discernir mejor cuales lo serían y cuales no. En este proceso la red generadora produce imágenes cada vez más similares al corpus inicial.

Cuando este proceso de autoconfiguración ha terminado, lo que tenemos es una herramienta capaz de producir imágenes muy similares a las que le hemos proporcionado, pero que no se limitan a estas sino que podría generar variaciones infinitas. Las imágenes de entrenamiento forman parte, hipotéticamente, de las imágenes que puede generar la GAN entrenada, pero entre cada una de estas imágenes hay un número infinito de variaciones a la vez similares y diferentes.

Si imaginamos el hipotético corpus de todas las imágenes posibles que podría generar la red, podríamos pensarlo en un espacio de dos dimensiones donde las imágenes más similares estuvieran próximas entre ellas y donde, en consecuencia, podríamos transitar entre dos imágenes cualesquiera transformándolas lentamente una en la otra a partir de pequeñas diferencias. Una GAN entrenada contiene, en cierta manera, un espacio como este, pero no compuesto por dos dimensiones sino por muchas más (del orden de las centenas). El conjunto de estas dimensiones forma un entramado multidimensional donde cada imagen posible se puede entender como un punto en este sistema de coordenadas complejo; este entramado se denomina «espacio latente».