¿Qué son las redes generativas antagónicas?

Tigo Panamá | 21 de diciembre, 2020

¿Qué son las redes generativas antagónicas?

Comparte

Las redes generativas antagónicas (GANs´/Generative Adversary Networks en inglés) son un tipo de algoritmos de inteligencia artificial que combinan el aprendizaje profundo y permiten la generación de datos a partir de ejemplos. ¿Ha escuchado acerca de las GANs? ¿Las ha visto funcionar? ¿Por qué investigar sobre ellas? ¿Qué debería saber?

Como resultado, de esas interrogantes, en este artículo veremos cómo surgen las redes generativas antagónicas, sus usos y sus riesgos.

Primero, las GANs se utilizan en el aprendizaje no supervisado. En segundo lugar, son implementadas por un sistema de dos redes neuronales que compiten mutuamente en una especie de juego de suma cero. ¿Aún no lo tiene claro?

Sin dudas, un ejemplo le ayudará a comprenderlas mejor. Probablemente, las haya visto funcionar, porque a finales del 2018 apareció un sitio que genera rostros de personas que no existen. Por su parte, el sitio muestra caras tan reales que se hace imposible diferenciar fotos de personas de una imagen creada desde cero por un algoritmo.

Nos referimos a algoritmos capaces de generar una fotografía a partir de rasgos de varias personas, dando como resultado, una imagen que simula ser una persona viva, pero que en realidad no existe. Por ello, surgen preguntas incomodas ¿De que son capaces las redes generativas antagónicas? ¿La inteligencia artificial puede ser creativa e inventar cosas?¿Con qué finalidad se utilizan? ¿Hasta dónde pueden llegar?

Investigando las Redes Generativas Antagónicas

A pesar de, lo novedoso el ejemplo de las personas que no existen (creadas por IA) es solo una pequeña muestra de lo que pueden hacer. De igual manera, subrayamos que los sistemas de inteligencia artificial en las GAN´s interactúan entre sí para generar algo completamente nuevo.

¿Hace cuánto existen las redes generativas antagónicas? Realmente, hace poco, fueron develadas en 2014. Así, luego de intensos estudios se publica su investigación con el título «Generative Adversarial Nets» . Finalmente, Ian J. Goodfellow y su equipo de investigadores presentaron el White Paper que las dio a conocer.

«Proponemos un nuevo marco para la estimación de modelos generativos a través de un proceso de confrontación, en el que entrenamos simultáneamente dos modelos: un modelo generativo G
que captura la distribución de datos, y un modelo discriminativo D que estima
la probabilidad de que una muestra provenga de los datos de entrenamiento en lugar de G.»

Generative Adversarial Nets | WHITE PAPER | UNIVERSIDAD DE MONTREAL

Seguramente, se pregunte ¿Quién es Ian J. Goodfellow? es un investigador que trabaja en aprendizaje automático y que ha logrado:

  • Inventó las redes generativas antagónicas.
  • Autor principal del libro de texto Deep Learning.
  • Desarrolló el sistema que permite a a Google Maps transcribir automáticamente las direcciones de las fotos tomadas por los autos de Street View.
  • Demostró a Google las vulnerabilidades de seguridad de los sistemas de aprendizaje automático.

También, Goodfellow, es el director de Machine Learning en Apple-Special Projects Group y continua investigando sobre este fascinante mundo.

¿Para qué sirven las redes generativas antagónicas?

Más allá de la manipulación de imágenes que han explotado las aplicaciones de filtros de edad, expresión y cambio de sexo, las GAN´s tienen usos interesantes.

Por su parte, y en palabras de su inventor sirven para «ofrecer mucho más a los seres humanos, ya que pueden crear objetos que se pueden utilizar en el mundo real.»

Asi mismo, sirven para crear imágenes realistas de buena resolución utilizando un único generador y se aplican en:

  • Industria de los videojuegos.
  • Diseño gráfico (generar a partir de imágenes de baja resolución, imágenes de alta resolución.)
  • Creación de personajes de caricaturas.
  • Diseño de logotipos.
  • Diseño de rostros de personajes.
  • Identificación de imágenes.
  • Industria cinematográfica.
  • Investigación médica.
  • Proyectos de ingeniería y arquitectura.

«Puede que no piense que los programadores son artistas, pero la programación es una profesión extremadamente creativa. Es creatividad basada en la lógica.»

John Romero

Con certeza, podemos esperar que esta tecnología se incluya aún más en los teléfonos inteligentes, tanto en fotografía como en otros servicios.

Lea un poco más sobre: sectores en transformación con inteligencia artificial

 ¿Ventajas y desventajas de las Redes Generativas Antagónicas ?

El potencial de las GAN´s para el bien y el mal es enorme. De hecho, pueden aprender a imitar cualquier distribución de datos. En otras palabras, se les puede enseñar a crear mundos tan similares al nuestro. Precisamente, inquietan a los humanistas porque influyen en la comunicación y el lenguaje: imágenes, música, habla, prosa.

«El lenguaje crea realidades, hace que sucedan cosas, porque los seres humanos son seres lingüísticos.»

-José manuel briceño guerrero

¿Se imagina si las utilizan personas inescrupulosas? Acertó, podrían usarse para delitos, para manipulación y control. Sobre todo, porqué, sin un ojo entrenado o sin conocimiento cualquier persona considera el producto de las GAN´s algo verdadero.

Ciertamente, las redes generativas antagónicas según dice John Romero, son algo así como «artistas robots, altamente capaces y su generación de contenido de calidad es impresionante». Pero, por otro lado, se pueden usar para generar contenido multimedia falso, y son la tecnología que sustenta los Deepfakes que se han hecho virales.

¿Qué sucederá cuando estas redes se hagan más inteligentes y se perfeccionen? Aún no lo sabemos, pero si de algo estamos seguros es de no perderles la pista.

Por último, las redes generativas adversarias (GAN) son arquitecturas algorítmicas que utilizan dos redes neuronales, enfrentando una contra la otra para generar nuevas instancias sintéticas de datos que pueden pasar por datos reales. 

Para concluir, le recomendamos investigar más sobre los usos que se les puede dar en la generación de imágenes, de video y de voz.

Comparte

Comentarios