El nuevo sistema de IA se inspira en los humanos: cuando un humano ve el color de un objeto, podemos aplicarlo fácilmente a cualquier otro sustituyendo el color original por el nuevo. Crédito: Chris Kim

Una nueva Inteligencia Artificial (IA) puede “imaginar” un objeto nunca visto

19 de julio de 2021|Historia original de la Universidad del Sur de California

Imagínese un gato naranja. Ahora, imagínese al mismo gato, pero con pelaje negro carbón. Ahora, imaginen al gato pavoneándose a lo largo de la Gran Muralla China. Haciendo esto, una serie rápida de activaciones neuronales en su cerebro llegará a variaciones de la imagen presentada, basado en su conocimiento previo del mundo.
En otras palabras, como humanos, es fácil imaginar un objeto con diferentes atributos. Pero, a pesar de los avances en las redes neuronales profundas que igualan o superan el rendimiento humano en ciertas tareas, las computadoras todavía luchan con la habilidad muy humana de la "imaginación".

Ahora, un equipo de investigación de la USC ha desarrollado una IA que utiliza capacidades similares a las humanas para imaginar un objeto nunca visto con diferentes atributos. El artículo, titulado Zero-Shot Synthesis with Group-Supervised Learning, fue publicado el 7 de mayo en la Conferencia Internacional sobre Representaciones de Aprendizaje 2021.

Nos inspiramos en las capacidades de generalización visual humana para tratar de simular la imaginación humana en máquinas”, dijo el autor principal del estudio, Yunhao Ge, un estudiante de doctorado en ciencias de la computación que trabaja bajo la supervisión de Laurent Itti, profesor de ciencias de la computación.

Los seres humanos pueden separar su conocimiento aprendido por atributos -por ejemplo, forma, pose, posición, color- y luego recombinarlos para imaginar un nuevo objeto. Nuestro artículo intenta simular este proceso utilizando redes neuronales”.

El problema de generalización de la IA

Por ejemplo, supongamos que desea crear un sistema de IA que genere imágenes de automóviles. Idealmente, usted proporcionaría el algoritmo con algunas imágenes de un coche, y sería capaz de generar muchos tipos de coches --de Porschs a Pontiacs o camionetas-- de cualquier color, desde múltiples ángulos.

Este es uno de los objetivos largamente buscados de la IA: crear modelos que se puedan extrapolar. Esto significa que, dados algunos ejemplos, el modelo debería ser capaz de extraer las reglas subyacentes y aplicarlas a una amplia gama de ejemplos novedosos que no ha visto antes. Pero las máquinas se entrenan más comúnmente en características de muestra, píxeles, por ejemplo, sin tener en cuenta los atributos del objeto.

La ciencia de la imaginación

En este nuevo estudio, los investigadores intentan superar esta limitación mediante el uso de un concepto llamado desenredo. El desenredo se puede utilizar para generar ‘falsificaciones profundas’, por ejemplo, desenredando los movimientos del rostro humano y la identidad. Al hacer esto, dijo Ge, “las personas pueden sintetizar nuevas imágenes y videos que reemplazan la identidad de la persona original con otra persona, pero mantienen el movimiento original”.

De manera similar, el nuevo enfoque toma un grupo de imágenes de muestra, en lugar de una muestra a la vez como lo han hecho los algoritmos tradicionales, y extrae la similitud entre ellas para lograr algo llamado “aprendizaje de representación de desenredados controlables”.

Luego, recombina este conocimiento para lograr una "síntesis de imágenes novedosas controlables", o lo que podríamos llamar imaginación. “Por ejemplo, tome la película Transformer”, dijo Ge, “Puede tomar la forma de un automóvil Megatron, el color y la pose de un automóvil Bumblebee amarillo y el fondo de Times Square de Nueva York. El resultado será un coche Megatron del color del Bumblebee que conduce en Times Square, incluso si esta muestra no se vio durante la sesión de entrenamiento”.

Esto es similar a cómo extrapolamos como humanos: cuando un humano ve un color de un objeto, podemos aplicarlo fácilmente a cualquier otro objeto sustituyendo el color original por el nuevo. Utilizando su técnica, el grupo generó un nuevo conjunto de datos que contiene 1,56 millones de imágenes que podrían ayudar a futuras investigaciones en el campo.

Entendiendo el mundo

Si bien el desenredamiento no es una idea nueva, los investigadores dicen que su marco puede ser compatible con casi cualquier tipo de datos o conocimientos. Esto amplía la oportunidad de las aplicaciones. Por ejemplo, desenredar el conocimiento relacionado con la raza y el género para hacer una IA más justa eliminando por completo los atributos sensibles de la ecuación.

En el campo de la medicina, podría ayudar a los médicos y biólogos a descubrir medicamentos más útiles desenredando la función de la medicina de otras propiedades, y luego recombinándolas para sintetizar la nueva medicina. Imbuir a las máquinas de imaginación también podría ayudar a crear una IA más segura, por ejemplo, permitiendo que los vehículos autónomos imaginen y eviten escenarios peligrosos que antes no se habían visto durante el entrenamiento.

El aprendizaje profundo ya ha demostrado un rendimiento y una promesa insuperables en muchos dominios, pero con demasiada frecuencia esto ha sucedido a través de un mimetismo superficial y sin una comprensión más profunda de los atributos separados que hacen que cada objeto sea único”, dijo Laurent Itti. “Este nuevo enfoque de desentrañamiento, por primera vez, realmente desata un nuevo sentido de la imaginación en los sistemas de IA, acercándolos a la comprensión del mundo como la que tenemos los humanos".

Referencia

Ge Y, Abu-El-Haija S, Xin G, Itti L. Zero-shot synthesis with group-supervised learning. In: International Conference on Learning Representations; 2020. https://openreview.net/forum?id=8wqCDnBmnrT Accessed July 19, 2021.

Este artículo ha sido republicado a partir de los siguientes materiales. Nota: el material puede haber sido editado por su longitud y contenido. Para más información, ver la fuente citada.

 




El contenido al que intenta acceder no se encuentra disponible para su dispositivo.

En breve este contenido estará disponible.