OpenAI presenta DALL-E 2, su nueva IA que convierte las palabras en imágenes realistas

DALL-E 2.
DALL-E 2. - OPENAI.
Publicado: viernes, 8 abril 2022 14:17

   MADRID, 8 Abr. (Portaltic/EP) -

   OpenAI, empresa de investigación de la Inteligencia Articial (IA) sin ánimo de lucro cofundada, entre otros, por Elon Musk, ha presentado DALL-E 2, su nuevo sistema capaz de convertir palabras en imágenes realistas.

   DALL-E 2 puede crear imágenes "originales y realistas" además de arte partiendo de una descripción de texto, según informa OpenAI en su sitio web. La compañía afirma que esta IA permite la combinación de "conceptos, atributos y estilos".

   En base a la descripción de textos, DALL-E 2 es capaz de convertir palabras o descripciones como "un astronauta descansando en un resort tropical en el espacio" o "un bol de sopa dibujado en la pared de una cueva" en imágenes.

Además, esta IA es también capaz de editar fotografías en base a una petición escrita. Dentro de esta función entra la posibilidad de eliminar elementos como sombras, reflejos y texturas.

   Otra de las funciones de DALL-E 2 es la de crear "distintas variaciones" de una imagen inspirándose en la original como, por ejemplo, con icónicas obras de arte pictórico.

   La IA ha aprendido "la relación entre las imágenes y el texto usado para describirlas" gracias a un proceso llamado 'diffusion', que parte de un patrón de puntos aleatorios y gradualmente lo altera hasta convertirlo en una imagen cuando reconoce ciertos aspectos específicos.

   DALL-E 2 llega un año después del lanzamiento de DALL-E, que llegó en enero de 2021. Este nuevo sistema es capaz de "generar imágenes más realistas y precisas con cuatro veces más resolución".

   Al comparar uno y otro, los evaluadores de OpenAI prefirieron DALL-E 2 por su mayor precisión respecto al texto base (71,7%) y su fotorrealismo (88,8%) en base a comparar mil imágenes generadas por cada uno de los sistemas.

   OpenAI se refiere a DALL-E 2 como un proyecto de investigación que, por el momento, no está disponible en su interfaz de programación de aplicaciones (API). Además, asegura estar estudiando sus "capacidades y limitaciones con un selecto grupo de usuarios". En este sentido, ofrece la posibilidad de unirse a la lista de espera para probarlo.