La IA de Microsoft que describe de forma automática las imágenes es más precisa que los humanos

Modelo de IA para la descripción automática de imágenes
Modelo de IA para la descripción automática de imágenes - MICROSOFT
Publicado: jueves, 15 octubre 2020 9:44

   MADRID, 15 Oct. (Portaltic/EP) -

   El nuevo sistema de inteligencia artificial (IA) que Microsoft emplea para poner las descripciones automáticas de las imágenes es capaz de realizar esta tarea con más precisión que los humanos, según informa la compañía.

   Microsoft ha presentado el nuevo modelo de IA que emplea para las descripciones automáticas de imágenes. Para su desarrollo, el equipo responsable ha utilizado un conjunto de imágenes emparejadas con etiquetas, cada una de ellas asignada a un objeto específico de la imagen.

   La diferencia en este modelo es que no han empleado descripciones completas, sino etiquetas, ya que estas últimas son "más eficientes" y permiten "introducir muchos datos al modelo", explican en el blog oficial.

   De esta forma han podido "preentrenar" al modelo con vocabulario visual, es decir, para que identifique palabras individuales con las imágenes correspondientes. Posteriormente, lo han ajustado para las descripciones sobre un conjunto de descripciones de imágenes, con lo que aprende a redactar una frase.

   Este enfoque de aprendizaje permite que el modelo, cuando está ante una imagen con nuevos objetos, "aproveche el vocabulario visual para generar una descripción precisa". La compañía asegura que ante imágenes sin descripciones, la IA es capaz de generar descripciones más precisas que las que fueron escritas por personas.

   Este nuevo modelo es, además, el doble de preciso que el que la compañía ha estado utilizando desde 2015 en sus productos y servicios.

   "El uso de subtítulos de imágenes para generar una descripción de la foto, conocido como texto alternativo, en una página web o documento es especialmente importante para las personas ciegas o con escasa visión", ha señalado el responsable de ingeniería de software del grupo de Plataformas de Inteligencia Artificial de Microsoft, Saqib Shaikh.

   Desde Microsoft han acelerado la implantación del nuevo modelo en Azure, donde está disponible en Cognitive Services, y también en Seeing AI, la app que facilita el reconocimiento y descripción del entorno a personas ciegas. A finales de año también llegará a Word y Outlook, para Windows y Mac, y PowerPoint para Windows, Mac y web.

Leer más acerca de: