MADRID, 23 May. (Portaltic/EP) -
Meta ha desarrollado una serie de modelos de inteligencia artificial para preservar las lenguas que están en peligro de desaparición, que ya son capaces de abarcar 4.000 idiomas hablados de todo el mundo.
Los modelos de habla multilingüe masivos han expandido las tecnologías de texto a voz y de voz a texto de cien idiomas a más de 1.100, un salto que también se replica en la identificación de lenguas habladas, que ya alcanza las 4.000, "40 veces más que antes".
Así lo ha afirmado Meta, que ha compartido novedades este lunes sobre los modelos de inteligencia artificial en los que trabaja para preservar las lenguas que están en peligro de desaparición. La finalidad es que los usuarios puedan acceder a la información y usar su dispositivo en el idioma de su preferencia.
Con este objetivo, ha anunciado la apertura de sus modelos y códigos para que la comunidad de investigadores pueda colaborar con esta tarea, como recoge en un comunicado compartido en su blog oficial.
Asimismo, ha explicado el enfoque que han aplicado a los trabajos con los modelos de habla multilingüe masivos, que ha permitido el salto en la cantidad de idiomas que admite. Para ello, han recurrido a la Biblia, ya que se ha traducido a multitud de idiomas.
Las traducciones de la Biblia se han usado en la investigación de la traducción de idiomas basada en texto, y se acompañan de lecturas grabadas que están disponibles de forma pública. A partir de estos audios, Meta ha creado "un conjunto de datos de lecturas del Nuevo Testamento en más de 1.100 idiomas, que proporcionó un promedio de 32 horas de datos por idioma".
Para alcanzar la cifra de los 4.000 idiomas, consideraron también "grabaciones no etiquetadas de otras lecturas religiosas cristianas". Pese a ser contenido religioso, la compañía asegura que los modelos no presentan un sesgo para producir un lenguaje más religioso.
La compañía espera en un futuro ampliar el número de idiomas que los modelos de habla multilingüe masivos pueden soportar, e incorporar dialectos.