MADRID, 26 May. (Portaltic/EP) -
La Real Academia Española (RAE) y Amazon Web Services (AWS) han presentado la herramienta de análisis del español que han creado conjuntamente, con la que planean examinar decenas de miles de documentos de Internet a la vez con el fin de valorar el estado del español en el mundo.
La herramienta se ha desarrollado a partir de las tecnologías nativas de la nube de AWS y con el asesoramiento de la RAE, y se ejecuta en tres fases, lo que permite que pueda trabajar con millones de documentos devolviendo resultados en muy poco tiempo.
Actualmente se ha probado con 8.745.563 textos digitales del español espontáneo de España y todos los países hispanohablantes de América, procedentes de redes sociales, foros o plataformas de venta en línea. También se ha incluido una representación de textos periodísticos para poder observar las diferencias entre un tipo de lenguaje y otro.
Con ella se busca valorar el estado del español en el mundo, analizar la claridad del lenguaje administrativo, comprar la calidad del español por épocas o detectar errores comunes en asistentes de voz y otros dispositivos de IA. En su fase inicial permite identificar extranjerismos, medir la riqueza léxica de un escrito y detectar errores lingüísticos, como informan en un comunicado conjunto.
La colaboración entre la RAE y AWS se enmarca en el proyecto Lengua Española e Inteligencia Artificial (LEIA). La acción busca aplicar la IA al español para hacer un análisis de su situación actual, cuidar su uso y velar por la unidad de la lengua en todos los ámbitos, especialmente en el digital.
La herramienta se ha presentado este jueves, en la sede de la Academia, en un acto que ha sido clausurado por la secretaria de Estado de Digitalización e Inteligencia Artificial, Carme Artigas, quien ha adquirido el compromiso de "apoyar con 5 millones de euros el proyecto LEIA" desde la Secretaría.
"La lengua española aplicada a la IA va a ser un activo económico sin precedentes. Tenemos 600 millones de hispanohablantes y estamos decididos a impulsar el desarrollo de esta industria. En el PERTE hemos dedicado 100 millones de euros para el desarrollo de este corpus y 200 millones más para impulsar una industria que desarrolle aplicaciones de IA en español", ha apostillado.