MADRID 14 Jun. (EUROPA PRESS) -
El director de la Real Academia Española (RAE), Víctor García de la Concha, y el presidente del Santander, Emilio Botín, han firmado hoy un acuerdo que recoge el apoyo del banco en la preparación del 'Corpus del Español del Siglo XXI', que amplía el banco de datos léxicos iniciado en 1986 con 'Corpus de Referencia del Español Actual (CREA)' y el del 'Corpus Diacrónico del Español (CORDE)'.
Se trata de un proyecto de la RAE en colaboración con las veintiuna instituciones que forman la Asociación de Academias de la Lengua Española. El trabajo servirá como fuente para los proyectos académicos y proporcionará materiales básicos para la investigación lexicográfica y gramatical del español.
Las Academias decidieron, en el reciente Congreso celebrado en Medellín en marzo de 2007, afrontar conjuntamente la construcción de un nuevo corpus del español, elaborado con 25 millones de formas para cada uno de los años comprendidos entre 2000 y 2011, y con una distribución de la procedencia de los textos del 30 por ciento para España y el 70 por ciento para América.
LOS ORÍGENES DEL IDIOMA
Con la creación del Corpus del Español del Siglo XXI, la RAE ampliará el banco de datos léxicos iniciado con la elaboración del CREA -que cuenta actualmente con más de 150 millones de formas léxicas procedentes de textos fechados a partir de 1975- y del CORDE, con cerca de 300 millones de formas desde los orígenes del idioma hasta 1974.
Ambos corpus, que permiten disponer de datos lingüísticos fiables, supusieron una modificación radical en el sistema de trabajo de la Real Academia Española y la Asociación de Academias de la Lengua Española.
Todas las obras publicadas por las Academias desde ese momento (la vigésima segunda edición del DRAE, el Diccionario panhispánico de dudas, el Diccionario del estudiante y, sobre todo, el Diccionario esencial), así como las que se encuentran actualmente en fase de preparación (la próxima edición del DRAE, la Nueva gramática de la lengua española y el Diccionario académico de americanismos), se han beneficiado de los datos contenidos en ambos corpus.
La construcción del 'Corpus del Español del Siglo XXI' se llevará a cabo con un equipo central, situado en la RAE, y un número relativamente amplio de equipos colaboradores, vinculados a diversas universidades de España y América.