ESTA HERRAMIENTA AYUDARá A MEJORAR EL APRENDIZAJE DEL ESPAñOL EN TODO EL MUNDO

El Instituto Cervantes y la Universidad de Santiago presentaron el Corpus de Aprendices de Español

El Instituto Cervantes ha elaborado, en colaboración con la Universidad de Santiago de Compostela, un Corpus de Aprendices de Español como lengua extranjera (CAES) que será una herramienta de gran utilidad y de acceso libre para todos los profesionales de la enseñanza del Español como Lengua Extranjera (ELE), lo que contribuirá a mejorar el aprendizaje del español en todo el mundo.

cronicas Santiago Universidad Cervantes instituto presentaron

El Instituto Cervantes y la Universidad de Santiago presentaron el Corpus de Aprendices de Español

Redacción, Madrid

13/02/15 - 15:42

Cervantes-Corpus Aprendices — De izda. a dcha., Julio Martínez Mesanza, Víctor García de la Concha, Álvaro García Santa-Cecilia y Guillermo Rojo, durante la presentación.

Profesores, investigadores, evaluadores, autores de materiales didácticos y responsables de entidades lingüísticas, entre otros profesionales, encontrarán en el CAES información práctica sobre las dificultades que encuentran los estudiantes de español, los errores más comunes, el vocabulario que emplean en mayor o menor medida, etc. Esta amplia información, obtenida a partir de datos sólidos y objetivos, facilitará el trabajo de los profesionales en las aulas, en la investigación, en la elaboración de textos o en otros cometidos relacionados con la enseñanza del español para extranjeros.

Este viernes han presentado el CAES Víctor García de la Concha, director del Instituto Cervantes; Guillermo Rojo, catedrático de Lingüística de la Universidad de Santiago de Compostela; Julio Martínez Mesanza, director académico del Cervantes; y Álvaro García Santa-Cecilia, jefe del departamento de Ordenación y proyectos académicos.

García de la Concha ha destacado la labor de Guillermo Rojo, quien ha diseñado y desarrollado esta investigación y cuya labor de informatización de la Real Academia Española permitió la creación de los sucesivos corpus de esta institución: el CORDE (Corpus Diacrónico del Español), el CREA (Corpus de Referencia del Español Actual) y el CORPES (Corpus del Español).

El nuevo CAES del Instituto Cervantes supone un paso importante en el proceso de digitalización de la institución y una apuesta por las tecnologías más avanzadas en beneficio de la lingüística y la promoción del español. En esta línea se inscriben otras iniciativas como el nuevo AVE Global (los cursos para aprender español a través de dispositivos móviles), el certificado de español SIELE, que se presentará en la feria de Boston del mayo próximo, o la creciente oferta de cursos formativos en línea para profesores de español.

Muestras en 28 centros y 7 universidades

Un corpus es un conjunto de textos en formato electrónico que han sido reunidos en una aplicación informática para facilitar el estudio de la lengua o variedad lingüística de la que esos textos han sido extraídos. Un ‘corpus de aprendices’ –como éste– contiene textos producidos por personas que están aprendiendo otra lengua, en este caso, el español.

Desde octubre de 2011 hasta septiembre de 2013, el Instituto Cervantes llevó a cabo la recogida sistemática de muestras de lengua entre estudiantes de español en 28 centros de todo el mundo, lo que supuso una gran implicación del profesorado. También participaron cinco universidades de España (las de Alcalá, León, Salamanca, Santiago y Vigo), de Estados Unidos (Universidad de Washington, Seattle) y de Portugal (Universidade do Minho).

Los estudiantes procedían de seis lenguas de origen diferentes –árabe, chino mandarín, francés, inglés, portugués y ruso– y contaban con distintos grados de dominio lingüístico (niveles A1 a C1 del Marco común europeo de referencia). Los datos han sido recogidos, compilados y tratados con una herramienta informática creada para esta iniciativa.

El Corpus contiene muestras producidas por 1.423 estudiantes, que escribieron dos o tres textos cada uno, lo cual arroja un total de 3.878 tareas integradas. Comprende casi 575.000 elementos lingüísticos, con una distribución que atiende a todos los niveles de español adquiridos y las seis lenguas iniciales mencionadas.

La información ya puede consultarse a través de una aplicación de fácil manejo que permite seleccionar los datos según los parámetros utilizados en la configuración del corpus: nivel adquirido de conocimiento de español, lengua familiar, país de residencia, edad y sexo. Las consultas pueden ser simples o combinadas con distintas variables.