Idioma: Español
Fecha: Subida: 2021-04-11T00:00:00+02:00
Duración: 14m 59s
Lugar: Conferencia
Visitas: 1.164 visitas

Análisis de los inventarios léxicos del Plan curricular del Instituto Cervantes: detección de (...)

Alicia San Mateo Valdehíta y Marc Rodius (Universidad Nacional de Educación a Distancia -UNED-)

Descripción

En el ámbito de la Enseñanza de Lenguas Asistida por Ordenador (CALL), existen herramientas
para dotar de autonomía al estudiante de español como L2 y ayudarlo en el desarrollo de la
destreza escrita, entre ellas el corrector ortográfico y gramatical que es objeto de este análisis. La
herramienta ha sido desarrollada en la Universidad [omitida] y basa su funcionamiento en el
análisis estadístico de frecuencias de un corpus de textos de cien millones de palabras. La
estadística sustituye al etiquetado de las palabras y al análisis morfosintáctico empleado por otros
correctores como Stilus® (Villena et al., 2002) o SpanishChecker® (Nadasdi y Sinclair, 2001-
2015), destinados al aprendiz de EL2 y disponibles en línea.
Numerosos estudios avalan la validez de los métodos estadísticos, pero han sido aplicados, sobre
todo, a programas destinados al estudiante de inglés para ayudarlo con la redacción de textos, en
general (Chacón-Beltrán, 2007, 2008, 2016; Chen, 2009; Briscoe, Medlock y Andersen, 2010;
Gamon et al., 2009; García-Heras, 2007; Hernández, 2012; Lawley, 2015a, 2015b; Moré, 2006),
o específicamente centrados en las redacciones del examen del TOEFL, como ALEK (Chodorow
y Leacock, 2000); o en la detección de un error concreto relacionado con las preposiciones (Wu y
Su, 2006) o con el orden de palabras en la oración (Athanaselis, Bakamidis y Dologlou, 2006;
Lin, Soe y Thein, 2011).
En el caso del español, Nazar y Renau (2012) proponen la utilización del corpus Google Books
N-gram, y San-Mateo (2016, 2018) aplica el análisis a una herramienta destinada a la corrección
de textos escritos por hablantes nativos de español y analiza las posibilidades de la
retroalimentación pedagógica en la L2.
El corrector analizado compara la frecuencia de las palabras y de los pares de palabras que
integran el texto que queremos corregir con la frecuencia de esas mismas palabras y pares en el
corpus de referencia. Siguiendo este procedimiento, se descubren aquellas unidades y
combinaciones cuya frecuencia es muy baja o que no aparecen en el corpus. Generalmente, la
escasa o nula frecuencia indica que existe algún error.
Para determinar su eficacia se han seleccionado redacciones incluidas en el Corpus para el
análisis de errores de aprendices de E/LE (CORANE) (Cestero et al., 2001; Cestero y Penadés,
2009) escritas por estudiantes de EL2, de nivel B2 ―según el MCER (Consejo de Europa,
2002)― y cuya lengua materna es el inglés. El objetivo es comprobar qué errores detecta el
corrector y cuáles no, y en qué medida se dan falsos positivos y falsos negativos. Del análisis de
los diferentes tipos de errores relacionados con la ortografía (puntuación o tildes) y la sintaxis
(preposiciones, concordancia, calcos sintácticos, etc.), se desprende que el nivel de detección es
elevado. Los resultados indican una precisión (relación entre los errores reales detectados y el
total de errores marcados) superior al 50 % y una cobertura (relación entre los errores reales
detectados y el total de errores existentes) del 80 %. No obstante, existen limitaciones como la
derivada de la segmentación en pares de palabras en lugar de combinaciones más extensas y de la
extensión del corpus de referencia, que no incluye topónimos y extranjerismos frecuentes. La
herramienta se muestra adecuada para la mejora de la expresión escrita del aprendiz de EL2 y de
la fluidez gracias al contacto con expresiones frecuentes y colocaciones usadas por los nativos.

Propietarios

Congreso Cilc 2021

Comentarios

Nuevo comentario

Serie: CILC2021: Los corpus y la adquisición y enseñanza del lenguaje / Corpora, LA and teaching (+información)