Diario de León

Exempraes, la herramienta de la ULE que transforma la escritura académica en inglés

​La catedrática de la Universidad de León Ana I. Moreno lidera el proyecto ENEIDA, una iniciativa que está revolucionando la enseñanza y escritura académica a través de Exempraes, una herramienta que facilita a los investigadores españoles el acceso a la publicación científica internacional

La catedrática Ana I. Moreno posa en el parque de la Chantría en León.

La catedrática Ana I. Moreno posa en el parque de la Chantría en León.RAMIRO

Clara Barrio
Publicado por
León

Creado:

Actualizado:

En un mundo globalizado, saber inglés no es suficiente. Esta es una de las principales conclusiones que expone la catedrática de Filología Inglesa en la Universidad de León, Ana I. Moreno sobre los desafíos de los científicos españoles a la hora de publicar artículos científicos. “Dominar el inglés es un requisito básico, claro, pero los obstáculos comunicativos más importantes no suelen estar en la gramática o el vocabulario. Están en las diferencias culturales de cómo se organiza un artículo, cómo se presenta la propia investigación, cómo se manejan aspectos tan sensibles como el grado de confianza en las afirmaciones, la modestia, la autocrítica o la autopromoción académica», explica la experta.

Ejemplo de ello fueron las diferencias que pudo constar en un estudio realizado en los años 90 donde comparó artículos científicos originales en inglés y en español del área de economía y empresa. En el análisis, Moreno observó cómo los autores españoles tendían a presentar sus conclusiones con más firmeza que los autores que publicaban en revistas internacionales en inglés. ¿Cómo se notaba esto? A través de la utilización de expresiones como ‘por tanto, de todo esto se deduce que, o como se desprende del análisis realizado’, mientras que en inglés se empleaban fórmulas como ‘this suggests that, these results would appear to indicate, o it is likely that’. “Esta diferencia puede tener implicaciones importantes para establecer una relación adecuada con el lector: en el contexto internacional de publicación en inglés, una afirmación excesivamente categórica puede interpretarse como poco crítica o incluso como un intento de imponer una conclusión. Por ello, aunque en español se valore un estilo claro y directo, en inglés dicho estilo puede llegar a generar desconfianza o rechazo si se traslada literalmente”, relata la lingüista.

Desde hace años, la catedrática ha recopilado evidencias a través de encuestas, entrevistas y estudios comparados donde muestra este diagnóstico. Uno de los hitos fue una encuesta nacional a más de 1.700 investigadores en 2010, que confirmó que lo que más necesitaban no era ayuda con la corrección del inglés, sino con cómo reflejar mejor las convenciones de escritura esperadas por la revista en la que elegían presentar su investigación. “Es decir, necesitan ayuda para construir un texto que sea persuasivo ante un lector internacional”, puntualiza.

Ante esta problemática, la investigadora decidió crear un ambicioso programa de investigación junto a un equipo interdisciplinar que dio lugar al proyecto ENEIDA. Tiene dos objetivos: comprender las dificultades que afrontan los científicos españoles al redactar en inglés y diseñar herramientas que les ayudasen a superarlas desde un enfoque intercultural y empírico.

Esta iniciativa centró sus esfuerzos en recoger datos de manera coordinada a través de entrevistas en profundidad a investigadores de distintas áreas y cuestionarios a investigadores de varias instituciones para su posterior compilación en un corpus de pares de artículos comparables en inglés y en español gracias a la participación de informantes expertos. Del análisis retórico de los pares comparables de artículos de investigación empírica compilados nació el Corpus EXEMPRAES (artículos de investigación empírica ejemplares en inglés y español). Esta herramienta trabaja con unidades retóricas (y no solo léxicas como otras herramientas basadas en corpus) gracias a que cada proposición significativa de los artículos ha sido segmentada y anotada manualmente según su función comunicativa o retórica: presentar un resultado, comparar con autores previos, etc.

“Estos fragmentos textuales pueden explorarse filtrando por área de conocimiento, disciplina, apartado del artículo y función comunicativa. Y, lo que es más innovador, el corpus permite comparar directamente fragmentos equivalentes en inglés y en español, procedentes de artículos que son originales (no traducidos), por lo que se puede asumir que son reflejo fiel de la cultura académica escrita que representan. Al poder extraer todos los fragmentos que cumplen una misma función comunicativa en un mismo apartado del artículo y disciplina en las dos lenguas, es posible comparar los patrones retóricos, o secuencias de funciones comunicativas típicas, entre ellas”, detalla la doctora Moreno.

La interfaz pública y gratuita de momento ofrece, como prueba de concepto, diez pares de apartados de Discusión y Conclusión en las ciencias sociales que ya están plenamente anotados. Sin embargo, el corpus incluye 32 pares de artículos completos en una gran variedad de disciplinas.

Ana I. Moreno durante la presentación del proyecto en un Congreso Internacional sobre lingüística en Birmingham.

Ana I. Moreno durante la presentación del proyecto en un Congreso Internacional sobre lingüística en Birmingham.DL

Una necesidad

El origen de esta herramienta y el interés de Moreno por las diferencias retóricas entre el inglés y el español comenzó al conocer el rechazo de un artículo de un investigador de la Universidad de León. Si bien el artículo había sido traducido correctamente, el informe de evaluación recomendaba una revisión por un hablante nativo. Esto llevó a la doctora a indagar en las diferencias discursivas profundas, especialmente las convenciones retóricas propias de cada comunidad científica y a explorar patrones del lenguaje que iban más allá de la construcción oracional.

Por otro lado, en una de sus estancias en la Universidad de Birmingham a principios de los 90 descubrió el potencial de la entonces incipiente lingüística de corpus para analizar patrones de uso de la lengua a partir de grandes cantidades de textos. No obstante, las limitaciones que presentaban las herramientas de concordancia de la época le llevó a seguir investigando.

Otra estancia decisiva para Ana I. Moreno fue Ann Arbor en Estados Unidos en el verano de 1995, donde conoció al lingüista John Swales, pionero en el análisis de géneros académicos. A través de la reformulación de un artículo de su propia tesis doctoral para “hacerlo más persuasivo para una revista internacional” pudo comprender que el problema era entender que el discurso científico en la comunidad anglosajona tiene convenciones argumentativas propias” y no simplemente ‘escribir bien en inglés’. Una problemática compartida por otros investigadores españoles.

Detalle de la interfaz EXEMPRAES.

Detalle de la interfaz EXEMPRAES.ENEIDA

Una tarea compleja

Como ha explicado la investigadora, la creación de EXEMPRAES ha supuesto “muchos desafíos, metodológicos, técnicos y logísticos”. “Hemos tardado casi una década en sacarlo a la luz. El primero de los desafíos fue conceptual: no queríamos simplemente un corpus digital de textos más, sino una herramienta funcional que ayudara a quienes escriben en inglés como lengua extranjera a comprender cómo se construye el discurso académico en ambas culturas escritas. Eso requería ir más allá del análisis léxico o gramatical tradicional. Otro desafío importante fue conseguir pares de artículos auténticos comparables —no traducidos— y de alta calidad, en inglés y español, publicados en revistas científicas distintas, pero sobre temáticas similares. Nuestra solución consistió en que los pares fueran seleccionados con criterios de comparabilidad y de calidad muy estrictos por informantes expertos de distintas áreas. Tuvimos la suerte de contar con un gran número de informantes, 54 de los cuales no son anónimos y sus nombres aparecen en la página web de ENEIDA”, relata Moreno.

Un gran reto fue la segmentación de los textos para anotarlos. “En lugar de usar la oración ortográfica como unidad, adoptamos la proposición significativa, como unidad mínima de análisis; es decir, unidades que suelen tener al menos un sujeto y un verbo, y que transmiten un significado completo desde el punto de vista retórico. Esta decisión fue arriesgada, porque suponía romper el paradigma utilizado en la mayor parte de los estudios previos, pero clave para poder identificar con precisión qué se dice en cada momento del texto y con qué intención, y poder comparar entre culturas. Al final, la decisión ha demostrado ser un acierto”, detalla.

“Otro fue diseñar y aplicar una jerarquía de funciones comunicativas que permitiera etiquetar cada proposición significativa del texto con su función comunicativa. Para lograrlo, las etiquetas debían ser claras y aceptadas por los propios científicos. Además, la jerarquía debía ser manejable y aplicable a textos reales. Todo esto nos llevó años de trabajo colaborativo y validación entre expertos”, añade.

Para facilitar el acceso a los investigadores, EXAMPRAES se creó con una interfaz web intuitiva, que permitiera su uso sin exigir conocimientos previos de lingüística de corpus. Para ello, la lingüista contó con la ayuda del desarrollador Laurence Anthony de la Universidad Waseda en Japón, creador de herramientas como AntConc, que desarrolló un entorno web a medida, siguiendo las indicaciones de Moreno.

La herramienta está diseñada para ser usada por cualquier usuario desde su navegador, sin necesidad de descargar o instalar nada, ni tener conocimientos técnicos. Por dentro, la herramienta funciona con una combinación sencilla pero eficaz de lenguajes de programación web —PHP, HTML y JavaScript—, lo que garantiza que se cargue rápido y funcione bien en cualquier dispositivo moderno. La interfaz permite filtrar, comparar fragmentos, verlos en contexto y explorar patrones del discurso y del lenguaje académico en español e inglés, con la novedad de poder hacerlo solo en los fragmentos textuales que respondan a los filtros. “Lo importante es que no hace falta saber lingüística para sacarle partido. Está hecha para estudiantes, investigadores en formación y profesorado que quiera usarla en clase o de forma autónoma”, resalta.

Las ventajas de esta herramienta son notorias. Como demostró la profesora Moreno en su reciente presentación en el congreso internacional CL2025, celebrado en Birmingham, el corpus permite observar patrones retóricos que serían imposibles de detectar de otro modo. Otro punto fuerte de la interfaz, en su opinión, es su utilidad para quienes aún no saben qué términos buscar. La doctora Moreno añade que una forma alternativa de identificar palabras clave de una función comunicativa es a través de la lista de palabras. Pero lo que para la investigadora resulta más “mágico” es la capacidad de la interfaz de mostrar líneas de concordancias de esas palabras que el usuario ha identificado como clave para expresar una misma función comunicativa en ambas lenguas. Para lograr esa asociación, la experta explica que ha sido un proceso “bastante artesanal”, pero “más fiable que si lo hiciera una IA”. “Lo hicimos con una simple hoja Excel. Yo misma segmenté los textos, coloqué cada segmento en una fila y lo anoté manualmente, indicando qué función comunicativa cumple, siguiendo una jerarquía de funciones previamente validada. Luego envié mis anotaciones a los propios autores para obtener su ‘feedback’. Además, anoté cada fragmento con los metadatos que permitirían realizar las búsquedas previstas mediante filtros. Los metadatos que hemos empleado en esta primera versión de EXEMPRAES son: el código del artículo en el que aparece cada segmento, el apartado del artículo donde se encuentra, su posición en el texto, el área de conocimiento, la disciplina, el idioma, la referencia bibliográfica completa (para facilitar la cita ética) y su resumen (para ayudar a entenderlo mejor). Toda esta información de la hoja Excel se importó a la base de datos que alimenta la interfaz de EXEMPRAES”, destaca Moreno.

“Si alguien quiere buscar, por ejemplo, fragmentos que expresen una limitación del estudio en sociología, el sistema muestra directamente los fragmentos que yo etiqueté con esa función en esa disciplina. Una vez aplicado el filtro por función, área o disciplina, hay una pestaña que permite generar listas de palabras ordenadas por frecuencia, y otra que permite explorar cómo se usa exactamente una palabra de interés dentro de esos fragmentos filtrados. De esta manera conseguimos asociar las palabras a las funciones comunicativas. Y eso es precisamente lo que convierte a EXEMPRAES en una herramienta pedagógica tan potente”, añade.

Aunque la herramienta pretende facilitar el acceso a la literatura científica internacional a los investigadores españoles, EXEMPRAES no proporciona el texto completo original de los artículos, sean de pago o no, sino solo los fragmentos necesarios para el aprendizaje, el autoestudio o la investigación, hasta un máximo de 250 palabras. De este modo, se busca respetar las prácticas éticas en la cita de fuentes. Para facilitar la interpretación de los fragmentos, se incluye también el resumen del artículo, lo que ayuda a situar el fragmento dentro del conjunto del texto. Esta forma de presentación está pensada para apoyar la docencia y la investigación sin necesidad de acceder a los artículos completos.

“EXEMPRAES no sustituye el acceso a los artículos originales, pero sí permite aprender de ellos de forma ética y eficaz, con fragmentos cuidadosamente seleccionados, anotados y referenciados. Esto lo convierte en una herramienta singularmente útil para quienes no tienen acceso a bases de datos de pago, pero necesitan modelos reales de escritura académica nacional e internacional”, recalca.

Ventana de Exempraes.

Ventana de Exempraes.ENEIDA

Y ahora con la IA, ¿qué?

Desde hace un año, la inteligencia artificial (IA) envuelve nuestro día a día y cada vez ofrece mejores herramientas, también para los científicos. Sin embargo, como explica la propia investigadora, “la IA puede traducir lo escrito, pero no puede traducir lo no escrito”. “El valor de EXEMPRAES está en que ayuda a descubrir, en contextos auténticos de uso, qué funciones comunicativas se expresan, dónde, cómo, y cómo se integran en el discurso académico. Y lo más importante, el usuario no podrá valorar si una IA ha realizado bien una traducción si no tiene los conocimientos para poder juzgarlo. Adquirir dicha concienciación es primordial para usar una IA y asegurarse de que el resultado es fiable», expone Moreno. Además, mientras que la IA suele centrarse en el nivel fraseológico o gramatical, EXEMPRAES ofrece una guía para estructurar el discurso completo. “Ayuda a responder preguntas como: ¿dónde suele presentarse una limitación?, ¿con qué lenguaje?, ¿qué la precede y qué la sigue?, ¿cómo se diferencia esta estructura en inglés y en español?”, detalla.

A pesar de las propias limitaciones de la IA, la doctora cree que la inteligencia artificial generativa puede “aportar mucho al desarrollo futuro del corpus EXEMPRAES, pero siempre con precaución y bajo supervisión experta”. Una de las áreas donde más puede ayudar es en la anotación preliminar de textos. “Actualmente, las funciones comunicativas de cada fragmento han sido identificadas y codificadas manualmente, uno a uno, por especialistas. Esto garantiza una gran fiabilidad, pero es un proceso muy laborioso. La idea es que, en futuras fases del proyecto, podamos entrenar modelos de IA para que realicen una primera propuesta de anotación automática de los textos. Esa propuesta sería después revisada y validada por el equipo experto. De este modo, la IA no sustituiría al trabajo humano, sino que lo aceleraría y ampliaría. Gracias a ello, podríamos incluir más artículos en menos tiempo, más apartados del artículo, más disciplinas, o incluso incorporar artículos más recientes, manteniendo la coherencia y el control de calidad que caracterizan el corpus. Además, la IA también podría ayudar a detectar patrones nuevos o sugerir asociaciones entre formas lingüísticas y funciones comunicativas que quizá no habíamos previsto”, desarrolla.

“Es importante recordar que la IA, por sí sola, todavía no capta bien los matices retóricos, el tono adecuado o la intención comunicativa que subyace al discurso académico. Por eso, el trabajo de los investigadores seguirá siendo insustituible para asegurar que la herramienta sea útil y fiable”, agrega.

Ana I. Moreno junto a Laurence Anthony, lingüista computacional y desarrollador de la web.

Ana I. Moreno junto a Laurence Anthony, lingüista computacional y desarrollador de la web.DL

Siguientes pasos

En los próximos años, el equipo ENEIDA tiene previsto llevar a cabo varias mejoras importantes en el Corpus EXEMPRAES. Estas actualizaciones buscan ampliar el alcance de la herramienta y facilitar aún más su uso por parte de investigadores y docentes. Entre ellos, incluir nuevos apartados de los artículos, aumentar el número de disciplinas representadas, incorporar funciones avanzadas para realizar búsquedas por los marcadores de función y explorar patrones de secuencias retóricas e identificar patrones léxicos y gramaticales dependiendo de la función. Todo ello con vistas a construir un futuro asistente de escritura intercultural que no se limite a sugerencias léxicas o gramaticales, sino que guíe o inspire la construcción del razonamiento científico dentro de los estándares internacionales, por comparación a los españoles.

Desde el Departamento de Filología Moderna de la Universidad de León, la iniciativa ENEIDA, capitaneada por la catedrática, ya se ha convertido en un nodo internacional de innovación en retórica académica intercultural. Como explica la lingüista, su contribución no se limita a la enseñanza del vocabulario o la gramática del inglés (y el español) para fines científicos, sino que ofrece una nueva manera de entender las lenguas de la ciencia: como formas de razonar y argumentar para construir conocimiento”. “Lo que queremos es ayudar a que los investigadores españoles no solo escriban en inglés correcto, sino que participen con confianza y autoridad en sus comunidades científicas internacionales. Eso no es solo una cuestión lingüística. Es una cuestión cultural, retórica y pragmática. Y por eso necesitábamos una herramienta como EXEMPRAES”, concluye Ana I. Moreno.

Foto detalle de Exempraes.

Foto detalle de Exempraes.DL

Gran aceptación nacional e internacional

La importancia de EXEMPRAES no solo se limita a la enseñanza del vocabulario o la gramática del inglés y el español para fines científicos, sino que ofrece una nueva manera de entender las lenguas de la ciencia. El corpus está diseñado para estudiantes, investigadores en formación y docentes de escritura académica. 
Esta iniciativa ha sido valorada positivamente por lingüistas y expertos nacionales e internacionales. Como señaló María Luisa Carrió Pastor, Catedrática de la Universidad Politécnica de Valencia y presidenta de la Asociación Española de Lingüística Aplicada, «el corpus EXEMPRAES es un recurso imprescindible para investigar, enseñar y aprender a escribir artículos académicos en inglés y español. Su interfaz permite identificar funciones comunicativas y entender, desde una perspectiva contrastiva, cómo se estructuran y comunican las ideas en ambas lenguas». Por su parte, Lynne Flowerdew, miembro honorífico en la School of Creative Arts, Culture and Communication, Birbeck College de la Universidad de Londres, resaltó que «el corpus EXEMPRAES es un recurso extremadamente valioso para la redacción académica en inglés y español. Su interfaz fácil de usar ofrece nuevas funcionalidades para analizar datos del corpus y explorar aspectos interculturales de la redacción académica».
tracking