Tres estudiantes de doctorado de la UPC-ESEIAAT, premiados por la RAE por un algoritmo que identifica neologismos tecnológicos
De izquierda a derecha, Pol Fontanes, Eva Maria Urbano y Víctor Martínez, con sendos diccionarios de la RAE
Tres estudiantes de doctorado de la Escuela Superior de Ingenierías Industrial, Aeroespacial i Audiovisual de Terrassa (ESEIAAT) de la UPC han diseñado un algoritmo de detección automática de neologismos tecnológicos. Con este sistema han ganado el segundo premio de la hackathon 'Neologismos y tecnicismos en el ámbito energético y medioambiental', organizado por la Real Academia de la Lengua Española (RAE) y la Fundación Endesa.
17/06/2021
Los trabajos de los participantes tenían que resolver cuestiones como por ejemplo cuáles son las palabras de uso más reciente en el sector, qué tecnicismos se utilizan, cuáles han pasado ya al uso más general, qué extranjerismos son los más frecuentes o si existen alternativas en español a estos extranjerismos. La propuesta de los estudiantes de doctorado Pol Fontanes, Víctor Martínez y Eva María Urbano, de la ESEIAAT, ha sido valorada por el jurado del evento “por el grado de finalización, la originalidad, la exhaustividad, la automaticidad y la dificultad técnica de las herramientas del proyecto”, así como "por la viabilidad, el diseño y la usabilidad de las mismas". Pol Fontanes cursa el doctorado en Ingeniería Eléctrica, mientras que Víctor Martínez y Eva María Urbano cursan el doctorado en Ingeniería Electrónica.
ADAN
El sistema ADAN se basa en la utilización de algoritmos de inteligencia artificial y big data para procesar textos e identificar las palabras susceptibles de ser neologismos. Para conseguirlo, ADAN utiliza técnicas llamadas de Natural Language Processing (NLP) con las que es capaz de analizar morfológica, sintáctica y semánticamente los textos, para buscar los neologismos y los extranjerismos, cuyos significados son inferidos por el contexto en caso de ser desconocidos.
Urbano añade que "antes de empezar a trabajar, la RAE nos hizo ver la importancia de generar estrategias inteligentes para asegurar un entendimiento correcto entre el la máquina y la persona; así podremos avanzar hacia la integración de la tecnología sin dejar de lado la riqueza del lenguaje".
El algoritmo ha sido diseñado para el ámbito de la energía y el medioambiente, pero podría ser útil también en otros campos y otras lenguas.
En palabras de Santiago Muñoz Machado, director de la RAE: “los neologismos son un asunto importante, porque invaden con mucha velocidad el terreno de las ciencias y las nuevas tecnologías [...] Cada día las máquinas hablan más y hay un número mayor de máquinas que hablan y usan un idioma que no es necesariamente el que ha normativizado la RAE, sino que es el idioma que han determinado los fabricantes de dicha tenología”.