miércoles, 13 de agosto de 2025

TeresIA, terminología + IA

 

TeresIA es un proyecto de investigación sobre terminologías e inteligencia artificial en las lenguas oficiales de España, que generará un metabuscador de términos así como tecnologías para la extracción y el tratamiento de neologismos. El metabuscador será una puerta de entrada única a las terminologías ya existentes en ámbitos especializados. Pretende responder a la dispersión de recursos terminológicos y a la necesidad de disponer de terminologías validadas de calidad en las lenguas oficiales de España. La idea primigenia de TeresIA surgió hace más de quince años. El nombre del proyecto quiere reconocer el destacado trabajo de la catedrática de Lingüística y Terminología de la Universitat Pompeu Fabra, Teresa Cabré, en la definición y planteamiento de esta iniciativa. 

TeresIA es un proyecto interinstitucional, diseñado y concebido por un consorcio del que forman parte el Consejo Superior de Investigaciones (CSIC), institución coordinadora del proyecto, pero también el Instituto Cervantes (IC), la Asociación Española de Terminología (AETER), la Universidad Politécnica de Madrid (UPM), el Centro Nacional de Supercomputación (BSC) y la Real Academia de Ingeniería (RAI). Cuenta además con el apoyo decidido de la Dirección General de Traducción de la Comisión Europea (DGT). Por tanto, TeresIA es un proyecto interdisciplinar: su desarrollo implica el trabajo en colaboración entre lingüistas computacionales, terminólogos, documentalistas, traductores y especialistas en ciencia de datos, inteligencia artificial y procesamiento del lenguaje natural. En TeresIA se trabaja con terminología en las lenguas oficiales de España y, en el caso del español, lo hacemos con perspectiva panhispánica, es decir, tratando de atender a las variantes geográficas de esta lengua.

El proyecto está desarrollando:
- Un metabuscador de términos, puerte de entrada única a las terminologías ya existentes en ámbitos especializados. Será una herramiento de código abierto para visibilizar al máximo las terminologías en español y también en el resto de lenguas oficiales de España. 
- Tecnología para la extracción (algortimo KeyCARE), el tratamiento de neologismos (TermonIA) y ontología para la representación de datos terminológicos. 

Todo ello se integrará en el portal TeresIA que ofrecerá estos servicios y tecnología a instituciones y ciudadanos con la finalidad de: 1) generar, validar y sancionar nuevas terminologías; 2) garantizar la interoperabilidad de recursos terminológicos existentes; 3) garantizar la interoperabilidad de recursos terminológicos existentes; 4) garantizar la visibilidad de los recursos generados. 

De momento, TeresIA ha identificado más de 400 recursos terminológicos (diccionarios, vocabularios, ontologías, etc.), en español o multilíngües que incluyen el español, y los ha recunido en el censo de recursos terminológicos que pueden encontrarse en la web del proyecto.

Por tanto, TeresIA es un proyecto de ciencia abierta, interdisciplinar, interinstitucional, con perspectiva panhispánica y que defiende y contribuye al multilingüismo en la comunicación científica. Un proyecto que conocí en la pasada en la XIX Jornada MEDES celebrada hace un mes en El Escorial bajo el título "El español de la ciencia multilíngüe", y que vale la pena difundir y conocer.

No hay comentarios: