La Lingüística computacional, disciplina híbrida necesaria en la era digital

Carmen Torrijos, en su ponencia sobre Lingüística computacional

En el Instituto de Ingeniería del Conocimiento (IIC) se cree que los estudios de letras son cada vez más variados, se relacionan con campos aparentemente opuestos, como el de la tecnología (Lingüística computacional), y que se encuentran muchas veces a través de las prácticas de empresa.

Esta ha sido una de las principales conclusiones de la jornada “El ciudadano global: Las lenguas en el siglo XXI”, organizada por el Grado en Lenguas Modernas de la Universidad Nebrija de Madrid.

El encuentro online (abierto al público) ha tenido como objetivo acercar a los estudiantes algunas experiencias variadas de personas con una formación lingüística similar.

El Instituto de Ingeniería del Conocimiento es un centro español de investigación, desarrollo e innovación, ubicado en el campus de la Universidad Autónoma de Madrid (UAM).

Una de esas experiencias ha sido la de Carmen Torrijos, cuya incursión en el mundo laboral la llevó al mundo de la tecnología y, en concreto, a ser Lingüista computacional en el IIC.

Además, se han mostrado los casos de Clara Scribà, quien decidió emprender y fundar Letropía, una agencia de corrección, traducción y asesoramiento lingüístico; y de José Fuentes, quien actualmente es estudiante en prácticas en Naciones Unidas.

Y es que las tecnologías impregnan todo y las lenguas también se alían con lo tecnológico en un campo que necesita de las dos partes.

Fue así como las prácticas de traducción tecnológica provocaron que Torrijos encontrara el departamento de Lingüística computacional del IIC y se quedara allí para desarrollar un nuevo perfil laboral.

De esta manera, la Lingüística computacional se ha podido definir como una disciplina híbrida que combina el estudio de las lenguas y el área de la computación.

“Participas en la creación de software, de programas informáticos que necesitan Procesamiento del Lenguaje Natural (PLN). Hay que trasladar a la máquina todos los procesos cognitivos que los seres humanos llevamos a cabo para procesar el lenguaje”.

Torrijos también ha explicado que se debe transformar el lenguaje natural en un lenguaje formal, como el de las matemáticas y la programación.

Lingüística computacional, conocimientos y carreras

Carmen Torrijos ha destacado que la gramática formal (los árboles sintácticos y el análisis de constituyentes) y la semántica son áreas de conocimientos que confluyen en la Lingüística computacional.

También se ha referido a los idiomas porque, en la Lingüística, el estudio de las lenguas es transversal, ya que conocer distintas lenguas permite comprender los mecanismos del lenguaje a un nivel más profundo.

“Actualmente, la Inteligencia Artificial (IA) conlleva procesar el lenguaje natural, y en este proceso hacen falta lingüistas”.

Es por esto que la carrera de Torrijos es un claro ejemplo de lo que también ha mencionado José Fuentes: el valor de los estudios relacionados con las lenguas y la comunicación.

Estos estudios ofrecen la posibilidad de emplear los conocimientos en distintos contextos y buscar trabajo en lugares muy variados, aunque al principio no se tenga claro por dónde empezar.

Igualmente funcionaría a la inversa, ya que «ese acceso a diferentes ‘mundos’ te lleva a aprender de campos totalmente diferentes”.

Cada vez hay más demanda de lingüistas computacionales, pero este es un perfil para el que se necesita formación constante.

“Es necesario realizar cursos de programación (especialmente en lenguaje Python) y Estadística, tener la capacidad y la aptitud para trabajar en equipos multidisciplinares, etc.”.

Se trataría entonces de un aprendizaje que “te lleva finalmente a ser un profesional muy completo”, según Torrijos, donde no hay que olvidar la parte lingüística porque sería el profesional referente en este campo dentro del equipo tecnológico.

Procesamiento del lenguaje natural

Torrijos ha invitado a los participantes a acercarse a un entorno de programación para mostrar su trabajo y hacer un ejercicio de Procesamiento del Lenguaje Natural con Python en cinco pasos.

Dividir el texto en frases, dividir el texto en palabras (tokens o unidades léxicas mínimas), anotar características morfológicas, desplegar un árbol sintáctico y detectar entidades en el texto con Aprendizaje Automático, han sido esos cinco pasos.

La experta, al comprobar si el sistema lo hacía bien o no y detectar sus errores, ha resaltado que los lingüistas computacionales son los encargados de supervisar el trabajo de la máquina, entrenarla y validar los resultados con sus conocimientos teóricos de Lingüística.