¿Qué es el Procesamiento de Lenguaje Natural (PLN)?
Seguro que has escuchado hablar del Procesamiento de Lenguaje Natural (PLN) o Natural Language Processing (NLP), en estos momentos de plena actualidad, aunque sus orígenes tienen más de siete décadas. Si no te suena el término, lo que si conoces, has manejado o tienes es algún sistema de interpretación del lenguaje humano por máquinas, como traductores, correctores ortográficos o los, tan de moda, asistentes de voz.
Con esta pequeña introducción ya se pueden adivinar las funcionalidades y definición del PNL, pero vamos a matizarlas para aclarar los conceptos. El Procesamiento de Lenguaje Natural es un campo de la Inteligencia Artificial que se encarga de estudiar la interacción, a través del lenguaje, de personas y máquinas. Es decir, conseguir que las máquinas entiendan y reproduzcan nuestra manera de comunicarnos para poder relacionarnos con ellas mediante el lenguaje.
La explosión de esta tecnología en los últimos años, que como apuntábamos anteriormente nace en la década de los 50, viene de la mano de la creciente capacidad para analizar ingentes volúmenes de datos gracias al big data, del desarrollo de la algoritmia y de la importantísima evolución de la inteligencia artificial. El mundo, nuestro día a día, es cada vez más digital y se incrementa nuestra interacción con las máquinas, que es cada vez más natural.
Fluidez de interacción hombre-máquina
En este proceso el lenguaje, como elemento vehiculador de la comunicación, es fundamental. El intercambio hombre-máquina puede basarse en lengua escrita o hablada, siendo el objetivo de ambas formas de expresión conseguir que las máquinas reciban nuestros mensajes, los decodifiquen, los interpreten y nos devuelvan la respuesta esperada de manera que la entendamos sin conocimientos añadidos previos.
La fluidez en la comunicación que otorga el lenguaje, como ya hemos advertido nuestra forma natural de interacción, tiene múltiples beneficios a todos los niveles, si bien cuenta con especial importancia de cara a facilitar y simplificar los procesos de digitalización y transformación digital en los entornos productivos. La sencillez en la comunicación consigue implantaciones más rápidas y fluidas, puesto que minimiza la necesidad de conocimientos técnicos y agiliza las acciones que requieren de la acción conjunta de trabajadores y máquinas.
En este punto es importante dejar patente, además, que el Procesamiento de Lenguaje Natural supone un cambio de paradigma, que pone a las personas en el centro del proceso, puesto que son las máquinas las que se adaptan a nuestra forma de comunicarnos y no al revés, como sucedía hasta ahora.
Aplicaciones del Procesamiento de Lenguaje Natural
Las aplicaciones del Procesamiento de Lenguaje Natural son muchas y cada vez más extendidas. Veamos alguna:
Interacción textual: podemos interactuar con ordenadores mediante texto escrito. Emitido el mensaje por el emisor humano, el sistema lo decodifican, lo descompone, lo analiza y, en función de los patrones encontrados, codifica una respuesta que envía de vuelta a su interlocutor. Un ejemplo claro de esta función son los famosos chat bot. Si hacemos una pregunta a un sistema de interacción textual, buscará en las palabras que le trasladamos las correlaciones para las que ha sido programado y emitirá una respuesta en base al análisis de esa combinación de palabras.
Interacción verbal: este segundo caso tiene la misma base que el anterior, con la complicación añadida de que el sistema tienen que reconocer la voz del emisor, transformarla en texto y seguir el procedimiento de decodificación y búsqueda de patrones descrito. Una vez determinado el mensaje a transmitir, el texto se convierte de nuevo en voz para emitir la respuesta. Siri, Alexa, los controles por voz de los vehículos o los sistemas de atención telefónica son ejemplos cotidianos de este tipo de tecnología. Les preguntamos algo que nos interesa saber o les damos una determinada orden, y nos devuelven una respuesta basada en la interpretación que han dado a la cuestión inicial.
Identificación y clasificación de textos: los Sistemas de Procesamiento de lenguaje natural son también capaces de identificar textos, en base a las palabras que los forman. De este modo, pueden localizarse partes de un escrito en un documento de extensión larga (ley, decreto, tesis…) o identificar el tipo de documento por su contenido. En este último caso es muy gráfico el ejemplo del correo spam. Los sistemas PNL identifican determinadas palabras y expresiones preestablecidas, a partir de las que determinan si se trata de un correo basura o lo asignan a la bandeja de entrada.
Traducción: Otra de las aplicaciones de PNL más extendidas es la traducción automática de textos, que todos hemos utilizado en formato on line, y que ofrecen respuestas en centenares de idiomas. Una nueva generación de traductores muestran el contenido de cartelería, señalética y cualquier tipo de texto que se quiera convertir de idioma, captando la imagen de la reseña a traducir con el móvil.
Como vemos, nuestra interacción con las máquinas es cada vez más cotidiana y se da en todos los ámbitos y sectores. La transformación digital ha llegado para quedarse y facilitarnos determinadas tareas, y en esta evolución tiene mucho que decir el Procesamiento de Lenguaje Natural, puesto que el propio lenguaje es nuestra forma de comunicación más directa.