We stand with Ukraine

Comprensión del lenguaje natural (NLU)


Cogito comprende el lenguaje natural porque sabe descifrar el significado de las palabras y los conceptos contenidos en los textos de la misma forma que lo haría un ser humano. Esta capacidad casi humana de comprensión se basa en la “desambiguación”.

¿Qué es la desambiguación?

El lenguaje está repleto de ambigüedades. Aunque el ser humano puede deshacer fácilmente la ambigüedad de las palabras en función del contexto y a través de su experiencia y educación, interpretar automáticamente el lenguaje es todo un desafío para una máquina.

Cogito resuelve la ambigüedad mediante la interacción entre su motor semántico y su gráfico de conocimiento. Esto le permite diferenciar el verdadero sentido de todos los componentes de una frase aplicando el “razonamiento” para identificar el contexto adecuado y resolver los conflictos que surgen cuando una palabra puede tener más de un significado.

En otras palabras, a partir del análisis lingüístico de un texto, el proceso de desambiguación de Cogito efectúa una representación del contenido en términos de conceptos y entidades, y las relaciones existentes entre ellos. Son los cimientos de un mapa cognitivo y conceptual de los textos, lo que constituye el resultado final del proceso de desambiguación y es un elemento clave para la comprensión del lenguaje.

Fases del proceso de desambiguación

El análisis textual de Expert System consta de una serie de fases de análisis consecutivas que incluye:

  • Análisis morfológico para identificar las categorías gramaticales: sustantivos, nombres propios, verbos, adjetivos, artículos, etc.
  • Análisis sintáctico para identificar un primer nivel de agrupación de palabras que componen los “sintagmas” (sintagmas nominales, verbales, preposicionales, etc.), un segundo nivel de agrupación de palabras que componen las frases (si la frase tiene un verbo, puede ser una oración simple o combinarse para formar una oración compuesta) y un tercer nivel de palabras que, juntas, componen un enunciado (una unidad gramatical que consta de una o varias palabras unidas entre sí por una relación sintáctica para formar una expresión con significado completo).
  • Análisis semántico para asociar las palabras a los significados mediante la interacción entre el motor semántico o la tecnología de comprensión del lenguaje natural de Expert System y Sensigrafo. Tras el análisis morfológico y sintáctico, las palabras se asocian a varios conceptos extraídos de entre todos aquellos disponibles en Sensigrafo. El “desambiguador” empieza a limpiar la lista de candidatos disponibles para las distintas palabras teniendo en cuenta el contexto en el que aparece cada una de ellas a fin de determinar su significado.