Hipótesis y objetivos

Hipótesis

La hipótesis inicial del proyecto CORTEX es la siguiente: la integración efectiva del conocimiento del mundo y del conocimiento externo en las arquitecturas de GLN mejora las capacidades de éstos en relación con la generación de texto con sentido común. Consideramos que es necesario mejorar las capacidades de razonamiento de sentido común de los sistemas de GLN para producir automáticamente textos precisos, correctos y fiables que se ajusten a los hechos reales.

Por tanto, se propone una nueva generación de enfoques de GLN potenciados por el conocimiento que superen el fenómeno de la «alucinación» y eviten la generación de lenguaje natural «económico con la verdad». Esto es posible dado que las arquitecturas Transformers, un tipo de arquitectura «end-to-end» que predomina en la generación de textos, pueden afinarse, entrenarse y adaptarse, de modo que: 1) aprendan a generalizar e identificar la información implícita, y 2) tengan en cuenta determinadas características que se deben reflejar en el texto generado, tales como estructura, longitud, estilo, formalidad, etc., permitiendo así una generación más controlada y precisa. Este tipo de ajustes ayudaría, por un lado, a generar textos de una forma más natural, diversa y con mayor calidad semántica, y por otro, a detectar patrones extraños o sesgos que deberían evitarse en el texto generado. Además, el control de diferentes aspectos del texto es clave para aplicar y transferir con éxito los enfoques de GLN a escenarios reales relevantes para la industria y la sociedad (Len et al., 2020).

Las preguntas de investigación que deben plantearse para validar la hipótesis propuesta son las siguientes:

  • ¿Qué modelos de lenguaje genéricos existen?
  • ¿Qué información y características deben tener las fuentes de conocimiento para que un sistema de GLN genere textos sintáctica y semánticamente correctos que, además, sean adecuados según la situación comunicativa requerida?
  • ¿Con qué eficacia podrían los enfoques de GLN propuestos integrar, utilizar y adaptar grandes modelos de lenguaje genéricos con conocimiento de sentido común?

Las respuestas a estas preguntas de investigación encarnan el principal objetivo científico del proyecto, que se define en los siguientes términos:  Investigar y proponer arquitecturas de GLN que integren distintos tipos de conocimiento para producir automáticamente textos fiables, veraces y de calidad, cuya información cumpla los principios de objetividad y pluralidad, evitando sesgos o contenido manipulado.

Objetivos

Una vez expuestas la hipótesis de partida y el objetivo general del proyecto, se concreta el objetivo general anteriormente definido en los siguientes objetivos específicos:

  • OBJ1. Recopilar y analizar los modelos de lenguaje genéricos existentes y las fuentes de conocimiento (estructuradas y no estructuradas) disponibles, identificando el tipo de información que contienen y descubriendo nuevos conocimientos que puedan inferirse de ellos (IP: Elena Lloret).
  • OBJ2. Determinar qué tipo de conocimiento es el más apropiado para mejorar el proceso de GLN, así como compilar y adaptar modelos que permitan el enriquecimiento semántico de los enfoques de GLN (IP: Elena Lloret).
  • OBJ3. Investigar, proponer y desarrollar enfoques de GLN novedosos que puedan integrar, guiarse por, o simplemente utilizar el conocimiento obtenido, conduciendo así a enfoques de generación con sentido común, más precisos, flexibles y dinámicos (IP: Elena Lloret).
  • OBJ4. Proponer y desarrollar varios escenarios y casos de uso que demuestren la validez y aplicación de la tarea de GLN, junto con el impacto positivo derivado de la integración del conocimiento de sentido común en los enfoques propuestos (IP: Armando Suárez).
  • OBJ5. Evaluar intrínseca y extrínsecamente cada una de las técnicas y enfoques y escenarios propuestos con las métricas estándar más adecuadas, o crear métricas novedosas, si es necesario (IP: Armando Suárez).
  • OBJ6. Promover y difundir los resultados de investigación obtenidos en el proyecto a través de diferentes medios nacionales e internacionales –incluyendo revistas indexadas, conferencias, seminarios, etc.–, así como explotar el potencial de transferencia de esta tecnología a la sociedad (IP: Armando Suárez).