plan de trabajo

WP3. Escenarios de generación del lenguaje natural y casos de uso

Este último WP contribuirá al cumplimiento de los OB4 y OB5, y su propósito es aplicar las propuestas y enfoques NLG basados en el conocimiento en diversos escenarios y casos de uso para validar y mostrar su idoneidad en contextos reales. Cada escenario integrará los hallazgos y resultados de WP1 y WP2, y serán evaluados con métricas específicas y estándares adecuados para los diversos escenarios. En particular, para este proyecto se prevén los siguientes escenarios y se explican a continuación.

Tarea 3.1 Resumenes de textos

Esta tarea tiene como objetivo sintetizar la información manteniendo solo lo relevante (Syed, Gaol y Matsuo, 2021). Aunque la investigación sobre enfoques extractivos es la más predominante, están limitados a copiar literalmente la información de entrada y pegarla en el resumen de salida. Por otro lado, el resumen abstractivo es más poderoso, pero al mismo tiempo más desafiante. El objetivo de esta tarea es abordar el resumen abstractivo, integrando un fuerte componente NLG de los resultados de WP2. Esto abrirá varios dominios para experimentar (por ejemplo, finanzas, periodismo, salud, o la educación, por nombrar algunos). La integración de un componente NLG basado en el conocimiento durante el proceso de resumen abstracto contribuiría a producir resúmenes más humanos, ya que será posible detectar e inferir información relevante, incluso cuando esta se describe a través de varias oraciones no consecutivas. También permitirá una paráfrasis fiable y precisa de los documentos textuales a partir de los cuales se generará el resumen. 

Hito: Análisis y desarrollo de un resumen de texto abstractivo que integra el enfoque de NLG de la tarea 2.3 como uno de sus componentes principales.

Tarea 3.2 Generación de textos creativos (textos narrativos y poesía)

Uno de los escenarios más complejos de NLG es la producción de textos creativos o artísticos, incluyendo storytelling (narrativa ficcional) o poesía (Barros et al., 2019; Bena and Kalita, 2019; Chakrabarty et al., 2021; Lau et al., 2018; Papay y Padó, 2020; Vicente et al., 2018; Wang et al., 2021). En ambos casos, un sistema NLG debe tratar con fenómenos lingüísticos específicos, como el tipo y la estructura de los acontecimientos narrativos, relaciones temporales o causales, representación de estados mentales, lenguaje figurado, o dispositivos prosódicos como la métrica y el ritmo, entre otros. Aunque aparecen en otro tipo de textos, es en estos textos donde se utilizan con frecuencia. 

El objetivo de este escenario es profundizar en el análisis computacional de estos fenómenos textuales (en el marco de los Estudios Literarios Computacionales) y analizar en qué medida afectará NLG (Van Heerden & Bas 2021). Nuestro objetivo es doble. Primero, analizaremos y extraeremos automáticamente los acontecimientos literarios, sus estructuras y las relaciones temporales o causales entre ellos (Sims et al. otros, 2019; Feder et al., 2021). Para esta tarea aprovecharemos el literario europeo Text Collection, un corpus multilingüe de novelas europeas (Odrebrech et al., 2019). En segundo lugar, exploraremos el análisis formal de la métrica y el ritmo en un corpus de poesía (como el corpus ADSO (Navarro Colorado et al., 2016), un gran corpus de poesía española con información métrica) para introducir prosodia en NLG. 

Hito: un modelo computacional formal para el análisis y generación de textos creativos.

Tarea 3.3 Chatbots para la inteligencia emocional

La educación en Inteligencia Emocional (Goleman, 1995) es una asignatura pendiente para la sociedad que potencialmente podría contribuir a la solución de muchos problemas sociales actuales. Algunos de estos incluyen intimidación, suicidio, violencia de género, estrés, ansiedad, depresión, anorexia, discriminación y autismo. Demostraremos los beneficios de los chatbots para ayudar a los usuarios a mejorar su inteligencia emocional y a gestionar mejor y comprender sus emociones. En concreto, el chatbot funcionará con “cuentos con mensaje”. Estas historias populares o fábulas son apropiadas porque representan la tradición milenaria del homo sapiens para transmitir y comprender hábilmente el conocimiento. Estas historias se entienden fácilmente, a menudo con moraleja simple o metáforas asociadas. El trabajo de los siguientes académicos apoya la utilidad de estos relatos en este tipo de investigaciones: Färber & Färber, 2015; Odabasi et al., 2012; Kulikovskaya y Andrienko, 2016. Aplicaremos la investigación realizada a las técnicas de generación de textos de los WP anteriores para ayudar a los usuarios a desarrollar la cognición social (la capacidad de identificar y comprender situaciones: Uekerman et al., 2010), así como para mejorar su nivel de comprensión lectora. Por ejemplo, un generador de preguntas de comprensión de lectora podrá ayudar al usuario a entender mejor el cuento. 

Hito: Desarrollar un chatbot de cuentos con mensaje que integre técnicas de generación de texto para mejorar la inteligencia emocional y la comprensión lectora.

Tarea 3.4 Hacer que las metáforas en inglés sean más inteligibles

El estudio de las metáforas en dominios específicos del inglés está motivado por el deseo de promover la inclusión y cae dentro del área conocida como inglés para propósitos específicos. La meta es facilitar la asimilación humana de información abstracta cuando esta sucede en un contexto desconocido así como, en última instancia, proporcionar un significado equivalente de una manera más simple y directa. Esto es beneficioso para la nueva generación de ciudadanos digitales o “netizens”, que necesitan estar operativos a través de las fronteras nacionales, a menudo utilizando el inglés como vehículo. De hecho, según Rai y Chakraverty (2020), existe una necesidad apremiante de procesar las metáforas en un lenguaje común para todas las comunidades, ya que a menudo son ambiguas y requieren un conocimiento global actualizado para comprender su significado y propósito. 

En el ámbito financiero, como un ejemplo entre muchos, la comunicación diaria se produce muy a menudo mediante el uso de metáforas conceptuales y, a menudo, difíciles de desentrañar, que pueden hacer que los extraños al ámbito financiero se sientan excluidos. Frases como «rebote del mercado bajista» o «rebote del gato muerto», entre muchos otros, tienen su propio significado basado en el dominio que puede ser difícil de descifrar, especialmente para comunidades no expertas u otras partes interesadas para quienes el inglés es un idioma extranjero. Por lo tanto, recursos que faciliten el acceso al conocimiento a través del desarrollo de nuevas tecnologías tendrían un impacto positivo en, por ejemplo, la gestión de una persona en sus finanzas personales y inversiones. 

En tal escenario, nos basaremos en la teoría de la metáfora conceptual desarrollada por la investigación de Lakoff y Johnson (1980) como base, complementándolo con las técnicas de adquisición de conocimiento del WP1 que nos permitirá identificar metáforas, así como emplear los métodos desarrollados en WP2 para hacerlas más inteligibles mediante el uso de un lenguaje sencillo y accesible, de forma que tanto expertos como no expertos en el dominio específico pueda entenderlo. 

Hito: desarrollo de recursos para facilitar la inteligibilidad de metáforas de la lengua inglesa en dominios específicos.