Metodología

Módulos de Trabajo y Estrategias Transversales

El proyecto HEART-NLP se estructura en torno a una metodología robusta y coordinada, dividida en siete módulos de trabajo (M1 a M7) que garantizan el cumplimiento de los objetivos. Este enfoque está impulsado por estrategias de investigación clave que se aplican de manera transversal a lo largo de todo el ciclo de vida del proyecto para asegurar la confiabilidad, la ética y la sostenibilidad.

Estrategias Transversales

Estas estrategias se aplican en cada fase de la investigación:

  • Diseño de Métricas de Calidad: Para asegurar la consistencia y robustez de las salidas de los modelos, las bases de conocimiento y los datos.

  • Principios FAIR: Asegurando que los recursos y tecnologías de PLN sean Localizables (Findable), Accesibles (Accessible), Interoperables (Interoperable) y Reutilizables (Reusable).

  • Principios de Sostenibilidad (Green AI): Estudiando y aplicando prácticas para optimizar la eficiencia energética y reducir el impacto ambiental del desarrollo de modelos.

  • Estrategias de Privacidad y Seguridad: Desarrollando defensas para garantizar la robustez de las tecnologías del proyecto frente a ataques adversarios, fugas de datos e inyecciones de prompt.

Módulos de Trabajo

Módulo
Enfoque principal
Tareas clave

M1

Gestión y coordinación

Asegurar la comunicación continua, el control del estado del proyecto y el cumplimiento de los principios FAIR entre los subproyectos de la Universidad de Jaen y la Universidad de Alicante.

M2

Análisis del problema

Identificación de casos de uso en dominios como noticias, medios sociales, biomedicina y turismo, y diseño de las Métricas de Calidad y Métricas Sostenibles.

M3

Creación de recursos

Extracción, compilación y curación de datos de alta calidad. Generación de recursos lingüísticos avanzados, incluyendo bases de conocimiento curadas y datasets de instrucción para Modelos de Lenguaje (LMs).

M4

Diseño de métodos y algoritmos

Desarrollo de métodos para la generación de conocimiento y la integración de datos. Creación y adaptación de LMs mediante técnicas como continual pre-training e instruction tuning. También se incluye el diseño de enfoques de evaluación, como los modelos LLM-as-Judge.

M5

Fiabilidad y sostenibilidad de LMs

Investigación centrada en la robustez de la IA. Mitigación de sesgos, implementación de la seguridad y privacidad de LMs, evaluación de la explicabilidad (XAI) y medición del impacto ambiental (Green AI).

M6

Integración y evaluación

Desarrollo de módulos y construcción de demostradores tecnológicos (plataformas web, APIs, paquetes de software) para cada escenario. Experimentación y análisis riguroso de resultados.

M7

Difusión

Promoción de las líneas de investigación, organización de eventos científicos, publicaciones en congresos y revistas de alto impacto, y difusión de resultados y recursos a la sociedad.

Resumen visual del proyecto

Marco de investigación de HEART. Leyenda -KR: Knowledge Retrieval; LM-AG: Language Model Augmented Generation; R-AG: Retrieval Augmented Generation; Grounding External Models-

Agradecimientos

Este trabajo de investigación es parte del proyecto I+D+I <<PID2024-156263OB-C22>> financiado por MICIU /AEI /10.13039/501100011033 / FEDER, UE.

Last updated