Metodología
Módulos de Trabajo y Estrategias Transversales
El proyecto HEART-NLP se estructura en torno a una metodología robusta y coordinada, dividida en siete módulos de trabajo (M1 a M7) que garantizan el cumplimiento de los objetivos. Este enfoque está impulsado por estrategias de investigación clave que se aplican de manera transversal a lo largo de todo el ciclo de vida del proyecto para asegurar la confiabilidad, la ética y la sostenibilidad.
Estrategias Transversales
Estas estrategias se aplican en cada fase de la investigación:
Diseño de Métricas de Calidad: Para asegurar la consistencia y robustez de las salidas de los modelos, las bases de conocimiento y los datos.
Principios FAIR: Asegurando que los recursos y tecnologías de PLN sean Localizables (Findable), Accesibles (Accessible), Interoperables (Interoperable) y Reutilizables (Reusable).
Principios de Sostenibilidad (Green AI): Estudiando y aplicando prácticas para optimizar la eficiencia energética y reducir el impacto ambiental del desarrollo de modelos.
Estrategias de Privacidad y Seguridad: Desarrollando defensas para garantizar la robustez de las tecnologías del proyecto frente a ataques adversarios, fugas de datos e inyecciones de prompt.
Módulos de Trabajo
M1
Gestión y coordinación
Asegurar la comunicación continua, el control del estado del proyecto y el cumplimiento de los principios FAIR entre los subproyectos de la Universidad de Jaen y la Universidad de Alicante.
M2
Análisis del problema
Identificación de casos de uso en dominios como noticias, medios sociales, biomedicina y turismo, y diseño de las Métricas de Calidad y Métricas Sostenibles.
M3
Creación de recursos
Extracción, compilación y curación de datos de alta calidad. Generación de recursos lingüísticos avanzados, incluyendo bases de conocimiento curadas y datasets de instrucción para Modelos de Lenguaje (LMs).
M4
Diseño de métodos y algoritmos
Desarrollo de métodos para la generación de conocimiento y la integración de datos. Creación y adaptación de LMs mediante técnicas como continual pre-training e instruction tuning. También se incluye el diseño de enfoques de evaluación, como los modelos LLM-as-Judge.
M5
Fiabilidad y sostenibilidad de LMs
Investigación centrada en la robustez de la IA. Mitigación de sesgos, implementación de la seguridad y privacidad de LMs, evaluación de la explicabilidad (XAI) y medición del impacto ambiental (Green AI).
M6
Integración y evaluación
Desarrollo de módulos y construcción de demostradores tecnológicos (plataformas web, APIs, paquetes de software) para cada escenario. Experimentación y análisis riguroso de resultados.
M7
Difusión
Promoción de las líneas de investigación, organización de eventos científicos, publicaciones en congresos y revistas de alto impacto, y difusión de resultados y recursos a la sociedad.
Resumen visual del proyecto

Marco de investigación de HEART. Leyenda -KR: Knowledge Retrieval; LM-AG: Language Model Augmented Generation; R-AG: Retrieval Augmented Generation; Grounding External Models-
Agradecimientos

Este trabajo de investigación es parte del proyecto I+D+I <<PID2024-156263OB-C22>> financiado por MICIU /AEI /10.13039/501100011033 / FEDER, UE.
Last updated