El alumno Haritz Odriozola Olalde obtuvo la calificación SOBRESALIENTE con mención DOCTORADO INTERNACIONAL y DOCTORADO INDUSTRIAL

Atrás

El alumno Haritz Odriozola Olalde obtuvo la calificación SOBRESALIENTE con mención DOCTORADO INTERNACIONAL y DOCTORADO INDUSTRIAL

TESIS

El alumno Haritz Odriozola Olalde obtuvo la calificación SOBRESALIENTE con mención DOCTORADO INTERNACIONAL y DOCTORADO INDUSTRIAL

10·12·2025

$titulo.getData()


  • Título de tesis: Safe Reinforcement Learning-based adaptive control software platform for domain-shift environments

Tribunal:

  • Presidencia: Matthias Althoff (Technische Universität München)
  • Vocalía: Viviane Cadenat (LAAS-CNRS)
  • Vocalía: Juan Ignacio Vazquez Gómez (Universidad de Deusto)
  • Vocalía: Aizea Lojo Novo (Ikerlan)
  • Secretaría: Tomaso Poggi (Mondragon Unibertsitatea)

Resumen:

El aprendizaje automático (ML) se utiliza cada vez más en aplicaciones industriales, pero su implementación en contextos críticos para la seguridad sigue siendo un reto debido a las lagunas tecnológicas y normativas. El aprendizaje por refuerzo (RL), conocido por su adaptabilidad, es muy popular en sectores como la robótica y los vehículos autónomos, pero comparte problemas de seguridad similares a los del ML. El Shielded RL ofrece garantías de seguridad al filtrar las acciones inseguras mediante un modelo abstracto, pero los problemas de cambio de dominio pueden comprometer estas garantías. Esta tesis presenta el Fear Field framework, inspirado en formas de vida inteligentes, para detectar imprecisiones en los modelos y ajustar la conservatividad de los agentes Shielded RL. Los resultados experimentales en tareas simuladas de cambio de dominio muestran mejoras significativas en la seguridad, de hasta dos órdenes de magnitud, al tiempo que se mantiene o mejora el rendimiento y la escalabilidad. El trabajo demuestra que los mecanismos inspirados en la biología pueden avanzar en la integración del Shielded RL en sistemas industriales críticos para la seguridad.