Haritz Odriozola Olalde ikasleak BIKAIN kalifikazioa lortu zuen NAZIOARTEKO DOKTORETZA eta DOKTORETZA INDUSTRIALA aipamenarekin

Atzealdea

Haritz Odriozola Olalde ikasleak BIKAIN kalifikazioa lortu zuen NAZIOARTEKO DOKTORETZA eta DOKTORETZA INDUSTRIALA aipamenarekin

TESIA

Haritz Odriozola Olalde ikasleak BIKAIN kalifikazioa lortu zuen NAZIOARTEKO DOKTORETZA eta DOKTORETZA INDUSTRIALA aipamenarekin

2025·12·10

$titulo.getData()


  • Tesi titulua: Safe Reinforcement Learning-based adaptive control software platform for domain-shift environments

Epaimahaia:

  • Lehendakaritza: Matthias Althoff (Technische Universität München)
  • Bokala: Viviane Cadenat (LAAS-CNRS)
  • Bokala: Juan Ignacio Vazquez Gómez (Universidad de Deusto)
  • Bokala: Aizea Lojo Novo (Ikerlan)
  • Idazkaritza: Tomaso Poggi (Mondragon Unibertsitatea)

Laburpena:

Ikasketa Automatikoa (ML) aplikazio industrialetan gero eta gehiago erabiltzen ari da, baina segurtasun aldetik kritikoak diren aplikazioetan integratzea erronka handia da oraindik. Indargarri bidezko Ikaskuntzak (RL) gaitasun handiak eskaintzen ditu ingurune dinamikoetara egokitzeko, eta horregatik da aski erabilia robotika eta ibilgailu autonomoen eremuetan. Hala ere, ML-ak dituen segurtasunari lotutako erronka antzekoak ditu. Shielded RL teknikak segurtasun-bermeak eskaintzen ditu, ekintzak iragazten dituen "shield" baten bidez. Baina domeinu-aldaketek ereduaren zehaztasuna murriztu dezakete, eta horrek segurtasun-bermeak arriskuan jar ditzake. Doktore-tesi honek Fear Field framework-a proposatzen du, bizi forma adimendunen portaeran inspiratua, domeinu-aldaketaren arazoari aurre egiteko. Mekanismo honek modeloaren zehaztasun gutxituko iragarpenak identifikatu eta horren arabera kontserbakortasun maila egokitzen du. Framework hau simulazioetan balioztatu da, eta segurtasuna bi magnitude ordenetaraino hobetu da errendimendua eta eskalagarritasuna mantenduz. Tesi honek frogatzen du biologian inspiratutako mekanismoek aurrerapenak ekar ditzatezkeela, etorkizunean Shielded RL teknikak segurtasunean kritikoak diren sistema industrialetan integratzeko aukera eskainiz.