Iñaki Velez de Mendizabal Gonzalez ikasleak BIKAIN kalifikazioa lortu zuen, ‘DOKTOREGO INTERNAZIONALEKO’ aipamenarekin

Atzealdea

Iñaki Velez de Mendizabal Gonzalez ikasleak BIKAIN kalifikazioa lortu zuen, ‘DOKTOREGO INTERNAZIONALEKO’ aipamenarekin

TESIA

Iñaki Velez de Mendizabal Gonzalez ikasleak BIKAIN kalifikazioa lortu zuen, ‘DOKTOREGO INTERNAZIONALEKO’ aipamenarekin

2022·07·19

$titulo.getData()


Tesiaren izenburua: "Dimensionality reduction for the improvement of anti-spam filters."

Epaimahaia:

  • Presidentzia: Octavian Adrian Postolache (ISCTE)
  • Bokala: Iryna Yevseyeva (University of De Montfort)
  • Bokala: José Mª Gómez Hidalgo (TIBCO SOFTWARE)
  • Bokala: Ekhi Zugasti Uriguen (Mondragon Unibertsitatea)
  • Idazkaria: Iñaki Garitano Garitano (Mondragon Unibertsitatea)

Laburpena:

Gaur egun spam mezuek mundu osoko email trafiko globalaren %45-a suposatzen dute. Azken urteetan spam-aren arazoa konpontzeko tekniketan ikerketa ugari egin dira. Soluzio desberdinak probatu dira alderdi legalak, administratiboak eta teknikoak nahastuz. Ikuspuntu tekniko batetik edukietan eta token-etan oinarrituriko teknikek hobekuntza eskasak lortu dituzte. Azken hauek lortutako emaitzak hobetzeko, mezuen barruko informazioa errepresentatzeko era berriak garatu dira (adierazpen bektoriala, gaiak edo synset-ak). Hitzen esanahiak erabiltzeak mezua zein asmorekin idatzia izan den asmatzera bideratzen gaitu, produktuak saldu nahi dituen mezu bat bezala klasifikatuz, informazioa lortu nahi duen mezu bat bezala, etabar. Informazioa errepresentatzeko metodo berri hauek kontzeptuak elkartzeko gaitasuna daukate, esanahi desberdineko hitzak eta esanahi bereko hitzak taxonomikoki azteretuz. Propietate hauetan oinarrituz, ikerketa lan honetan, informazio galera gabeko ezaugarri kopuru murrizketa lortzen duen sistema bat garatu da, zein Ikaste Automatikoan oinarritzen den kontzeptuak elkartzeko. Honi esker arazoaren dimentsioa (tamaina) gutxitu da mezuen sailkapenaren errendimendua hobetuz. Bestalde, garaturiko lan honen honen abantailetan oinarritzen den bigarren sistema bat ere garatu da, non informazio galera gabeko sistemaren sendotasuna, informazio galera txiki batekin konbinatzen den. Amaitzeko Leetspeak-ean kodifikaturiko hitzen informazioa berreskuratzeko dekodifikatzaile bat garatu da. Garaturiko dekodifikatzaileak berreskuratzen dituen hitzen informazioari esker, klasifikazioaren emaitzak hobetu egiten dira.