Argitalpenak
HABE-IXA euskarazko idazmen-proben corpuseko idazlanen mailakatze automatikoa
- Atala:
- Egilea:
- Dokumentu-mota:
- Areas of knowledge:
- e-Hizpide zenbakia:
- 101
- Saila e-Hizpide / Hizpide / Zutabe:
- Atala:
- Egilea:
- Dokumentu-mota:
- Areas of knowledge:
- e-Hizpide zenbakia:
- 101
- Saila e-Hizpide / Hizpide / Zutabe:
- Bisitak: 968
- Iruzkinak: 0
- Gogokoak: 1
Gero eta euskarazko testu gehiago idazten da ordenagailuz eta hainbat erabileratarako interesgarria litzateke Helduen Euskalduntzearen Oinarrizko Curriculumeko (HEOC) komunikagaitasun-mailetan oinarrituta testuok automatikoki mailakatzea. Artikulu honetan azalduko den lanaren helburua honako hau da: HABE-IXA euskarazko idazmen-proben corpusa aurkeztea eta, Europako Erreferentzia Marko Bateratuko (EEMB) B1, B2, C1 eta C2 mailen arabera sailkatzeko tresna automatikoekin lortutako emaitzak azaltzea. HABE-IXA corpusa HABE erakundeak egiaztatzegintza-prozesuetan jasotako 480 idazlanez eta horien ebaluazioez osaturik dago. Testu-sailkapenean, Ixa taldeak (UPV/EHU) hizkuntza-prozesamendurako sorturiko analisi-tresnak eta ikasketa automatikoko teknikak erabiliz, zenbait sailkapen-ataza garatu dira eta emaitzarik onena (% 97ko zehaztasuna) idazlanei dagokien maila esleitzean lortu da. Etorkizuneko asmoa da corpus handiagoak osatu eta euskararen irakaskuntzarako baliagarriak izan daitezkeen sailkapen-tresnak garatzea. Corpusa eskura dago CC BY-NC 4.0 lizentziapean.
https://doi.org/10.54512/AGRJ9063