Konkurenčnost slovenščine – toda na čigav račun?

Veliki jezikovni modeli UI tudi pri nas predmet burnih razprav – Gre za primer dobre prakse ali obsežno kršitev avtorskih pravic?

Galerija

Na neustreznost kodeksa ravnanja EU za izvajanje akta o UI so prejšnji teden opozorila združenja evropskih književnih prevajalcev, novinarjev in pisateljev, ki zastopajo več kot 550.000 avtorjev. FOTO: Nicolas Maeterlinck Belga/Reuters

Pia Prezelj

5. 4. 2025 | 05:00

23:33

A+A-

V nadaljevanju preberite:

V luči razvoja novega velikega jezikovnega modela za slovenščino GaMS, ki bo deloval po principu ChatGPT-ja, se tudi pri nas razpira vse burnejša razprava o etičnosti podatkovnega rudarjenja, s katerim si UI avtorska besedila prisvaja brez soglasja avtorja in brez nadomestila.

Barbara Pogačnik, predstavnica Društva slovenskih pisateljev v European Writers Council, poudarja, da je »etični standard tu vprašanje zakonodaje. Slovenski 'izvirni greh' se je zgodil ob razpravi in implementaciji evropske direktive o enotnem digitalnem trgu iz leta 2019. Že tedaj reprezentativna avtorska društva niso bila povabljena v javno razpravo, saj ne predstavljajo gospodarske entitete«.

Pod okriljem Centra za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT UL) je ta hip v razvoju tudi veliki jezikovni model za slovenščino, ki se bo, če se bodo »z NUK in drugimi deležniki dogovorili, da nam omogoči dostop do tovrstnih del,« morebiti učil tudi na avtorsko zaščitenih besedilih, ki jih hrani NUK. Kot poudarja vodja CJVT UL Simon Krek, gre za kolektivno odločitev govorcev in govork slovenščine, »do katere mere želimo, da bo umetna inteligenca znala slovensko oziroma bo poznala slovensko okolje in kulturo«. Glavni namen projekta je »zagotoviti, da bo imel slovenski jezik primerno podporo v digitalnem okolju«, a pod trenutno evropsko zakonodajo jezikovni modeli jezike v digitalno okolje vpeljujejo prav na račun avtoric in avtorjev, katerih dela jih hranijo.