Ljudje se jezika učimo s posnemanjem, opazovanjem, ponavljanjem, poskusi in odstopanji od jezika okolja. Raziskovanje govora s perspektive jezikoslovne tradicije poteka že stoletja, zato lahko znanstveniki jezikoslovne zakonitosti uporabijo tudi pri razumevanju delovanja nevronskih mrež oziroma umetne inteligence. A kako zgodovinski jezikoslovec pristane v svetu računalniškega jezikoslovja? Zakaj raziskovati jezik kitov glavačev, živalske vrste, ki se sporazumeva na povsem drugačen način kot ljudje? Kako se umetna inteligenca uči jezika? Kup zanimivih vprašanj, na katera sva poskušala najti odgovor z docentom na oddelku za jezikoslovje kalifornijske univerze Berkeley Gašperjem Begušem, ki se ukvarja predvsem s povezavo med jezikom in umetno inteligenco.
Pred nekaj leti je bila misel, da bo jezikoslovje nekoč zelo zaželena panoga, še nenavadna, danes postaja veda ena osrednjih v znanstveni sferi, pojasnjuje
Gašper Beguš, ki razloge za ta premik pripisuje umetni inteligenci. Če pomislimo, da smo nenehno obdani z jezikom in da nas ta determinira že od rojstva, postane vse skupaj bolj razumljivo.
Pri kitih kljub temu o jeziku ne moremo govoriti. Ali pač? »Jezik lahko definiramo kot nekaj izključno človeškega ali pa kot sistem komunikacije bolj na splošno in v tem primeru je marsikaj lahko jezik. Projekt CETI s kiti glavači je izjemno širok, pri njem sodeluje velika skupina znanstvenikov z različnih področij – od inženirjev, biologov, robotikov do kriptografov in jezikoslovcev. Slednji se bomo ukvarjali z jezikoslovjem v povezavi s strojnim učenjem. Inženirji so oblikovali sonde, s katerimi bomo snemali živalsko komunikacijo, nato bodo sonde s pomočjo dronov podatke pošiljale v analizo. Komunikacija kitov glavačev še ni dobro raziskana ali dokumentirana, to bo eden prvih projektov, pri katerem bomo poskušali umetno inteligenco uporabiti kot orodje za dekodiranje nečesa, o čemer vemo zelo malo.«
Napredek v govorni in jezikoslovni tehnologiji, kot so avtomatizirano prepoznavanje govora, nenadzorovano prevajanje, dialoški sistemi, bo raziskovalcem omogočil izdelavo modelov strojnega učenja, ki jih bodo usposobili za obdelavo velike količine podatkov o komunikaciji kitov glavačev.
Razumevanje jezika živali nas bo neizogibno tesneje povezalo z njimi. FOTO: Shutterstock
Zakaj raziskovati jezik kitov
Ko se jezika učimo ljudje, imamo osnovo, vemo, kaj so enote, na primer besede, pri kitih pa tak antropocentrični vidik ne pride v poštev. »Kiti prek foničnih ustnic oddajajo klike, podobne Morsejevi abecedi. S temi kliki lovijo plen, pa tudi komunicirajo. Skupkom klikov pravimo kode,« neskončno zanimivi svet živalske komunikacije orisuje ustanovitelj fonološkega laboratorija na univerzi Washington in laboratorija za govor in računalništvo na Berkeleyju. Dejstvo, da komunikacija kitov poteka pod vodo, ki je povsem drugačen medij kot ta, v katerem poteka naše sporazumevanje, bo izziv za inženirje.
Na vprašanje, zakaj sploh raziskovati njihovo sporazumevanje, Gašper Beguš odgovarja: »Kite glavače zelo moti hrup. Naš projekt bo eden od načinov, kako zmanjšati človekov vpliv na njihovo bivanje. Ljudje kot vrsta se moramo začeti zavedati odnosa do drugih vrst. Prav tako nas zanima, kam sodi jezik kitov glavačev glede na jezik drugih vrst. Zame je razburljiv del tudi priprava na analizo podatkov o novih komunikacijah. Njihov sistem sporazumevanja je zelo unikaten in k njemu pristopamo, ne da bi sploh vedeli, kje iskati osnovne enote komunikacije, kako se kiti med sporazumevanjem obnašajo. Strojno učenje bomo uporabili za analizo neznanih komunikacij.«
Knjižni govor je družbeni konstrukt, v realnosti je ob uporabi narečij govor namreč bolj kompleksen. »Otrok naju je sposoben razumeti, čeprav prihajava iz različnih jezikovnih okolij. Za treniranje nevronskih mrež oziroma umetne inteligence poskušamo posnemati otroško učenje. Naredil sem model, pri katerem mora umetna inteligenca iz nič producirati govor na tak informativen način, da ga razumemo. Pri tem modeliramo, kot bi bili neodvisni od organov za govor, pljuč, grla. Po eni strani je to seveda drugače od resničnosti, a lahko bolje modeliramo kognitivno dogajanje. Sam raziskujem, kaj je pri govoru res kognitivnega in kaj posledica tega, da moramo to izreči z usti, nosom, grlom in jezikom.« Vsako modeliranje, poudarja sogovornik, je le približek realnosti.
Jezik lahko definiramo kot nekaj izključno človeškega ali pa kot sistem komunikacije bolj na splošno in v tem primeru je marsikaj lahko jezik. FOTO: Alain Jocard/Afp
Združevanje novih in starih odkritij
Ljudje se jezika učimo tudi s čutili, posnemanjem, opazovanjem okolice, ne le z možgani oziroma govornimi organi. »V laboratoriju razvijamo modele umetne inteligence, ki se učijo jezika zgolj iz posnetkov govora. Nato opazujemo, kako ta način učenja odstopa od na primer otroškega. Otroci imajo določene meje, enako je pri umetni inteligenci, le da je teh meja v nekaterih primerih manj,« pojasnjuje Gašper Beguš in pri vprašanju, ali lahko o strojnem učenju torej govorimo kot o »zelo naprednem otroku«, opozori na previdnost.
»Zdaj še ne razumemo dobro niti tega, kako možgani delujejo. Otroci so trenutno vsekakor uspešnejši pri učenju kot strojni modeli, a ko smo raziskovali, kako se otroci iz angleško govorečega okolja učijo glasov zapornikov, smo ugotovili, da v nekaterih pogledih pri umetni inteligenci učenje jezika poteka podobno.«
Občutek, ko kot znanstvenik sodeluje pri takšnih prebojnih raziskavah, je dober, pravi. Poskuša zgraditi modele, o katerih prej ni niti razmišljal, z nove perspektive ugotavlja, kako delujejo možgani in komunikacija. V znanosti je vse proces, zato so takšni poskusi pomembni za celotno družbo, čeprav morda na koncu ne bodo prišli do vseh odgovorov.
»A ne smemo se osredotočati le na nove stvari, pač pa najti vrednost tudi v preteklih odkritjih. V mojem laboratoriju na Berkeleyju delamo analize z nevronskimi mrežami, pri tem pa uporabljamo tudi teorijo formalnega in zgodovinskega jezikoslovja. Združevanje starih in novih metod je fascinantno.« Med študijem primerjalnega jezikoslovja na ljubljanski filozofski fakulteti se je naučil prav tega, kako se jezik spreminja, kar mu pride prav pri raziskovanju jezika kitov glavačev. V ZDA je sodelovanje med oddelki oziroma univerzami nekaj vsakdanjega, saj je brez tega pogled študentov, profesorjev in drugih osiromašen, se strinja.
Gašper Beguš, znanstvenik, ki raziskuje skrivnosti komunikacije kitov glavačev. FOTO: Uroš Hočevar/Kolektiff
Rešitve, ki jih s pomočjo strojnega učenja znanstveniki vpeljujejo v celotno družbo, pomembno vplivajo na življenje posameznika, zato so etična vprašanja nujen del raziskav. »Govor sam po sebi nosi ogromno potencialno nevarnih podatkov. Iz nekaj besed lahko razberemo spol, raso, starost, geografske podatke. Naj ponazorim s teoretičnim primerom – govorec neke družbene skupine določeno besedo med govorom uporabi večkrat kot govorec druge skupine.
Z jezikoslovnimi tehnologijami se lahko nevronska mreža nauči to zaznati. Če recimo zgradiš model, s katerim želiš napovedati neki družbeni izid, lahko to dejstvo vpliva na odločitev, ali boš nekomu odobril kredit ali ne. Te tehnologije so zato po eni strani zelo nevarne. Vprašanje torej je, ali lahko modele kreiramo tako, da teh 'predsodkov' – v tem primeru torej ponavljajoče se besede – ne bodo potencirali,« pojasni Gašper Beguš in poudari, da so etična merila pri uporabi umetne inteligence zato nadvse pomembna.
Komentarji