Besedna igra, ki bo koristila tudi logopedom

Na Inštitutu za slovenski jezik po vzoru kolegov iz Katalonije zbirajo podatke o razširjenosti besed v našem jeziku. Pobudo za raziskavo so dali logopedi.

Galerija

Besedomat vsebuje 80.000 pravih besed in 20.000 lažnih. FOTO: Blaž Samec

Simona Bandur

21. 1. 2025 | 07:51

21. 1. 2025 | 07:57

9:16

A+A-

Kakšen je besedni zaklad Slovencev? To je eno od vprašanj, na katera išče odgovor Besedomat, besedna igra, ki so jo zasnovali na Inštitutu za slovenski jezik Frana Ramovša ZRC SAZU po vzoru kolegov jezikoslovcev iz Katalonije. Medtem ko reševalci ugibajo, ali besedo poznajo ali ne, ter tekmujejo sami s sabo in izzivalci, jezikoslovci zbirajo podatke o razširjenosti besed v našem jeziku. Doslej so uporabniki igro rešili več kot 21.000-krat, da bi bili podatki znanstveno relevantni, potrebujejo še dvakrat tolikšno število, pravi vodja projekta dr. Andrej Perdih, raziskovalec z omenjenega inštituta, zato si želijo privabiti čim več ljudi različnih starostnih skupin in iz različnih okolij.

Zastonjskost, spisovati, posrednica, rdečeok, magnetnost, vmes pa estenizirati, fipoteza, kletovati, mimetričen, besede, ki zvenijo nekako znane, ampak ne čisto prave. Dvom o njih je povsem upravičen, to so gnila jajca, ki so jih podtaknili snovalci Besedomata, sicer s plemenitim namenom – ugotoviti, katere besede bolj ali manj poznamo Slovenci. Plemenit je tudi povod za besedno igro. Pobuda je namreč prišla od logopedov, ki obravnavajo ljudi z motnjami v jezikovnem procesiranju.

Stetoskop v življenju zdravnika ali slehernika

Med njimi je Tina Pogorelčnik, specialistka klinične logopedije na nevrološki kliniki UKC Ljubljana. Kot je pojasnila, se razlika med zdravimi ljudmi in ljudmi, ki so utrpeli možgansko kap, poškodbo možganov, se zdravijo zaradi možganskega tumorja ali imajo kognitivne težave, pogosto kaže v priklicu besed. Pri zdravih ljudeh, ki se morda ne spomnijo takoj določene besede, se ta čas meri v milisekundah, pri ljudeh z motnjami v jezikovnem procesiranju pa se tovrstni priklici podaljšajo do te mere (tudi do deset sekund ali več), da jih slišimo s prostim ušesom ali so lahko celo moteče za poslušalca.

»Izziv logopedov pri obravnavi odraslih ali otrok s posebnostmi v komunikaciji je izbrati ravno prav zahtevno raven besed. Zato je pomembno, da vemo, katere besede so najbolj razširjene med prebivalstvom. Besedomat nam bo dal prav to: bogat nabor podatkov o besedah, ki jih bomo lahko uporabili in na podlagi tega individualno prilagodili terapije.« Za primer je navedla stetoskop. »Ta beseda je splošni javnosti dobro znana, vendar ni zelo razširjena. A če bi prišla na primer na obravnavo starejša zdravnica, ki sumi, da ji pešajo kognitivne sposobnosti, bi ta beseda verjetno ostala v njenem mentalnem slovarju in bi ga med 50 slikami, ki bi ji jih pokazala, najbrž brez težav poimenovala.«

Poleg razširjenosti besed, ki jo meri Besedomat, so za logopede pomembne še druge besedne značilnosti, denimo, koliko je beseda konkretna, kako je predstavljiva in navsezadnje, kdaj smo jo usvojili. »Praviloma velja, da prej ko smo besedo usvojili, bolj se bo ustalila v našem besednjaku, tudi če je pozneje ne uporabljamo. Takšen primer je duda. Naučimo se je zelo zgodaj v življenju, a čeprav je pozneje ne uporabljamo več, jo bomo brez težav priklicali v spomin.« Besede, ki jih pogosto uporabljamo, tudi procesiramo hitreje kot tiste, ki jih uporabljamo redko.

Pri snovanju diagnostičnih testov so logopedi do zdaj že sodelovali z dr. Maticem Pavličem z ljubljanske pedagoške fakultete, ki je eden od sodelujočih v projektu, med drugim so ustvarili prvi standardizirani test poimenovanja predmetov v slovenščini (uradno slovenski test iskanja besed), želeli pa so razviti tudi diagnostični test za ocenjevanje jezikovnih zmožnosti med operacijo možganskega tumorja v budnem stanju, a jim je umanjkal prav omenjeni podatek o razširjenosti besed.

Prej ko smo besedo usvojili, bolj se bo ustalila v našem besednjaku, je pojasnila specialistka klinične logopedije Tina Pogorelčnik. FOTO: osebni arhiv

Besedna razširjenost

To je razmeroma nova besedna značilnost, ki pomaga ugotoviti zahtevnost besede v skupini besed, ki niso zelo pogoste.

»Tako lahko ločimo na primer med besedama bakrenast in bedresce, ki imata v korpusu enako izmerjeno pogostost, pa je ena od njiju občutno bolj razširjena med govorci slovenskega jezika, druga pa manj,« je pojasnila specialistka klinične logopedije Tina Pogorelčnik z nevrološke klinike UKC Ljubljana.

Za vsako besedo sto odgovorov

Besedomat so na Inštitutu za slovenski jezik Frana Ramovša zasnovali po katalonskem vzoru, deluje pa tako, da uporabnik za vsako od 120 besed, ki se prikažejo na zaslonu, presodi, ali je del slovenskega jezika ali ne. Med njimi je 84 pravih besed, izbranih iz geslovnikov slovarjev (SSKJ2, eSSKJ in sprotnega slovarja slovenskega jezika), preostalih 36 je lažnih. Slednje so narejene računalniško, a tako, da se še vedno ujemajo z značilnostmi slovenskega jezika, kakor je pojasnil Andrej Perdih. Na koncu reševalec izve, kakšen je bil njegov odstotek uspešnosti, kar ga seveda žene naprej, da bi premagal sam sebe – ali pa vsaj tiste, ki jih je pritegnil k igri. V njej so raziskovalci sicer vsega skupaj uporabili približno 80.000 pravih besed in 20.000 izmišljenih.

Do zdaj so uporabniki besedno igro rešili več kot 21.000-krat, cilj raziskovalcev je dobiti vsaj 40.000 rešenih izzivov. Ali kot je pojasnil Perdih: za vsako besedo želijo pridobiti sto odgovorov.

Do 20. leta 42.000 besed

Podobna raziskava, narejena za ameriško angleščino, je pokazala, da pozna 20-letni govorec v povprečju približno 42.000 besed. Do 60. leta se jih nauči še 6000, to je približno eno v dveh dneh.

Slovenija je sicer peta država v Evropi, kjer poteka takšna množična raziskava razširjenosti uporabe besed (financira jo Aris, javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost), doslej so jo izvedli za nizozemščino, španščino, angleščino in katalonščino. Slovenski jezik ima med njimi najmanj govorcev, zato so seznam 80.000 pravih besed razdelili na deset sklopov, vsakega izmed njih bodo, ko bodo v vsakem dosegli želeno število odgovorov, zamenjali z novim. Sicer pa za merilo uporabljajo tudi primerjavo s Katalonci, približno devetmilijonskim narodom, kjer je takšno raziskavo rešilo 200.000 ljudi. Če bi hoteli prekositi Katalonce, bi morali tako k igri pritegniti 40.000 Slovencev in Slovenk, pravi Perdih.

Pri tem si nikakor ne želijo odgovorov (samo) tistih, ki jih jezik zanima sam po sebi ali zaradi narave dela, ampak čim širšega nabora sodelujočih iz različnih delov Slovenije, z različno izobrazbo in različnimi interesi. »Za odrasle govorce slovenščine nas zanima, kakšno je splošno poznavanje besed pri določeni starosti, kako na to vplivata izobrazba ter kraj rojstva in bivanja in katere besede poznamo bolj in katere manj,« je razložil Perdih. Kot je dodal, so dosedanje raziskave pokazale, da besede, ki so v besedilnih korpusih zelo pogoste, praviloma tudi zelo dobro poznamo. »Kar zadeva besede, ki so redkejše v korpusu, pa je zelo različno, ali jih dobro ali slabo poznamo. Zlasti ta del spoznanj iz raziskave bo zelo dragocen.«

Spoznanja o razširjenosti besed ne bodo pomembna le za logopede in nevrologe, marveč tudi pri učenju slovenskega jezika za tujce in navsezadnje z vidika slovaropisja. »Slovarji, kot sta SSKJ in eSSKJ, obravnavajo 100.000 besed, kar pomeni, da so v njih vse besede, ki so pogoste, in tudi veliko redkih. Mi se pa želimo čim bolj objektivno odločati o tem, katere besede naj uvrstimo v slovar – katere so za današnjo slovenščino najbolj relevantne.« Doslej je bil tudi pri tem najbolj objektiven in empirično ugotovljiv kriterij korpusna frekvenca, izsledki Besedomata pa bodo pomagali razločevati tudi med besedami, ki so redke. »Tako bomo izvedeli, katere besede, čeprav so redke, govorci poznamo in tvorijo sodobno slovenščino.« Šestkotnik, je dodal primer, ni prav pogosta beseda, a jo vsi poznamo, ker smo se učili o njem v šoli, medtem ko vedo, kaj pomeni peskalni, ki je približno enako pogosta beseda, samo strokovnjaki s področja kamnarstva.