Pošljite nam svoje jezikovne dileme
Dragi bralci, vabimo vas k soustvarjanju tedenske jezikovne rubrike. Svoje jezikovne dvome nam pošljite na spodnji naslov.
jezik@primorski.eu
Pozdravljeni, mene pa zanima, za kaj in kako se uporablja orodje za spremljanje jezikovnih trendov Sledilnik?
Sledilnik 1.0 je eno novejših orodij Centra za jezikovne vire in tehnologije (CJVT) Univerze v Ljubljani, v tem zapisu pa bomo poskušali čim krajše predstaviti funkcije in tehnično ozadje orodja.
Lotimo se kar tehnične plati – kot je nekoč rekel veliki računalniški jezikoslovec Adam Kilgariff: »Jezikovna raba ni nikoli, ampak res nikoli naključna.« To pomeni, da se ljudje izražamo v vzorcih, ki se vseskozi ponavljajo, hkrati pa se s časom, prostorom, situacijami in nami samimi spreminjajo. Tako se denimo tudi slovenščina v Italiji sčasoma nekoliko odmika od slovenščine v Sloveniji, saj se pojavlja v drugačnih okoliščinah, opisuje druge predmetnosti ipd. Orodje Sledilnik – grobo povedano – izrablja to načelo prožne stalnosti jezika: ker že imamo zgrajene velike »žaklje« besedil v slovenščini, ki jim pravimo korpusi, vemo, kaj je v jeziku običajno, stalno in pričakovano. Posledično lahko s tem, da vsakodnevno napravimo »sliko« ali dnevni prerez spletne slovenščine ob koncu leta vseh 365 (letos 366) slik strnemo v mozaik celotnega leta, nato pa to sliko primerjamo z vsemi podatki za slovenščino in vidimo, kaj izstopa.
In za kaj je to orodje uporabno? Predvsem nam daje uvid v novejše koncepte, ki se pojavljajo v naši kulturi in jeziku, obenem pa lahko vidimo, kaj je bilo v določenem obdobju najbolj pereče. Pa si oglejmo leto 2023: spodnji graf prikazuje najbolj relevantne samostalnike (ujma, nutrija, protiofenziva, poplava in letalnik).
Graf je sicer pisan, a kaže bolj žalostno podobo: rdeča krivulja (ujma) naznanja katastrofo, ki odseva v rumeni krivulji (poplava), pri tem pa višina krivulje odraža pogostnost omembe v slovenskih spletnih medijih. Ostale besede so povezane z vojno v Ukrajini (protiofenziva, letalnik) in pa (ne)dobrodošle ljubljanske nutrije.
Tako lahko vidimo, kaj je najbolj zaznamovalo jezik slovenskih spletnih medijev v preteklem letu, obenem pa lahko spremljamo tudi nove pojave in nove predmetnosti. Če denimo z orodjem preverimo pet najbolj relevantnih novih besed leta 2023, med njimi najdemo drekovod (sporni kanal C0), šahed (iranski dron), neprihajanje (izostanek od dela ali naročenega termina pri zdravniku), ChatGPT (vseprisotni veliki jezikovni model) in vejavico (snežni metež).
Tovrstna orodja omogočajo predvsem uvid v najsodobnejšo jezikovno rabo v slovenščini, nove trende in nove predmetnosti, obenem pa omogočajo tudi povezljivost z drugimi viri v »ekosistemu« jezikovnih tehnologij. Ob tem pa vsem vam in nam želimo, da bodo jezikovni trendi za leto 2024 odsevali čim lepše reči.