englishflag

Stafrænt líf íslenskunnar – eða stafrænn dauði?

EiríkurEnginn vafi er á því að ytra áreiti á íslenskuna hefur vaxið mjög mikið á undraskömmum tíma, einkum á undanförnum fimm árum eða svo, og mun fyrirsjáanlega aukast enn á næstunni. Fyrir því eru ýmsar ástæður sem margar hverjar tengjast tölvu- og upplýsingatækni, svo sem snjall-tækjabyltingin, útbreiðsla gagnvirkra tölvuleikja, YouTube- og Netflix-væðingin, og í sjónmáli er mikil útbreiðsla talstýringar. Flest tæki eru nú tölvustýrð að mestu leyti og þessum tækjum verður á næstunni stjórnað með tungumálinu að miklu leyti – við munum tala við þau eins og maður við mann. Margir þekkja nú þegar talandi leiðsögutæki í bílum, eða Siri í iPhone, eða sjónvörp sem talað er við.

Þessar nýju aðstæður skapa mikið álag og þrýsting á íslenskuna og þótt staða hennar virðist góð á yfirborðinu er hún brothætt – það þarf e.t.v. ekki mikið til að fari að molna úr undirstöðunum. Til að verða öruggir málnotendur þurfa börn og unglingar að hafa mikla íslensku í öllu málumhverfi sínu. Sá tími sem varið er í afþreyingu, samskipti og störf á ensku er að mestu leyti tekinn frá íslenskunni. Því má spyrja hvort ástæða sé til að bregðast við þessari þróun – og þá hvernig?

Viðbrögð stjórnvalda

Stjórnvöld hafa sýnt að þau átta sig á hættumerkjunum – í orði a.m.k. Vorið 2014 samþykkti Alþingi einróma þingsályktun um „aðgerðaáætlun um notkun íslensku í stafrænni upplýsinga-tækni“. Í skýrslu nefndar sem skipuð var í framhaldi af þingsályktuninni er lagt til "að fjárfest verði í íslenskri máltækni með sérstakri langtímaáætlun til 10 ára […]. Nefndin áætlar að það þurfi um einn milljarð króna til að byggja nauðsynlegan grunn þannig að í lok áætlunarinnar verði íslenskan komin í flokk nágrannatungumála þegar litið er til stuðnings við máltækni. Þetta er vissulega mikið fé, en nefndin telur að á þessu sviði eigi þjóðin ekkert val, sé raunverulegur vilji til þess að gera Íslendingum kleift að halda áfram að nota íslensku á öllum sviðum þjóðlífsins."

Í umræðum á Alþingi á degi íslenskrar tungu 2015 sagði Illugi Gunnarsson mennta- og menn-ingarmálaráðherra: Það verður að vera þannig, og það verður þannig, að á næstu missirum og árum verði tryggt að nægjanlegt fjármagn fáist til að vinna þá vinnu sem nauðsynleg er til að íslenskan verði gjaldgeng í hinum stafræna heimi."

Á þingfundi í vor upplýsti ráðherra svo að ríkisstjórnin hefði efnt til samstarfs við atvinnulífið um átak á sviði máltækni og unnið væri að ítarlegri verk- og kostnaðaráætlun sem væntanleg væri með haustinu. Á meðan tifar klukkan og því hefur jafnvel verið haldið fram að næstu tvö til þrjú ár geti ráðið úrslitum um framtíð íslenskunnar.

Stafrænn tungumáladauði

Hugtakið stafrænn tungumáladauði (e. digital language death) hefur talsvert verið notað í umræðu um stöðu og lífvænleik tungumála upp á síðkastið. Með því er átt við að tungumál verði undir á netinu og í stafrænum samskiptum. Í viðamikilli könnun sem gerð var 2012 og náði til 30 evrópumála kom fram að 21 af þeim málum sem könnunin tók til ætti á hættu stafrænan dauða – næði ekki að halda í við öra þróun í máltækni og stafrænum sam-skiptum þar sem tungumálið leikur sífellt stærra hlutverk. Íslenska var meðal þeirra mála sem voru talin í hættu – og stóð raunar næstverst allra málanna. Því hefur einnig verið haldið fram að a.m.k. 95% allra tungumála í heiminum láti undan síga í stafrænni notkun.

Stafrænn dauði er án efa gagnlegt hugtak, en ýmislegt er enn óljóst í sambandi við merkingu þess og notkun. Hvernig er nákvæm skilgreining á stafrænum dauða? Hvernig lýsir hann sér? Hvað veldur honum? Hvaða mælistikur eða viðmið er hægt að nota til að meta stafrænt lífsmark tungumála? Er hægt að koma í veg fyrir stafrænan dauða – og þá hvernig? Leiðir stafrænn dauði óhjákvæmilega til algers dauða, eða getur tungumál lifað góðu lífi í raunheiminum þótt það verði undir á netinu?

Mikilvægi máltækninnnar

Ef við viljum gera eitthvað til að bæta lífsskilyrði íslenskunnar til frambúðar og auka möguleika hennar á að lifa áfram, bæði í stafrænum heimi og raunheimi, tel ég að það mikilvægasta og gagnlegasta sem við getum gert sé að gera átak á sviði íslenskrar máltækni.  Með máltækni er átt við margs konar tengsl tungumáls og tölvutækni – máltækni gerir okkur kleift að hafa samskipti við tölvurnar, og nýta þær á ýmsan hátt til að liðsinna okkur við tungumálið. Framfarir í talgreiningu eru stórstígar og skammt er í að ýmsum algengum heim-ilistækjum verði stjórnað með því að tala við þau – en hvaða tungumál?

Að óbreyttu er ekki útlit fyrir að hægt verði að tala íslensku við tækin. Að vísu er íslensk tal-greining í símum með Android-stýrikerfi, og tæknilega séð er ekkert því til fyrirstöðu að við notum íslensku í stað ensku í samskiptum við leiðsögukerfið í bílnum okkar, eða tölum íslensku við Siri. En til að svo megi verða þarf fé til að útbúa ákveðin gögn og vinna ákveðna tæknivinnu. Verði þetta ekki gert er hætta á að íslenskan missi stórt notkunarsvið yfir til enskunnar.

En máltæknin getur líka komið að gagni á ýmsum öðrum sviðum. Það er t.d. tæknilega hægt að setja íslenskan texta á allt sjónvarpsefni, hvort sem það er á Netflix, YouTube eða annars staðar, með því að nota talgreiningu og vélrænar þýðingar. Talgreinir greinir þá erlenda talið og breytir því í ritaðan texta sem sendur er til þýðingarforrits. Þýðingarforritið snarar textanum á íslensku og getur skrifað hann sem neðanmálstexta á skjáinn, eða sent hann til talgervils sem skilar frá sér íslensku tali. Þessi tækni er þegar til fyrir ensku – að vísu ekki sérlega fullkomin enn, en batnar mjög með hverju ári. Tækni af þessu tagi gæti skipt sköpum fyrir framtíð íslenskunnar.

Nauðsynlegar aðgerðir

Hvað þarf þá að gera? Þess má vænta að ítarlegar tillögur um það komi út úr áðurnefndu samráði ríkisvaldsins og Samtaka atvinnulífsins, en nefndin sem samdi aðgerðaáætlunina sem áður er getið lagði áherslu á þróun þrenns konar búnaðar: Fullkominnar talgreiningar fyrir íslensku, vélrænna þýðinga milli íslensku og annarra mála, og búnaðar til að lagfæra og leiðrétta málfar á íslenskum textum.

En að auki er grundvallaratriði að byggja upp viðamikil málleg gagnasöfn fyrir íslensku – textasöfn og orðasöfn sem eru greind á margvíslegan hátt (beygingarlega, setningafræðilega, merkingarlega o.fl.), og einnig söfn með upptökum af töluðu máli. Í söfn af þessu tagi er hægt að sækja margvíslegar upplýsingar um málið og notkun þess. Því stærri og vandaðri sem söfnin eru, þeim mun ítarlegri upplýsingar má vinna úr þeim, og þeim mun betri verður máltæknibúnaðurinn sem byggður er á þessum upplýsingum.

Lokaorð

Íslenska deyr ekki út á næstu fimm eða tíu árum – og ekki á næstu áratugum, held ég. Hún hefur góða möguleika á að standast þann þrýsting sem hún verður nú fyrir en til þess þarf hún stuðning, og fyrsta skrefið er að málnotendur – og stjórnvöld – átti sig á þeim gífurlegu breyt-ingum sem hafa orðið á umhverfi og aðstæðum íslenskunnar á örfáum árum, og til hvers þær gætu leitt. Það er vissulega útilokað að segja til um langtímaáhrif þessara breytinga, en við getum ekki leyft okkur að loka augunum fyrir þeim. Þegar og ef hrun verður í tungumálinu, eða það verður ónothæft á mikilvægum sviðum, verður of seint að grípa til aðgerða – glötuð tunga verður ekki endurheimt. Tíminn er þess vegna dýrmætur og íslenskan á að njóta vafans.

Höfundur: Eiríkur Rögnvaldsson prófessor í íslensku við Háskóla Íslands