Tamning tauganeta

14. mars 2024

Tamning tauganeta

Hafsteinn Einarsson

Gervigreind, gervigreind gefðu mér gaum
gefðu mér svarið hið sanna í raun.
Þig þarf að temja og setja í taum,
því taumlaus þú óreiðu skilar sem laun.

Þróun gervigreindar, sérstaklega spjallmenna á borð við ChatGPT, hefur vakið mikla athygli frá því ChatGPT var fyrst kynnt til sögunnar 30. nóvember 2022. Notendur voru fljótir að sjá hversu mikilvæg þessi tækni á eftir að verða og það endurspeglaðist í hraðri notendaaukningu - á fimm dögum urðu notendurnir milljón. Í dag er ChatGPT jafnvel valið fram yfir leitarvélar á borð við Google þegar leitað er eftir upplýsingum.

Þessi nýja tækni hefur vakið upp spurningar um mögulegar breytingar við kennslu, í atvinnulífinu og samfélaginu almennt. Sumir hafa áhyggjur af því að tæknin muni taka störf af fólki, en aðrir benda á að hún geti einnig bætt framleiðni og skapað ný atvinnutækifæri. Ljóst er að þessi þróun er afar mikilvæg og mun hafa víðtæk áhrif á komandi árum og áratugum.

Ein af helstu ástæðum fyrir velgengni ChatGPT er geta þess til að læra út frá samhengi (e. in-context learning). Í því felst að hægt er að lýsa verkefni fyrir spjallmenninu og jafnvel gefa því nokkur dæmi um það hvernig hægt er að leysa það og ef verkefnið er ekki of flókið þá eru ágætar líkur á því að það geti leyst fleiri sambærileg verkefni. Þetta er bylting í samanburði við það hvernig gervigreindarlíkön voru þjálfuð áður fyrr. Þá þurfti yfirleitt að safna saman talsvert af gögnum, merkja þau og þjálfa svo líkan fyrir afmarkað verkefni. Það þótti að auki óraunhæft að vona að slík líkön gætu leyst annað en það verkefni sem þau voru sérstaklega þjálfuð til að leysa.

Vert er að geta þess að ChatGPT er ekki fyrsta gervigreindarlíkanið með þennan eiginleika að læra út frá samhengi. GPT-3 líkanið sem kom út þann 11. júní 2020 var líka með þennan eiginleika en það var þó ekki aðgengilegt í spjallformi, einungis sem líkan sem gat myndað eðlilegt framhald af gefnum texta. GPT-3 er eins og nafnið gefur til kynna, þriðja GPT (e. generative pretrained transformer) líkanið í röð sem gefið var út af OpenAI. Í hverri ítrun var líkanið gert stærra og þjálfað á meira af gögnum. Að læra út frá samhengi var svo eiginleiki sem spratt fram í þessu líkani.

2985 image — Mynd : Gerð með Midjourney og ílagið var: „*An award-winning watercolour painting of a person and a robot facing each other and meditating. They are shown in an epic Icelandic landscape with the sun rising*“

Þrátt fyrir framfarir GPT-3 líkansins liðu rúmlega tvö ár þar til ChatGPT kom út. Ástæðan var sú að GPT-3 skorti kurteisi og hæfni til að haga sér eins og spjallmenni. Að auki átti það í erfiðleikum með að álykta um þarfir notandans út frá óskýru ílagi (e. prompt). Þetta skýrist af því að GPT-3 var einungis þjálfað til að mynda texta, þ.e.a.s. fyrir gefinn texta myndar líkanið eðlilegt framhald af textanum. Almennt hefur lítið verið gefið út um það á hvaða texta líkanið var þjálfað en svona líkön eru í vissum skilningi eins og svampar sem soga í sig upplýsingar úr textanum sem þau eru þjálfuð á. Það hefur jákvæðar afleiðingar, eins og við höfum kynnst, en einnig neikvæðar því líkönin gera t.d. ekki greinarmun á því hvort texti innihaldi fordóma eða ekki eða hvort um hatursorðræðu sé að ræða. 1 Þó bera að nefna að Bard, nýjasta spjallmennið frá Google, er með innbyggða virkni sem gerir notandanum kleift að staðfesta réttmæti þeirra upplýsinga sem spjallmennið lætur frá sér.

GPT-3 hafði því miður ýmsa annmarka sem gerðu það óhentugt sem spjallmenni fyrir almenning. Það gat t.d. sagt mjög niðrandi hluti um ákveðna trúar- eða minnihlutahópa. Einnig gat það gefið notendum siðferðislega vafasamar leiðbeiningar, til dæmis um framleiðslu sprengiefna eða eiturlyfja. Ekkert fyrirtæki, ekki einu sinni OpenAI, gæti þolað þann orðsporshnekk sem myndi fylgja því að bjóða notendum sínum upp á slíkt viðmót frá spjallmenni. Því var ekki annað í stöðunni en að temja tauganetið.

Tamning tauganeta eins og GPT-3 er margslungið verkefni. Markmiðið er að þjálfa líkanið betur í að fylgja fyrirmælum notandans á spjallformi, en jafnframt að auka siðferðislegan skilning þess. Það þarf að geta hafnað siðferðislega vafasömum beiðnum en svarað öllu öðru kurteislega. Ný þjálfunargögn og aðferðir voru notuð til að færa líkanið í þessa átt.

En tamning tryggir ekki að svör líkansins verði rétt. Það getur enn myndað rangar upplýsingar eða sett fram fullyrðingar sem reynast villandi. Þessi óvissa er ein meginástæðan þess að stór tæknifyrirtæki eins og Google voru ekki búin að bjóða upp á þessa tækni fyrr^{^[1]}.

Aðferð OpenAI við að temja tauganet byggir á mannlegu mati. Tauganetin mynda nokkur frálög fyrir gefið inntak og fólk metur og raðar þeim. Svo þurfa matsaðilar að lagfæra besta frálagið til að gera það réttara. Þessi gögn eru notuð til að þjálfa svokallað dómaralíkan sem tekur við hlutverki mannanna. Þannig er hægt að temja netið hratt og bæta frálögin.

Fyrirtæki eins og Facebook hafa notað svipaðar aðferðir við þjálfun líkana sinna. Rannsóknir sýna að þessi nálgun skilar betri árangri en þegar þjálfun fer eingöngu fram á manngerðum gögnum. Litlar upplýsingar liggja fyrir um hverjir útbúa þessi þjálfunargögn, en ljóst er að mikil handavinna liggur að baki. Til dæmis hafa verktakar frá Kenýa unnið við að flokka texta sem inniheldur hatursorðræðu fyrir OpenAI.

Þótt þessar aðferðir hafi skilað árangri, fela þær í sér siðferðisleg álitamál um vinnuaðstæður og greiðslur til þeirra sem vinna við gerð þjálfunargagnanna. Mikilvægt er að skoða þessi mál nánar eftir því sem þessi tækni þróast áfram.

Aðrar leiðir hafa verið farnar við tamningu spjallmenna. Anthropic, sem þróaði Claude 2, sleppti t.d. alfarið mannlegu mati á svörum líkansins. Í staðinn notuðu þeir aðferð sem kölluð er „constitutional AI“ þar sem líkaninu var gefin svokölluð stjórnarskrá. Fyrir gefið inntak fer Claude 2 yfir svarið sitt miðað við stjórnarskrána og lagfærir það til dæmis með því að fjarlægja fordóma og hatursorðræðu. Claude 2 er þekkt fyrir mikla kurteisi og getur myndað betri íslenskan texta en GPT-4. Hins vegar er GPT-4 betra á flestum öðrum sviðum.

Sumir hafa náð langt í tamningu tauganeta með því að safna dæmum um góð ílög og frálög frá notendum. Þau gögn eru síðan notuð til að þjálfa líkönin. Rannsóknir sýna að gæði þjálfunargagnanna skipta höfuðmáli. Ef stór hluti gagnanna er ekki nógu góður mun það endurspeglast í lakari frammistöðu líkansins.

Það er því mikilvægt að útbúa þjálfunargögn af miklum gæðum til að þróa íslenskt mállíkan, sem getur myndað góðan íslenskan texta í samræmi við íslenska menningu og íslensk gildi. Slík gögn geta hjálpað til við að viðhalda íslenskunni í tæknivæddu umhverfi. Einnig er mikilvægt að gögnin séu opin öllum svo sem flest fyrirtæki geti notað þau til að kenna spjallmennum sínum íslensku.

Höfundur: Hafsteinn Einarsson, lektor í tölvunarfræði við HÍ og formaður félags tölvunarfræðinga

Heimildir:

^{^[1]} Þó bera að nefna að Bard, nýjasta spjallmennið frá Google, er með innbyggða virkni sem gerir notandanum kleift að staðfesta réttmæti þeirra upplýsinga sem spjallmennið lætur frá sér.

Skoðað: 346 sinnum

Blaðið Tölvumál

Eldri tölublöð

Skil á efni

Til greinahöfunda

Til auglýsenda

Leita í vefútgáfu Tölvumála

Um Tölvumál

Tölvumál - tímarit Skýrslutæknifélags Íslands er óháð tímarit um tölvutækni og hefur verið gefið út frá árinu 1976.

Vefútgáfa Tölvumála birtir vikulega nýja grein á vef Ský og árlega er gefið út veglegt prentað tímarit undir nafninu "Tölvumál" þar sem fjallað er um tölvutækni frá ýmsum sjónarhornum og er þema blaðsins jafnan valið snemma árs og útgáfa að hausti.

Ritnefnd Ský sér um að afla efni í Tölvumál og geta allir sem áhuga hafa sent inn efni.

Um ritnefnd Tölvumála

Fyrri
Næsta