Skip to main content
6. júní 2019

Babel fiskur

kolbeinnHitchhiker‘s Guide to the Galaxy er frægt útvarpsleikrit eftir Douglas Adams. Þar er fjallað um Englendinginn Arthur Dent sem lendir í því að þurfa að fara á puttanum út í geim eftir að jörðin er eyðilögð. Í geimnum tala menn önnur tungumál sem hann ekki skilur. Til allrar hamingju er vinur hans Ford Prefect með í för og treður litlum gulum slímugum fisk upp í eyrað á honum (BBC, 2014).

Fiskurinn  sem  um  ræðir  kallast  Babel  fiskur  og  er  líklega  það  allra  furðulegasta  í  öllum alheiminum. Fiskurinn nærist á heilabylgjum og dregur í sig tíðnisvið undirmeðvitundarinnar. Fiskurinn skilar svo úrgangi í formi taugaboða sem berast til málúrvinnslusvæðis í heilanum. Það  að  stinga  svona  fisk  upp  í  eyrað  hefur  því  í  för  með  sér  að  viðkomandi  skilur  á örskotsstundu allt sem er sagt við hann á hvaða tungumáli sem er (BBC Studios, 2017).

Þessu leikriti  var  útvarpað  árið  1978  og  var  þá  eingöngu  um  vísindaskáldskap  að  ræða  en  í  dag  er Google  búið  að  finna  upp  svipaða  tækni  sem  hefur  álíka  virkni  og  fiskurinn  nema  ekki  eins slímuga. Babel-Fish EarbudsTæknin  sem  um  ræðir  kallast  Pixel  Buds.  Hún  er  þróuð  af  Google  og  er  í  formi  heyrnartóla. Þessi  ágætu  heyrnartól  notast  með  Pixel  snjallsímanum  þeirra  og  smáforritinu  Google Translate.  Tæknin  virkar  þannig  að  ein  manneskja  setur  heyrnartólin,  sem  eru  eins  konar eyrnatappar, í eyrun á meðan önnur manneskja heldur á símanum. Sú sem er með „fiskinn“ í eyranu,  styður  fingri  á  hægri  eyrnatappann  á  meðan  hún  segir  eitthvað  á  sínu  móðurmáli. Smáforritið  þýðir  það  sem  var  sagt  yfir  á  tungumál  sem  er  valið  í  símanum  og  spilar  það upphátt. Manneskjan sem heldur á símanum svarar því sem var spilað og svarið er síðan þýtt til baka og spilað í gegnum heyrnartólin (Metz, 2017).

Góð hugmynd en slæm hönnun

Google  Translate  getur  þýtt  meira  en  100  tungumál  en  Pixel  Buds  getur  enn  sem  komið  er aðeins  þýtt  40.  Þessi  nýja  tækni  getur  brúað  tungumálagjá  milli  tveggja  einstaklinga  nokkuð fljótt en þó ekki í rauntíma. Samskiptin taka því aðeins lengri tíma en ella, því bíða þarf eftir að tækin þýði það sem er verið að segja í samræðum. Þá ganga þessi samskipti ekki alltaf villulaust fyrir sig eins og þeir þekkja sem hafa notað Google Translate. Tækið á það til að klippa burt endann á setningum á meðan fólk er ennþá að tala og skiptir jafnvel um tungumál í miðjum samræðum.Helstu vankantar á tækinu eru þó hönnunin. Tækið er þungt og fyrirferðarmikið í eyranu á þér. Þó að heyrnartólin eigi að vera þráðlaus og notast við Bluetooth tækni er engu að síður snúra á milli eyrnatappanna sem hægt er að herða til aðlögunar milli eyrna. Þá eiga eyrnatapparnir það til að detta út ef viðkomandi er með lítil eyru. Hægt er að hlaða heyrnatólin en rafhlaðan í þeim endist í 5 tíma (Metz, 2017).

Google Translate

Þar  til  í  september  2016  notaði  Google  Phrase-Based  Machine  Translation  (PBMT)  tækni  í þýðingarnar sínar. Sú tækni byggir á Statistical Machine Translation (SMT) en í stuttu máli þá safna  eins  mikið  af  upplýsingum  í  formi  texta  með  orðasamböndum  og  reyna  að  finna hliðstæður með tveimur tungumálum. Síðan vinna þeir úr öllum gögnunum og reyna að finna líkurnar á að eitthvað á einu tungumáli þýði eitthvað annað á öðru tungumáli (Zhang, 2017). En Google Translate var ekki alltaf besta leiðin til að þýða heilar málsgreinar af einu tungumáli yfir á annað. Hver kannast ekki við að fá tölvupóst skrifaðan á „íslensku“ af nígerískum prins með  Google  Translate.  Ég  fékk  einu  sinni  slíkan  póst  og  hann  var  svo  skemmtilega  vitlaust skrifaður að það fékk mig til að brosa. Nú fer þessum vitleysum fækkandi og vinur okkar frá Nígeríu er farinn að geta skrifað nánast eins og innfæddur Íslendingur.

Mynd 1, myndtexti Google Translate.

Google Translate fer óðum fram í að þýða tungumál en frá árinu 2016 hafa þeir verið að notfæra sér framfarir á sviði gervigreindar. Nýja kerfið þeirra GNMT (Google  Neural  Machine  Translation),  byggir  á  ANN  eða  Artificial  Neural  Networks  (Zhang, 2017). Artificial Neural Networks eru notuð meðal annars í að talgreina og þekkja rithandarsýnishorn. Þessar  nýju  aðferðir  gera  þeim  kleift  að  greina  setningar  sem  eina  heild  frekar  en  að  brjóta þær  niður  í  einstök  orð  eða  frasa.  Með  hjálp  GNMT  tekst  Google  að  draga  úr  villum  við þýðingar um meira en 55-85% en vélrænar þýðingar af þessu tagi eru ekki villulausar enn sem komið er, þó að þeim hafi vissulega farið fram (Le og Schuster, 2016).

Mér finnst alltaf gaman að því þegar tæknin eltir vísindaskáldskapinn og Douglas Adams hefði líklega haft gaman af þessum heyrnartólum. Ekki veit ég hvort að hann hafi verið sá fyrsti sem lét sér detta í hug tæki að til að þýða önnur tungumál, jafnóðum og maður heyrði það, en var alla vega sá frumlegasti. Ég er líka viss um að sögupersónunni Arthur Dent hefði líkað betur við að setja heyrnatól í eyrun heldur en að þurfa að troða fisk þangað.

Höfundur: Kolbeinn Páll Erlingsson, nemandi við Háskólann í Reykjavík

Heimildaskrá:

BBC. (2014). Comedy: The Hitchhiker‘s Guide To The Galaxy. Sótt 13. september 2018 af http://www.bbc.co.uk/comedy/hitchhikersguide/index.shtml

BBC Studios. (2017, 21. janúar). Babel Fish - The Oddest Thing In The Universe - The Hitchhiker's Guide To The Galaxy – BBC. [myndskeið]. Sótt 18. september 2018 af https://www.youtube.com/watch?v=iuumnjJWFO4

Metz, R. (2017, 15. nóvember). MIT Technology Review. Sótt 13. september 2018 af https://www.technologyreview.com/s/609470/googles-pixel-buds-translate-a-great-idea-into-horrible-design/#comments

Zhang, M. (2017, 17. ágúst). History and Frontier of the Neural Machine Translation. Sótt 18. september 2018 af https://medium.com/syncedreview/history-and-frontier-of-the-neural-machine-translation-dc981d25422d

Le, Q. V. og Schuster, M. (2016, 27. september). A Neural Network for Machine Translation, at Production Scale. [bloggfærsla]. Google AI Blog. Sótt 13. september 2018 af https://ai.googleblog.com/2016/09/a-neural-network-for-machine.html

Skoðað: 1278 sinnum

Blaðið Tölvumál

Forsíða Tölvumála

Leita í vefútgáfu Tölvumála

Um Tölvumál

Tölvumál - tímarit Skýrslutæknifélags Íslands er óháð tímarit um tölvutækni og hefur verið gefið út frá árinu 1976.

Vefútgáfa Tölvumála birtir vikulega nýja grein á vef Ský og árlega er gefið út veglegt prentað tímarit undir nafninu "Tölvumál" þar sem fjallað er um tölvutækni frá ýmsum sjónarhornum og er þema blaðsins jafnan valið snemma árs og útgáfa að hausti.

Ritnefnd Ský sér um að afla efni í Tölvumál og geta allir sem áhuga hafa sent inn efni.

Um ritnefnd Tölvumála