Þessi síða notar kökur (e. cookies) til að auðvelda þér að vafra um vefinn.

GERVIGREIND Í LÆKNISFRÆÐILEGRI MYNDGREININGU

EGudmundsson Tolvumal Mynd af hofundiAllt frá því á 7. áratug síðustu aldar hafa vísindamenn unnið að þróun tölvukerfa til nota við greiningu á læknisfræðilegum myndum, t.d. fyrir sjálfvirka leit að brjósta- og lungnakrabbameini, en nýlega hefur orðið bylting á þessu rannsóknarsviði. Frekari rannsóknir geta aukið færni tölvukerfa við að bera kennsl á „grunsamleg“ svæði á læknisfræðilegum myndum og til að meta sjúkdómshorfur sjúklinga.

Tölvur til aðstoðar röntgenlæknum

Margt getur valdið manneskjum erfiðleikum við lestur læknisfræðilegra mynda. Má þar nefna myndsuð vegna skörunar líffæra og líkamshluta, þreytu, truflun við lestur, mikið magn myndgagna sem þarf að fara yfir og gæði myndanna.

Hlutverk tölva við leit að meinum á læknisfræðilegum myndum hefur til þessa verið fólgið í því að staðsetja og sýna lækni það sem tölvukerfið telur vera „grunsamleg“ svæði á myndunum, en í framhaldinu sker læknirinn svo úr um hvort að svæðið krefjist nánari skoðunar. Greining tölva á sjúkdómshorfum meina (e. prognosis) er hins vegar annars eðlis. Sú greining felst í því að reikna út og sýna lækninum eiginleika æxlisins eða svæðisins á myndinni. Þar má til dæmis nefna sjálfvirka mælingu á rúmmáli lungnaæxlis á tölvusneiðmynd og tölvukerfi sem sýna líkindi þess að mein sé illkynja, en slík kerfi eru nú í þróun. Í öllum tilfellum fellir þó læknir eða hópur lækna lokaúrskurð um sjúkdómshorfur eða hvort að mein sé til staðar.

Bylting í greiningu starfrænna mynda

Á síðastliðnum áratug má segja að bylting hafi orðið í beitingu gervigreindar á flokkun stafrænna mynda, með aukinni notkun flokkunaraðferðar sem kallast djúp tauganet (e. deep neural networks). Sú flokkunaraðferð tók fram úr öðrum sambærilegum aðferðum á árunum 2011–2012. Þessi aðferð við greiningu mynda hafði þó verið til staðar í nokkra áratugi, henni var t.d. beitt við þróun á sjálfvirkum lestri ávísana í Bandaríkjunum á tíunda áratugnum. Helstu orsakir byltingar síðastliðins áratugar voru aukin afkastageta tölvubúnaðar (m.a. hraðari og stærri skjákort sem ráða við samhliða reikninga), framfarir í forritun skjákorta, og betri aðgangur að stórum myndasöfnum sem hægt var að nota til að þróa slík líkön. Fljótlega tók svo vísindafólk að kanna hvernig mætti beita þessum kerfum við læknisfræðilega myndgreiningu.

Það má annars deila um hvort raunverulega sé hægt að tala um „greind“ í þessu sambandi, en munur er á „sértækri“ og „almennri“ gervigreind. Fyrra hugtakið tekur til kerfa sem þjálfuð eru til að leysa ákveðin verkefni, líkt og þeirra sem beitt er við flokkun og greiningu læknisfræðilegri mynda, en almenn gervigreind, sem getur yfirfært þekkingu frá einu sviði til annars, hefur enn ekki komið fram.

Vélrænt nám og djúp tauganet

Djúp tauganet og önnur sértæk gervigreind sem notuð er við greiningu mynda, falla í flokk tölvukerfa og reiknirita sem „ástunda“ vélrænt nám (e. machine learning), en þá eru gögn á einhverju formi nýtt til þess að búa til líkan sem hægt er að beita til að leysa ákveðin verkefni. Hugtakið „þjálfun“ er yfirleitt notað þegar slíkt líkan ákvarðar flokkunarskilyrðin sem svo eru notuð til að fella tiltekin gögn í rétta flokka.

Fyrst er gerður útreikningur á tilteknu safni stærða sem lýsa eiginleikum ákveðins svæðis á mynd, svo úr verður eins konar „fingrafar“ svæðisins. Einföld dæmi um þessar stærðir eru staðalfrávik eða meðalgildi mynddílanna á svæðinu innan æxlisins. Síðan er reiknirit af einhverju tagi notað til að „þjálfa“ líkan sem býr til flokkunarreglur eða -skilyrði sem má nota til að setja myndsvæðið í fyrirframgefinn flokk (t.d. góðkynja/illkynja æxli), út frá gögnunum í fingrafarinu. Mikilvægast er að líkanið nýtist síðan til þess að flokka áður óséð svæði á réttan hátt – þá er talað um að líkanið búi yfir góðri „alhæfingu“ (e. generalisation).

Vélrænt nám hefur í nokkra áratugi verið notað til að þróa kerfi sem flokka og greina læknisfræðilegar myndir, m.a. til að bera kennsl á „grunsamleg“ svæði á brjóstaskimunarmyndum sem gætu verið illkynja æxli. En upp úr 2010 hófst gervigreindarbylting sem stórjók möguleika vélræns nám. Sú bylting varð meðal annars vegna tilkomu djúpra tauganeta, sem geta flokkað myndir og myndsvæði á skilvirkari hátt og eftir flóknari flokkunarskilyrðum en þau líkön sem áður voru notuð við vélrænt nám í myndgreiningu.

Til dæmis ákvarða djúp tauganet samtímis „fingrafar“ myndsvæðis og hvaða flokkunarskilyrði, sem byggja á þessu fingrafari, gætu nýst við að fella svæðið í réttan flokk meðan á „þjálfun“ líkansins stendur. Djúp tauganet sameina einnig upplýsingar af mismunandi kvörðum í myndinni á skilvirkan hátt. Til dæmis getur tauganet lært að „þekkja“ mynd af andliti kattar með því að nema fyrst fíngerðari og smærri hluta þess, svo sem veiðihár og nef kattarins, og búið svo til mynd af andlitinu öllu með því að setja þessa fíngerðari hluta saman í heildarmynd. Innri uppbygging djúpra tauganeta gerir þeim kleift að byggja slíka heildarmynd á skilvirkari og nákvæmari hátt en hægt er með öðrum aðferðum við myndgreiningu.

Djúp tauganet í læknisfræðilegri myndgreiningu

Á síðustu árum hafa rannsóknir í auknum mæli beinst að því hvernig megi beita djúpum tauganetum við læknisfræðilega myndgreiningu. Þessari tegund líkana hefur t.d. verið beitt á sjúkdómsgreiningu æxla, við sjálfvirka leit að meinum eða æxlum, og við sjálfvirka læknisfræðilega myndbútun (e. medical image segmentation).

Á tölvusneiðmynd sem fylgir þessari grein hafa verið dregnar tvær útlínur miðþekjuæxlis (e. mesothelioma), annars vegar útlínur sem voru teiknaðar handvirkt af röntgenlækni og hins vegar útlínur sem voru dregnar upp sjálfvirkt af djúpu tauganeti, sem þróað var við University of Chicago. Mæling á rúmmáli miðþekjuæxla eftir slíkum útlínum gæti nýst við að ákvarða hvernig þessum sjúkdómi vindur fram en afar tímafrekt er að teikna útlínur æxlisins handvirkt á tölvusneiðmynd. Sýnt hefur verið fram á að gervigreindarlíkön byggð á djúpum tauganetum geti leyst slík myndbútunarverkefni betur en aðrar myndgreiningaraðferðir.

Mynd 1

Mynd 1 Tölvusneiðmynd af sjúklingi með miðþekjuæxli (e. mesothelioma). Hér má sjá samanburð handvirkra útlína æxlisins frá röntgenlækni og sjálfvirkra útlína frá tölvukerfi sem byggir á gervigreind.

Nýlega gaf rannsóknarhópur hjá Google út grein þar sem fjallað er um notkun gervigreindar við sjúkdómsgreiningu á æxlum sem fundist hafa við skimun eftir brjóstakrabbameini. Þar sýndi vísindafólkið fram á að líkanið þeirra, sem byggt var á djúpum tauganetum og sannprófað á stórum gagnasöfnum frá Bandaríkjunum og Bretlandi, gæti fækkað bæði röngum neikvæðum niðurstöðum og röngum jákvæðum niðurstöðum í skimun við brjóstakrabbameini um allt að 9%. Niðurstöður greinarinnar bentu einnig til þess að slíkt kerfi gæti létt á álagi á röntgenlækna við skimunina. Þó á eftir að sannreyna þetta líkan og samsvarandi líkön við raunverulegar aðstæður.

Áskoranir og næstu skref

Djúp tauganet hafa vissa eiginleika fram yfir eldri aðferðir við vélrænt nám, sem geta einfaldað þróun tölvukerfa. Ef notast er við djúp tauganet, þarf ekki lengur að forrita sérstaklega eða ákvarða stærðir sem gætu gagnast við flokkun myndsvæða (þ.e., „fingraför“ myndsvæða) – djúpu tauganetin ákvarða þessar stærðir sjálfvirkt út frá gögnunum sem þau eru þjálfuð á. Líkön sem byggja á djúpum tauganetum virðast líka yfirleitt búa yfir betri alhæfingu en líkön unnin með eldri aðferðum við vélrænt nám.

Sumir eiginleikar djúpra tauganeta gætu aftur á móti takmarkað notagildi þeirra við raunverulegar aðstæður á sjúkrahúsum. Þannig getur verið óljóst hvaða upplýsingar úr tiltekinni mynd djúp tauganet eru að nota við flokkun gefins myndsvæðis eða æxlis, en eins og gefur að skilja vill heilbrigðisstarfsfólk vita hvað það er við myndina sem veldur því að gervigreindarlíkanið setur myndsvæðið eða æxlið í ákveðinn flokk. Nú eru þó komnar fram aðferðir sem geta sýnt hvaða svæði myndar hafa mest áhrif á flokkun tauganetsins.

Annað sem hindrar þróun skilvirkra tölvukerfa sem byggja á gervigreind og ætluð eru til nota við læknisfræðilega myndgreiningu, er aðgangur að gögnum. Yfirleitt þarf mikið magn mynda til þess að þjálfa líkön sem byggja á djúpum tauganetum. Til dæmis sýndi hópur vísindafólks við Memorial Sloan Kettering Cancer Center í Bandaríkjunum nýlega fram á að nákvæmni gervigreindarlíkans sem þróað var til greiningar á sýnum í meinafræði (e. pathology) jókst mjög þegar myndunum sem líkanið var þjálfað á var fjölgað. Einnig er þörf á ströngu gæðamati, með aðkomu sérfræðinga og lækna, til að tryggja að gervigreindarlíkön séu nægilega nákvæm fyrir notkun í heilbrigðisþjónustu, en gæðamatið eykur kostnað við þróun slíkra tölvukerfa.

Þau gervigreindarkerfi sem eru í þróun núna eru flest hönnuð með afmörkuð svið í huga, enda er mannslíkaminn og sá aragrúi sjúkdóma sem hrjáir okkur gríðarlega flókið viðfangsefni. Þrátt fyrir miklar framfarir í gervigreind á undanförnum árum verður því að teljast líklegt að áfram verði unnið að hönnun kerfa sem byggja á djúpum tauganetum, og ætluð eru til aðstoðar fyrir taugalækna. Það er líklega ótvírætt að hlutverk gervigreindar í læknisfræðilegri myndgreiningu aukist á komandi árum og áratugum og að heilbrigðisstarfsfólk muni í auknum mæli þurfa að meðhöndla upplýsingar frá slíkum kerfum. Mikilvægast er að þessi þróun leiði til betri meðferðar sjúklinga og verði til þess að auðvelda starf röntgenlækna og annars heilbrigðisstarfsfólks.

Höfundur: Eyjólfur Guðmundsson, nýdoktor í læknisfræðilegri eðlisfræði við Centre for Medical Image Computing, University College London

Úr Tölvumál 2020/1. tbl. /45

Ítarefni

  1. „Gervigreind á mannamáli,“ grein í Tölvumálum 2019 eftir Brynjólf B. Jónsson, stofnanda Data Lab Iceland.
  2. L. Giger. „Machine learning in medical imaging.“ Journal of the American College of Radiology 15(3) (2018): bls. 512–520.
  3. Guðmundsson o.fl. „Deep learning-based segmentation of malignant pleural mesothelioma tumor on computed tomography scans: application to scans demonstrating pleural effusion.“ Journal of Medical Imaging 7(1) (2020).
  4. M. McKinney o.fl. „International evaluation of an AI system for breast cancer screening.“ Nature 577 (2020), bls. 89–94.
  5. Campanella o.fl. „Clinical-grade computational pathology using weakly supervised deep learning on whole slide images.“ Nature Medicine 25 (2019): bls. 1301–1309.
  6. Chan og E. L. Siegel. „Will machine learning end the viability of radiology as a thriving medical specialty?“ British Journal of Radiology 91 (2019).