englishflag

Gagnasöfnun í nútímanum

mogoÁ tímum þar sem gagnasöfnun risafyrirtækja í tækniheiminum eykst með hverjum degi verður sífellt erfiðara að fylgjast með hvaða gögnum er verið að safna um notendur. Fyrirtæki eins og Facebook, Google og Amazon fylgjast með hegðun notenda og nota hana til að búa til ógrynni af gögnum. Þetta gríðarlega magn af gögnum eru síðan nýtt til þess að spá fyrir um hegðun notenda á internetinu, t.d. hvaða auglýsingar notendur eru líklegir til að smella á og hvaða vörur notendur eru líklegri til að kaupa.

Oft er tekið fram í þjónustuskilmálum fyrirtækja hverju er safnað en það er ekki algengt að fólk kynni sér skilmálanna í þaula áður en aðgangur er stofnaður. Það er því mjög mikilvægt að notendur séu meðvitaðir um hvaða gögnum er safnað um þá og til hvers. Slík vitneskja veitir notendum upplýsingar um hvað þessi fyrirtæki ákveða að birta notendum og af hverju. Við ætlum hér að skoða samfélagsmiðilinn Facebook og rýna í hvaða gögnum er safnað þar og hvernig þau eru nýtt.

Hvaða gögnum safnar Facebook um þig?

Í þjónustuskilmálum Facebook er tekið fram að notendur gefi Facebook fullan rétt á að nota allt „content” sem að notendur setja inn á síðuna eins og þeim sýnist. Content er skilgreint sem allt það efni sem að notendur leggja fram (pósta), veita eða deila í gegnum þjónustur Facebook. Facebook áskilur sér rétt til að deila þessu efni með öðrum og í raun gera hvað sem þeim sýnist við þær upplýsingar og efni sem safnað er um notendur.

Þegar notendur velja að skrá sig inn með Facebook aðgangi sínum á vefsíðum þriðja aðila safnar Facebook gögnum frá vefsíðunum [1]. Það vekur eflaust óhug margra að ekki eru nema nokkrir mánuðir síðan að samið var í málaferli tveggja lögfræðinga gegn Facebook eftir að upp komst að kerfi frá síðunni voru að renna í gegnum einkaskilaboð notenda í þeim tilgangi að safna meiri gögnum [2].
Það sem gefur þó kannski sem besta mynd af þeim upplýsingum sem Facebook safnar um notendur og hvernig þær eru nýttar eru þeir gagnapunktar sem þeir bjóða upp á fyrir auglýsendur og þá sem vilja ýta efni sínu til fleiri notenda.

Gögn fyrir auglýsendur

Facbook notar gögnin og öflug algrím til þess að flokka notendur sína niður í alls konar markhópa eftir gagnapunktum. Þessa hópa geta síðan auglýsendur eða þeir sem eiga opinberar síður á Facebook nýtt sér til þess að koma efni eða auglýsingum inn í fréttaveitu (news feed) hjá þeim notendum sem falla undir þeirra markhóp.

Auglýsingafyrirtækið Wordstream býður upp á mjög gott yfirlit yfir hvaða gagnapunktar eru í boði [3]. Auk þess hafa höfundar greinarinnar báðir reynslu af því að vinna með þessa punkta í auglýsingakerfi Facebook. Hægt er að púsla saman mörgum punktum og skilgreina þannig þröngan markhóp. Nýta upplýsingar eins og aldur, kyn, menntun, tekjur og atvinnu. Hægt er að velja eftir atburðum í lífi notenda, eins og hvort notandinn sé nýgiftur, nýbyrjaður í sambandi, nýfluttur og margt fleira. Síðan er hægt að flokka eftir ótalmörgum áhugamálum.
Sá flokkur sem að hefur þó eflaust mesta notagildi fyrir auglýsendur er hegðunarflokkurinn. Þar er hægt að flokka notendur niður eftir t.d. ferðahegðun, kauphegðun og svipuðum hegðunarmynstrum. Hérna erum við aðeins að fara yfir hluta af valmöguleikunum og mælum með að þeir sem vilji kynna sér þetta betur skoði myndina sem að má finna hér: http://bit.ly/28ZZnBa

News feed

News feed á Facebook er stillt þannig að færslur birtast ekki í tímaröð. Þess í stað er algrím notað til þess að birta notendum það efni sem talið er að eigi mest við þá eða er líklegast að þeir vilji sjá. Facebook hefur verið gagnrýnt fyrir hversu lokað þetta algrím er og hversu mikið þeir sjálfir geta krukkað í stillingum þess án vitundar notandans. Þá er sérstaklega verið að tala um tilraunir sem þeir gera á notendum án þeirra vitundar.

Dæmi um þetta er rannsókn sem var framkvæmd árið 2012 á notendum Facebook. Í rannsókninni var stillingum hjá úrtaki notenda breytt þannig að hluti fékk meira af jákvæðu efni í news feed sitt en annar hluti fékk meira af neikvæðu efni. Rannsóknin leiddi í ljós að þeir sem fengu meira af jákvæðu efni voru líklegri til að setja jákvæða pósta inn á Facebook á meðan hið gagnstæða átti við um þá sem að fengu aukningu í neikvæðu efni [4].

Þó að niðurstöður rannsóknarinnar séu í sjálfu sér áhugaverðar er hægt að setja siðferðislegt spurningamerki við það að nota notendur og tilfinningar þeirra í tilraunaskyni án þess að þeir séu meðvitaðir um það. Annað atriði sem ber að hafa í huga er að þó að fréttaveita eigi að birta notendum það efni sem á mest við þá þýðir það líka að auglýsendur hafa frjálst vald til að skilgreina hvaða hópar séu líklegastir til að kaupa vörurnar þeirra. Þetta þýðir að fréttaveita notenda inniheldur oft ekki aðeins það efni sem að hann er líklegur til að vilja sjá frá vinum og vandamönnum heldur líka þær auglýsingar sem að auglýsendur telja að notandinn sé líklegur til að smella á eða nýta sér.

Kostir og gallar

Þrátt fyrir siðferðislegar spurningar um gagnasöfnun Facebook og notkun þeirra gagna er ekki hægt að neita því að það eru líka margir jákvæðir þættir. Þótt að news feed okkar sýni sérsniðnar auglýsingar sýnir það líka hnitmiðað efni sem er líklegra til að skipta notendur máli. Gögnin eru líka nýtt til þess að bæta þjónustur Facebook og þróa kerfið áfram. Annað dæmi um jákvæða notkun á gögnunum er að Facebook er að þróa gervigreind sem greinir hvort notandi sé í sjálfsvígshugleiðingum eða í hættu á að valda sjálfum sér skaða.

Þegar notandi sýnir ákveðið hegðunarmynstur á Facebook, t.d. í póstunum sínum eða myndbandsupptökum sem hann deilir mun Facebook setja upp viðvaranir og veita upplýsingar hvar hægt sé að leita aðstoðar [5]. Einnig er Facebook að nota myndagögn til þess að þróa gervigreind sem greinir hvaða hlutir eru á myndum. Rödd telur upp hluti sem eru á myndinni og þar með getur notandinn fengið einhverja hugmynd um hvernig myndin lítur út [6]. Þetta auðveldar notkun fyrir blinda og sjónskerta til muna.

Þótt að það séu greinilega jákvæðar og neikvæðar hliðar á gagnasöfnun Facebook er mikilvægast að vera meðvitaður um hana. Eins og áður hefur komið fram áskilur Facebook sér rétt til að eigna sér allt sem sett er inn á síðuna. Einnig er gögnum safnað frá vefsíðum þriðja aðila. Auglýsendur geta síðan notað valda gagnapunkta til þess að auglýsa vörur sínar til þröngt skilgreindra markhópa. Notendur verða að gera sér grein fyrir því að Facebook áskilur sér rétt til gagnasöfnunar, hvað stendur þar að baki og taka meðvitaða ákvörðun um hvað þeir vilja setja inn á Facebook og hvernig þeir vilja nýta sér þjónustu þess.

Höfundar: Magnús Gunnarsson og Ólafur Valur Valdimarsson nemendur við Háskólann í Reykjavík

Heimildir:
[1] Facebook. (2015, January 30). Terms of Service: Facebook . Retrieved September 24, 2017, from Facebook: https://www.facebook.com/terms.phpKramer
[2] Campbell & Hurley vs Facebook, Case5:13-cv-05996-PJH (United States district court northern district of California December 30, 2013).
[3] Lister, M. (2017, September 6). All of Facebook’s Ad Targeting Options (in One Epic Infographic): WordStream. Retrieved September 24, 2017, from WordStream: http://www.wordstream.com/blog/ws/2016/06/27/facebook-ad-targeting-options-infographic2017 
[4] Kramer, A. D., Guillory, J. E., & Hancock, J. T. (2014, June 2). Experimental evidence of massive-scale emotional contagion through social networks. Proceedings of the National Academy of Sciences of the United States of America, 8788-8790.
[5] Kwon, D. (2017, March 8). Can Facebook’s Machine-Learning Algorithms Accurately Predict Suicide?: Scientific American. Retrieved September 24, 2017, from Scientific American: https://www.scientificamerican.com/article/can-facebooks-machine-learning-algorithms-accurately-predict-suicide/Lister,
[6] Wu, S. (2016, April 4). How blind people interact with visual content on social networking sites: Facebook Research. Retrieved September 24, 2017, from Facebook Research: https://research.fb.com/how-blind-people-interact-with-visual-content-on-social-networking-sites/