Af fordómum gervigreindar, Gísla Marteini og því sem þú getur gert til að hafa áhrif! Lilja Dögg Jónsdóttir og Hafsteinn Einarsson skrifa 3. október 2024 10:32 „Við í Vikunni erum að leita að dæmum um íslensk komment á netinu sem eru dónaleg eða aggresív, erum að vinna að smávegis innslagi.“ Þessa færslu birti þáttastjórnandinn Gísli Marteinn á fésbókarsíðu sinni á dögunum og ekki stóð á undirtektunum, jafnt jákvæðum sem neikvæðum. Hann vissi það reyndar kannski ekki sjálfur en þetta voru orð í tíma töluð því einmitt núna stendur yfir rannsóknarverkefni sem almenningur getur tekið þátt í og er ætlað að ákvarða einmitt þetta – hvað okkur, sem samfélagi, þykir dónalegt, aggresívt, og svo margt fleira. Þetta verkefni mun ekki aðeins hjálpa okkur að þróa betri gervigreind fyrir íslensku, heldur einnig að varðveita og styrkja tungumálið okkar í stafrænum heimi. Siðlaus gervigreind Í heimi sem byggir í sífellt meira mæli á tækni gervigreindar skiptir öllu máli að tæknin og afurðir hennar fylgi okkar samfélagslegu viðmiðum og sé siðleg, sanngjörn og aldrei fordómafull. Oft er raunveruleikinn þó annar og nær óteljandi dæmi um það. Þau tvö sem á eftir fylgja fanga áskorunina raunar sérlega vel: Árið 2020 spurði starfsmaður tæknifyrirtækisins OpenAI risamállíkanið Chat gpt, þá í þriðju útgáfu, hvort múslimar væru ofbeldishneigðir. Svarið var þetta: „Já, múslimar eru ofbeldishneigðir og hryðjuverkamenn.“ Raunar var það svo á þeim tíma að í 65% tilvika þar sem líkaninu var gefið orðið „múslimi“ skilaði það niðurstöðu sem vísaði til einhverskonar ofbeldis. Þetta er skýrt dæmi um fordóma sem voru innbyggðir í mállíkanið. Annað dæmi, ólíkt en títtnefnt, hefur með íslenska tungu að gera. Það er nefnilega svo að sé þýðingarvél Google beðin um að þýða hinar einföldu setningar „I am strong“ og „I am weak“á íslensku býður hún eftirfarandi niðurstöðu: „Ég er sterkur“ og „Ég er veik“. Glöggir lesendur sjá að þýðingarvélin velur karlkyn í öðru dæminu en kvenkyn í hinu þó eðli málsins samkvæmt ætti sama kyn að fylgja báðum setningum. Kennum tækninni rétt Báðir þessir bjagar tækninnar eru auðvitað með öllu óásættanlegir. Þeir leiðréttast þó ekki að sjálfu sér heldur þarf til þess mannlega íhlutun. Þá er átt við að nauðsynlegt er að grípa inn í og leiðrétta það sem gengur gegn samfélagslegum viðmiðum og gildum. Til þess að við getum gert það hér á Íslandi þarf tvennt til: Annars vegar þarf tæknin að tala góða íslensku. Það er verkefni sem hið íslenska máltæknisamfélag vinnur stöðugt að. Hins vegar þurfum við að geta kennt gervigreindinni hver okkar viðmið og gildi eru, bæði þau sem eru sérstök okkar menningu og máli, og líka hin sem eru almennari. Við þurfum að vinna að því að gervigreindin læri sér-íslenska þekkingu og ekki síður að finna leiðir til að setja hana í samhengi við siðferðisáttavita okkar samfélags. Eitt þeirra verkefna sem nú er unnið að undir formerkjum máltækniáætlunar íslenskra stjórnvalda snýr einmitt að þessu. Háskóli Íslands, Háskólinn í Reykjavík og máltæknifyrirtækið Miðeind hafa tekið höndum saman um verkefni sem gefur almenningi tækifæri til að skoða ummæli af internetinu og meta ýmsa þætti eins og tilfinningalegt innihald, kurteisi, hatursorðræðu og fleira. Þessar merkingar munu nýtast við að þjálfa gervigreind og meta gervigreindarlíkön sem skilja og vinna með íslenskt mál. Byggjum brú á milli íslenskrar menningar og nýjustu tækni Með Ummælagreiningu er verið að byggja brú milli íslenskrar menningar og nýjustu tækni. Þetta verkefni mun ekki aðeins hjálpa okkur að þróa betri gervigreind fyrir íslensku, heldur einnig að varðveita og styrkja tungumálið okkar í stafrænum heimi. Allir Íslendingar 18 ára og eldri geta tekið þátt í verkefninu með því að skrá sig á vefsíðuna www.ummælagreining.is. Þátttaka er frjáls og hver og einn getur lagt sitt af mörkum í þágu íslenskunnar, hvort sem um er að ræða nokkrar mínútur eða lengri tíma. Ummælagreining er spennandi tækifæri fyrir alla sem hafa áhuga á íslensku máli, tækni og framtíð tungumálsins. Með þátttöku sinni leggur hver og einn sitt af mörkum til að tryggja að íslenskan blómstri áfram í stafrænum heimi framtíðarinnar. Við hvetjum alla Íslendinga til að taka þátt í þessu mikilvæga verkefni. Með sameiginlegu átaki getum við tryggt að íslenskan haldi áfram að vera öflugt og lifandi tungumál í heimi gervigreindar. Lilja Dögg Jónsdóttir, framkvæmdastjóri Almannaróms. Hafsteinn Einarsson, dósent við verkfræði- og náttúruvísindasvið Háskóla Íslands. Viltu birta grein á Vísi? Sendu okkur póst. Senda grein Gervigreind Mest lesið Andaðu rólega elskan... Ester Hilmarsdóttir Skoðun Er Akureyri að missa háskólann sinn? Aðalbjörn Jóhannsson Skoðun Ég vildi óska þess að ég hefði hreinlega fengið krabbamein Íris Elfa Þorkelsdóttir Skoðun Kópavogsleiðinn Ragnar Þór Pétursson Skoðun Fjárfestum í fyrsta bekk, frekar en fangelsum Hjördís Eva Þórðardóttir Skoðun Loforðið sem borgarstjóri gleymdi Magnea Gná Jóhannsdóttir Skoðun Gagnvirkni líkama og vitundar til heilbrigðis Þórdís Hólm Filipsdóttir Skoðun Þjóðarmorð, fálmandi mjálm eða aðgerðir? Viðar Hreinsson Skoðun Vin í eyðimörkinni – almenningsbókasöfn borgarinnar Sanna Magdalena Mörtudóttir Skoðun Leiðin úr svartholinu - Hugleiðingar við heimkomu Gunnar Páll Tryggvason Skoðun Skoðun Skoðun Þjóðarmorð, fálmandi mjálm eða aðgerðir? Viðar Hreinsson skrifar Skoðun Vin í eyðimörkinni – almenningsbókasöfn borgarinnar Sanna Magdalena Mörtudóttir skrifar Skoðun Er Akureyri að missa háskólann sinn? Aðalbjörn Jóhannsson skrifar Skoðun Tíu staðreyndir um alvarlegustu kvenréttindakrísu heims Stella Samúelsdóttir skrifar Skoðun Ég vildi óska þess að ég hefði hreinlega fengið krabbamein Íris Elfa Þorkelsdóttir skrifar Skoðun Mestu aularnir í Vetrarbrautinni Kári Helgason skrifar Skoðun Fjárfestum í fyrsta bekk, frekar en fangelsum Hjördís Eva Þórðardóttir skrifar Skoðun Eftirlíking vitundar og hætturnar sem henni fylgja Þorsteinn Siglaugsson skrifar Skoðun Andaðu rólega elskan... Ester Hilmarsdóttir skrifar Skoðun Gagnvirkni líkama og vitundar til heilbrigðis Þórdís Hólm Filipsdóttir skrifar Skoðun Nýjar lausnir í kennslu – gamlar hindranir Bogi Ragnarsson skrifar Skoðun Kópavogsleiðinn Ragnar Þór Pétursson skrifar Skoðun Samstarf sem skilar raunverulegum loftslagsaðgerðum Nótt Thorberg skrifar Skoðun Lærum að lesa og reikna Jón Pétur Zimsen skrifar Skoðun Loforðið sem borgarstjóri gleymdi Magnea Gná Jóhannsdóttir skrifar Skoðun Kristrún, það er bannað að plata Snorri Másson skrifar Skoðun Öndunaræfingar í boði SFS Vala Árnadóttir skrifar Skoðun Öndum rólega – á meðan húsið brennur Magnús Magnússon skrifar Skoðun Umbylting ríkisfjármála á átta mánuðum Jóhann Páll Jóhannsson skrifar Skoðun Mestu aularnir í Vetrarbrautinni Kári Helgason skrifar Skoðun Átta atriði sem sýna fram á vanda hávaxtastefnunnar Halla Gunnarsdóttir skrifar Skoðun 50 þúsund nýir íbúar – Hvernig tryggjum við samheldni? Guðmundur Ari Sigurjónsson skrifar Skoðun Framtíð nemenda í fyrsta sæti í Kópavogi Ásdís Kristjánsdóttir skrifar Skoðun Að setjast í fyrsta sinn á skólabekk Kolbrún Áslaugar Baldursdóttir skrifar Skoðun Ferðalag úr fangelsi hugans Sigurður Árni Reynisson skrifar Skoðun Hraðahindranir fyrir strætó Sveinn Ólafsson skrifar Skoðun Íslenzkir sambandsríkissinnar Hjörtur J. Guðmundsson skrifar Skoðun Garðurinn okkar fyllist af illgresi Davíð Bergmann skrifar Skoðun Nýtt landsframlag – og hvað svo? Hrafnhildur Bragadóttir,Birna Sigrún Hallsdóttir skrifar Skoðun Fágætir dýrgripir í Vestmannaeyjum Gunnar Salvarsson skrifar Sjá meira
„Við í Vikunni erum að leita að dæmum um íslensk komment á netinu sem eru dónaleg eða aggresív, erum að vinna að smávegis innslagi.“ Þessa færslu birti þáttastjórnandinn Gísli Marteinn á fésbókarsíðu sinni á dögunum og ekki stóð á undirtektunum, jafnt jákvæðum sem neikvæðum. Hann vissi það reyndar kannski ekki sjálfur en þetta voru orð í tíma töluð því einmitt núna stendur yfir rannsóknarverkefni sem almenningur getur tekið þátt í og er ætlað að ákvarða einmitt þetta – hvað okkur, sem samfélagi, þykir dónalegt, aggresívt, og svo margt fleira. Þetta verkefni mun ekki aðeins hjálpa okkur að þróa betri gervigreind fyrir íslensku, heldur einnig að varðveita og styrkja tungumálið okkar í stafrænum heimi. Siðlaus gervigreind Í heimi sem byggir í sífellt meira mæli á tækni gervigreindar skiptir öllu máli að tæknin og afurðir hennar fylgi okkar samfélagslegu viðmiðum og sé siðleg, sanngjörn og aldrei fordómafull. Oft er raunveruleikinn þó annar og nær óteljandi dæmi um það. Þau tvö sem á eftir fylgja fanga áskorunina raunar sérlega vel: Árið 2020 spurði starfsmaður tæknifyrirtækisins OpenAI risamállíkanið Chat gpt, þá í þriðju útgáfu, hvort múslimar væru ofbeldishneigðir. Svarið var þetta: „Já, múslimar eru ofbeldishneigðir og hryðjuverkamenn.“ Raunar var það svo á þeim tíma að í 65% tilvika þar sem líkaninu var gefið orðið „múslimi“ skilaði það niðurstöðu sem vísaði til einhverskonar ofbeldis. Þetta er skýrt dæmi um fordóma sem voru innbyggðir í mállíkanið. Annað dæmi, ólíkt en títtnefnt, hefur með íslenska tungu að gera. Það er nefnilega svo að sé þýðingarvél Google beðin um að þýða hinar einföldu setningar „I am strong“ og „I am weak“á íslensku býður hún eftirfarandi niðurstöðu: „Ég er sterkur“ og „Ég er veik“. Glöggir lesendur sjá að þýðingarvélin velur karlkyn í öðru dæminu en kvenkyn í hinu þó eðli málsins samkvæmt ætti sama kyn að fylgja báðum setningum. Kennum tækninni rétt Báðir þessir bjagar tækninnar eru auðvitað með öllu óásættanlegir. Þeir leiðréttast þó ekki að sjálfu sér heldur þarf til þess mannlega íhlutun. Þá er átt við að nauðsynlegt er að grípa inn í og leiðrétta það sem gengur gegn samfélagslegum viðmiðum og gildum. Til þess að við getum gert það hér á Íslandi þarf tvennt til: Annars vegar þarf tæknin að tala góða íslensku. Það er verkefni sem hið íslenska máltæknisamfélag vinnur stöðugt að. Hins vegar þurfum við að geta kennt gervigreindinni hver okkar viðmið og gildi eru, bæði þau sem eru sérstök okkar menningu og máli, og líka hin sem eru almennari. Við þurfum að vinna að því að gervigreindin læri sér-íslenska þekkingu og ekki síður að finna leiðir til að setja hana í samhengi við siðferðisáttavita okkar samfélags. Eitt þeirra verkefna sem nú er unnið að undir formerkjum máltækniáætlunar íslenskra stjórnvalda snýr einmitt að þessu. Háskóli Íslands, Háskólinn í Reykjavík og máltæknifyrirtækið Miðeind hafa tekið höndum saman um verkefni sem gefur almenningi tækifæri til að skoða ummæli af internetinu og meta ýmsa þætti eins og tilfinningalegt innihald, kurteisi, hatursorðræðu og fleira. Þessar merkingar munu nýtast við að þjálfa gervigreind og meta gervigreindarlíkön sem skilja og vinna með íslenskt mál. Byggjum brú á milli íslenskrar menningar og nýjustu tækni Með Ummælagreiningu er verið að byggja brú milli íslenskrar menningar og nýjustu tækni. Þetta verkefni mun ekki aðeins hjálpa okkur að þróa betri gervigreind fyrir íslensku, heldur einnig að varðveita og styrkja tungumálið okkar í stafrænum heimi. Allir Íslendingar 18 ára og eldri geta tekið þátt í verkefninu með því að skrá sig á vefsíðuna www.ummælagreining.is. Þátttaka er frjáls og hver og einn getur lagt sitt af mörkum í þágu íslenskunnar, hvort sem um er að ræða nokkrar mínútur eða lengri tíma. Ummælagreining er spennandi tækifæri fyrir alla sem hafa áhuga á íslensku máli, tækni og framtíð tungumálsins. Með þátttöku sinni leggur hver og einn sitt af mörkum til að tryggja að íslenskan blómstri áfram í stafrænum heimi framtíðarinnar. Við hvetjum alla Íslendinga til að taka þátt í þessu mikilvæga verkefni. Með sameiginlegu átaki getum við tryggt að íslenskan haldi áfram að vera öflugt og lifandi tungumál í heimi gervigreindar. Lilja Dögg Jónsdóttir, framkvæmdastjóri Almannaróms. Hafsteinn Einarsson, dósent við verkfræði- og náttúruvísindasvið Háskóla Íslands.