Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Kynntu þér reglur ritstjórnar um skoðanagreinar. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Frá nauðungarsölum til 5 milljarða í arð á ári Jón Ferdínand Estherarson,Guðný Benediktsdóttir,Yngvi Ómar Sigrúnarson Skoðun Hvað gerist ef meirihlutinn segir „já“ í sumar? Jón Pétur Zimsen Skoðun Er óheppni hjúkrunarfræðingurinn raunverulega óheppinn? Eggert Sigurbergsson Skoðun Halldór 14.03.2026 Agnar Már Másson Halldór Það er gott að hafa „góðar tengingar“ í Kópavogi. 2 af 4. Theodóra S. Þorsteinsdóttir Skoðun Er skólafólk ómarktækt? Hólmfríður Jennýjar Árnadóttir Skoðun Hjúkrunarfræðingurinn sem skuldar meira, græðir helling og vill kíkja í pakka Haraldur Ólafsson Skoðun Enn og aftur, Alma Möller Arnar Helgi Lárusson Skoðun Ábyrgðarleysi í fiskeldi undir formerkjum uppbyggingar Björn Gunnar Jónsson Skoðun Handjárn eða heilbrigð tengsl Sigurður Árni Reynisson Skoðun Skoðun Skoðun Er óheppni hjúkrunarfræðingurinn raunverulega óheppinn? Eggert Sigurbergsson skrifar Skoðun Það er gott að hafa „góðar tengingar“ í Kópavogi. 2 af 4. Theodóra S. Þorsteinsdóttir skrifar Skoðun Handjárn eða heilbrigð tengsl Sigurður Árni Reynisson skrifar Skoðun Er skólafólk ómarktækt? Hólmfríður Jennýjar Árnadóttir skrifar Skoðun Frá nauðungarsölum til 5 milljarða í arð á ári Jón Ferdínand Estherarson,Guðný Benediktsdóttir,Yngvi Ómar Sigrúnarson skrifar Skoðun Ábyrgðarleysi í fiskeldi undir formerkjum uppbyggingar Björn Gunnar Jónsson skrifar Skoðun Hvað gerist ef meirihlutinn segir „já“ í sumar? Jón Pétur Zimsen skrifar Skoðun Kerfið er brotið af því þú þolir það þannig Anna Bergþórsdóttir skrifar Skoðun Til leiðtoga í stjórnmálum og stjórnsýslu: Málefni barna og ungmenna Þóra Björg Jónsdóttir skrifar Skoðun Skerðing í Kópavogi Stefán Vilbergsson skrifar Skoðun Sigurvíma Trump Hannes Örn Blandon skrifar Skoðun Hesturinn í umferðinni Ólafur Gestur Arnalds skrifar Skoðun Hvað er eldsneytið þitt? Sigrún Þóra Sveinsdóttir skrifar Skoðun Er ESB „hnignunarbandalag“? Jean-Rémi Chareyre skrifar Skoðun Heppni hjúkrunarfræðingurinn sem á að græða helling Berglind Guðmundsdóttir skrifar Skoðun Davíð kvaddur Ámundi Loftsson skrifar Skoðun Hvað gerðist með „sérlausn“ Írlands? Erna Bjarnadóttir skrifar Skoðun Kennsla í skugga skráninga Sóldís Birta Reynisdóttir skrifar Skoðun Hvað hefur oddviti Framsóknar í Kópavogi að fela? Theodóra Þorsteinsdóttir skrifar Skoðun Loftslagspólitík sem gagnast bændum Jóhann Páll Jóhannsson skrifar Skoðun Þorgerður Katrín treystir ekki þjóðinni Hjörvar Sigurðsson skrifar Skoðun Kaþólska kirkjan og uppbygging íslensks heilbrigðiskerfis Árni Már Jensson skrifar Skoðun Kópavogsleiðin er merkilegt fyrirbæri Tinna Gunnur Bjarnadóttir skrifar Skoðun Ófrjósemi og andleg líðan Ástdís Pálsdóttir Bang skrifar Skoðun Til hamingju, Kópavogsbúar – þið eigið von á góðu! Elísabet Sveinsdóttir skrifar Skoðun Við erum að taka hlutverkin frá eldra fólki Rannveig Tenchi Ernudóttir skrifar Skoðun Að byggja upp samfélagslegt umboð í afskekktum samfélögum: Hvernig ábyrgt fiskeldi styrkir Vestfirðina Daníel Jakobsson skrifar Skoðun Hvernig verjum við Ísland? Finnur Beck skrifar Skoðun Enn og aftur, Alma Möller Arnar Helgi Lárusson skrifar Skoðun Reikniskekkja Viðreisnar í Kópavogi Orri Vignir Hlöðversson skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Frá nauðungarsölum til 5 milljarða í arð á ári Jón Ferdínand Estherarson,Guðný Benediktsdóttir,Yngvi Ómar Sigrúnarson Skoðun
Hjúkrunarfræðingurinn sem skuldar meira, græðir helling og vill kíkja í pakka Haraldur Ólafsson Skoðun
Skoðun Það er gott að hafa „góðar tengingar“ í Kópavogi. 2 af 4. Theodóra S. Þorsteinsdóttir skrifar
Skoðun Frá nauðungarsölum til 5 milljarða í arð á ári Jón Ferdínand Estherarson,Guðný Benediktsdóttir,Yngvi Ómar Sigrúnarson skrifar
Skoðun Til leiðtoga í stjórnmálum og stjórnsýslu: Málefni barna og ungmenna Þóra Björg Jónsdóttir skrifar
Skoðun Að byggja upp samfélagslegt umboð í afskekktum samfélögum: Hvernig ábyrgt fiskeldi styrkir Vestfirðina Daníel Jakobsson skrifar
Frá nauðungarsölum til 5 milljarða í arð á ári Jón Ferdínand Estherarson,Guðný Benediktsdóttir,Yngvi Ómar Sigrúnarson Skoðun
Hjúkrunarfræðingurinn sem skuldar meira, græðir helling og vill kíkja í pakka Haraldur Ólafsson Skoðun