Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Kynntu þér reglur ritstjórnar um skoðanagreinar. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Miðflokkurinn í Kópavogi treystir konum Thelma Árnadóttir Skoðun Kerfislægt rán um hábjartan dag: Þegar silkihúfurnar brenna framtíðina Sigurður Sigurðsson Skoðun Getnaðarsigur og fullnægjandi árangur María Ellen Steingrímsdóttir Skoðun Fimm sunnlensk sveitarfélög neita íbúum um velferðarþjónustu án skýrrar lagaheimildar Guðrún Margrét Njálsdóttir,Steinþór Hreinsson,Þröstur Sverrisson Skoðun Hvað kom fyrir þig í fyrsta kafla ævisögu þinnar? Diljá Ámundadóttir Zoega Skoðun Fjárfestum í börnum Pétur Marteinsson Skoðun Er til ósýnileg fötlun? Arnar Helgi Lárusson Skoðun Íslendingar sem ég hef hitt þegar ég reyni að tala íslensku Valerio Gargiulo Skoðun Skrefin við lok grunnskóla Arnar Þorsteinsson,Guðrún Helga Ástríðardóttir,Svanhildur Svavarsdóttir Skoðun Þegar hávaðinn ræður ferðinni Sigurður Helgi Pálmason Skoðun Skoðun Skoðun Gleðilegt sumar, Happy First Day of Summer, Wesołego pierwszego dnia lata. Freyja Þórisdóttir skrifar Skoðun Ábyrgðarmörk og vinnufriður þegar pólitík mætir fagmennsku Andrés Bertelsen skrifar Skoðun Í stuttu máli: Hægt er að semja við ESB um sjávarútveg (staðfest) Dagur B. Eggertsson skrifar Skoðun Læknisþjónusta á ferðalögum Ágúst Mogensen skrifar Skoðun Miðflokkurinn í Kópavogi treystir konum Thelma Árnadóttir skrifar Skoðun Afnemum vaxtarmörk í Hafnarfirði - Byggjum fyrir fólkið Arnhildur Ásdís Kolbeins skrifar Skoðun Þið eruð bara eins og hlaupár Bjarni Fritzson skrifar Skoðun Jafnrétti er ákvörðun Ása Björk Jónsdóttir,Helga Kristín Jóhannsdóttir skrifar Skoðun Krýsuvíkursamtökin 40 ára Valdimar Víðisson skrifar Skoðun Skrefin við lok grunnskóla Arnar Þorsteinsson,Guðrún Helga Ástríðardóttir,Svanhildur Svavarsdóttir skrifar Skoðun Netvarnir í gervigreindum heimi Guðmundur Arnar Sigmundsson skrifar Skoðun Hvað kom fyrir þig í fyrsta kafla ævisögu þinnar? Diljá Ámundadóttir Zoega skrifar Skoðun Er til ósýnileg fötlun? Arnar Helgi Lárusson skrifar Skoðun Kerfislægt rán um hábjartan dag: Þegar silkihúfurnar brenna framtíðina Sigurður Sigurðsson skrifar Skoðun Menntamál ættu ekki að vera pólitískt þrætuefni Kolbrún Áslaugar Baldursdóttir skrifar Skoðun Við vitum betur – en gerum ekki nóg Eva Einarsdóttir skrifar Skoðun Getnaðarsigur og fullnægjandi árangur María Ellen Steingrímsdóttir skrifar Skoðun Fjárfestum í börnum Pétur Marteinsson skrifar Skoðun Leikurinn er ekki tapaður Einar Mikael Sverrisson skrifar Skoðun Börnin geta ekki beðið Sigurveig Jóhannsdóttir skrifar Skoðun Réttur barna til menntunar Salvör Nordal skrifar Skoðun Grundarreitur í gamla Hveragerði - byggjum rétt Arnar H. Halldórsson skrifar Skoðun Inngilding og þátttaka fatlaðra barna Snæfríður Þóra Egilson skrifar Skoðun Af hlutleysisstefnu ríkisútvarpsins og falleinkunn fjármálaráðs Brynjar Níelsson skrifar Skoðun Fimm sunnlensk sveitarfélög neita íbúum um velferðarþjónustu án skýrrar lagaheimildar Guðrún Margrét Njálsdóttir,Steinþór Hreinsson,Þröstur Sverrisson skrifar Skoðun Verk að vinna Elsa María Guðmundsdóttir skrifar Skoðun Foreldrahús lokar 1. maí! Viljum við það? Dagbjört Ósk Steindórsdóttir skrifar Skoðun Meirihluti fólks með fötlun í Bretlandi styður rétt til dánaraðstoðar Ingrid Kuhlman skrifar Skoðun Íslendingar sem ég hef hitt þegar ég reyni að tala íslensku Valerio Gargiulo skrifar Skoðun Öruggt húsnæði jafngildir mannréttindum Þórarinn Ingi Pétursson skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Fimm sunnlensk sveitarfélög neita íbúum um velferðarþjónustu án skýrrar lagaheimildar Guðrún Margrét Njálsdóttir,Steinþór Hreinsson,Þröstur Sverrisson Skoðun
Skrefin við lok grunnskóla Arnar Þorsteinsson,Guðrún Helga Ástríðardóttir,Svanhildur Svavarsdóttir Skoðun
Skoðun Gleðilegt sumar, Happy First Day of Summer, Wesołego pierwszego dnia lata. Freyja Þórisdóttir skrifar
Skoðun Í stuttu máli: Hægt er að semja við ESB um sjávarútveg (staðfest) Dagur B. Eggertsson skrifar
Skoðun Skrefin við lok grunnskóla Arnar Þorsteinsson,Guðrún Helga Ástríðardóttir,Svanhildur Svavarsdóttir skrifar
Skoðun Kerfislægt rán um hábjartan dag: Þegar silkihúfurnar brenna framtíðina Sigurður Sigurðsson skrifar
Skoðun Af hlutleysisstefnu ríkisútvarpsins og falleinkunn fjármálaráðs Brynjar Níelsson skrifar
Skoðun Fimm sunnlensk sveitarfélög neita íbúum um velferðarþjónustu án skýrrar lagaheimildar Guðrún Margrét Njálsdóttir,Steinþór Hreinsson,Þröstur Sverrisson skrifar
Skoðun Meirihluti fólks með fötlun í Bretlandi styður rétt til dánaraðstoðar Ingrid Kuhlman skrifar
Fimm sunnlensk sveitarfélög neita íbúum um velferðarþjónustu án skýrrar lagaheimildar Guðrún Margrét Njálsdóttir,Steinþór Hreinsson,Þröstur Sverrisson Skoðun
Skrefin við lok grunnskóla Arnar Þorsteinsson,Guðrún Helga Ástríðardóttir,Svanhildur Svavarsdóttir Skoðun