Ótrúlegt hve hratt Google lærði íslensku Breki Logason skrifar 3. september 2012 22:51 Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. Hingað til hefur það ekki talist neitt tiltökumál að tala íslensku í símann. Þannig hefur maður getað rætt við vini og vandamenn um nánast hvað sem er á hinu ástkæra og ylhýra. En nú getur maður talað íslensku við internetið í símanum. Þannig getur maður spurt sjálfan Google um nánast hvað sem er. Þetta eru þeir Trausti og Jón. Mennirnir á bakvið tungumálakunnáttu Google, sem nú í ágúst byrjaði að skilja íslensku. Íslenska er ekki beint efst á lista hjá Google en Trausti var þar starfsmaður og ýtti á eftir sínu móðurmáli. Hann leitaði til Jóns sem í samvinnu við fleiri hóf söfnun á íslenskum setningum. „Fyrst létum við einhverja fá síma og vonuðumst til að þeir söfnuðu. Það gekk voða hægt. Svo sátum við fyrir gestum og gangandi hérna í HR og veiddum inn fólk. Þá gekk þetta aðeins," segir Jón Guðnason, lektor við HR. en það komst ekki skriður á söfnunina fyrr en fyrirtæki og stofnanir hoppuðu um borð. Á endanum voru þetta um 230 þúsund setningar sem söfnuðust hjá rúmlega 500 manns. Íslenskan virkar vel að sögn strákanna en þeir vildu fá eins marga og þeir gátu til þess að tala eins fjölbreytt íslenskt mál og hægt er. Tölvan lærir síðan nokkurskonar meðaltals íslensku, og þjálfar sig í að tengja hljóð og texta. Og þeir eru óneitanlega stoltir. „Ég er búinn að vera í talgreiningu núna í 15 ár. Gerði fyrst talgervil. Þetta var lokatakmarkið. Ég vildi ekki fara frá Google fyrr en þetta yrði að veruleika," segir Trausti Kristjánsson, stofnandi. „Við erum með svona svipaðan bakgrunn við Trausti. Ég var í svona svipuðum sporum og hann. Þetta var draumur þegar maður kom út úr meistaranámi og eitthvað sem maður ætlaði að vinna að. Talgreining var augljóslega komin af stað. En það að ná talgreiningu fyrir íslensku var bara fjarlægur draumur. Og það er í raun bara ótrúlegt hvað við náðum þessu á stuttum tíma," segir Jón. Mest lesið Kosningavaktin: Íslendingar ganga að kjörborðinu Innlent Allt of margir með hugann annars staðar í umferðinni Innlent Óeirðir í Valensía og kallað eftir afsögn ráðamanna Erlent Baráttan hafin á TikTok: Traktor í skeifunni, kaldar kveðjur og endurkoma Innlent Missti stjórn á bílnum þegar klæðingin umvafði dekkin Innlent Hætta sem sáttasemjarar í deilu Ísraela og Hamas Fréttir Ætlar 1750 kílómetra á þrektækjum á einni viku í minningu vina Innlent Yazan og fjölskylda leita að nýju húsnæði Innlent Bjartsýn eftir fund í Virginíu vegna Söndru sem afplánar 37 ára dóm Innlent Lögreglan bannaði bjór á B5 Innlent Fleiri fréttir Allt of margir með hugann annars staðar í umferðinni Ætlar 1750 kílómetra á þrektækjum á einni viku í minningu vina Baráttan hafin á TikTok: Traktor í skeifunni, kaldar kveðjur og endurkoma Engin miðlæg skráning slysa í ferðaþjónustu Yazan og fjölskylda leita að nýju húsnæði Úrbætur í kjölfar slyss á Breiðamerkurjökli og vikulöng þrekraun Grunaður um sölu fíkniefna og brot á útlendingalögum Missti stjórn á bílnum þegar klæðingin umvafði dekkin Lögreglan bannaði bjór á B5 Leikskólastarfsmenn í Hafnarfirði greiða atkvæði um verkfall Um 60 kennarar hjá Fræðsluneti Suðurlands Bein útsending: Sigmundur kynnir innihaldið Öryrkjar fá 1,7 skattfrjálsa milljarða Ætla ekki að slíta viðræðum Engin ákvörðun um hvalveiðar og maurasýrumengun á Bíldudal Kallar eftir sams konar úrræði og Breivik og árásarmaður hennar sæta Bjartsýn eftir fund í Virginíu vegna Söndru sem afplánar 37 ára dóm Helmingi þætti óeðlilegt ef Bjarni gæfi út hvalveiðileyfi Þúsund lítrar af sýru láku á Bíldudal Ríkisstjórnin bjó sjálf til flóttamannavandamál Tveir handteknir eftir hópslagsmál Mansalsmál Gríska hússins: Vann sjö daga í viku hverri og svaf í kjallaranum Sakar Snorra um að tendra bál fordóma Nýju húsnæði Myndlistaskólans lokað Ísland meðal Evrópulanda þar sem lyfjatengd andlát eru hlutfallslega flest Nánast engin læknisþjónusta ef til verkfalls kemur Mikill eldur í iðnaðarhúsnæði á Akureyri Lyfjatengd andlát, rauð Bandaríki og glimmerveisla í Eldborg Tóku fyrstu skóflustunguna að nýjum skóla Óvíst hvort umsókn um hvalveiðileyfi verði afgreidd fyrir kosningar Sjá meira
Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. Hingað til hefur það ekki talist neitt tiltökumál að tala íslensku í símann. Þannig hefur maður getað rætt við vini og vandamenn um nánast hvað sem er á hinu ástkæra og ylhýra. En nú getur maður talað íslensku við internetið í símanum. Þannig getur maður spurt sjálfan Google um nánast hvað sem er. Þetta eru þeir Trausti og Jón. Mennirnir á bakvið tungumálakunnáttu Google, sem nú í ágúst byrjaði að skilja íslensku. Íslenska er ekki beint efst á lista hjá Google en Trausti var þar starfsmaður og ýtti á eftir sínu móðurmáli. Hann leitaði til Jóns sem í samvinnu við fleiri hóf söfnun á íslenskum setningum. „Fyrst létum við einhverja fá síma og vonuðumst til að þeir söfnuðu. Það gekk voða hægt. Svo sátum við fyrir gestum og gangandi hérna í HR og veiddum inn fólk. Þá gekk þetta aðeins," segir Jón Guðnason, lektor við HR. en það komst ekki skriður á söfnunina fyrr en fyrirtæki og stofnanir hoppuðu um borð. Á endanum voru þetta um 230 þúsund setningar sem söfnuðust hjá rúmlega 500 manns. Íslenskan virkar vel að sögn strákanna en þeir vildu fá eins marga og þeir gátu til þess að tala eins fjölbreytt íslenskt mál og hægt er. Tölvan lærir síðan nokkurskonar meðaltals íslensku, og þjálfar sig í að tengja hljóð og texta. Og þeir eru óneitanlega stoltir. „Ég er búinn að vera í talgreiningu núna í 15 ár. Gerði fyrst talgervil. Þetta var lokatakmarkið. Ég vildi ekki fara frá Google fyrr en þetta yrði að veruleika," segir Trausti Kristjánsson, stofnandi. „Við erum með svona svipaðan bakgrunn við Trausti. Ég var í svona svipuðum sporum og hann. Þetta var draumur þegar maður kom út úr meistaranámi og eitthvað sem maður ætlaði að vinna að. Talgreining var augljóslega komin af stað. En það að ná talgreiningu fyrir íslensku var bara fjarlægur draumur. Og það er í raun bara ótrúlegt hvað við náðum þessu á stuttum tíma," segir Jón.
Mest lesið Kosningavaktin: Íslendingar ganga að kjörborðinu Innlent Allt of margir með hugann annars staðar í umferðinni Innlent Óeirðir í Valensía og kallað eftir afsögn ráðamanna Erlent Baráttan hafin á TikTok: Traktor í skeifunni, kaldar kveðjur og endurkoma Innlent Missti stjórn á bílnum þegar klæðingin umvafði dekkin Innlent Hætta sem sáttasemjarar í deilu Ísraela og Hamas Fréttir Ætlar 1750 kílómetra á þrektækjum á einni viku í minningu vina Innlent Yazan og fjölskylda leita að nýju húsnæði Innlent Bjartsýn eftir fund í Virginíu vegna Söndru sem afplánar 37 ára dóm Innlent Lögreglan bannaði bjór á B5 Innlent Fleiri fréttir Allt of margir með hugann annars staðar í umferðinni Ætlar 1750 kílómetra á þrektækjum á einni viku í minningu vina Baráttan hafin á TikTok: Traktor í skeifunni, kaldar kveðjur og endurkoma Engin miðlæg skráning slysa í ferðaþjónustu Yazan og fjölskylda leita að nýju húsnæði Úrbætur í kjölfar slyss á Breiðamerkurjökli og vikulöng þrekraun Grunaður um sölu fíkniefna og brot á útlendingalögum Missti stjórn á bílnum þegar klæðingin umvafði dekkin Lögreglan bannaði bjór á B5 Leikskólastarfsmenn í Hafnarfirði greiða atkvæði um verkfall Um 60 kennarar hjá Fræðsluneti Suðurlands Bein útsending: Sigmundur kynnir innihaldið Öryrkjar fá 1,7 skattfrjálsa milljarða Ætla ekki að slíta viðræðum Engin ákvörðun um hvalveiðar og maurasýrumengun á Bíldudal Kallar eftir sams konar úrræði og Breivik og árásarmaður hennar sæta Bjartsýn eftir fund í Virginíu vegna Söndru sem afplánar 37 ára dóm Helmingi þætti óeðlilegt ef Bjarni gæfi út hvalveiðileyfi Þúsund lítrar af sýru láku á Bíldudal Ríkisstjórnin bjó sjálf til flóttamannavandamál Tveir handteknir eftir hópslagsmál Mansalsmál Gríska hússins: Vann sjö daga í viku hverri og svaf í kjallaranum Sakar Snorra um að tendra bál fordóma Nýju húsnæði Myndlistaskólans lokað Ísland meðal Evrópulanda þar sem lyfjatengd andlát eru hlutfallslega flest Nánast engin læknisþjónusta ef til verkfalls kemur Mikill eldur í iðnaðarhúsnæði á Akureyri Lyfjatengd andlát, rauð Bandaríki og glimmerveisla í Eldborg Tóku fyrstu skóflustunguna að nýjum skóla Óvíst hvort umsókn um hvalveiðileyfi verði afgreidd fyrir kosningar Sjá meira