Ótrúlegt hve hratt Google lærði íslensku Breki Logason skrifar 3. september 2012 22:51 Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. Hingað til hefur það ekki talist neitt tiltökumál að tala íslensku í símann. Þannig hefur maður getað rætt við vini og vandamenn um nánast hvað sem er á hinu ástkæra og ylhýra. En nú getur maður talað íslensku við internetið í símanum. Þannig getur maður spurt sjálfan Google um nánast hvað sem er. Þetta eru þeir Trausti og Jón. Mennirnir á bakvið tungumálakunnáttu Google, sem nú í ágúst byrjaði að skilja íslensku. Íslenska er ekki beint efst á lista hjá Google en Trausti var þar starfsmaður og ýtti á eftir sínu móðurmáli. Hann leitaði til Jóns sem í samvinnu við fleiri hóf söfnun á íslenskum setningum. „Fyrst létum við einhverja fá síma og vonuðumst til að þeir söfnuðu. Það gekk voða hægt. Svo sátum við fyrir gestum og gangandi hérna í HR og veiddum inn fólk. Þá gekk þetta aðeins," segir Jón Guðnason, lektor við HR. en það komst ekki skriður á söfnunina fyrr en fyrirtæki og stofnanir hoppuðu um borð. Á endanum voru þetta um 230 þúsund setningar sem söfnuðust hjá rúmlega 500 manns. Íslenskan virkar vel að sögn strákanna en þeir vildu fá eins marga og þeir gátu til þess að tala eins fjölbreytt íslenskt mál og hægt er. Tölvan lærir síðan nokkurskonar meðaltals íslensku, og þjálfar sig í að tengja hljóð og texta. Og þeir eru óneitanlega stoltir. „Ég er búinn að vera í talgreiningu núna í 15 ár. Gerði fyrst talgervil. Þetta var lokatakmarkið. Ég vildi ekki fara frá Google fyrr en þetta yrði að veruleika," segir Trausti Kristjánsson, stofnandi. „Við erum með svona svipaðan bakgrunn við Trausti. Ég var í svona svipuðum sporum og hann. Þetta var draumur þegar maður kom út úr meistaranámi og eitthvað sem maður ætlaði að vinna að. Talgreining var augljóslega komin af stað. En það að ná talgreiningu fyrir íslensku var bara fjarlægur draumur. Og það er í raun bara ótrúlegt hvað við náðum þessu á stuttum tíma," segir Jón. Mest lesið Fífldjarft að fara í formanninn en varaformannsembættið...? Innlent Segir um að ræða alvarlega aðför að sjálfstæði forseta Íslands Innlent Hýdd 140 sinnum fyrir áfengisneyslu og kynlíf utan hjónabands Erlent Játaði brot sín og sleppur ekki aftur við fangelsisvist Innlent Trump vill hafa Pútín og Xi út af fyrir sig Erlent Njósnastjóri Trumps leitar að kosningasvindli Erlent Afar sérstakt að lækka laun og það á verkalýðsdaginn sjálfan Innlent „Muni ekki valda neinu öðru en umferðaröngþveiti“ Innlent Hafði aldrei heyrt um handbolta fyrr en hún kynntist handboltaóðu þjóðinni Innlent Myndbirtingar foreldra geti skapað hættu Innlent Fleiri fréttir Betri að innleiða tilskipanir en verri að innleiða reglugerðir Segir um að ræða alvarlega aðför að sjálfstæði forseta Íslands Hitni undir olíufélögum sem þurfi að passa sig Stórleikurinn riðlar dagskrá margra Afar sérstakt að lækka laun og það á verkalýðsdaginn sjálfan Kristrún ræðir verðbólguna og allt á suðupunkti fyrir leikinn í kvöld Aldrei verið gefnar út fleiri rauðar viðvaranir Finnist hvergi eins sterk skilyrði til umhverfisverndar í lagareldi Streymi: Heilsan okkar: Meðferð offitu hjá fullorðnum Burðardýr hlaut þungan dóm fyrir vökvasmygl Fífldjarft að fara í formanninn en varaformannsembættið...? Játaði brot sín og sleppur ekki aftur við fangelsisvist Ráðhús Árborgar sprungið – 10 starfsmenn fluttir í annað húsnæði Streymi: Málþing um stöðu fatlaðra barna í íþróttum Lögregla eltist við afbrotamenn Harma launalækkanir í fiskeldi á Vestfjörðum Myndbirtingar foreldra geti skapað hættu Óvissustigi lýst yfir vegna snjóflóðahættu „Muni ekki valda neinu öðru en umferðaröngþveiti“ „Mér þykir leiðinlegt að þetta gangi ekki betur“ Hafði aldrei heyrt um handbolta fyrr en hún kynntist handboltaóðu þjóðinni Auglýsa forskráningu í skóla í Grindavík Segir ekkert náttúrulögmál að bílasalar þurfi að velta hækkunum út í verðlagið Þrjár hlutu heiðursverðlaun Fimm handteknir grunaðir um skipulagðan þjófnað Ráðherra situr fyrir svörum, gleðitíðindi og konan sem hafði aldrei heyrt um handbolta Seinka sýningum fyrir leikinn Óbirt svör og starfslokin tekin fyrir Tæplega þrjátíu prósent Tesla Y þurftu í endurskoðun Mikil andstaða við nýtt 160 herbergja hótel á Laugarvatni Sjá meira
Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. Hingað til hefur það ekki talist neitt tiltökumál að tala íslensku í símann. Þannig hefur maður getað rætt við vini og vandamenn um nánast hvað sem er á hinu ástkæra og ylhýra. En nú getur maður talað íslensku við internetið í símanum. Þannig getur maður spurt sjálfan Google um nánast hvað sem er. Þetta eru þeir Trausti og Jón. Mennirnir á bakvið tungumálakunnáttu Google, sem nú í ágúst byrjaði að skilja íslensku. Íslenska er ekki beint efst á lista hjá Google en Trausti var þar starfsmaður og ýtti á eftir sínu móðurmáli. Hann leitaði til Jóns sem í samvinnu við fleiri hóf söfnun á íslenskum setningum. „Fyrst létum við einhverja fá síma og vonuðumst til að þeir söfnuðu. Það gekk voða hægt. Svo sátum við fyrir gestum og gangandi hérna í HR og veiddum inn fólk. Þá gekk þetta aðeins," segir Jón Guðnason, lektor við HR. en það komst ekki skriður á söfnunina fyrr en fyrirtæki og stofnanir hoppuðu um borð. Á endanum voru þetta um 230 þúsund setningar sem söfnuðust hjá rúmlega 500 manns. Íslenskan virkar vel að sögn strákanna en þeir vildu fá eins marga og þeir gátu til þess að tala eins fjölbreytt íslenskt mál og hægt er. Tölvan lærir síðan nokkurskonar meðaltals íslensku, og þjálfar sig í að tengja hljóð og texta. Og þeir eru óneitanlega stoltir. „Ég er búinn að vera í talgreiningu núna í 15 ár. Gerði fyrst talgervil. Þetta var lokatakmarkið. Ég vildi ekki fara frá Google fyrr en þetta yrði að veruleika," segir Trausti Kristjánsson, stofnandi. „Við erum með svona svipaðan bakgrunn við Trausti. Ég var í svona svipuðum sporum og hann. Þetta var draumur þegar maður kom út úr meistaranámi og eitthvað sem maður ætlaði að vinna að. Talgreining var augljóslega komin af stað. En það að ná talgreiningu fyrir íslensku var bara fjarlægur draumur. Og það er í raun bara ótrúlegt hvað við náðum þessu á stuttum tíma," segir Jón.
Mest lesið Fífldjarft að fara í formanninn en varaformannsembættið...? Innlent Segir um að ræða alvarlega aðför að sjálfstæði forseta Íslands Innlent Hýdd 140 sinnum fyrir áfengisneyslu og kynlíf utan hjónabands Erlent Játaði brot sín og sleppur ekki aftur við fangelsisvist Innlent Trump vill hafa Pútín og Xi út af fyrir sig Erlent Njósnastjóri Trumps leitar að kosningasvindli Erlent Afar sérstakt að lækka laun og það á verkalýðsdaginn sjálfan Innlent „Muni ekki valda neinu öðru en umferðaröngþveiti“ Innlent Hafði aldrei heyrt um handbolta fyrr en hún kynntist handboltaóðu þjóðinni Innlent Myndbirtingar foreldra geti skapað hættu Innlent Fleiri fréttir Betri að innleiða tilskipanir en verri að innleiða reglugerðir Segir um að ræða alvarlega aðför að sjálfstæði forseta Íslands Hitni undir olíufélögum sem þurfi að passa sig Stórleikurinn riðlar dagskrá margra Afar sérstakt að lækka laun og það á verkalýðsdaginn sjálfan Kristrún ræðir verðbólguna og allt á suðupunkti fyrir leikinn í kvöld Aldrei verið gefnar út fleiri rauðar viðvaranir Finnist hvergi eins sterk skilyrði til umhverfisverndar í lagareldi Streymi: Heilsan okkar: Meðferð offitu hjá fullorðnum Burðardýr hlaut þungan dóm fyrir vökvasmygl Fífldjarft að fara í formanninn en varaformannsembættið...? Játaði brot sín og sleppur ekki aftur við fangelsisvist Ráðhús Árborgar sprungið – 10 starfsmenn fluttir í annað húsnæði Streymi: Málþing um stöðu fatlaðra barna í íþróttum Lögregla eltist við afbrotamenn Harma launalækkanir í fiskeldi á Vestfjörðum Myndbirtingar foreldra geti skapað hættu Óvissustigi lýst yfir vegna snjóflóðahættu „Muni ekki valda neinu öðru en umferðaröngþveiti“ „Mér þykir leiðinlegt að þetta gangi ekki betur“ Hafði aldrei heyrt um handbolta fyrr en hún kynntist handboltaóðu þjóðinni Auglýsa forskráningu í skóla í Grindavík Segir ekkert náttúrulögmál að bílasalar þurfi að velta hækkunum út í verðlagið Þrjár hlutu heiðursverðlaun Fimm handteknir grunaðir um skipulagðan þjófnað Ráðherra situr fyrir svörum, gleðitíðindi og konan sem hafði aldrei heyrt um handbolta Seinka sýningum fyrir leikinn Óbirt svör og starfslokin tekin fyrir Tæplega þrjátíu prósent Tesla Y þurftu í endurskoðun Mikil andstaða við nýtt 160 herbergja hótel á Laugarvatni Sjá meira