Skoðun

Stærðfræði­kennari sem kann ekki að reikna? (Og getur ekki lært það!)

Brynjólfur Þorvarðsson skrifar

Auðvitað myndi enginn skólastjóri skoða alvarlega umsókn í starf stærðfræðikennara frá aðila sem kynni ekki að reikna. Hvað þá þegar viðkomandi getur ekki einusinni lært að reikna, getur ekki lært að keyra, getur ekki lært að hugsa og hefur engan skilning á kennslufræði, sálfræði, félagsfræði, mannlegum samskiptum né yfirhöfuð nokkru því sem gerir okkur mennsk og hæf til að sinna öðrum manneskjum. Hvaða gagn er af slíkum kennara? Nákvæmlega ekkert.

Samt eru sumir sem eru að reyna að selja skólastjórnendum og rekstraraðilum skóla slíkar lausnir – í stað kennara komi spjallþumbar á borð við ChatGPT sem eiga, samkvæmt söluáróðri, að geta gert allt betur en mennskir kennarar. Ágætt dæmi um þetta er fyrirtæki á sviði einkakennslu í BNA og víðar sem kennir sig við Alpha og er núna að reyna að fá starfsleyfi í ýmsum fylkjum fyrir eitthvað sem þeir kalla „tveggja tíma kennsla“ undir nafninu „Unbound Academy“. Þessir skólar nota ekki kennara, að sögn, heldur eingöngu spjallþumba og svo einhverja leiðbeinendur til eftirlits. En þegar nánar er skoðað kemur í ljós að „leiðbeinendur“ í þessum skólum þurfa að vera með fullgild kennsluréttindi, með þriggja ára reynslu í kennslu, og munu starfa í hlutfalli 1 leiðbeinandi á hverja 20 nemendur, samanborið við hið opinbera viðmið í skólum vestanhafs að það skuli vera 1 kennari á hverja 30 nemendur. Unbound Academy er enda að reyna að markaðssetja sig sem dýran einkaskóla fyrir elítuna. Og ein af helstu markaðsbrellum þeirra er að þykjast nota gervigreind.

Gervigreind getur ekki gengið í alvöru störf

Bara svo það sé ljóst: Engin gervigreindarlausn sem til er í dag getur sjálfstætt leyst af hendi einföldustu störf. Forsprakkar gervigreindarfyrirtækja eru allir að reyna að ná þessu marki, að búa til „alvöru“ almenna gervigreind (Artificial General Intelligence, AGI) og eru að eyða ofboðslegum fjármunum í sókn að þessu marki. Talið er að gervigreindariðnaðurinn sé að fjárfesta fyrir rúmlega þúsund milljarði Bandaríkjadali á næstu tveimur árum, allt í þeim yfirlýsta tilgangi að búa til gervigreind sem getur leyst af hendi einföldustu störf.

Í grein minni, Bylting, bóla, bölvun – bull?sem birtist í byrjun júní 2025 fór ég rækilega í saumana á því hvers vegna ég og margir aðrir á tæknisviði, ásamt miklum meirihluta fræðimanna á sviði gervigreindarvísinda, telja ógjörning að ná alvöru gervigreind með núverandi nálgun, sem er sú að búa til sífellt stærri og flóknari spjallþumba. Við teljum að þessi risastóru fyrirtæki á sviði gervigreindar sem eru að eyða gríðarlegum fjármunum (annarra auðvitað – þeir eru ekki að eyða eigin peningum, heldur því sem þeir geta platað út úr fjárfestum og misvitrum stjórnmálamönnum) séu að eltast við tálsýn.

Spjallþumbar sífellt lélegri, líklegri til að ljúga

Allir vita að spjallþumbar eru óáreiðanlegir. Spjallþumbarnir spinna texta samkvæmt tölfræðilegum líkindum og gera engan greinarmun á sannleika og lygum, staðreyndum eða bulli. Þeir hafa engar forsendur til að skilja mismuninn á raunveruleika og ímyndun sem er kannski en besta sönnun þess að þeir geta ekki hugsað, ekki frekar en reiknivélar.

Áætlað er milli 20 og 40% af því sem frá spjallþumbum kemur sé þvæla en hún er fallega sett fram og faglega rökstudd sem verður til þess að margir láta plata sig. Það er algeng umkvörtun að spjallþumbar geti svarað spurningum um allt nema sérsvið spyrilsins – því þá sér spyrillinn hversu lítið er að marka spjallþumbann. Og spjallþumbar fara ekki batnandi – þeir bulla meira með tímanum og nýjustu útgáfur spjallþumba reynast verri en fyrri útgáfur að flestu leyti, nokkuð sem vísindamenn hafa spáð að muni gerast. Sú tækni sem liggur að baki spjallþumbunum er þegar fullþróuð og kemst ekki lengra, gagnasafnið er þegar full lesið og það sem verra er, nýir spjallþumbar eru í sívaxandi mæli þjálfaðir á eigin framleiðslu sem leiðir til sífellt lélegri árangurs.

Spjallþumbar geta ekki lært

Það er vel þekkt að það er ekki hægt að kenna spjallþumbum að tefla skák. En færri vita að það er ekki hægt að kenna þeim neitt yfirhöfuð. Þeir eru ófærir um að taka til sín þekkingu og ófærir um að vinna úr þekkingu. Þeir get því ekki lært að reikna, og í kennsluumhverfi þá geta þeir ekki lært að þekkja nemendur og sérkenni þeirra svo eitt örfárra dæma sé tekið.

Stórfyrirtækið Apple birti á dögunum grein um það hvernig hægt var að „sprengja“ öflugustu spjallþumba með því að láta þá reyna við algengan leikskólaleik, sem kallast á ensku „Towers of Hanoi“ og allir hafa séð. Leikurinn felst í því að misstórum skífum með gati er staflað hver ofan á aðra á litlu priki, minnsta platan efst og svo koll af kolli. Tvö önnur prik standa tóm við hlið fyrsta priksins. Markmið leiksins er að færa eina plötu í einu þar til allar plöturnar eru á þriðja priki, en alltaf þarf að fylgja þeirri reglu að stærri plötur mega ekki liggja á minni.

Leikskólabörn eru fljót að átta sig, en fjöldi skífa í upphafi eykur flækjustigið nokkuð. Þrautin er leikur einn með þrjár eða fjórar, jafnvel fimm, skífur en eftir það þarf einbeitingar til. En um leið og menn átta sig á grundvallar reglum leiksins þá er alltaf hægt að leysa þrautina sama hversu margar skífurnar eru. Venjulegt fólk finnur gjarnan nokkrar einfaldar reglur sem hægt er að endurtaka aftur og aftur. Forritarar hafa hins vegar fyrir löngu fundið sáraeinfaldan endurkvæman algoriþma sem fer létt með að leysa þrautina, mikið notað í háskólakennslu sem dæmi um flottan endurkvæman algoriþma.

Spjallþumbar eiga í mestu erfiðleikum með þennan leik, gengur sífellt verr eftir því sem skífunum fjölgar og springa og fara í baklás þegar skífurnar eru orðnar 7 eða 8 – þeim er fyrirmunað að læra regluna (jafnvel þegar þeim er sagt hún!) og reyna í hvert skipti að leysa þrautina með einhverjum þumbaraskap sem er miklu seinlegra en hreinlega að prófa allar lausnir, nokkuð sem tekur sekúndubrot á nútíma tölvu.

Spjallþumbar skilja ekkert

Að öllu ofansögðu ætti að vera ljóst að spjallþumbar hafa engan skilning á því sem þeir segja eða gera. En er hvernig er hægt að staðfesta það? Fræðimenn eru byrjaðir að tala um Pótemkin skilning (samanber Pótemkin tjöld, yfirborð sem felur auðnina fyrir aftan). Vandinn með spjallþumba er að þeir virðast skilja það sem þeir eru að segja, og það er mjög auðvelt að láta sannfærast um að þeir skilji í raun. En við nánari athugun kemur í ljós að skilningurinn er enginn.

Gott dæmi er að biðja spjallþumba að útskýra bragarhátt (sem þeir geta yfirleitt, þó ekki alltaf, sjá neðar) og biðja þá síðan að dæma hvort bragarhætti sé fylgt í tilteknum tilfellum. Það geta þeir sjaldnast, enda skilja þeir ekki regluna sem þeir voru sjálfir að enda við að lýsa.

Tilraun undirritaðs sýnir vel takmarkanir spjallþumbans. Hér er það Gemini frá Google sem er til prófunar:


BÞ: Skilurðu Íslensku?

G: Já, ég skil íslensku. Get ég aðstoðað þig með eitthvað?”

BÞ: Geturðu útskýrt hvernig sléttubönd virka?

G: Hvernig sléttubönd virka: Sléttubönd, eða flatbandsbrautir eins og þau eru stundum kölluð, eru tæknileg lausn sem er notuð í rafrásum til að stjórna hvernig rafboð ferðast. [Hér fylgir 352 orða útskýring úr rafmagnsfræði. Lítur skynsamlega út, en er eitthvað að marka þetta? Leit í Íslensku Íðorðabókinni finnur hvorki sléttubönd né flatbandsbrautir]

B Þ: Þú hefur misskilið mig, ég var að meina sléttubönd í kveðskap.

G: Ég biðst velvirðingar, ég misskildi þig algjörlega! Það er algengt að rugla saman tækniheiti og heitum úr bókmenntum. Nú skil ég þig betur – þú ert að tala um sléttubönd í kveðskap, sem er bókmenntafræðilegt hugtak. Sléttuband er ekki sérstök tegund bragarháttar eða ljóðforms, heldur á það við um einkenni kveðskapar þar sem áhersla er lögð á mikið hljóðlíkingar, orðaleiki og oft flókið orðalag.

[163 or ðum sleppt, virðist vera tóm vitleysa ]

B Þ: Geturðu nefnt dæmi?

G: Já, auðvitað get ég nefnt dæmi! [293 orða þvæla fylgir, ásamt furðulegri vísu sem á ekkert skylt við sléttubönd og lítið skylt við kveðskap]


Spjallþumbinn hefur ekki hugmynd um hvað hann er að bulla en svarar engu að síður tómri þvælu í löngu og áferðarfallegu máli. Samtalið allt fylgir með fyrir aftan heimildarlistann. Sléttubönd eru eins og allir vita, „dýrt kveðin ferskeytla sem hægt er að lesa bæði afturábak og áfram án þess að raska bragforminu“ (Wikipedia).

Spjallþumbar í skólastarfi

Skólastarf er víða í uppnámi vegna spjallþumba og alls ekki ljóst hvað framtíðin mun bera í skauti sér. En eitt er alveg öruggt: Spjallþumbar geta ekki komið í stað kennara. Spjallþumbar geta eflaust gert eitthvað gagn. Undirritaður notar þá til að forrita einföld verkefni og veit til þess að aðrir forritarar hafa nýtt sér spjallþumba til gagns. En notkun þeirra krefst mikið aðhalds, stanslausrar prófunar og góðrar þekkingar á forritun. Góð menntun og löng reynsla er forsenda þess að hægt sé að nýta sér spjallþumba í forritun.

Ætli sama eigi ekki við um kennslu sem og önnur störf? Spjallþumbar geta gert gagn en aðeins þegar notandi veit nákvæmlega hvað hann vill og hefur burði til að meta afraksturinn og laga hann til. Enginn sem vill halda virðingu sinni, hvað þá starfi, treystir því sem spjallþumbar láta út úr sér! Springer forlagið í Þýskalandi birti nýlega fræðibók um gervigreind. Mikill meirihluti tilvitnana í bókinni reyndust uppspuni og höfundur neitar að svara hvort hann lét spjallþumba skrifa bókina fyrir sig. Niðurstaðan: álitshnekkur fyrir forlagið og eyðilagður orðstír höfundar.

Hættan við spjallþumbana er að þeir eru forheimskandi eins og margar rannsóknir eru þegar farnar að sýna. Nemendur sem láta spjallþumba skrifa fyrir sig ritgerðir standa sig verr en aðrir nemendur og það sem meira er, frammistaða þeirra versnar á öllum sviðum. Spjallþumbar gefa fölsk svör og veita vond ráð, en ýta undir sjálfsánægju notenda. Gott nýlegt dæmi er hlutabréfaviðskiptaleikur sem algengt er að verðandi stjórnendur fyrirtækja taka þátt í. Þrjú hundruð manns voru látnir leika sér á gervi-hlutabréfamarkaði í nokkurn tíma. Hópnum var síðan skipt í tvennt, annar hópurinn var hvattur til að nýta sér spjallþumba við hlutabréfakaupin en hinn hópurinn var hvattur til að vera virkur á sameiginlegu spjallborði þar sem einstaklingar gátu spurt hvorn annan ráða. Niðurstaðan var sú að spjallþumbahópurinn stóð sig áberandi verst en aðspurðir þóttust þeir hafa staðið sig langbest. Sjálfsánægja þeirra og vissa um eigið ágæti jókst í öfugu hlutfalli við raunverulega frammistöðu.

Það þarf að kenna á spjallþumba og ekki síst að sýna nemendum takmarkanir þeirra, og láta þá sjálfa reka spjallþumbana á gat. Og gott er að hafa í huga þá grundvallar reglu að ef maður nennir ekki sjálfur að skrifa texta getur maður ekki ætlast til að aðrir nenni að lesa hann.

Höfundur rekur hugbúnaðarfyrirtæki.


Heimildir:

Um Alpha skólana og gervikennslu:

https://danmeyer.substack.com/p/the-truth-about-2-hour-learning-and

Meira um tveggja tíma kennslugabbið

https://www.chalkbeat.org/philadelphia/2025/01/24/ai-cyber-charter-school-pennsylvania-promises-2-hour-learning/

Spjallþumbar á niðurleið

https://www.theintrinsicperspective.com/p/ai-progress-has-plateaued-at-gpt

Blindgata í þróun gervigreindar

https://www.theregister.com/2025/05/27/opinion_column_ai_model_collapse/

Spjallþumbinn sprengdur

https://cacm.acm.org/blogcacm/a-knockout-blow-for-llms/

Springer forlagið lætur plata sig

https://retractionwatch.com/2025/06/30/springer-nature-book-on-machine-learning-is-full-of-made-up-citations/

Spjallþumbar eru forheimskandi

https://www.brainonllm.com/

Ágæt grein um hvernig hægt er að koma upp um spjallþumba

https://theconversation.com/understanding-the-slopocene-how-the-failures-of-ai-can-reveal-its-inner-workings-258584




Skoðun

Sjá meira


×