Tekoälytyökalujen käytön näkyminen opiskelijoiden suoritustuloksissa
Miten tekoälytyökalujen käyttö ja tekoälyn avulla suoritettavat toimenpiteet ovat näkyneet Aalto-yliopiston opiskelijoiden suoritustuloksissa kandidaattitason kurssilla "TU-C2020 Operaatioiden johtaminen" vuosina 2024 ja 2025?
Kuva: Timo Seppälä
Kirjoittajat Atte Kapanen & Timo Seppälä
Tekoälytyökalujen käytön näkyminen opiskelijoiden suoritustuloksissa
Tiivistelmä
Tarkoitus: Selvitetään, näkyykö tekoälytyökalujen käyttö opiskelijoiden suoritustuloksissa Aalto-yliopiston kandidaattitason kurssilla ”TU-C2020 Operaatioiden johtaminen”. Verrataan tekoälytyökalujen käytöstä harjoitustyössään ilmoittaneiden opiskelijoiden tentti- ja harjoitustyöpisteitä toisiinsa ja heihin, jotka eivät ole käyttöä ilmoittaneet.
Aineisto ja menetelmät: Aineistona on opiskelijaryhmien vapaamuotoisoa ilmoituksia tekoälytyökalujen käytöstä harjoitustyössä (n = 259) sekä samojen opiskelijoiden (n = 511) yksin tehtävän paperitentin ja ryhmässä tehtävän harjoitustyön suoritustuloksia vuosilta 2024 ja 2025. Ilmoitukset kerättiin osana vaiheittain etenevää harjoitustyötä, jossa suunniteltiin tuotantojärjestelmä uudelle leluautolle. Ilmoitukset sisältävät kuvauksia siitä, miten tekoälytyökaluja hyödynnettiin ja miten tiedon oikeellisuus varmistettiin. Ryhmien ilmoitukset luokitellaan toimenpideluokkien ja käytön syvyystasojen mukaan (nämä mallit esitellään tarkemmin) sekä kytketään opiskelijoiden suoritustuloksiin. Tämän jälkeen suoritustuloksista piirretään kaavioita ja lasketaan tunnuslukuja eri muuttujien mukaan.
Tuloksia ja pohdintaa: Tekoälyn käytöstä ilmoittaneiden ryhmien opiskelijat vaikuttavat saaneet keskimäärin hieman korkeampia pistemääriä kuin he, jotka eivät ole ilmoittaneet käytöstä harjoitustyössä. Hajonnat ovat kuitenkin suuria ja erot ovat hyvin maltillisia. Näyttää siltä, että opiskelijoilla ei vielä ole taitoja hyödyntää tekoälytyökalujen mahdollisuuksia oppimisen kannalta oikein. Jatkotutkimuksia varten koeasetelmaa pitäisi tarkentaa varsinkin yksilökohtaisten erojen huomioimiseksi ja aineistoa pitäisi kerätä systemaattisemmin ja standardisoidummin.
Avainsanat: Tekoälytyökalut, generatiivinen tekoäly, suuret kielimallit, yliopisto, korkeakouluopetus, opiskelijat, käyttötapaukset, kognitiivinen ulkoistaminen, suoritustulokset.
Johdanto
Generatiiviset tekoälytyökalut, erityisesti suuret kielimallit (engl. large language model, LLM), ovat tulleet korkeakouluopiskelijoiden arkeen nopeasti OpenAI:n julkaistua ChatGPT-3.5-mallin marraskuussa 2022 ja muiden toimijoiden seuratessa perässä. Nämä työkalut eivät ainoastaan hae ja säilö tietoa, vaan ne voivat myös jäsentää, tiivistävää, vertailla ja tuottaa tekstiä sekä kommentoida ja ehdottaa ratkaisuvaihtoehtoja. Niiden avulla voidaan esimerkiksi tehostaa ja nopeuttaa erilaisia toissijaisia tehtäviä, hankkia välitöntä palautetta ja näin mahdollisesti parantaa oppimista. Samanaikaisesti huolena on muun muassa oppimisen pinnallistuminen, opiskelijan oman kognitiivisen työn väheneminen ja kriittisen ajattelun heikkeneminen sekä erilaiset eettisyyteen, alkuperäisyyteen ja tietoturvaan liittyvät kysymykset.
Tekoälytyökalujen avulla osa muistamisesta, päättelystä ja tiedon jäsentämisestä siirretään ulkoisiin välineisiin. Tällainen kognitiivinen ulkoistaminen (engl. cognitive offloading)(1) ei ole uusi ilmiö, mutta tekoälytyökalut laajentavat ulkoistamisen mahdollisuuksia sisällön tulkintaa ja luovaan tuottamiseen. Vielä ei ole kuitenkaan paljoa empiiristä tutkimustietoa siitä, missä määrin tekoälytyökalujen kanssa työskentely näkyy kognitiivisessa kuormassa ja oppimisessa taikka korkeakouluopiskelijoiden todellisissa suoritustuloksissa ja minkälainen käyttö on oppimisen kannalta hyödyllistä. Nykyisten tekoälytyökalujen tarkasteluaikajänne on vielä lyhyt, eikä tekoäly ole mikään yksi yleispätevillä periaatteilla toimiva tai hyödynnettävä teknologia tai sovellus.
Tässä artikkelissa tarkastellaan Aalto-yliopiston tuotantotalouden kandidaattikurssin ”TU-C2020 Operaatioiden johtaminen” kahden lukuvuoden (2024 ja 2025) aineistoa. Aineisto koostuu opiskelijaryhmien vapaasti muotoilemista ilmoituksista tekoälytyökalujen käytöstä harjoitustyössä sekä samaisten opiskelijoiden suoritustuloksista. Käyttöilmoitukset on luokiteltu sen mukaan, mitä toimenpideluokkia(2) käytössä on ilmennyt ja mikä on ollut käytön korkein syvyystaso(liite 1) kehitetyn mallin mukaisesti. Käyttöilmoitusten luokitukset kytketään opiskelijoiden suoritustuloksiin ja pyritään selvittämään, näkyykö ilmoitettu tekoälytyökalujen käyttö suoritustuloksissa. Tavoitteena ei ole tehdä suoria johtopäätöksiä vaan kuvata mahdollisia yhteyksiä tekoälyn käytön ja suoritustuloksien välillä. Artikkeli on jatkoa artikkelille ”Tekoälyjen ja opiskelijoiden kilpajuoksu”(2).
Artikkeli on jatkoa 12.8.2025 julkaistulle artikkelille ”Tekoälyjen ja opiskelijoiden kilpajuoksu”.
Taustaksi
Kognitiivinen ulkoistaminen (engl. cognitive offloading) on prosessi, jossa ihminen siirtää osan tiedonkäsittelyn tehtävistä, kuten muistamisesta, päättelystä, laskemisesta, tiedon jäsentämisestä tai ongelmanratkaisusta, ulkoisille välineille ja resursseille vähentääkseen omaa kognitiivista kuormitustaan (engl. cognitive load)(1). Tällaisia välineitä voivat olla esimerkiksi paperille tehtävät muistiinpanot, laskimet, hakukoneet, älypuhelimet tai nykypäivänä yhä useammin generatiiviset tekoälytyökalut.
Ilmiö ei ole uusi. Historiallisesti sen varhaisimpia esimerkkejä ovat kirjoituksen kehittäminen muistamisen tueksi ja erilaisten laskentavälineiden käyttöönotto laskennallisen työn helpottamiseksi. Digitalisaation myötä kognitiivinen ulkoistaminen on saanut uusia muotoja: esimerkiksi internetin hakukoneet ja erilaiset ryhmäpohjaiset sovellukset, kuten pilvipohjaiset muistiinpanosovellukset. Generatiiviset tekoälytyökalut laajentavat mahdollisuuksia entisestään, koska ne eivät ainoastaan tallenna ja hae tietoa, vaan kykenevät myös jäsentämään, tiivistämään, vertailemaan, selittämään ja tuottamaan uutta sisältöä.
Kognitiivisen ulkoistamisen hyötynä on kognitiivisen kuorman keveneminen ja resurssien vapauttaminen muihin tehtäviin. Esimerkiksi monimutkaisen tiedon jäsentäminen tekoälyn avulla voi säästää aikaa ja antaa ihmiselle mahdollisuuden keskittyä johonkin muuhun tärkeämmäksi koettuun. Näin vähintään hetkellinen suorituskyky paranee ja monia toimenpiteitä voidaan tehostaa(3).
Haittana voi puolestaan olla kognitiivisen ulkoistamisen liiallisuus. Jos tekoälyn vastauksiin luotetaan kritiikittä ja ajattelu ulkoistetaan liiallisesti tai tehtävissä, joissa aktiivinen muistaminen ja oma päättely olisivat oppimisen kannalta tärkeitä, seurauksena voi olla syvällisen ymmärryksen ja pitkäkestoisen muistamisen heikkeneminen(3, 4). Hakukoneiden myötä ihmiset ovat alkaneet muistaa, mistä jonkin tiedon löytää, itse tiedon sijasta ja sitä kautta yliarvioimaan oma osaaminen(5). Ilmiötä on kuvattu nimellä Google-ilmiö (engl. Google effect) tai laajemmin nimellä digitaalinen amnesia (engl. digital amnesia), mikä on yleistettävissä myös tekoälytyökalujen käyttöön(6).
Tiedonhakutavat ja -menetelmät kehittyvät ja muuttuvat jatkuvasti. Kirjastoissa kognitiivinen ulkoistaminen rajoittuu siihen, että jotkin valitut aineistot on talletettu ja järjestetty valmiiksi mutta käyttäjän tehtävänä on etsiä fyysisesti aineisto, arvioida se ja muodostaa oma ymmärryksensä. Internetin ja hakukoneiden myötä tiedonhaku on nopeutunut ja saatavilla olevan aineiston määrä on kasvanut valtavaksi, mutta arviointi ja suodattaminen on ollut edelleen käyttäjän vastuulla. Hakusanatulokset kuitenkin lajitellaan ja järjestetään käyttäjän puolesta johonkin järjestykseen taikka esimerkiksi Googlen ”I’m Feeling Lucky” -hauissa valitaan valmiiksi paras hakutulos.
Näiden lisäksi nykyiset tekoälytyökalut arvaavat oikean sisällön ja kirjoittavat siitä valmiin tulkinnan, mikä säästää aikaa ja vähentää kognitiivista kuormaa mutta samalla alkuperäinen lähde ja käyttäjän rooli kriittisenä arvioijana ja kokonaisuuden hahmottajana hämärtyy. Siksi tekoälyn tuottama tieto asettaa entistä enemmän vastuuta tiedon validoinnista ja kuratoinnista yksilölle itselleen. Tämä puolestaan edellyttää taitoja hyödyntää ulkoisia välineitä niin, että ne tukevat omaa ajattelua sen korvaamisen sijasta. Käytön mahdollisuudet eroavatkin usein siitä, miten opiskelijat todellisuudessa työkaluja hyödyntävät(7).
Oppimisen kannalta kognitiivisen kuorman pitää olla sopivan kokoinen ja laadultaan tarkoituksenmukainen(8). Kysymys ei ole niinkään, onko järkevää kuormaa kasvattaa tai pienentää esimerkiksi ulkoistamalla. Sitä vastoin kysymys on se, miten kognitiivisen ulkoistamisen määrä pidetään tasapainossa niin, että ihminen säilyttää aktiivisen roolin tiedonkäsittelyssä sen sijaan, että vain hyväksyy valmiin tiedon sellaisenaan ajattelematta ja sitä kautta heikentää kriittisen ajattelun taitojaan(9).
Tekoälytyökaluilla suoritettavat ulkoistukset
Opiskelijaryhmien vapaamuotoisien tekoälytyökalujen käyttöilmoituksien mukainen käyttö operaatioiden johtamisen harjoitusryhmätyössä voidaan jakaa viiteen isompaan toimenpideluokkaan, jotka kuvaavat samantyyppisiä käyttötarkoituksia ja suoritettavia toimenpiteitä:
1) Tekstinkäsittely ja muut senkaltaiset tukitoiminnot
2) Mekaaninen tiedonhaku
3) Selittäminen ja ohjeistaminen
4) Luovien tuotoksien synnyttäminen
5) Palautteen vaihto
Luokkajako on karkea, luokat ovat osittain päällekkäisiä eivätkä ne muodosta keskinäistä hierarkiaa. Samassa ilmoituksessa kuvattu käyttö voi kuulua samanaikaisesti useampaan luokkaan. Luokat itsessään eivät ota kantaa käytön hyödyllisyyteen tai siihen, onko tekoälysovellus paras työkalu kunkin toimenpiteen suorittamiseen esimerkiksi silloin, kun toimenpide voitaisiin suorittaa myös jollakin toisella välineellä. Luokkajako on syntynyt opiskelijaryhmien käyttöilmoituksien laadullisen sisällönanalyysin mukaan, mikä esitellään artikkelissa ”Tekoälyjen ja opiskelijoiden kilpajuoksu”(2).
Ulkoistusten syvyystasot
Toimenpideluokittelun rinnalle on kehitetty malli tekoälytyökalujen käytön syvyydestä. Mallissa syvyydellä viitataan siihen, kuinka vaativalla ja tiedollisesti jalostuneella tavalla tekoäly osallistuu työskentelyyn ja millainen on ihmisen rooli sisällön tulkinnassa, arvioinnissa ja päätöksenteossa."
Mallissa erotellaan Taso – sekä Tasot 1, 2, 3 ja 4. Korkeammille tasoille siirryttäessä tiedon ja sen käsittelyn monimutkaisuus sekä merkityksellisyys kasvavat, vuorovaikutus tekoälyn kanssa monipuolistuu ja ihmisen rooli harkitsijana ja arvioijana korostuu. Alemmilla tasoilla painottuvat tehtävien tehostaminen ja tekninen suoritus, joissa ihminen pääosin käskyttää työkalua ja hyväksyy tuotokset. Korkeammilla tasoilla käytössä painottuu myös uuden ja syvällisen ajattelun syntyminen. Tasot perustuvat käyttöilmoitusten tulkintaan. Tarkemmat kuvaukset tasoista on koottu liitteeseen ”Liite 1: Malli tekoälytyökalujen käytön syvyystasoista”.
Syvyystasot antavat toimenpideluokkien kanssa rinnakkaisen tavan tarkastella käyttöä: saman toimenpideluokan sisällä voi esiintyä eri syvyystasoja. Syvyystasot eivät mittaa suoraan kognitiivista kuormaa. Tason – (eli tilanteiden, joista ei ole ilmoitusta) syvyydestä voida tehdä päätelmiä, koska muiden työkalujen käytöstä ei ole tietoa.
Aineisto ja menetelmät
Aineiston kuvaus
Aineiston osat
Aineisto koostuu kahdesta osasta:
- Opiskelijaryhmien tekoälytyökalujen käyttöilmoitukset osana harjoitusryhmätyötä käytön mukaan luokiteltuna toimenpideluokkiin ja syvyystasoihin
- Opiskelijoiden suoritustuloksista eli harjoitustyön kokonaispisteistä (ryhmätaso, 0–15) ja tentin pisteistä (yksilötaso, 0–30).
Aineisto on Aalto-yliopiston tuotantotalouden laitoksen järjestämältä kandidaattitason kurssilta ”TU-C2020 Operaatioiden johtaminen”. Aineisto kattaa kaksi lukuvuotta (2024 ja 2025). Tänä aikana kurssin on suorittanut loppuun 254 + 257 = 511 opiskelijaa, joiden suorituspisteet on tiedossa. Samalta ajanjaksolta on myös saatu yhteensä 259 ilmoitusta tekoälytyökalujen käytöstä 77 ryhmältä (136 ryhmästä). Käyttöilmoitukset ovat ryhmien vapaamuotoisia kuvauksia siitä, mihin ja miten tekoälytyökaluja hyödynnettiin sekä miten tuotosten oikeellisuus varmistettiin. Nämä ilmoitukset on luokiteltu toimenpideluokkiin ja käytön syvyystasoihin. Luokittelu on pohjautunut ilmoitusten tulkintaan.
TAULUKKO 1: Kurssin loppuun suorittaneiden opiskelijoiden lukumäärän jakautuminen Aalto-yliopiston kuuden eri korkeakoulun mukaan
| Aalto-yliopiston korkeakoulu | Kurssin loppuun suorittaneiden opiskelijoiden lukumäärä |
|
ARTS (Taiteiden ja suunnittelun korkeakoulu) BIZ (Kauppakorkeakoulu) CHEM (Kemian tekniikan korkeakoulu) ELEC (Sähkötekniikan korkeakoulu) ENG (Insinööritieteiden korkeakoulu) SCI (Perustieteiden korkeakoulu) Yhteensä |
3 12 43 58 177 218 257 |
Kurssin konteksti ja kuvaus
”TU-C2020 Operaatioiden johtaminen” on viiden opintopisteen kurssi, joka kuuluu tuotantotalouden pakollisiin pääaineopintoihin ja vapaavalintaisiin sivuaineopintoihin. Kurssille voivat osallistua myös muiden alojen sekä avoimen yliopiston opiskelijat.
Kurssin tavoitteena on se, että opiskelija
- ymmärtää tuotteiden ja tuotantojärjestelmien suunnittelua ja toimintaa kuvaavan käsitteistön ja viitekehykset sekä operatiivisella että strategisella tasolla
- käsittää operaatioiden johtamisen sekä organisaation sisäisenä että organisaatioiden välisenä toimintana globaalilla tasolla
- osaa soveltaa opittua käytäntöön tuotekeskeisten tuotantojärjestelmien suunnittelemisessa.
Vuosittainen osallistujamäärä on noin 250–300 opiskelijaa. Kurssi koostuu luennoista (noin 20 tuntia), itseopiskelusta ja kurssimateriaaliin tutustumisesta (arviolta 55 tuntia) sekä harjoitustyökokonaisuudesta (arviolta 55 tuntia per opiskelija) ja tentistä (3 tuntia). Kurssin arvostelussa harjoitustyökokonaisuus muodostaa kolmanneksen ja tentti kaksi kolmannesta.
Harjoitustyö
Harjoitustyö tehdään yleensä neljän hengen ryhmissä, jotka opiskelijat valitsevat ja muodostavat itse. Harjoitustyö koostuu neljästä osapalautuksesta sekä ne kokoavasta ja niitä täydentävästä loppupalautuksesta. Harjoitustyössä suunnitellaan ja rakennetaan vaiheittain tuotantojärjestelmä uudelle muoviselle leluajoneuvolle, mietitään ratkaisuja keskeisiin operatiivisiin kysymyksiin, perustellaan liiketoimintamalli yritykselle ja tehdään liiketaloudellisia laskelmia. Jokainen ryhmä saa oman ajoneuvotyypin (esim. kaivinkone) sekä ryhmäkohtaiset kysyntäarviot lelulle ja analysoitavat tehtaan sijaintivaihtoehdot.
Harjoitustyön voi kirjoittaa suomeksi, ruotsiksi tai englanniksi. Osapalautukset tehdään viikon välein, ja ryhmät saavat kurssiassistenteilta osapalautuksista muutaman lauseen palautteen, jota voi hyödyntää loppupalautuksen kehittämisessä. Osapalautusten jälkeen on kaksi viikkoa aikaa koota loppupalautus. Neljästä osapalautuksesta ja erillisestä talouslaskelmat sisältävästä Excel-tiedostosta saa jokaisesta maksimissaan yhden pisteen. Loppupalautuksesta puolestaan saa maksimissaan 10 pistettä. Osapalautusten suorittaminen ei ole täysin välttämätöntä, mutta niiden tekeminen helpottaa loppupalautuksen tekemistä ja siksi lähes kaikki ryhmät tekevät nämä palautukset.
Harjoitustyössä suositellaan käyttämään apuna kurssikirjaa(10), jonka teorian soveltamiseen arviointikriteerit perustuvat. Hyvän tuloksen saaminen vaatii myös ulkopuolisia lähteitä ja viitteitä työssä tehtävien analyysien, päätelmien ja valintojen tueksi sekä selkeän ja yhtenäisen rakenteen ja muotoilun. Harjoitustyöhön ei ole yksittäistä oikeaa vastausta, vaan opiskelijoilta vaaditaan hyvin perusteltuja arvioita ja tulkintoja.
Osapalautuksissa kirjoitetaan ja suunnitellaan osia harjoitustyön kokonaisuudesta. Loppupalautuksessa osapalautukset kootaan kokonaiseksi raportiksi, puutteita ja virheitä korjataan, analyysejä täydennetään ja esimerkiksi tiivistelmä kirjoitetaan. Lopputuotos on siis sujuvaksi ja yhtenäiseksi muotoiltu selkeärakenteinen yleensä noin 50–100-sivuinen raportti, joka sisältää on muun muassa tiivistelmän, sisällysluettelon, johdannon, kattavan lähdeluettelon, analyysitekstit, ratkaisut tuotantojärjestelmästä ja operatiivisesta toiminnasta, taloudellisia laskelmia sekä kuvia, taulukoita ja kaavioita. Ryhmän jäsenet saavat harjoitustyöstä saman pistemäärän.
Tekoälytyökalujen käyttö ja käytöstä ilmoittaminen
Tietoteknisten ohjelmistojen tai työkalujen käyttöä ei rajoiteta tai velvoiteta. Opiskelijoilla on lupa hyödyntää esimerkiksi tekoälytyökaluja (mm. generative pre-trained transformers eli GPT-sovellukset) monipuolisesta. Tekoälytyökalujen käyttöön on vuodesta 2024 lähtien kannustettu tutustumaan ja sen hyödyntämisestä annetaan yleisiä vinkkejä videosarjaksi koostetun käyttötapausesimerkkien muodossa(11). Ryhmien tulee kuitenkin ilmoittaa mahdollinen käyttö ja kertoa, miten ja minkälaisessa roolissa tekoälyä hyödynnettiin sekä miten sen tuotoksien oikeellisuus varmistettiin. Nämä opiskelijaryhmien vapaasti muotoilemat ilmoitukset on kerätty vuosilta 2024 ja 2025 erikseen joka palautuksesta.
Tentti
Kurssin päätteeksi opiskelijat suorittavat tentin yksin kynällä ja paperilla, ilman mitään tukimateriaaleja. Tentti sisältää sananmäärittelytehtävän, kaksi lyhyttä esseetä, joissa tarkastellaan laajempia kokonaisuuksia (esim. varastonhallinta), sekä soveltavan tehtävän, jossa opiskelija suunnittelee teoriaan pohjaten tuotantojärjestelmän ja siihen liittyviä osatekijöitä jollekin tuotteelle. Tentin maksimipistemäärä on 30 ja läpipääsyraja 14 pistettä. Tenttejä järjestetään kolme kertaa lukuvuoden aikana, ja ne arvostelee sama henkilö. Tentit ovat rakenteeltaan ja vaikeustasoltaan yhtenäisiä, mutta tehtävien sisällöt vaihtelevat hieman. Tentti pohjautuu samaan teoriaan ja teorian soveltamiseen, mitä on tehty harjoitusryhmätyössä. Näin tentin voidaan ajatella kuvastavan harjoitustyössä opittua.
Pistejakaumat
Kaavio 1 esittää opiskelijoiden suoritusten pistejakaumat pistemäärän saaneiden opiskelijoiden lukumäärän mukaan, ja taulukko 2 näyttää tunnuslukuja pistemääristä. Kaavio 2 näyttää harjoitustyö- ja tenttipisteiden yhteyden hajontakaaviona. Harjoitustyöpisteet korreloivat kohtalaisen positiivisesti Pearsonin korrelaatiokertoimella 0,37 tenttipisteiden kanssa. Kaavio 3 kuvaa ryhmien jäsenten tenttipisteiden sisäistä hajontaa. Keskihajonta on yleensä noin 2–4 tenttipisteen kokoinen.
TAULUKKO 2: Tilastoja suoritusten pisteistä.
| Tenttipisteet |
Harjoitustyön kokonaispisteet |
|
| Keskiarvo | 19,54 | 12,51 |
| Keskihajonta | 4,29 | 1,96 |
| Mediaani | 19,50 | 13,00 |
| Alin kymmenes | 14,00 | 10,00 |
| Alin neljännes | 17,00 | 11,00 |
| Ylin neljännes | 22,50 | 14,00 |
| Ylin kymmenes | 25,00 | 15,00 |
Aineiston käsittely ja menetelmät
Aineiston osat on yhdistetty anonyymisti opiskelijanumeron ja ryhmänumeron perusteella. Ryhmäkohtaiset tekoälytyökalujen käyttöilmoitukset on liitetty ryhmän loppupalautuspisteisiin ja ryhmän jäsenten tenttipisteisiin. Käyttöilmoitukset on tulkittu ja luokiteltu toimenpideluokkien ja käytön syvyystason mukaan. Toimenpideluokittelu tehtiin artikkelin ”Tekoälyjen ja opiskelijoiden kilpajuoksu” yhteydessä. Malli syvyystasoista kuvataan tarkemmin liitteessä ”Liite 1: Malli tekoälytyökalujen käytön syvyystasoista”.
Alkuperäisestä aineistosta on poistettu ne opiskelijat, joilta puuttuu tenttisuoritus tai jotka ovat jättäneet kurssin kesken. Aineisto ei sisällä tietoa, minkä tenttikerroista kukin opiskelija on suorittanut. Koska erottelu ei ole mahdollista ja kahden lukuvuoden aikaiset kolme tenttiä ovat rakenteeltaan ja vaikeudeltaan samanlaisia, vuosien 2024 ja 2025 tulokset on yhdistetty samaan kokonaisuuteen. Näin on saatu taulukko, jossa on vain yksilön tenttipisteet (0–30), harjoitustyön loppupalautuspisteet (0–10), ryhmänumero, kunkin toimenpideluokan esiintyminen (joko 0 tai 1) sekä ryhmän ilmoituksien mukainen korkein syvyystaso (–, 1, 2, 3 tai 4). Käsittelyä on jatkettu piirtämällä aineistosta tyypillisiä kaavioita havainnollistukseksi ja laskemalla tunnuslukuja eri muuttujien mukaan. Tilastollisia testejä aineistolle ei ole tehty, vaan suorituspisteitä ja niiden jakaumaan vain kuvataan.
Tulokset
Toimenpideluokkien näkyminen suoritustuloksissa
Kaavio 4 esittää box- ja violin-kaavioina yksittäisten opiskelijoiden tentti- ja harjoituspisteiden jakauman sekä tunnuslukuja (myös taulukossa 3) suoritustuloksista sen mukaan, toteutuiko mikäkin tekoälytyökalujen käytön toimenpideluokka ryhmän harjoitustyössä (tentti puolestaan tehtiin ilman apuvälineitä).
287 opiskelijan harjoitustyössä ilmoituksien mukaan käytettiin tekoälytyökaluja apuna. Heidän tenttipisteiden keskiarvo on 19,74 (keskihajonta 4,36) ja harjoitustyön kokonaispisteiden keskiarvo 12,66 (keskihajonta 1,89). Vastaavasti 224 opiskelijan harjoitustyössä ei ilmoituksien mukaan käytetty tekoälytyökaluja apuna. Heidän tenttipisteiden keskiarvo 19,28 (keskihajonta 4,21) ja harjoitustyön kokonaispisteiden keskiarvo 12,32 (keskihajonta 2,03).
Pienet erot näkyvät tarkemmin taulukossa 3. Luettaessa kaaviota tai taulukkoa on huomioitava, että kunkin yksittäisen toimenpideluokan toteutumattomuuden tilastoissa ei oteta kantaa muiden toimenpideluokkien toteutumiseen. Kohdassa ”vähintään yksi toimenpideluokka” näkyy niiden opiskelijoiden tulokset, joilta ei ole ollenkaan ilmoitusta tekoälytyökalujen käytöstä.
Syvyystasojen näkyminen suoritustuloksissa
Kaavio 5 esittää box- ja violin-kaavioina yksittäisten opiskelijoiden tentti- ja harjoituspisteiden jakauman sekä tunnuslukuja (myös taulukossa 4) suoritustuloksista sen mukaan, mikä oli harjoitustyössä tekoälytyökalujen käytön korkein syvyystaso (-, 1, 2, 3, 4).
Harjoitustyössä minkään ryhmän syvyystaso ei ollut 4. Syvyystason – tenttipisteiden keskiarvo on 19,29 ja harjoitustyöpisteiden keskiarvo 12,33 koostuen 224 opiskelijasta. Syvyystason 1 tenttipisteiden keskiarvo on 18,95 ja harjoitustyöpisteiden keskiarvo 12,91 koostuen 38 opiskelijasta. Syvyystason 2 tenttipisteiden keskiarvo on 19,81 ja harjoitustyöpisteiden keskiarvo on 12,49 koostuen 217 opiskelijasta. Syvyystason 3 tenttipisteiden keskiarvo on 20,17 ja harjoitustyöpisteiden keskiarvo 13,44 koostuen 32 opiskelijasta. Taulukko 4 esittää erot tarkemmin.
TAULUKKO 3: Tunnuslukuja opiskelijoiden suoritustuloksista harjoitustyössä toteutuneiden toimenpideluokkien mukaan.
TAULUKKO 4: Tunnuslukuja opiskelijoiden suoritustuloksista tekoälytyökalujen käytön korkeimmasta syvyystasosta harjoitustyössä.
Lopuksi
1. Erot opiskelijoiden suoritustuloksissa maltillisia
Aineiston perusteella tekoälyn käyttöä ilmoittaneet opiskelijat ovat saaneet keskimäärin hieman korkeampia arvosanoja sekä tentissä että harjoitustyössä, mutta erot ovat hyvin maltillisia. Hajonnat ovat suuria ja erot voivat selittyä muilla tekijöillä. Toimenpideluokista varsinkin palautteen vaihto vaikuttaa olevan yhteydessä korkeampiin pisteisiin. On kuitenkin mahdollista, että opiskelijat, jotka hakevat palautetta tekoälysovellukselta, ovat muutenkin sellaisia, jotka aktiivisesti hankkivat palautetta ja reflektoivat työtään. Syvyystaso 3 puolestaan näyttää estävän heikoimpia tuloksia. Toisaalta otoskoot ovat pienempiä.
2. Rajoitteet ja virhelähteet
Tutkimukseen liittyy joitakin rajoitteita ja virhelähteitä, eikä löydökset siten välttämättä kuvasta ihan kaikkea tekoälytyökalujen käyttöä.
Rajoitteita ja virhelähteitä:
- Ilmoitusten luotettavuus: Opiskelijat eivät välttämättä ole ilmoittaneet kaikkea käyttöään. Osa käytöstä on saattanut jäädä ilmoittamatta esimerkiksi vilppiepäilyksien tai laiskuuden vuoksi. Julkinen keskustelu tekoälytyökalujen käytöstä on voinut synnyttää opiskelijoille epävarmuutta tai negatiivisia mielikuvia, jotka vaikuttavat siihen, mitä ja miten ilmoitetaan. Vaikka ilmoituksen tekeminen velvoitetaan, on mahdollista myös, etteivät opiskelijat ole jaksaneet kirjoittaa kuvausta tekoälytyökalujen käytöstä, koska siitä ei ole saanut lisäpisteitä harjoitustyöhön.
- Yksilötason erojen tunnistamattomuus: Ilmoitukset on tehty ryhmäkohtaisesti, eikä niistä voi päätellä yksittäisten opiskelijoiden tekoälytyökalujen käyttöä. On siis mahdollista, että ryhmässä pääasiassa vain yksi opiskelija on hyödyntänyt tekoälytyökaluja, mikä rajoittaa yksilökohtaisten tenttitulosten tarkastelua. Toisaalta ryhmätyö on pitänyt sovittaa yhteiseen muotoon ja opiskelijat eivät ole ainakaan täysin pystyneet jakamaan työn osia kullekin opiskelijalle tehtäväksi.
- Käytön määrän arvioinnin mahdottomuus: Ilmoituksista voidaan päätellä, mitä toimenpiteitä tekoälyllä on tehty, mutta ei aina sitä, kuinka paljon tekoälyä on käytetty, kuinka monta kertaa, kuinka pitkään tai missä vaiheissa työskentelyä. Näin ollen käytön intensiteetti jää aineistossa näkymättömäksi.
- Ilmoitusten tulkinta: Ilmoitukset ovat vapaamuotoisia, mikä tekee niistä keskenään vaihtelevia ja vaikeasti vertailtavia. Käytetty kieli, tarkkuuden taso ja kirjoittajan tyyli vaihtelevat. Luokittelu perustuu ilmoitusten tulkintaan ja on siten osin epävarma.
- Muiden tekijöiden osuus ja se, ettei aineistolle ole tehty tilastollista analyysia: Muiden työkalujen käyttöä harjoitustyössä ei tunneta. Myös muut tekijät selittävät tentissä menestymistä. Opiskelijat ovat valinneet itse ryhmänsä ja sen, miten työkaluja käyttää.
- Erot tenttien välillä: Aineiston opiskelijat ovat osallistuneet kuuteen eri tenttiin. Tentit on tehnyt ja tarkastanut sama henkilö, ja niiden pitäisi olla tasoltaan samanlaisia. On kuitenkin mahdollista, että jokin tenteistä on ollut toista helpompi, minkä vuoksi tenttipisteet ovat näillä henkilöillä suurempia.
3. Jatkotutkimukset
Seuraavaksi tutkimuksen aineistolla voisi tehdä tilastollisia testejä ja sitä kautta saada tarkempaa tietoa kunkin muuttujan yhteydestä toiseen. Esimerkiksi toimenpideluokkia on tarkasteltu tällä hetkellä yksi kerrallaan. Tarkastelua voisi laajentaa vertaamalla luokkien yhdistelmiä toisiinsa sekä vertaamalla luokkia syvyystasoihin.
Lisäksi aineistoa pitäisi kerätä tarkemmin ja systemaattisemmin, koska tekoälyn käyttö on laaja-alainen ilmiö ja sen käytön vaikutukset syntyvät monista tekijöistä. Vaikka tekoälytyökalut mahdollistavat uusia asioita, niiden käyttäjät eivät välttämättä osaa tai halua hyödyntää työkaluja parhaimmalla tavalla oppimisen kannalta. Myös ryhmän sisäiset erot pitäisi tarkemmin huomioida.
Nyt on ajateltu tentin mittaavan harjoitustyössä ja kurssilla opittua. Tätä asetelmaa voisi kehittää paremmin mittaamaan opittua ja tekoälytyökaluilla tehtävän kognitiivisen ulkoistamisen hyötyä. Luokitukset ovat syntyneet aineistopohjaisesti, mutta niiden kooditusta voisi tarkentaa ja saada niin luotettavammat tulkinnat ilmoituksista.
Viitteet
- Risko, E.F. & Gilbert, S.J. (2016) ‘Cognitive offloading’, Trends in Cognitive Sciences, 20(9), s. 676–688. doi:10.1016/j.tics.2016.07.002.
- Kapanen, A. & Seppälä, T. (2025) ‘Tekoälyjen ja opiskelijoiden kilpajuoksu’. Tuta Blog, Aalto Blogs. Saatavilla osoitteessa: https://blogs.aalto.fi/tutablog/tekoalyjen-ja-opiskelijoiden-kilpajuoksu/ (haettu 14.8.2025).
- Pallant, J.L., Blijlevens, J., Campbell, A. & Jopp, R. (2025) ‘Mastering knowledge: The impact of generative AI on student learning outcomes’, Studies in Higher Education. doi:10.1080/03075079.2025.2487570.
- Gerlich, M. (2025) ‘AI tools in society: Impacts on cognitive offloading and the future of critical thinking’, Societies, 15(6). doi:10.3390/soc15010006.
- Sparrow, B., Liu, J. & Wegner, D.M. (2011) ‘Google effects on memory: Cognitive consequences of having information at our fingertips’, Science, 333(6043), s. 776–778. doi:10.1126/science.1207745.
- Ali, L.A.E.H., Ali, M.I.E.B., Ali, S.M.A. & Nashwan, A.J. (2025) ‘Smartphone dependency, digital amnesia, and somatic symptoms among nursing students: the challenge of artificial intelligence’. BMC Nursing, 24, s. 599. doi: 10.1186/s12912-025-03228-0.
- Wecks, J.O., Voshaar, J., Plate, B.J. & Zimmermann, J. (2024) ‘Generative AI Usage and Exam Performance’. SSRN Electronic Journal. doi:10.2139/ssrn.4812513.
- Sweller, J. (2011) ‘Cognitive load theory’, in Mestre, J.P. and Ross, B.H. (eds.) The psychology of learning and motivation: Cognition in education. Amsterdam: Elsevier Academic Press, s. 37–76. doi:10.1016/B978-0-12-387691-1.00002-8.
- Lee, H-P., Drosos, I., Sarkar, A., Rintel, S., Wilson, N., Tankelovitch, L. & Banks, R. (2025) ‘The impact of generative AI on critical thinking: Self-reported reductions in cognitive effort and confidence effects from a survey of knowledge workers’. CHI Conference on Human Factors in Computing Systems (CHI ’25), April 26–May 01, Yokohama, Japan. ACM. doi:10.1145/3706598.3713778.
- Slack, N., Brandon-Jones, A. & Johnston, R. (2011). ‘Essentials of Operations Management’. Harlow: Prentice Hall.
- Mucha, T. (2024) ‘Generative AI Use Cases: Video Series Delving into 10 Realistic Business Applications’ [videosarja]. Tuta Blog, Aalto Blogs. Saatavilla osoitteessa: https://ourblogs.aalto.fi/tuta-blog/generative-ai-use-cases-video-series-delving-into-10-realistic-business-applications (haettu 14.8.2025).
- Rowley, J. (2007) ‘The wisdom hierarchy: representations of the DIKW hierarchy’, Journal of Information Science, 33(2), s. 163–180. doi:10.1177/0165551506070706.
Liite 1: Malli tekoälytyökalujen käytön syvyystasoista
Syvyysviitekehyksen syntyminen
Toimenpideluokittelun rinnalle kehitettiin myös käytön syvyyttä arvioiva havainnollistava viitekehys, joka kuvaa tekoälyohjelman roolia tiedonkäsittelyssä ja vuorovaikutusta ihmisen ja tekoälysovelluksen välillä. Syvyydellä viitataan siihen, kuinka vaativalla, merkityksellisellä ja tiedollisesti jalostuneella tavalla tekoäly osallistuu työskentelyyn, ajatteluun ja oppimiseen.
Aluksi aineistosta (opiskelijaryhmien vapaamuotoiset ilmoitukset tekoälytyökalujen käytöstä osana harjoitustyötä) havaittiin, että pelkät toimenpideluokat eivät kuvasta tekoälytyökalujen käytön luonnetta. Joissakin tapauksissa tekoälyn käyttö on yksisuuntaista ja mekaanista, ja joissakin tapauksissa taas käyttö on hyvin vuorovaikutteista, toistuvaa ja käyttäjältä aktiivista tulkintaa, arviointia ja päätöksentekoa edellyttävää.
Eroja näkyy erityisesti siinä, miten tekoälysovelluksen tuottamaa tietoa hyödynnetään ja jäsennellään. Joskus tietoa ja tuotoksia käytetään sellaisenaan, kun taas joskus ihmisen rooli on paljon laajempi: hän punnitsee ehdotuksia, vertaa niitä aiempaan osaamiseen ja tekee omia johtopäätöksiä. Tällöin tiedon validointi, soveltuvuuden arviointi ja muokkaaminen ovat keskeinen osa työskentelyä. Näiden erojen pohjalta haluttiin käyttöä luokitella myös jonkinlaisen syvyyden ja vuorovaikutuksen luonteen mukaan.
Viitekehyksen muodostamiseen haettiin inspiraatioita kirjallisuudesta ja erilaisista kognitiotieteiden, kasvatustieteiden ja tiedonhallinnan malleista. Mahdollisia malleja arvioitiin suhteessa aineistoon ja niiden soveltuvuudesta keskusteltiin tuotantotalouden laitoksen henkilökunnan kanssa.
Viitekehyksen rakentamisessa hyödynnettiin erityisesti tietojohtamisen (knowledge management) ja datatieteiden alan DIKW-pyramidimallia sekä esimerkiksi myös psykologian alan osaamisen mittaria Bloomin taksonomiaa. Keskustelujen pohjalta ja tuotantotalouden laitoksen osaamisen perusteella DIKW-pyramidia tarkasteltiin eniten, koska se kuvastaa tiedon luonnetta ja siirtymää yksinkertaisesta datasta kohti syvällisempää ymmärrystä ja viisauteen perustuvaa päätöksentekoa. Mallin mukaan tietoa on neljällä eri tasolla: data, informaatio (information), tietämys (knowledge) ja viisaus (wisdom)(11).
Viitekehyksessä pyrittiin huomioimaan seuraavia näkökulmia:
- Kuinka monimutkaista ja merkityksellistä käsiteltävä tieto ja tehtävät päätelmät ovat?
- Millaisen tiedonkäsittelyyn tekoäly osallistuu omasta näkökulmastaan?
- Minkälaista ja kuinka moniulotteista ihmisen ja tekoälyn vuorovaikutus on?
- Mikä ja kuinka suuri on ihmisen ja tekoälyn vastuu- ja roolijako tiedon jäsentelyssä, tulkinnassa ja kehittämisessä sekä tiedon laadun arvioimisessa?
Taulukossa 5 luonnehditaan käytön eri tasoja. Viitekehyksen alemmilla tasoilla keskeistä on nopeuttaa ja tehostaa erityyppisiä rutiininomaisia työtehtäviä, kun taas korkeammilla tasoilla keskeistä on puolestaan syventää ajattelua sekä kehittää ymmärrystä, oivaltaa uutta ja tarkastella asioita kriittisesti (kaavio 6).
TAULUKKO 5: Tekoälytyökalujen syvyystasojen luonnehdinta.
| Käytön syvyyden tasot | Tiedon ja sen käsittelyn monimutkaisuus ja merkityksellisyys | Vuorovaikutuksen luonne | Ihmisen rooli | Tekoälyn rooli | Esimerkkikäyttöä |
| Taso - | ei tekoälytyökaluja, muuhun työskentelyyn ei oteta kantaa | ||||
| Taso 1 | matala | yksisuuntaista, suoraviivaista, yksittäistä | käskyttää, hyödyntää, ei tulkita | suorittaa mekaanisesti ohjeiden mukaisesti | viitteiden aakkosjärjestäminen, kirjoitusvirheiden tunnistaminen, kuvanmuokkaus, muotoilumuunnokset, kaavioiden piirtäminen, laskimena toiminen |
| Taso 2 | matala – kohtalainen | osittain kaksisuuntaista ja toistuvaa, mahdollisesti vähitellen tarkentuvaa | valikoida, tarkistaa, jäsentää, hyväksyä ja todentaa vastaukset | etsiä, tiivistää, jäsentää, selkeyttää, ohjeistaa | tiedonhaku, tekstin sujuvoittaminen, kontekstisidonnainen kääntäminen, tiivistäminen, konseptien selittäminen, käyttöohjeiden antaminen |
| Taso 3 | kohtalainen – korkea | kaksisuuntaista, toistuvaa, aktiivista, vähitellen tarkentuvaa ja kehittyvää | soveltaa, perustella, rakentaa kokonaisuuksia ja ymmärrystä, harkita vaihtoehtoja | kommentoida ja arvioida suhteessa johonkin, ehdottaa, ideoida, sparrata | uusien näkökulmien pohtiminen, kommenttien pyytäminen ja sen pohjalta jatkokehittäminen, laaja luova hahmottelu tai ideointi, arviointi suhteessa ohjeisiin |
| Taso 4 | erittäin korkea |
monitasoista, muun ympäristön, tiedon ja arvojen kanssa vertailevaa, kriittisesti ja eettisesti pohtivaa |
reflektoida, pohdiskella peilaten kaikkeen opittuun ja koettuun, tehdä valintoja, päätellä, arvioida ja punnita vaikutuksia, kyetä asemoimaan uusi tieto aikaisempaan tietoon | tarjota tukea syvälliseen pohdintaan, tarkastella ja arvioida omia vastauksia kriittisesti ja eettiset näkökulmat huomioiden, ennakoida, tehdä johtopäätöksiä | – |
Show other posts from this blog
Optimoiduista tuotanto-operaatioista ja lisäarvomyynnistä veturi yritysten tuotekehitysinvestoinneille
Panokset uuteen teknologia-, tuote- ja systeemikehitykseen, tuotannon uudelleen organisointiin, myyntiin asiakkaiden asiakkaille ja tehokkaampi käyttöpääoman hallinta.
Säästä kymmeniä tuhansia euroja kestävyysraportoinnin laskelmissa
Menetelmän avulla voidaan henkilökunnan työ- ja liikematkoja lukuun ottamatta määrittää kaikki Scope 3:een lukeutuvat alakategoriat kategorisoimalla yrityksen hankintatietoja.
Tekoälyjen ja opiskelijoiden kilpajuoksu
Mihin toimenpiteisiin Aalto-yliopiston tekniikan opiskelijat hyödyntävät tekoälytyökaluja?