AI och förändrade bedömningspraktiker

Det här kapitlet handlar om hur bedömningspraktiker förändras i takt med studenters ökade tillgång till AI. Vi lyfter fram centrala iakttagelser från vårt pågående projekt Universitetslärares design och erfarenheter av digital examination och diskuterar både utmaningar och möjligheter med olika bedömningsformer. 


Av Eva Svärdemo Åberg, universitetslektor i pedagogik vid Institutionen för pedagogik och didaktik på Stockholms universitet, Eva Edman Stålbrandt, universitetslektor i didaktik vid Institutionen för pedagogik och didaktik på Stockholms universitet och Anna Wiik, assisterande lektor och disputerad inom fysiologi vid Institutionen för Laboratoriemedicin på Karolinska Institutet.

Artikeln är en del i Guldäpplets antologi – Rika lärmiljöer. Med bidrag från lärare och forskare speglar den hur lärmiljöerna har förändrats och berikats explosionsartat på senare år – och hur de skapar bättre förutsättningar för elever och deras lärande.

Reflektions- och samtalsfrågor till artikeln


Vi tror att förändringarna inom högre utbildning kan vara exempelbildande för nya praktiker vad gäller bedömning i ungdomsskolan. Särskilt betonas vikten av att utbilda studenter till att bli engagerade samhällsaktörer med kritiskt förhållningssätt. I kapitlet kommer vi att presentera några exempel på bedömningspraktiker inom högre utbildning som visserligen skiljer sig från dem inom ungdomsskolan, men som också i vissa avseenden liknar dess praktiker.

Digitalisering och förändrade bedömningspraktiker i högre utbildning
Bedömningspraktiker inom högre utbildning har genom åren förändrats i takt med den allmänna digitaliseringstrenden (OECD, 2020; Hodges & Fowler, 2020). Universitet använder i allt större utsträckning digitala format och verktyg för examinationer, vilka kan fylla både formativa och summativa syften. Den digitala utvecklingen, särskilt tillgången till olika AI-resurser såsom ChatGPT och Keenious har redan påverkat universitetslärares bedömningspraktik och synssätt på lärande och kunskap. Vissa lärare ser möjligheter och uttrycker optimism, medan andra varnar för risken att vissa kunskaper kan gå förlorade om förändringar i examinationspraktiken präglas av rädsla för fusk. Ett alltför ensidigt fokus på vissa examinationsformer för att kontrollera studenters kunskaper kan, menar vissa lärare, begränsa studenternas handlingsutrymme och akademiska frihet.

Den digitala utvecklingen har i grunden förändrat examinationsformerna inom högre utbildning. Den traditionella övervakade salsskrivningen med papper och penna har ersatts av digital examination, vilket har gett lärare större möjligheter att variera både examinationsformer och frågetyper. Samtidigt har det skapat fler sätt för studenter att visa sina kunskaper. Genom att använda en variation av uppgiftstyper – såsom skriftliga prov med en kombination av flervalsfrågor (MCQ) och essäfrågor, visualiseringar samt praktiska och muntliga prov – kan både studenters lärande och kunskaper bedömas på ett mer nyanserat sätt. Universitet har dessutom under lång tid använt digitala lärplattformar (Learning Management System, LMS) och bedömningsplattformar (Assessment Management System, AMS) för att organisera kursinnehåll, stödja formativ bedömning och genomföra examinationer.

Vidare har bedömningspraktiker inom högre utbildning av tradition präglats av så kallade höginsatsbedömningar (high stakes) som genomförs i slutet av kursen. Särskilt där examinationer, såväl salsskrivning (sluten-bok-prov) som hemexamination (öppen-bok-prov), utgjort underlag för att även kunna bedöma ett skriftspråkligt akademiskt genreskrivande utöver ämnesmässigt kunskapsinnehåll. Frågor om vad som utgör valida och reliabla kunskapsbedömningar har än mer väckts i och med AI:s inträde i processer kring studenters lärande och arbete med texter i utbildningar. Det har till exempel visat sig i tidigare forskning (Cerratto Pargman, et.al. 2024; Fleckenstein, et.al. 2024) att trots att universitetslärare har god tilltro till sin egen förmåga att upptäcka fusk och otillåten hjälp från AI, är det mycket svårt att särskilja studenters texter och ChatGPT-genererade texter. Det har visat sig att AI-genererade texter kan oavsiktligt få högre betyg om de antas vara studentproducerade. För att hantera denna utmaning har vi kunnat identifiera att universitetslärare i allt större utsträckning uppmärksammar behovet av en större variation i examination, där studenter kan visa sina kunskaper, både genom låg- och höginsatsbedömningar, och på ett mer multimodalt sätt.

Universitetslärares erfarenheter av digital examination
I vårt praktiknära forskningsprojekt om Universitetslärares design och erfarenheter av digital examination har vi dels undersökt hur universitetslärare designar examinationer inom tre olika yrkesprogram vid tre fakulteter: juridisk, samhällsvetenskaplig och medicinsk fakultet. Vi var intresserade av att undersöka vilka examinationer som användes i början och i slutet av ett program och vilka kunskapsbedömningar som var i fokus vid digital examination. Vi genomförde också intervjuer med kursansvariga lärare.

Resultatet av vår undersökning visade att ett brett spektrum av kunskapskrav betonades inom digital examination, vilket reflekterade den ökade komplexiteten i de kognitiva färdigheter som efterfrågades i kurserna. Lägre kognitiva färdigheter, som att minnas och förstå fakta samt teoretisk och procedurkunskap, bedömdes genom olika digitala format, såsom quiz, praktiska digitala prov och digitala diskussioner, med eller utan tillgång till böcker. Däremot uppmärksammades högre kognitiva färdigheter, såsom analys, värdering och syntes, på olika sätt i bedömningarna, särskilt genom blandade bedömningsdesigner som kombinerade både skriftliga och muntliga prov.

Ur lärarnas perspektiv var en central iakttagelse att det fanns ett behov av förändringar i etablerade bedömningstraditioner för att gå bortom de enkelt mätbara färdigheterna. Lärarnas val vid utformningen av bedömningsuppgifter påverkades både av dessa etablerade traditioner – särskilt inom ämneskunskapsbedömning i digitala format – och av en medvetenhet om hur olika digitala verktyg kan representera den kunskap som skulle bedömas. Det visade sig att bedömningen av högre kognitiva färdigheter och kompetenser, såsom förmågan att tillämpa metakognitiv kunskap, ofta inte hade anpassats alls till digitala format. Detta väckte frågor om hur digitala bedömningar kunde utformas för att på ett tillfredsställande sätt bedöma högre kognitiva färdigheter som kritiskt tänkande. Resultaten visade också att bedömningsdesign både kunde möjliggöra och begränsa studenters förmåga att vara självständiga och kreativa i sitt akademiska arbete. Detta underströk vikten av en avsiktlig och välstrukturerad bedömningsdesign för att främja studenters agens och kunskapsmässiga engagemang i digitala lärmiljöer (Nieminen & Ketonen, 2024).

Vidare uppmärksammade lärarna att deras val vid utformningen av bedömningsuppgifter ibland begränsades av strukturella faktorer, såsom tekniska begränsningar i programvara, begränsade platser i gemensamma examinationssalar, olika regler och långa ledtider. Lärarna var öppna för att prova nya bedömningsformer och variera dessa mer, och de såg ett behov av fortsatt professionell utveckling, särskilt i relation till AI. Lärarna uppmärksammade också den starka skriftspråkliga traditionen vid examination, där det skriftliga sågs som det mest pålitliga sättet att bedöma studenters prestationer. Samtidigt rådde en viss osäkerhet kring huruvida betygssystemet fullt ut speglar studenters faktiska kunnande. Frågan om betygens och examinationernas förmåga att återspegla studenternas verkliga kunskap var därmed en central aspekt av bedömningskulturen, vilket öppnade upp för ett ökat intresse för alternativa och mer varierade sätt att bedöma kunskap.

Möjligheter och utmaningar med olika digitala bedömningsformer
Genom våra intervjuer har vi identifierat flera upplevda möjligheter och hinder med digital examination. Lärarna såg den digitala omställningen som en stor möjlighet att variera examinationsformerna samt att både effektivisera och stärka tillförlitligheten i bedömningen. Digitala examinationsverktyg erbjöd en mängd nya multimodala möjligheter, till exempel att kunna använda bilder, film och ljud. Flera olika självrättande frågetyper effektiviserade bedömningsprocessen genom att minska den tid som behövdes för att rätta och bedöma prov och när öppna essäfrågor användes innebar digitaliseringen att flera lärare kunde bedöma samma student vilket ökade tillförlitligheten och rättssäkerheten i bedömningen. Trots fördelarna med digitala verktyg stod lärarna inför utmaningar när det gällde att upprätthålla kvaliteten på det akademiska skrivandet. Digitala salstentor kunde skapa ökad stress för studenterna, och det var en utmaning att designa frågor som på ett tillförlitligt sätt kunde bedöma de olika lärandemålen. En svår utmaning som också diskuterades av lärarna var hanteringen av AI i relation till kvalitet och rättssäkerhet i bedömningarna. Här handlade det om att bibehålla tilltron till studenterna och samtidigt hantera om och på vad sätt AI ska komma in i utbildningen.

I vissa kurser inom högre utbildning är det tillåtet för studenter att använda AI som en del av det akademiska arbetsflödet, under förutsättning att de redogör för hur AI har använts. Studenter kan exempelvis använda AI för informationssökning, grammatik- och språkgranskning, översättningar och strukturering av texter. Vid informationssökning, kan flera etiska dilemman uppstå, såsom missvisande innehåll – så kallade ”hallucinationer” – samt bristande transparens, vilket försvårar tillförlitligheten. Dessutom kan mångfalden i informationshämtningen leda till att vissa ämnesområden dominerar på bekostnad av mindre vanliga (Huang & Huang, 2024). 

Den pedagogiska utmaningen ligger i att säkerställa att studenter utvecklar självständighet, kritiskt tänkande och kreativitet. I ett exempel på bedömningsdesign skulle studenterna lära sig att genomföra informationssökningar med hjälp av AI-resursen Keenious. För att underlätta detta och öka medvetenheten om kvalitetsaspekter i ett vetenskapligt förhållningssätt skapade lärarna i kursen en mall för kritisk granskning av vetenskapliga artiklar. Studenternas tillämpning av mallen vid informationssökning med AI bedömdes både under seminarier, där studenternas praktiska genomförande utvärderades, och i en individuell skriftlig rapport, där de fick beskriva hur de i detalj hade använt både mallen och AI-resursen. Det visade sig att lärarens roll blev än mer central för att studenter ska utveckla ett vetenskapligt förhållningssätt i undervisningen. Läraren har en viktig funktion, dels i att stödja studenterna i att förstå vad som utgör kvalitetsaspekter vid vetenskaplig granskning av artiklar, dels i att hjälpa dem att jämföra hur AI-resursen fungerar i relation till andra sökmotorer. En utmaning som visade sig var att studenter upplevde svårigheter i att identifiera och bedöma värdet av stora mängder studier som genererades vid användning av AI-resursen. 

En viktig iakttagelse var att studenter behövde ordentligt med tid och lärarstöd för att förstå kvalitetsaspekterna i mallen och därigenom utveckla sitt vetenskapliga förhållningssätt. En annan viktig iakttagelse var att studenternas performativitet – det vill säga deras aktiva engagemang och arbete i informationssökningsprocessen – blev mer central vid bedömning, än enbart den slutgiltiga skriftspråkliga produkten, vilket också ökade deras agens vid examinationsprocessen.

Ett annat exempel på en bedömningsdesign som hanterade varierade kognitiva färdigheter på olika sätt i en serie examinationer inom juridik är följande. Som första steg i bedömningsprocessen delades studenterna in i grupper, där varje grupp förberedde en skriftlig case-uppgift som lämnades in via LMS inför en muntlig presentationen av grupparbetet. Det andra steget var kopplat till lärandemålet ”Opponera på andra studenters grupparbeten”, vilket genomfördes under ett seminarium i form av en muntlig session. Kursbeskrivningen specificerade vissa kriterier för muntlig prestation. Under seminariet ansvarade studenterna för att presentera sitt eget grupparbete och ge muntlig återkoppling på andra gruppers projekt. Flera lärandemål var kopplade till grupparbetet och de case-baserade uppgifterna. Studenterna förväntades demonstrera både skriftlig och muntlig förmåga samt ”ha ett professionellt förhållningssätt till juridiken och den professionella rollen.” Detta innebar att studenterna behövde tillämpa både begreppslig och metakognitiv kunskap. Sådan möjlighet till kunskapsinhämtning sattes på prov vid den muntliga utfrågningen på djupet. 

Avslutning 
Genom analyser av digitala bedömningsformer och universitetslärares erfarenheter av bedömning i högre utbildning har vi identifierat flera centrala iakttagelser. Digital examination möjliggör anpassning av bedömningsformer till olika lärandemål, men för att fullt ut dra nytta av tekniken krävs en genomtänkt pedagogisk strategi. Om tekniken endast används för att replikera traditionella bedömningsformer riskerar dess potential att förbises. 

För många kan AI-stöd bidra till ökat självförtroende i skrivprocessen och en bättre förståelse för akademisk integritet. Samtidigt finns farhågor om att AI kan hämma studenters kritiska tänkande och kreativa skrivförmåga (Cardon et al., 2024). Användningen av AI-resurser får därför inte reducera studenternas förmåga till eget problemlösande och skrivande. Som en strategi för att hantera studenters ökade tillgång till AI har lärare inom högre utbildning i allt större utsträckning börjat använda fler (low stakes) och mer varierade examinationsformer. Dessa betonar både studenters lärprocess och de prestationer de åstadkommer samt möjliggör att studenterna kan visa sina kunskaper mer multimodalt. Här ser vi att en förändring av bedömningspraktiken håller på att ske inom högre utbildning som mer liknar ungdomsskolans mer processliknande undervisning och bedömningspraktik. Det återspeglas även i den senaste betygsutredningen (SOU 2025:18) som föreslår att inte helt förlita sig på centrala examensprov (high stakes) som underlag för betygssättning eftersom det ger begränsad information om elevers kunskaper erhållen vid några få mättillfällen.

Text: Eva Svärdemo Åberg, Eva Edman Stålbrandt och Anna Wiik



Reflektions- och samtalsfrågor

• Vilka kompetenser och kunskaper blir viktiga att värna inom era utbildningar i tider av snabba tekniska förändringar?

• Vilka former av processinriktade examinationer och bedömningar skulle kunna utvecklas för att främja högre kognitiva förmågor såsom kritiskt tänkande

Referenser och lästips

Cardon, P., Fleischmann, C., Aritz, J., Logemann, M., & Heidewald, J. (2023). The Challenges and Opportunities of AI-Assisted Writing: Developing AI Literacy for the AI Age. Business and Professional Communication Quarterly, 86(3), 257–295. 

Cerratto Pargman, T., Sporring, E., Farazouli, A., & McGrath, C. (2024). Beyond the Hype: Towards a Critical Debate About AI in Swedish Higher Education. Högre Utbildning, 14(1), 74-81. 

Fleckenstein, J., Meyer, J., Jansen, T., Keller, S. D., Köller, O., & Möller, J. (2024). Do teachers spot AI? Evaluating the detectability of AI-generated texts among student essays. Computers and Education: Artificial Intelligence, 6. Scopus. 

Hodges, C. B. & Fowler, D. J. (2020). The COVID-19 Crisis and Faculty Members in Higher Education: From Emergency Remote Teaching to Better Teaching through Reflection. International Journal of Multidisciplinary Perspectives in Higher Education. Vol. 5, Issue 1,118-122.

Huang, Y., & Huang, J. (2024). Exploring ChatGPT for Next-generation Information Retrieval: Opportunities and Challenges. Web Intelligence, 22(1), 31–44. 

Nieminen, JH. & Ketonen. (2024). Epistemic agency: a link between assessment, knowledge and society. Higher Education. 88: 777–794 

OECD (2020). Remote online exams in higher education during the COVID-19 crisis. No 1. 

Statens Offentliga Utredningar, SOU 2025:18 Ett likvärdigt betygssystem.  

Guldäpplets antologi – Rika lärmiljöer