Nationella prov – gör om gör rätt!

I skolans värld går vi nu in i en period med nationella prov. För många av oss som arbetar i skolan medför detta en stor påverkan på vårt arbete. Lärare som undervisar i ämnen och kurser som ska prövas anpassar sin undervisning och gör sitt bästa för att förbereda sina elever. Men de nationella proven påverkar även andra lärare och ämnen eftersom de även leder till omfattande schemaändringar och förskjutningseffekter. Kostnaderna för att utveckla och administrera proven är även de betydande, för att inte nämna arbetet med att digitalisera dem. Till detta kommer all den stress som de nationella proven orsakar, särskilt för våra elever. Vi behöver därför fråga oss om denna påverkan och dessa kostnader är motiverade? Svaret på den frågan är inte helt uppenbar. Jag vill mena att dagens nationella prov är problematiska av flera skäl, och för att kunna motivera dem behöver de omformas från grunden.

Det största problemet är provens dubbla syften. En vanlig missuppfattning är att nationella prov är slutprov i ett ämne eller en kurs. Det är de inte. De nationella proven infördes 1997, som en ersättning för de äldre centrala proven, och som en följd av de omfattande skolreformerna i början av 1990-talet. Proven utformades med tre uttalade övergripande syften: betygsstödjande, utvärderande och formativa. Den formativa aspekten innebar att proven skulle tjäna som en kontrollpunkt för att möjliggöra anpassningar under pågående undervisning. Det är uppenbart att en sådan ambition är oförenlig med ett summativt slutprov. Över tid har det uttalade formativa syftet tagits bort men utformingen av proven är i stort sett fortfarande samma som när de introducerades. Om vi önskar summativa prov vars resultat ska vägas in vid betygssättning, behöver dessa prov genomföras i slutet av terminen och pröva ämnes- och kursinnehåll på ett sätt som är relevant för betygsättningen. Vill vi ha formativa tester som stödjer lärare och elever för att kunna förbättra pågående undervisning och lärande, behöver vi utforma dessa så att de testar delar av ämnes- och kursinnehållet så att lärare kan använda resultaten på ett meningsfullt sätt. Dagens nationella prov strävar efter att uppnå båda dessa mål samtidigt, vilket är acceptabelt enbart under förutsättning att man erkänner att det inte är möjligt att helt och hållet realisera något av målen.

Ytterligare ett problem med de nationella proven, som ligger i linje med ovanstående problematik, är hur de har börjat användas för att hantera betygsinflation och ökande ojämlikhet i skolan. Idén om att resultaten från de nationella proven ska vägas in vid betygssättningen bygger delvis på föreställningen att proven är relevanta för detta ändamål (vilket följdaktligen går att diskutera), och delvis på tanken att man kan lösa ett problem genom att hantera dess symtom. Att använda de nationella proven som en lösning på ett djupare systemfel bör därför ses som en akutåtgärd snarare än som en hållbar lösning på lång sikt.

När vi talar om de nationella proven och de problem som följer med dessa går det numer inte heller att bortse från projeket att digitalisera dem. Skolverket har arbetat med detta sedan 2017. Den ursprungliga ambitionen var att alla nationella prov skulle vara helt digitaliserade till 2022, men målet är nu justerat till hösten 2024 och omfattar initialt inte alla ämnen eller årskurs 3. Skolverkets interna utredning har dock visat att det justerade målet inte kommer att kunna uppnås helt (Strategirådet, 2023). Efter att personligen både ha deltagit i och studerat projektet, är min slutsats att det har stora problem som helhet och omgående borde granskas externt av oberoende part. Problemen stannar dock inte vid eskalerande kostnader och ett troligt icke fungerande provsystem. Att elever tycks prestera sämre när de går från att genomföra prov med papper och penna till att skriva dem på dator är ett lika allvarligt och tillika förbisett faktum. Att läsförståelse är svårare vid läsning på digitala enheter än motsvarande på papper är relativt väl påvisat (Delgado et al., 2018), men skillnaden mellan att skriva prov digitalt jämfört med på papper är mindre utforskad. Den hittills enda större studien på området undersökte införandet av digitala prov under 2015 och 2016 i USA (Backes & Cowan, 2019). Resultatet visade att elever presterade betydligt sämre på de digitala proven. Den statistiska försämringen motsvarade ungefär ett läsårs progression, det vill säga en elev i årskurs 8 presterade på ett digitalt prov som om denne hade gått i årskurs 7.


Grafen visar standardiserad prestation per år. Från artikeln Is the pen mightier than the keyboard? The effect of online testing on measured student achievement. Backers & Cowan, 2019.

Varför eleverna presterade sämre på de digitala proven framgår inte av studien. Sämre läsförståelse på skärm, allmän datorovana och ovana vid att genomföra prov digitalt kan vara bidragande faktorer. Men en ytterligare rimlig orsak är ovanan vid det faktiska provsystemet. Förtrogenhet med menyer, var knappar sitter och generell funktionalitet spelar sannolikt stor roll. Skolverkets beslut att utveckla ett eget digitalt provsystem som endast får användas vid nationella prov, samtidigt som våra elever behöver skriva alla övriga digitala prov i andra system, är därför mycket olyckligt. En bättre lösning hade varit att sätta upp standarder för de nationella proven som olika leverantörer gavs möjlighet att möta och därigenom skapa incitament för befintliga provsystem på marknaden att utvecklas, samt möjliggöra att elever fick skriva nationella prov i system de känner sig förtrogna med. En sådan lösning hade därtill minskat kostnaderna för huvudmän och skolor samt resulterat i provresultat med bättre validitet.

Det är dock viktigt att notera att man utifrån nämnda studie inte automatiskt kan dra slutsatsen att digitala prov är sämre än analoga. De försämrade provresultaten kan också bero på själva bytet från ett format till ett annat. Om vi exempelvis skulle designa ett prov för ett digitalt format och sedan låta elever genomföra samma prov med papper och penna skulle vi kanske se en liknande försämring. Det centrala är att vara medveten om att provformatet påverkar reliabiliteten, det vill säga hur tillförlitlig mätningningen är. Det digitala formatet, och den utveckling vi nu erfar inom generativ AI, öppnar dessutom upp för nya och potentiellt sätt bättre sätt att utforma prov. Ta ett traditionellt hörförståelseprov där elever får lyssna till en dialog på exempelvis engelska och därefter skall svara på frågor om innehållet. Mäter ett sådant provet den faktiska språkliga färdigheten eller störs mätningen av att även minne och koncentrationsförmåga spelar roll? Här kan vi leka med tanken om en testsituation där elever i stället fick prata med en välfungerande adaptiv AI-bot som också sannolikt skulle kunna fungera som ett bättre mätinstrument.

Sammanfattningsvis. Det vi borde göra är att gå tillbaka till början och ställa oss frågan varför vi ska ha nationella prov. Först när vi enats om ett svar bör vi utforma dessa prov så att de fyller sitt syfte. Att som idag försöka lösa ett problem med något som inte är utformat för ändamålet är lika symptomatiskt som det är dumdristigt. Att försöka hantera problemet med betygsinflation genom att väga in resultat från digitala nationella prov kan liknas vid att ställa ut hinkar när ett tak läcker. Det är rimligt i ett akut skede, men det är inte en hållbar lösning på längre sikt. Taket behöver läggas om.

Referenser

Backes, B., & Cowan, J. (2019). Is the pen mightier than the keyboard? The effect of online testing on measured student achievement. Economics of Education Review, 68, 89–103. https://doi.org/10.1016/j.econedurev.2018.12.007

Delgado, P., Vargas, C., Ackerman, R., & Salmerón, L. (2018). Don’t throw away your printed books: A meta-analysis on the effects of reading media on reading comprehension. Educational Research Review, 25, 23–38. https://doi.org/10.1016/j.edurev.2018.09.003

Strategirådet. (2023). Utvärdering av DNP- delstudie 1, utvärdering på uppdrag av Skolverket.