Pædagogisk brug af nationale testresultater skal gå hånd i hånd med fejltypeanalyser - Nyt fra DPU
Ny omfattende analyse af 28 års international forskning viser, at nøglen til pædagogisk brug af nationale test er respons og fejltypeanalyser.
Nationale test er gode til benchmarking og kvalitetssikring, og en ny undersøgelse fra Dansk Clearinghouse for Uddannelsesforskning på DPU, Aarhus Universitet, peger på, at man kan styrke anvendelsen af lærerens pædagogiske brug ved at tilbyde respons- og/eller fejltypeanalyser af elevernes besvarelser.
"Læreruddannelsen bør derfor inddrage lærerkompetencer til både at udvikle lokale test og til at fortolke faglige analyser af testdata fra centralt producerede instanser," siger professor Sven Erik Nordenbo fra Clearinghouse.
Tolkningen af "pædagogisk brug af test" i betydningen "pædagogisk brug af testdata" er svagt belyst forskningsmæssigt.
Dansk Clearinghouse for Uddannelsesforskning har undersøgt de sidste 28 års forskning og har kun fundet 61 undersøgelser på verdensplan, der beskæftiger sig med den pædagogiske anvendelse af test.
En samlet vurdering viser, at fordelene ved introduktion af formelle test ikke kan opvejes af de negative virkninger, som disse test har især for de svagere præsterende elevers vedkommende.
Elevernes testresultater stiger ved indførelse af test, men først efter nogle år. Annonceringen af, at der skal testes kan udløse følelsesreaktioner som nervøsitet og angst. Eleven forbereder sig på testen ved at lære udenad og memorere sætninger.
Der er en stærk evidens for, at de testdata, som testen genererer, kan virke ind på elevens fremtidige motivation og selvværd. Højt præsterende elever styrkes i motivation og selvværd, mens det modsatte er tilfældet for svagt præsterende elever. Også lav tiltro til egen dygtighed indvirker negativt på elevens testpræstation, motivation og selvværd.
"Test anvendt som pædagogisk/didaktisk redskab i tilknytning til formativ evaluering, af de test, der er forankret i klassens daglige liv og lærernes pædagogiske tilrettelæggelse af undervisningen, har større chance for at blive anvendt pædagogisk end test, der er centralt administrerede," siger professor Sven Erik Nordenbo.
Baggrundsfaktorer som lærerens køn, alder, socioøkonomiske baggrund og etnicitet, spiller i det store og hele ingen rolle i de kortlagte undersøgelser.
Download
Teknisk rapport "Pædagogisk brug af nationale test - et systematisk review" (pdf)
Udtræk af hovedresultater fra rapporten (word)
LÆS VIDERE I POSTENProfessor Sven Erik Nordenbos præsentation af resultater (powerpoint)
Yderligere oplysninger om Pædagogisk brug af nationale testresultater:
Sven Erik Nordenbo, professor, Dansk Clearinghouse for Uddannelsesforskning, DPU, Aarhus Universitet E:
sen@dpu.dk T: direkte: 8888 9980; privat: 3259 3347; mobil (arbejde) 4025 6791; mobil (privat) 2679 2354
Pædagogisk brug af test - hovedresultater
Dette systematiske review er gennemført på et grundlag, der er beskrevet i Dansk Clearinghouse for Uddannelsesforsknings konceptnotat (
http://dpu.dk/Clearinghouse).
Analysen behandler ikke de nationale test i Danmark, Norge og Sverige, men er en meta-undersøgelse af internationale primærstudier, der behandler nedenstående reviewspørgsmål:
Hvordan kan grundskolelæreres individ- og klassecentrerede brug af data fra test forbedre læreres fagdidaktiske tiltag i klasser med almindelige elever?
Hvilke virkninger forbundet med testning er der på lærere og elever i grundskolen?
Definitioner
Ved ‘test’ skal forstås egentlige test, ikke mere eller mindre uformelle tilgange til at få data om elever. Alene testtyper, som indgår i de nationale test i de nordiske landes grundskoler, kan indgå. Dette betyder, at der alene sigtes mod skolastiske test. Skolastiske test findes dog i mange former.
‘Fagdidaktiske’ skal i dette review forstås som omhandlende følgende fag: læsning/sprog, matematik og naturvidenskaber.
De ‘aktører’ der er fokus på, er elever og lærere. Skoleledere, forældre, offentligheden, politikere etc er ikke aktører i dette systematiske review.
Test og testdata kan “bruges” pædagogisk på to måder. I det første tilfælde sker brugen, efter at testen er gennemført og testdata foreligger. I det andet tilfælde sker brugen, før testen er gennemført og testdata endnu ikke foreligger. I sidste tilfælde knytter brugen sig til annonceringen af, at ‘der skal gennemføres test’.
Baggrund og metode
Alle tre skandinaviske lande har indført nationale test. Det land, der har størst erfaring med gennemførelse af nationale test er Sverige, der allerede indførte de nationale test i 1994. Først i 2004 og 2005 gennemførte Norge test på nationalt niveau og Danmark kom til i 2006/2007.
Søgninger er foretaget af Clearinghouse og omfatter perioden 1980-2008. Reviewgruppen har haft lejlighed til at kommentere alle søgninger. Desuden har de haft mulighed for at supplere søgninger med referencer. Gruppen har udnyttet denne mulighed.
Der er søgt på en måde, der muliggør fund af studier gennemført i overordentlig mange lande og publiceret på overordentlig mange sprog.
5716 fund er blevet screenet i en proces med to faser: referencescreening og fuldtekstscreening.
61 undersøgelser er genbeskrevet og vurderet. Dette arbejde er sket i et samarbejde mellem Reviewgruppen og medarbejdere fra Clearinghouse.
Genbeskrivelserne af den enkelte undersøgelse er gennemført i et samarbejde mellem en medarbejder fra Clearinghouse og et medlem af reviewgruppen. I processen har der således altid været mindst to, der har arbejdet med genbeskrivelsen. Processen er ligeledes gennemført med transparens for alle i Clearinghouse og Reviewgruppe. På denne vis er genbeskrivelser og vurderinger kvalitetssikret.
Reviewgruppen
I forbindelse med løsningen af denne opgave har der været nedsat en reviewgruppe med følgende medlemmer:
Professor Peter Allerup Institut for Læring, Aarhus Universitet
Professor Hanne Leth Andersen Center for Undervisningsudvikling, Aarhus
Universitet
Institutleder Jens Dolin Institut for Naturfagenes Didaktik, Københavns
Universitet
Lektor, fil.dr. Helena Korp Högskolan Väst
Postdoc, dr.polit. Rolf Vegar Olsen Institutt for lærerutdanning og skoleutvikling,
Universitetet i Oslo
Reviewgruppen har deltaget ved datauddragning/genbeskrivelse af de kortlagte undersøgelser og i samarbejde med Clearinghouse udarbejdet den tekniske rapport. Der har ikke været interessekonflikter for reviewgruppemedlemmer i tilknytning til denne rapport.
Studiernes kortlægning
Som det fremgår af tabellen nedenfor, er ca. halvdelen af studierne gennemført i USA. De resterende fordeler sig på mange forskellige lande. Antallet af lande er større end 61, fordi enkelte af studierne er komparative undersøgelser, hvori indgår flere lande.
Undersøgelsesland/
Antal studier
USA
32Kina/Hong Kong/Taiwan
6U.K.
5Israel
4Australien
3Canada
2Sverige
2Danmark
1Svejts
1Trinidad Tobago
1Sri Lanka
1Japan
1Uspecificerede eller mange lande
4
---
Medens der er en vis spredning i studierne på undersøgelsesland, så er dette ikke tilfældet for studiernes publiceringssprog. Som det ses af nedenstående tabel, er næsten alle studier publiceret på engelsk.
Publiceringssprog /
Antal studier /
Engelsk
58
Tysk
1
Dansk
1
Svensk
1
---
Studierne fordeler sig på besvarelse af de to spørgsmål på denne vis:
Svar på reviewspørgsmål
Antal studier
Svar på spørgsmål 1
28
Svar på spørgsmål 2
44
------
Undersøgelsens resultater
Grundskolelæreres individ- og klassecentrerede brug af testdata i klasser med almindelige elever forbedres, når de didaktiske og/eller fagdidaktiske tiltag bygger på test, som lærerne oplever et
medejerskab til.
Introduktion af test fra instanser over klasseniveau med det formål at indvirke på undervisning og elevers læringsadfærd kan anvendes, idet der kan registreres virkninger på curriculum, undervisning og tidsforbrug, på elevernes følelsesreaktioner, motivation, læringsadfærd og selvværd. Positive virkninger af centralt administrerede test modsvares af negative virkninger, især for de svagt præsterende elevers vedkommende.
En elev, der udsættes for test, påvirkes på en kompliceret måde både med hensyn til læringspraksis og læringsresultat.
Lærere foretrækker så uddybede oplysninger om testdata som muligt, eventuelt ledsaget af respons-/fejltype-analyser, og lærere foretrækker test på klasseniveau, der er tilpasset den aktuelle undervisning, frem for formelle test.
Lærere anvender test til at planlægge og tilrettelægge undervisningen på klasseniveau. Dette er især tilfældet, hvis læreren ikke kender eleverne godt. Lærere anvender også test individuelt i forbindelse med karaktergivning, elev og forældresamtaler, til belysning af faglige problemområder, og pædagogiske tiltag knyttet hertil.
Det pædagogiske tiltag, der alene handler om at rette og korrigere fejl i test medfører ikke i sig selv
øget elevlæring. Der er også svag evidens for, at pædagogiske tiltag, hvor læreren ud fra testdata underviser i strategier, der letter indlæringsopgaven, giver en øget elevlæring.
En afgørende kontekstuel faktor er de reelle eller forestillede følger, som testdata har eller kan have for de involverede parter, i denne sammenhæng lærerne og eleverne.Man skelner mellem to polære muligheder, nemlig high stakes og low stakes test.
Opfattelsen af, at nationale test er high stake test, lav socioøkonomisk status og lav tiltro til egen dygtighed alle indvirker negativt på elevens testpræstation, motivation og selvværd.
Baggrundsfaktorer som lærerens køn, alder, socioøkonomiske baggrund og etnicitet, spiller i det store og hele ingen rolle i de kortlagte undersøgelser.
Annoncering af, at der skal testes, indvirker på undervisningen, og eleven er bedre belyst i den eksisterende forskning i sammenligning med forrige problemstilling.
Relationen mellem testning og undervisning er kompleks og i høj grad afhængig af kontekstuelle faktorer.Der er påvist en række forhold (med svag evidens): Nemlig positive wash-back effekter – fra svagere til stærkere – med hensyn til testenes indflydelse på lærerens undervisning i intenderet retning, og betydeligere negative wash-back effekter af introduktion af formelle test. Disse negative effekter fordeler sig på tre områder: (a) indsnævret eller fordrejet curriculum, idet faglige tankegange forsimples, faktaviden og mekaniske færdigheder betones på bekostning af kreative og æstetiske perspektiver (b) undervisningstid allokeres til det/de fag, der skal testes i, på bekostning af de fag, der ikke testes i, og (c) undervisningen kan forfalde til træning til test og udenadslæren.
En samlet vurdering viser, at fordelene ved introduktion af formelle test kan opvejes af de negative virkninger, som disse test har især for de svagere præsterende elevers vedkommende.
Elevernes testresultater stiger ved indførelse af test, men først efter nogle år. Annonceringen af, at der skal testes kan udløse følelsesreaktioner som nervøsitet og angst. Eleven forbereder sig på testen ved at lære udenad og memorere sætninger. For bedre præsterende elever stiger motivationen, mens svagere præsterende taber modet.
Der er stærk evidens for, at de testdata, som testen genererer, kan virke ind på elevens fremtidige motivation og selvværd. Højt præsterende elever styrkes i motivation og selvværd, mens det modsatte er tilfældet for svagt præsterende elever.
Undersøgelsen siger ikke noget om test anvendt som redskab til summativ evaluering, kvalitetskontrol eller benchmarking.
Test anvendt som pædagogisk/didaktisk redskab i tilknytning til formativ evaluering, at de test, der er forankret i klassens daglige liv og lærernes pædagogiske tilrettelæggelse af undervisningen, har større chance for at blive anvendt pædagogisk end test, der er centralt administrerede.
Den information, som kan fås fra test, kan bedres ved, at der sammen med testdata tilbydes respons- og/eller fejltypeanalyser af elevernes besvarelser. Læreruddannelsen bør inddrage lærerkompetencer til både at udvikle lokale test og til at fortolke faglige analyser af testdata fra centralt producerede instanser.
Tolkningen af “pædagogisk brug af test” i betydningen “pædagogisk brug af testdata” er svagt belyst forskningsmæssigt.
ImplikationerUndervisere skal være opmærksomme på, at nationale test genererer testdata, hvis information skal fortolkes.
De nationale test kan have både positive og negative virkninger. Især bør opmærksomheden
rettes mod de negative virkninger på især de svagt præsterende elever i form af reduceret læringsadfærd, manglende motivation og selvværd. Foranstaltninger, der kan modvirke
disse effekter, bør inddrages i den pædagogiske tilrettelæggelse og dagligdag.
For beslutningstagere og tilrettelæggere af uddannelsespolitik, politikere og embedsmænd, kan resultaterne hjælpe med til at udpege de styrker og svagheder, som anvendelsen af nationale test kan medføre som pædagogisk/didaktisk redskab.
Der bør gennemføres forskning, som anvender metoder, der sikrer en bedre indsigt i virkningen på undervisning og elever af gennemførelse af nationale test.
Den aktuelt bedste viden
Dansk Clearinghouse for Uddannelsesforskning så dagens lys i 2006, fordi man gerne vil styrke anvendeligheden af pædagogisk forskning. Det gør man ved at udnytte allerede eksisterende forskning.
Clearinghouse skal bidrage til, at politikere og praktikere har adgang til sikker og kvalificeret viden om opdragelse, undervisning og uddannelse, der kan bruges i pædagogisk praksis og i den politiske beslutningsproces.
Læs mere om Dansk Clearinghouse for Uddannelsesforskning på
www.dpu.dk/clearinghouse