Pålidelighed og konsistens i psykometri

Når vi kalder nogen eller noget pålideligt, mener vi, at de er konsekvente og pålidelige. Pålidelighed er også en vigtig komponent i en god psykologisk test. Når alt kommer til alt, ville en test ikke være meget værdifuld, hvis den var inkonsekvent og producerede forskellige resultater hver gang. Hvordan definerer psykologer pålidelighed? Hvilken indflydelse har den på psykologisk testning?

Pålidelighed refererer til et måls konsistens. En test betragtes som pålidelig, hvis vi får det samme resultat gentagne gange. For eksempel, hvis en test er designet til at måle et træk (såsom introversion), så skal resultaterne være omtrent de samme, hver gang testen administreres til et individ. Desværre er det umuligt at beregne pålidelighed nøjagtigt, men det kan estimeres på en række forskellige måder.

Test-gentest pålidelighed

Test-retest-pålidelighed er et mål for konsistensen af en psykologisk test eller vurdering. Denne form for pålidelighed bruges til at bestemme konsistensen af en test på tværs af tid. Test-retest-pålidelighed bruges bedst til ting, der er stabile over tid, såsom intelligens.

Test-retest-pålidelighed måles ved at administrere en test to gange på to forskellige tidspunkter. Denne type pålidelighed forudsætter, at der ikke sker nogen ændring i kvaliteten eller konstruktionen, der måles. I de fleste tilfælde vil pålideligheden være højere, når der er gået lidt tid mellem testene.

Test-retest-metoden er blot en af de måder, der kan bruges til at bestemme pålideligheden af en måling. Andre teknikker, der kan bruges, inkluderer pålidelighed mellem raterne, intern konsistens og pålidelighed med parallelle former.

Det er vigtigt at bemærke, at pålideligheden af testtest kun refererer til en tests konsistens, ikke nødvendigvis gyldigheden af resultaterne.

Inter-Rater Pålidelighed

Denne type pålidelighed vurderes ved, at to eller flere uafhængige dommere scorer testen, hvor scorerne sammenlignes for at bestemme konsistensen af vurderingsestimaterne.

En måde at teste pålidelighed mellem rater på er at lade hver vurderer tildele hvert testelement en score. For eksempel kan hver vurderer score point på en skala fra 1 til 10. Derefter beregner du sammenhængen mellem de to klassifikationer for at bestemme niveauet for inter-klassificerings pålidelighed.

Et andet middel til at teste pålidelighed mellem rater er at få raterne til at bestemme, hvilken kategori hver observation falder i, og derefter beregne procentdelen af enighed mellem raterne. Så hvis raterne er enige 8 ud af 10 gange, har testen en pålidelighedsrate på 80%.

Parallel-Forms Pålidelighed

Parallelforms pålidelighed måles ved at sammenligne to forskellige tests, der blev oprettet ved hjælp af det samme indhold. Dette opnås ved at oprette en stor pool af testgenstande, der måler den samme kvalitet og derefter tilfældigt opdele elementerne i to separate tests. De to tests skal derefter administreres til de samme forsøgspersoner på samme tid.

Intern pålidelighed

Denne form for pålidelighed bruges til at bedømme konsekvens af resultater på tværs af emner på den samme test. I det væsentlige sammenligner du testelementer, der måler den samme konstruktion for at bestemme testens interne konsistens.

Når du ser et spørgsmål, der virker meget lig et andet testspørgsmål, kan det indikere, at de to spørgsmål bruges til at måle pålidelighed.

Da de to spørgsmål er ens og designet til at måle det samme, skal testpersonen besvare begge spørgsmål det samme, hvilket vil indikere, at testen har intern konsistens.

Påvirkende faktorer

Der er en række forskellige faktorer, der kan have indflydelse på et måles pålidelighed. Først og måske mest åbenlyst er det vigtigt, at det, der måles, er ret stabilt og konsistent. Hvis den målte variabel er noget, der ændres regelmæssigt, vil resultaterne af testen ikke være konsistente.

Aspekter af testsituationen kan også påvirke pålideligheden. For eksempel, hvis testen administreres i et rum, der er ekstremt varmt, kan respondenterne blive distraheret og ude af stand til at gennemføre testen efter deres bedste evne. Dette kan have indflydelse på foranstaltningens pålidelighed.

Andre ting som træthed, stress, sygdom, motivation, dårlige instruktioner og miljømæssige distraktioner kan også skade pålideligheden.

Pålidelighed vs. gyldighed

Det er vigtigt at bemærke, at bare fordi en test har pålidelighed, betyder det ikke, at den har gyldighed. Gyldighed henviser til, om en test virkelig måler, hvad den hævder at måle eller ej.

Tænk på pålidelighed som et mål for præcision og validitet som et mål for nøjagtighed. I nogle tilfælde kan en test være pålidelig, men ikke gyldig.

Forestil dig for eksempel, at jobansøgere tager en test for at afgøre, om de har et bestemt personlighedstræk. Selvom testen måske giver ensartede resultater, måler den muligvis ikke det træk, den påstås at måle.