Zanesljivost kot ena glavnih lastnosti testa. Vrste zanesljivosti. Zanesljivost in veljavnost testa

Zanesljivost testa je eden od kriterijev kakovosti testa, ki je povezan z natančnostjo psiholoških meritev. Večja kot je zanesljivost testa, relativno bolj je brez merilnih napak. Zanesljivost testa se obravnava v enem pristopu: kot stabilnost (stabilnost) rezultatov med ponovljenim testiranjem; na drugi strani pa kot manifestacija stopnje enakovrednosti dveh (vzporednih) testov, ki sta po obliki in namenu enaka.

Test zanesljivosti

Zanesljivost testa je temeljna lastnost testa, ki kaže, v kolikšni meri so rezultati testa stabilni pri ponavljajočih se pregledih. Zanesljivost testa lahko ugotovimo s ponovnim testiranjem (po strogo določenem časovnem obdobju) in izračunavanjem korelacijskega koeficienta med rezultati prvega in ponovnega testiranja. Zanesljivost testa lahko ugotavljamo tudi tako, da testiramo več različic istega testa, test razdelimo na dve polovici itd. Zanesljivost rezultatov testa ni odvisna samo od kakovosti samega testa, temveč tudi od postopka testiranja (v prvem in drugem primeru mora biti popolnoma enak), socialno-psihološke homogenosti vzorca (različen bo za otroci, moški, ženske, vojaki prvega leta - služenja, stari vojaki itd.). In lahko se izkaže, da se bo test, ki je zanesljiv za eno skupino ljudi, izkazal za nezanesljivega za drugo, rezultati testa pa bodo v slednjem primeru napačni. Tako nas NT, ki izraža stopnjo netočnosti, možnost napake, ki se neizogibno pojavi pri vsakem testiranju, sili k iskanju načinov za zmanjšanje te napake, za bolj specifično, namensko uporabo testa. Zanesljivost najboljših testov je 0,8 - 0,9.

Zanesljivost poskusa

stabilnost rezultatov poskusa, ko se izvaja za drugo, tretjo, četrto itd. enkrat.

Objektivnost psihološkega testa je mogoče doseči, če so izpolnjeni naslednji pogoji:

1) enotnost preskusnega postopka za pridobitev rezultatov, primerljivih z normo (glej spodaj);

2) enotnost ocenjevanja uspešnosti testa;

3) določitev standarda za uspešnost testa za primerjavo z njimi kazalnikov, pridobljenih kot rezultat obdelave podatkov o testiranju (glej tukaj "tretja stopnja standardizacije").

Ti trije pogoji se imenujejo stopnje standardizacije psihološki test.

Stopnje standardizacije

Na stopnji razvoja testa, kot tudi katere koli druge metode, se izvaja postopek standardizacije, ki vključuje tri stopnje.

Prvi korak pri standardizaciji psihološkega testa je oblikovanje enotnega postopka testiranja. Vključuje določanje naslednjih vidikov diagnostične situacije:

1) pogoji testiranja (prostor, osvetlitev in drugi zunanji dejavniki). Očitno je bolje meriti obseg kratkoročnega spomina (na primer s subtestom ponavljanja števk v Wechslerjevem testu), ko ni zunanjih dražljajev, kot so tuji zvoki, glasovi itd.

3) Razpoložljivost standardnega stimulacijskega materiala. Na primer, zanesljivost dobljenih rezultatov je bistveno odvisna od tega, ali so anketirancu ponujene domače kartice G. Rorschach ali standardne - z določeno barvno shemo in barvnimi odtenki.

4) Časovne omejitve za izvedbo tega testa. Na primer, odrasel anketiranec ima 20 minut časa, da opravi test Raven.

5) Standardni obrazec za izvedbo tega testa. Uporaba standardnega obrazca poenostavi postopek obdelave.

6) Upoštevanje vpliva situacijskih spremenljivk na proces testiranja in rezultat. Spremenljivke pomenijo stanje testiranca (utrujenost, preobremenjenost itd.), nestandardne pogoje testiranja (slaba osvetlitev, pomanjkanje prezračevanja itd.), prekinitev testiranja.

7) Upoštevanje vpliva vedenja diagnostika na potek in rezultat testiranja. Na primer, eksperimentatorjevo odobravajoče in spodbudno vedenje med testiranjem lahko anketiranec zazna kot namig na "pravilen odgovor" itd.

8) Upoštevanje vpliva respondentovih izkušenj pri testiranju. Seveda je anketiranec, ki ni bil prvič podvržen postopku testiranja, premagal občutek negotovosti in razvil določen odnos do testne situacije. Na primer, če je anketiranec že opravil test Raven, potem mu ga najverjetneje ni vredno ponuditi drugič.

Druga stopnja standardizacije psihološkega testa je sestavljena iz oblikovanja enotne ocene uspešnosti testa: standardne interpretacije dobljenih rezultatov in predhodne standardne obdelave. Ta stopnja vključuje tudi primerjavo pridobljenih kazalcev z normo za izvedbo tega testa za določeno starost (na primer pri testih inteligence), spol itd. (glej spodaj).

Tretja stopnja standardizacije psihološkega testa je določitev norm za izvedbo testa.

Norme so razvite za različne starosti, poklice, spole itd. Tukaj je nekaj obstoječih vrst norm:

Šolski normativi - se razvijajo na podlagi preizkusov šolskih dosežkov oziroma preizkusov šolskih sposobnosti. Določeni so za vsako šolsko stopnjo in veljajo po vsej državi.

Poklicni standardi so vzpostavljeni na podlagi testov za različne poklicne skupine (na primer mehaniki različnih profilov, strojepisci itd.).

Lokalni standardi so vzpostavljeni in se uporabljajo za ozke kategorije ljudi, ki jih odlikuje prisotnost skupne značilnosti - starost, spol, geografsko območje, socialno-ekonomski status itd. Na primer, za Wechslerjev inteligenčni test so norme omejene s starostjo.

Nacionalni standardi so razviti za predstavnike določene narodnosti, naroda, države kot celote. Potrebo po takih normah določajo posebna kultura, moralne zahteve in tradicije vsakega naroda.

Prisotnost normativnih podatkov (normov) v standardiziranih psihodiagnostičnih metodah je njihova bistvena značilnost.

Za začetek opredelimo obseg razvoja tega problema in na kratko naštejemo znanstvenike.

Znanstveniki, ki so se ukvarjali s problemom zanesljivosti in veljavnosti metod v psihodiagnostiki: A. Anastasi idr.

Opredelitev

Zanesljivost tehnike je stabilnost rezultatov med večkratnimi pregledi.

Veljavnost tehnike je zanesljivost merjenja določene duševne lastnosti, ki je predmet merjenja.

Test zanesljivosti

Razmislimo o več vrstah zanesljivosti psihodiagnostičnih testov.

Zanesljivost notranje skladnosti. Spremenjeni del testa meri spremenljivko, ki je nespremenjeni deli testa ne merijo.
Test-retest zanesljivost. Ponavljajoče se testiranje predmetov s kasnejšo korelacijo rezultatov začetnega in zaključnega izpita.
Zanesljivost vzporednih testnih obrazcev. Izdelava enakovrednega vprašalnika in njegova predstavitev istim subjektom za kasnejšo korelacijo rezultatov.
Zanesljivost preskusnih delov je mogoče določiti z razdelitev vprašalnika na dele; nato povežite dobljene rezultate.

Slika 1. »Kazalniki zanesljivosti testa«

Pri ugotavljanju zanesljivosti preskusa je treba tehniko izvajati v pomembnih časovnih intervalih. Priporočljivo je tudi izvedbo testa na vzorcih vsaj 200 oseb.

Veljavnost testa

Razmislimo o nekaterih vrstah veljavnosti testov v psihodiagnostiki.

Jasna veljavnost. Predmetnikove ideje o testu.
Sočasna veljavnost. Korelacija s podobnimi testi.
Napovedna veljavnost. Korelacija začetnih in kasnejših testnih rezultatov.
Inkrementalna veljavnost.
Diferencialna veljavnost.
Veljavnost vsebine. Refleksija testnih nalog na vidike določenega študijskega področja.
Empirična veljavnost. Korelacija rezultatov te tehnike z rezultati podobnih tehnik pri istih osebah.
Veljavnost kriterija. Razmerje med pridobljenimi rezultati in zunanjimi kriteriji.
Konstruktna veljavnost.

Ena pomembna razlika med psihometričnimi testi je, da standardizirana, kar vam omogoča primerjavo kazalnikov, ki jih je pridobil en subjekt, s tistimi v splošni populaciji ali ustreznih skupinah. Standardizacija testov je najpomembnejša v primerih, ko se primerja uspešnost subjektov.

To predstavlja koncept norme, oz standardni indikatorji. Za pridobitev standardnih norm je treba skrbno izbrati večje število subjektov po jasno določenih kriterijih. Pri oblikovanju standardizacijskega vzorca je treba upoštevati njegovo velikost in reprezentativnost.

V nekaterih primerih je potrebno oblikovati več standardizacijskih skupin ali stratificirati standardizacijsko skupino glede na parametre, kot npr. starost, spol, socialni status. Postavljanje standardov ni vedno potrebno. Pri uporabi psiholoških testov v znanstvenih raziskavah norme niso tako pomembne in zadostujejo surovi rezultati testov. Norme za vsako skupino je treba predstaviti v srednjih vrednostih in standardnem odklonu.

Slika 2. »Okvir veljavnosti«

Zanesljivost testa je eden od kriterijev kakovosti testa, ki je povezan z natančnostjo psiholoških meritev. Večja kot je zanesljivost testa, relativno bolj je brez merilnih napak. Zanesljivost testa se obravnava v enem pristopu: kot stabilnost rezultatov med ponovljenim testiranjem; na drugi strani pa kot manifestacija stopnje enakovrednosti dveh (vzporednih) testov, ki sta po obliki in namenu enaka.

Zanesljivost označuje preizkuse lastnosti, ne pa stanj. Lastnosti:

1. Ponovljivost rezultatov raziskav.
2. Natančnost meritev.
3. Trajnost rezultatov.

Stopnja zanesljivosti metod je odvisna od številnih razlogov. Med negativnimi dejavniki so najpogosteje navedeni naslednji:

1. nestabilnost lastnosti, ki se diagnosticira;
2. nepopolnost diagnostičnih metod (navodila so malomarno sestavljena, naloge so heterogene narave, navodila za predstavitev metode preiskovancem niso jasno oblikovana itd.);
3. spreminjajoča se situacija preiskave (različni časi dneva, ko se izvajajo poskusi, različni svetlobni pogoji v prostoru, prisotnost ali odsotnost tujega hrupa itd.);
4. razlike v vedenju eksperimentatorja (od poskusa do poskusa različno podaja navodila, različno spodbuja izpolnjevanje nalog ipd.);
5. nihanja funkcionalnega stanja subjekta (v enem poskusu je dobro zdravje, v drugem - utrujenost itd.);
6. elementi subjektivnosti v načinih ocenjevanja in interpretacije rezultatov (pri zapisovanju odgovorov testirancev se odgovori ocenjujejo glede na stopnjo popolnosti, izvirnosti ipd.).

K.M. Gurevich razlaga zanesljivost kot:

1. Zanesljivost samega merilnega instrumenta (koeficient zanesljivosti);
2. Stabilnost proučevane karakteristike (koeficient stabilnosti);
3. Konstantnost, tj. relativna neodvisnost rezultatov od osebnosti eksperimentatorja (koeficient konstantnosti).

Indikator, ki označuje merilni instrument, se predlaga, da se imenuje koeficient zanesljivosti; indikator, ki označuje stabilnost merjene lastnosti - koeficient stabilnosti; Indikator za oceno vpliva Osebnosti eksperimentatorja je koeficient konstantnosti. V tem vrstnem redu je priporočljivo preverjati metodologijo: priporočljivo je najprej preveriti merilno orodje. Če so dobljeni podatki zadovoljivi, lahko nadaljujemo z ugotavljanjem mere stabilnosti lastnosti, ki jo merimo, nato pa po potrebi upoštevamo kriterij konstantnosti. (Zanesljivost: test-retest, vzporedne oblike, deli telesa, notranja konsistentnost, faktorska varianca).

Za metodo pravimo, da je zelo zanesljiva, če natančno meri lastnost, ki jo namerava izmeriti. Upoštevati je mogoče naslednja merila točnosti:

Pri ponovitvi metode na istih preiskovancih pod enakimi pogoji po določenem časovnem intervalu se rezultati obeh testov med seboj bistveno ne razlikujejo.

Delovanje naključnih tujih dejavnikov nima pomembnega vpliva na rezultate testa. Kot zunanji dejavniki se lahko štejejo: čustveno stanje in utrujenost, če niso vključeni v obseg preučevanih značilnosti, temperatura, osvetlitev prostora itd. Takšni zunanji naključni dejavniki se imenujejo tudi dejavniki nestabilnosti merilnega postopka.

Pri ponovitvi metode na istih preiskovancih po določenem časovnem intervalu v spremenjenih pogojih se rezultati obeh testov med seboj bistveno ne razlikujejo. S spremenjenimi mislimo na naslednje pogoje: drug eksperimentator, stanje anketiranca itd.

Za ocenjevanje zanesljivosti obstajajo različne metode:

Retestna metoda - ponovno testiranje vzorca preiskovancev z istim testom po določenem časovnem intervalu pod enakimi pogoji. Časovni interval je odvisen od starosti (na primer pri majhnih otrocih se spremembe lahko pojavijo v enem mesecu), pa tudi od dogodkov v življenju subjekta.

TESTINTERVALRETEST

Indeks zanesljivosti je korelacijski koeficient med rezultati dveh preskusov. Nastala visoka korelacija je lahko rezultat subjektovega usposabljanja za naloge te vrste; nizka korelacija je lahko posledica sprememb pri testirancu in lahko kaže tudi na nezanesljivost testa.

Zanesljivost zamenljivih oblik - ponovljeno testiranje vzorca preiskovancev s paralelno obliko testa po minimalnem časovnem intervalu pod enakimi pogoji.

TEST "AINTERVALTEST A"

Indeks zanesljivosti je korelacijski koeficient med rezultati dveh vzporednih oblik testa. Visok korelacijski koeficient in velik interval med dvema testoma kažeta na visoko zanesljivost testa.

Morebitna prevara s strani subjekta, njegova prefinjenost, dogodki, ki so se zgodili v intervalu med testi, nimajo posebnega vpliva (kot pri metodi ponovnega testiranja) na stopnjo zanesljivosti testa. Če se pri testiranju z vzporednimi oblikami faktor usposabljanja zmanjša, se pogosto pojavi učinek prenosa principa nalog. Pri konstruiranju vzporednih oblik je treba upoštevati učinek prenosa.

Zahteve za izdelavo vzporednih obrazcev:

1. Vzporedni obrazci morajo biti neodvisno izdelani testi, vendar morajo izpolnjevati iste zahteve;
2. vsebovati mora enako število nalog s podobno težavnostno stopnjo;
3. Enakovrednost vzporednih oblik je treba preveriti z metodo ponovnega testiranja.

Opredelitev konstantnosti, tj. relativna neodvisnost rezultatov od osebnosti eksperimentatorja. Ker se tehnika razvija za nadaljnjo uporabo pri drugih psihodiagnostikih, je treba ugotoviti, v kolikšni meri na njene rezultate vpliva osebnost eksperimentatorja. Koeficient konstantnosti se določi s korelacijo rezultatov dveh poskusov, izvedenih na istem vzorcu, vendar s strani različnih izvajalcev. Korelacijski koeficient ne sme biti nižji od 0,80.

Preoblikovanje psihodiagnostičnih postopkov in tehnik v zanesljivo orodje znanosti in prakse je odvisno od prizadevanj številnih strokovnjakov za psihometrično odpravljanje napak, oblikovanje testov, ki izpolnjujejo osnovne psihometrične zahteve: zanesljivost, veljavnost, standardizacija. Osnovna načela testiranja in ugotavljanja zanesljivosti, konstrukcije in validacije psihodiagnostičnih tehnik so zajeta v številnih posebnih delih o psihodiagnostiki (A. Anastasi, A. Bodalsi, V. Stolin, A. Shmelev, K. Gurevich, V. Melnikov). itd.). V tej vadnici bomo opisali osnovne koncepte in načela izvajanja psihodiagnostičnega pregleda, katerih poznavanje je nepogrešljiv pogoj za poklicno usposobljenost praktičnega psihologa.

Psihodiagnostika kot znanstvena disciplina vključuje tri področja psihološkega znanja:

predmetno področje psihologije, ki preučuje te duševne pojave;

psihometrija - veda o merjenju individualnih razlik in diagnostičnih spremenljivk;

praktična uporaba psiholoških znanj z namenom ustreznega psihološkega vpliva in pomoči ljudem pri reševanju njihovih težav.

Metodološka osnova psihodiagnostike je psihometrija. Prav ta znanost razvija tehnologijo za ustvarjanje posebnih psihodiagnostičnih tehnik in določa metodologijo za zagotavljanje znanstvenih zahtev zanje:

zanesljivost - notranja konsistentnost delov testa in ponovljivost rezultatov med ponovljenim testiranjem;

veljavnost - odraz v rezultatih testa točno tiste lastnosti, za katero je namenjen diagnosticiranje;

zanesljivost - zaščita testa pred vplivom na rezultate testnikove želje, da jih spremeni v želeno smer;

reprezentativnost - prisotnost norm za rezultate množične ankete v populaciji, za katero je test zasnovan, kar omogoča oceno stopnje odstopanja od povprečnih vrednosti katerega koli posameznega kazalnika.

Te psihometrične zahteve veljajo za različne skupine testov, v največji meri za objektivne teste in osebnostne vprašalnike, v najmanjši meri pa za projektivne tehnike.

Objektivna ocena psiholoških tehnik in testov pomeni ugotavljanje njihove zanesljivosti. V psihometriji se izraz "zanesljivost" vedno nanaša na doslednost rezultatov, pridobljenih pri istih subjektih.

Kako uporaben je ta test? Ali res izpolnjuje svoje funkcije? Ta vprašanja lahko in včasih povzročijo dolgotrajne, brezplodne razprave. Predsodki, subjektivni sklepi in osebne pristranskosti vodijo, kot meni A. Anastasi, na eni strani v precenjevanje zmožnosti posameznega testa, na drugi pa v njegovo vztrajno zavračanje. Edini način za odgovor na takšna vprašanja je empirično testiranje. Objektivna ocena Psihološki testi pomenijo predvsem ugotavljanje njihove zanesljivosti in veljavnosti v specifičnih situacijah.

Test zanesljivosti rezultati, pridobljeni od istih subjektov pri ponovnem testiranju z istim testom ali enakovredno obliko, so dosledni.

Če je otrokov IQ 110 v ponedeljek in 80 v petek, potem je očitno, da tega kazalnika težko jemati z zaupanjem. Podobno, če je posameznik pravilno identificiral 40 besed v nizu 50 besed in 20 v drugem enakovrednem nizu, potem nobenega od teh kazalnikov ni mogoče šteti za merilo njegovega verbalnega razumevanja. Seveda je v obeh primerih možno, da je le eden od obeh kazalnikov napačen, a to lahko potrdi šele naknadno testiranje; Iz predstavljenih podatkov izhaja le to, da kazalniki skupaj ne morejo biti pravilni.

Preden je psihološki test na voljo javnosti, je treba opraviti temeljit, objektiven test njegove zanesljivosti. Zanesljivost je mogoče preizkusiti glede na spremembe skozi čas, izbiro posebnih nalog ali testnih vzorcev, osebnost eksperimentatorja ali obdelovalca testov in druge vidike testiranja. Zelo pomembno je natančno določiti vrsto zanesljivosti in kako jo določiti, saj se isti test lahko razlikuje v različnih vidikih. Prav tako je priporočljivo imeti podatke o številu in značilnostih posameznikov, na katerih je bila testirana zanesljivost testa.

Takšne informacije bodo uporabniku testa omogočile, da se odloči, kako zanesljiv je test za skupino, pri kateri ga namerava uporabiti.

Najbolj popolno razlago zanesljivosti testnih metod daje A. Anastasi. Zanesljivost se nanaša na doslednost rezultatov testa, pridobljenih, ko se ponavlja na istih subjektih v različnih časovnih točkah, z uporabo različnih nizov enakovrednih nalog ali pri spreminjanju drugih pogojev izpita. Izračun temelji na zanesljivosti merilne napake, ki služi za prikaz verjetnih meja nihanj merjene količine, ki nastanejo pod vplivom tujih naključnih dejavnikov. V najširšem pomenu se zanesljivost nanaša na obseg, v katerem se posamezne razlike v rezultatih testov izkažejo za "resnične" in obseg, v katerem jih je mogoče pripisati naključnim napakam. Če to prevedemo v jezik posebnih izrazov, potem merjenje zanesljivosti testa omogoča oceno vrednosti skupne disperzije testnih indikatorjev, ki je napaka varianca. Vprašanje pa je, kaj šteti kot varianco napake. Isti dejavniki, ki so v zvezi z nekaterimi problemi tuji, že veljajo za vire »pravih« razlik pri reševanju drugih problemov. Na primer, če nas zanimajo nihanja razpoloženja, potem bi lahko vsakodnevne spremembe v rezultatih testa čustvenega stanja bile povezane z namenom testa in torej z resnično varianco rezultatov. Če pa je test zasnovan za merjenje stabilnejših osebnostnih značilnosti, potem lahko enaka dnevna nihanja pripišemo varianci napak.

Pomembno je, da bodo kakršne koli spremembe pogojev, pod katerimi se izvaja test, če niso pomembne za njegov namen, povečale varianco napake. Zato eksperimentator z upoštevanjem enotnih pogojev testiranja (kontrola splošnega okolja, časovne omejitve, navodila preiskovancu, kontakt z njim in drugi podobni dejavniki) zmanjša varianco napake in poveča zanesljivost testa. Toda tudi v optimalnih pogojih noben test ni povsem zanesljivo orodje. Zato mora standardni nabor testnih podatkov vključevati merilo zanesljivosti. Ta ukrep je značilen za test, ko se izvaja v standardnih pogojih in izvaja subjektom, podobnim tistim, ki so sodelovali v normativnem vzorcu. Zato je treba zagotoviti tudi podatke o tem vzorcu.

K. M. Gurevich opredeljuje zanesljivost kot »izredno zapleten in večplasten koncept, katerega ena glavnih funkcij je oceniti konsistentnost indikatorjev uspešnosti testa« [Gurevich, 1981].

Načeloma lahko rečemo, da bi morala zanesljivost upravičiti merilno napako - pokazati bi moralo, koliko variabilnosti meritev je posledica napake. Obstaja več glavnih dejavnikov, ki določajo stopnjo zanesljivosti. Tako se bo zanesljivost vedno povečevala, če bodo pogoji preskusnega postopka konstantni, saj to zmanjša napako variabilnosti izmerjenega parametra. Hkrati množica ciljev, kompleksnost problema in spremenljivost situacij povečujejo merilno napako in s tem zmanjšujejo zanesljivost.

Obstaja toliko vrst zanesljivosti testa, kot je pogojev, ki vplivajo na rezultate testa, zato se lahko izkaže, da so kakršni koli taki pogoji nenavadni namenu, in potem

varianco, ki jo povzročijo, je treba vključiti v varianco napake. Vendar le nekaj vrst zanesljivosti najde praktično uporabo. Ker vse vrste zanesljivosti odražajo stopnjo doslednosti ali doslednosti dveh neodvisno dobljenih nizov kazalnikov, je njihova mera lahko korelacijski koeficient. Bolj specializirana razprava o korelaciji s podrobnim opisom računskih postopkov je podana v učbenikih o statistiki za učitelje in psihologe (V. Avanesov, A. Gusev, Ch. Izmailov, M. Mikhalevskaya itd.).

V praksi se za ocenjevanje zanesljivosti testov uporabljajo tri glavne metode:

1) ponovno testiranje;

2) vzporedno testiranje;

3) metoda cepitve.

Razmislimo o vsakem od njih posebej.

Ponovno testiranje Je ena glavnih metod za merjenje zanesljivosti. Ponavljajo se

testiranje vzorca preiskovancev se izvede z istim testom po določenem časovnem intervalu pod enakimi pogoji. Ponavadi se imenuje ponovno testiranje ponovno testiranje, in tako merjena zanesljivost je test-retest zanesljivost. Shema ocenjevanja zanesljivosti test-retest je videti takole:

V tem primeru se kot indeks zanesljivosti vzame korelacijski koeficient med rezultati dveh testov.

Metoda ponovnega testiranja ima tako prednosti kot slabosti. Prednosti vključujejo naravnost in enostavnost določanja koeficienta zanesljivosti. Slabosti vključujejo negotovost pri izbiri intervala med dvema meritvama. Pojav začasne negotovosti je posledica dejstva, da se ponovno testiranje razlikuje od začetnega. Preiskovanci že poznajo vsebino testa, si zapomnijo svoje začetne odgovore in se po njih vodijo pri ponavljanju testa. Zato med ponovnim testiranjem pogosto opazimo bodisi "prilagajanje" začetnim rezultatom bodisi, kot posledico negativizma, prikaz "novih" rezultatov. Da bi se temu izognili, morate pri podajanju zanesljivosti testa in ponovnega testiranja v testnem priročniku navesti, kateremu časovnemu intervalu ustreza. Glede na to, da zanesljivost test-retest pada z naraščajočim časovnim intervalom, so najbolj zanesljivi visoki koeficienti zanesljivosti, dobljeni z jasno velikimi intervali med testi. Nezadostno visoki koeficienti zanesljivosti so lahko posledica neoptimalne določitve časovnih intervalov.

Vzporedno testiranje V tem primeru se več meritev organizira z uporabo vzporednih ali enakovrednih testov. Vzporedni testi so testi, ki merijo isto duševno lastnost z enako napako. V tem primeru isti posamezniki izvajajo več različic istega testa ali enakovrednih testov. Praviloma je praktična uporaba te vrste zanesljivosti povezana s precejšnjimi težavami, saj je zelo težko sestaviti več različic enega testa tako, da subjekt ne more zaznati njihove psihološke homogenosti. In izkrivljajoči vpliv treninga v tem primeru ni popolnoma odstranjen. Poleg tega se postavlja vprašanje: ali so alternativne vrste zanesljivosti značilnosti testne zanesljivosti in ne parametrov enakovrednosti testa? Konec koncev, če se dve obliki testiranja izvajata pod isto vrsto stalnih pogojev, potem se najverjetneje preučujejo indikatorji enakovrednosti obeh oblik testiranja in ne kazalniki zanesljivosti samih testov. Merilno napako v tem primeru določajo nihanja v izvedbi testa in ne nihanja v strukturi testa.

Shema za uporabo vzporednih testov za merjenje zanesljivosti je naslednja:

Imenuje se korelacijski koeficient, izračunan med dvema testoma enakovredna zanesljivost.

Metoda cepitve Je razvoj vzporedne metode preverjanja znanja in temelji na predpostavki vzporednosti ne le posameznih testnih oblik, ampak tudi posameznih nalog znotraj enega testa. To je eden najpreprostejših testov testa, ko se izračuna korelacijski koeficient med njegovima polovicama. Kako test razdeliti na dve polovici, da bi obe polovici lahko uskladili na eni ali drugi podlagi? Najpogosteje so testne naloge razdeljene na sode in lihe, kar omogoča do neke mere odpravo morebitnih pomanjkljivosti. Glavna prednost te vrste zanesljivosti je neodvisnost rezultatov testa od elementov dejavnosti, kot so razvoj, usposabljanje, praksa, utrujenost itd. Pri razdelitvi testa na dva dela se indeks zanesljivosti izračuna s formulo Spearman-Brown, ki jo je predlagala neodvisno drug od drugega. Njihovi članki so bili objavljeni v isti številki psihološke revije s sklepi in formulami [Avanesov , 1982]. V njihovi formuli

R(x, 0=2 RJ\ + R, y

kjer je R korelacijski koeficient obeh polovic testa. Kot koeficient indeksa zanesljivosti se upošteva povprečni modul korelacijskega koeficienta vseh testnih postavk oziroma povprečni determinacijski koeficient.

Doslej smo preučili tri empirične metode za ocenjevanje zanesljivosti testa: ponovno testiranje z istim testom, ponovno testiranje z vzporedno obliko testa in razdelitev testa.

Katera od teh metod zagotavlja resnično oceno zanesljivosti testa? Katero metodo naj uporabite? Odgovor na to vprašanje je odvisen od osebnih preferenc in ciljev študija.

Pri uporabi ponovljene metode testiranja dobimo oceno stopnje stabilnosti rezultatov v času in odvisnosti od pogojev testiranja. Zato se imenuje tudi koeficient zanesljivosti test-retest koeficient stabilnosti oz stabilnost test. Pri uporabi metode vzporednih oblik in metode cepitve se ocenjuje stopnja medsebojne skladnosti testnih delov. Zato se koeficienti zanesljivosti, dobljeni s tema dvema metodama, razlagajo kot nihajoči in homogeneity, homogenost testi.

R. B. Cattell meni, da je poleg kazalnikov stabilnosti in homogenosti potrebno upoštevati še kazalnik prenosljivost. Je ocena zmožnosti testa, da ohrani natančnost meritev v različnih vzorcih, subkulturah in populacijah. Stabilnost, homogenost in prenosljivost skupaj tvorijo kompleksno značilnost zanesljivosti, ki jo R. B. Cattell imenuje doslednost in ga opredeljuje kot »stopnjo, do katere test kljub spremembam (v določenih mejah) še naprej napoveduje, kar je nekoč napovedal: a) obseg, do katerega je test uporabljen; b) pogoje, pod katerimi je bil uporabljen; c) sestavo vzorca, v katerem se uporablja.«

Končno obstaja vrsta zanesljivosti, ki je neposredno povezana z zanesljivostjo osebe, ki izvaja test. Ocena zanesljivosti osebe, ki izvaja test, se pridobi z neodvisno simulacijo testa s strani dveh različnih eksperimentatorjev.

Zanesljivost rezultatov testa ni odvisna le od zanesljivosti samega testa in postopka njegovega izvajanja. Pomemben dejavnik, ki vpliva na rezultate interpretacije podatkov, je specifičnost posameznega vzorca. Najpomembnejše značilnosti vzorca s tega vidika je treba prepoznati kot socialno-psihološko homogenost v različnih parametrih; upoštevata se tudi starost in spol.

A. G. Shmelev predlaga izvedbo zaporedja dejanj pri preverjanju zanesljivosti, kot sledi [Splošna psihodiagnostika, 1987]:

1. Ugotovite, ali obstajajo podatki o zanesljivosti testa, predlaganega za uporabo, na kateri populaciji in v kakšni diagnostični situaciji je bil testiran. Če preverjanja ni bilo ali če so lastnosti nove populacije in situacije jasno specifične, ponovno preverite zanesljivost ob upoštevanju spodaj navedenih možnosti.

2. Če priložnosti dopuščajo, ponovno testirajte na celotnem standardizacijskem vzorcu in izračunajte vse koeficiente, podane tako za celoten test kot za posamezne postavke. Analiza dobljenih koeficientov bo pomagala razumeti, kako zanemarljiva je merilna napaka.

3. Če so možnosti omejene, ponovite testiranje samo na delu vzorca (vsaj 30 subjektov), ročno izračunajte rang korelacijo za oceno notranje

doslednost (z metodo razdelitve) in stabilnost celotnega testa.

Seveda so obravnavani koncepti psihodiagnostike njeni najpomembnejši atributi. Vendar kazalniki visoke zanesljivosti sami po sebi ne določajo praktične vrednosti preskusa. Vodilni dejavnik, ki vam omogoča merjenje ciljnih rezultatov psihološkega testiranja, je veljavnost.

Vsaka empirična študija v psihologiji uporablja psihološke teste. Študenti morajo pogosto posredovati podatke o njihovi zanesljivosti in veljavnosti.

Zanesljivost psiholoških testov

V običajnem življenju zanesljivost osebe ali predmeta pomeni zaupanje, da se nanj lahko zanesete. Kako preverijo, ali se je na psihološki test mogoče zanesti?

Prvi način za preverjanje zanesljivosti psihološkega testa je analiza stabilnosti rezultatov testa. Dejansko, če se rezultati uporabe testa na istem vzorcu v več testih bistveno ne spremenijo, potem je to lahko merilo njegove zanesljivosti.

Ponovljeno testiranje se imenuje ponovni test. Izvaja se v intervalih od enega tedna do enega leta. Nato se analizirajo korelacije več meritev. Če korelacija med rezultati ponovnih testov ni nižja od 0,76, se tak test šteje za zanesljivega.

Slabosti testno-retestne zanesljivosti psiholoških testov.

1. Nekateri psihološki indikatorji so nestabilni in spremenljivi. Na primer, z merjenjem razpoloženja in počutja ob različnih urah dneva ali ob različnih dnevih lahko dobite različne rezultate in to ne bo posledica nezanesljivosti testa.

2. Pri večkratnem opravljanju istega testa se subjekti nanj »navadijo«. Lahko se spomnijo svojih odgovorov in se odzovejo na enak način. Lahko pa, nasprotno, spremenijo svoje odgovore v smeri družbene zaželenosti. Tako zanesljivost testa in ponovnega testa ne bo v celoti odražala zanesljivosti testa.

Drugi način preverjanja zanesljivosti psihološkega testa je analiza doslednosti različnih delov testa. Na primer, v testu je en indikator, ki ga diagnosticira 10 vprašanj. Doslednost tega testa določa visoka korelacija odgovorov na vsako vprašanje s skupno oceno na lestvici.

Da bi ugotovili doslednost psihološkega testa, ga pogosto razdelimo na dva dela. To lahko storite tako, da izberete vprašanja enega za drugim. Lahko ločite prvo in drugo polovico testa. Nato se analizirajo korelacije odgovorov obeh razdeljenih delov testa. Večja kot je korelacija, večja je doslednost in zanesljivost testa.

Torej je zanesljivost psihološkega testa značilnost njegove formalne primernosti za diagnosticiranje psiholoških kazalcev. Na primer, če je test za diagnosticiranje anksioznosti zanesljiv, to pomeni, da boste, če ga uporabite na različnih vzorcih ob različnih časih, dobili podobne rezultate. Toda ali bodo ti rezultati značilni za anksioznost preiskovancev? Zanesljivost psihološkega testa tega ne zagotavlja. Za to je odgovoren še en indikator - veljavnost psihološkega testa.

Veljavnost psiholoških testov

Veljavnost psiholoških testov odraža skladnost njihovih rezultatov z bistvom izmerjenih psiholoških pojavov. Na primer, v kolikšni meri rezultat testa agresivnosti odraža dejansko stopnjo agresivnosti anketiranca.

Obstajata dva glavna načina za ugotavljanje veljavnosti psiholoških testov.

Prvi način za določitev veljavnosti psihološkega testa vključuje korelacijo rezultatov testa s podobnimi kazalci drugih testov. Če želite na primer preveriti veljavnost testa samospoštovanja, lahko storite naslednje:

izvajati testiranje subjektov z novim testom;
ugotoviti samopodobo subjektov na drugem testu (ob predpostavki, da je veljaven);
izračunajte korelacijo kazalnikov samospoštovanja z dvema psihodiagnostičnima metodama;
statistično pomembna korelacija bo dala razlog za govor o veljavnosti novega testa.

Ta metoda nam omogoča identifikacijo tako imenovane konstruktne veljavnosti. Odraža ujemanje identificiranega psihološkega indikatorja s psihološkim konstruktom.

Drugi način ugotavljanja veljavnosti psihološkega testa vključuje korelacijo rezultatov testa z zunanjimi kriteriji. Ta veljavnost se imenuje kriterijska veljavnost psihološkega testa.

Na primer, kazalnik merilne veljavnosti testa nagnjenosti k deviantnemu vedenju je lahko dejansko število kaznivih dejanj najstnika. V zvezi s testom motivacije za dosežke je lahko indikator veljavnosti kriterija uspešnost opravljanja posamezne dejavnosti.

Razmerje med zanesljivostjo in veljavnostjo psiholoških testov

Zanesljivost testa odraža njegovo kakovost kot diagnostične metode v smislu formalnih indikatorjev. Brez upoštevanja smiselne analize rezultatov.

Veljavnost ocenjuje vsebino rezultatov testa. V kolikšni meri ustrezajo resničnim psihološkim fenomenom?

Zanesljiv test morda ni veljaven. Na primer, preizkus pobude lahko pokaže visoko zanesljivost testa in ponovnega testiranja ter delno doslednost. Z vsebinskega vidika pa rezultati testa ne odražajo toliko pobude kot volje. To pomeni, da je zanesljivost tega testa visoka, veljavnost pa nizka.

V praksi psihološkega testiranja je zanesljivost testov z uporabo ponovnega testiranja. Veljavnost psiholoških testov se običajno testira z analizo razmerij z rezultati na drugih testih, ki merijo podobne ali podobne psihološke indikatorje.

Primeri zaključkov o zanesljivosti in veljavnosti psiholoških testov

Preizkus življenjskih usmeritev (LSO)

Zanesljivost sistema za vzdrževanje življenja

Zanesljivost testa SLS smo preverjali s ponovnim testiranjem v presledku 2 tednov (preiskovanci: 76 študentov MSU). Rezultati testa so bili stabilni na 5% stopnji pomembnosti (str<0,05).

Veljavnost LSS

Avtor testa LSS, D.A. Leotiev, je bila preverjena konstruktna veljavnost LSS. V ta namen je bil oblikovan vzorec, ki je vključeval študente moskovskih univerz v skupnem številu 24 ljudi (moških in žensk).

Preiskovanci so bili testirani s testi: SZO, USK (stopnja subjektivne kontrole) in SAT (test stopnje samoaktualizacije). Nato je bila izvedena korelacijska analiza kazalnikov LSS s kazalniki testov USC in SAT.

Vseh šest indikatorjev testa SLS pomembno pozitivno korelira s splošno internostjo in z internostjo na področju dosežkov ter (razen tretje podlestvice) z internostjo na področju družinskih odnosov. Ugotovljene so bile tudi signifikantne korelacije pete podlestvice sistema reševanja z internostjo v proizvodni sferi ter v odnosu do zdravja in bolezni.

Kazalniki testa SJO pozitivno in signifikantno korelirajo z naslednjimi lestvicami testa SAT: lestvica podpore in kognitivnih potreb - vseh šest indikatorjev; lestvice kompetentnosti v času, samospoštovanja in predstav o človeški naravi - vse razen prve podlestvice; lestvica vrednotnih orientacij - vse razen splošnega indikatorja in lestvica spontanosti - tretja, četrta in peta podlestvica. Z drugimi lestvicami CAT niso bile ugotovljene pomembne korelacije.

Dokaj visoka stopnja korelacije med indikatorji testa življenjskih usmeritev (LSO) in indikatorji internosti (USK test) ter indikatorji samoaktualizacije (SAT test) nam omogoča govoriti o konstruktni veljavnosti testa SLO. .

Leontjev D.A. Test življenjskih usmeritev (LSO). 2. izd. M.: Smysl, 2000, 18 str.

Metodo S. Schwartza za preučevanje osebnih vrednot je v Rusiji prilagodil V.N. Karandašev.

Dejstvo, da ta psihodiagnostična tehnika temelji na jasnem in teoretično utemeljenem konceptu njenega avtorja, ki vsebuje operacionalizirane značilnosti vrednot;

Dejstvo je, da so bili pri razvoju prvotne različice vprašalnika uporabljeni podatki raziskav iz 54 držav.

Karandašev V.N. Schwartzova metoda za preučevanje osebnih vrednot: koncept in metodološka navodila. - Sankt Peterburg: Govor, 2004-70 str.

Metodologija "Stopnja korelacije med vrednostjo in razpoložljivostjo v različnih sferah življenja" (USDC) (E.B. Fantalova)

V metodologiji E.B. Fantalova "Stopnja korelacije med vrednostjo in razpoložljivostjo v različnih sferah življenja" uporablja seznam 12 vrednosti, vzetih s seznama končnih vrednosti metodologije M. Rokeach.

Tako sta zanesljivost in veljavnost metodologije E.B. Fantalova je določena z zanesljivostjo in veljavnostjo seznama vrednot M. Rokeacha.

Zanesljivost testa vrednotnih orientacij M. Rokeach je avtor preveril preko stabilnosti vrednotne strukture na ponovno testiranje v časovnih intervalih od 3 tednov do 14-16 mesecev na vzorcih študentov. Pri posameznih vrednostih se pri ponovnem testiranju v intervalih 3-7 tednov indeks stabilnosti giblje od 0,51 do 0,88 (terminalne vrednosti) in od 0,45 do 0,70 (instrumentalne vrednosti). Za različico tehnike v ruskem jeziku so med ponovnim testiranjem z intervalom 2 tednov dobili povprečne kazalnike zanesljivosti 0,82 (za terminalne vrednosti) in 0,79 (za instrumentalne vrednosti).

Veljavnost metode vrednotnih orientacij M. Rokeacha (in posledično metode E. B. Fantalove) posredno dokazujejo rezultati, pridobljeni iz ankete različnih družbenih skupin. Razlike v ocenah istih vrednosti pri moških in ženskah dosežejo statistično pomembne meje pri 12 od 18 terminalnih vrednosti in pri 8 instrumentalnih.

Leontjev, D.A. Metodologija preučevanja vrednotnih orientacij. - M.: Smysl, 1992. - 17 str.

Fantalova E.B. O enem metodološkem pristopu k preučevanju motivacije in notranjih konfliktov // Psychological Journal, letnik 13, 1992, N 1. strani 107-117.

Metodologija "Svobodna izbira vrednot" Fantalove E.B.

Tehnika »Svobodna izbira vrednot« je sestavni del avtorjevega vrednotno usmerjenega sistema »Diagnostika notranjega konflikta« (DVK).

V tej tehniki E.B. Fantalova je seznam vrednosti razširila z 12 na 72. Vendar pa avtor ni preveril zanesljivosti te strukture vrednosti in njene veljavnosti.

Fantalova E.B. Diagnostika in psihoterapija notranjega konflikta. Samara, 2001.

Upam, da vam bo ta članek pomagal, da sami napišete psihološko nalogo. Če potrebujete pomoč, se obrnite na nas (vse vrste del v psihologiji; statistični izračuni).