Tehnici neparametrice de comparatie între grupuri
Tehnicile statistice parametrice pleaca de la o serie de conditii privind normalitatea si omogenitatea dispersiei distributiei rezultatelor subiectilor. Când acestea nu sunt îndeplinite sunt utilizate tehnicile neparametrice denumite si tehnici statistice independente de distributia datelor.
Avantajele acestui tip de tehnici constau în diversitatea datelor care pot fi prelucrate atât calitativ cât si cantitativ. Dezavantajul principal este puterea mai mica de a detecta falsitatea unei ipoteze nule. Exista mai multe metode nonparametrice, cele mai întâlnite fiind:
Tehnica lui c 2
Se aplica atunci când rezultatele sunt clasificate în functie de gen, vârsta, nivel de pregatire, grupuri de tratament sau orice alta masura nominala. Proba furnizeaza un test statistic asupra semnificatiei discrepantei dintre rezultatele observate si asteptate.
De exemplu, studentul Ionel este superstitios. El crede ca o anumita sala îi poarta ghinion atunci când are de sustinut un examen. El a tinut evidenta tuturor salilor în care a dat examen. În total a sustinut 120 de examene în 4 sali diferite, adica în medie 30 de examene în fiecare sala.
Iata situatia reala (observata) si pe cea teoretica, pentru fiecare sala în ce priveste examenele luate cu note între 5 si 7 ("operationalizarea ghinionului")
Numarul salii |
|||||
1 |
2 |
3 |
4 |
Total |
|
Observat (O) |
24 |
34 |
22 |
40 |
120 |
Probabil (E) |
30 |
30 |
30 |
30 |
120 |
Formula lui c 2:
Unde: O = frecventa observata;
E =frecventa probabila (teoretica, expectata).
Sala |
O - E |
(O E) ² |
(O E) ² / E |
1 |
-6 |
36 |
1,20 |
2 |
+4 |
16 |
0,53 |
3 |
-8 |
64 |
2,13 |
4 |
+10 |
100 |
3,33 |
c 2=7,19
Valoarea obtinuta este interpretata prin compararea ei cu valoarea corespondenta din tabelul c ². Deoarece în cazul de fata exista patru variante (4 sali), numarul de grade de libertate este c-1, adica 3.
Valoarea lui c 2 de 7, 19 este mai mica decât cea din tabel la 3 df. Se observa ca la un prag de semnificatie p <.05, valoarea din tabel era de 7, 82. Astfel, ipoteza nula, ca nu exista diferente semnificative între cele patru banci nu poate fi eliminata, iar Ionut nu este întemeiat sa creada ca o sala îi aduce mai mult ghinion decât o alta.
Observatii:
De multe ori o problema implica doua sau mai multe categorii de evenimente si doua au mai multe grupe. Un exemplu ar fi analizarea rezultatelor la un chestionar de atitudine în care sunt precizate mai multe raspunsuri (de acord, abtinere, dezacord) si doua grupe de subiecti (religiosi crestini, respectiv atei). Acest tip de clasificare este numita tabel de contingenta.
Exemplu: În urmatorul tabel sunt cuprinse raspunsurile unui grup de persoane religioase si al unui alt grup de persoane nereligioase la urmatoarea întrebare: "Sunteti de acord ca tinerii sa faca dragoste înainte de casatorie?"
O tabela 3 x 2 de contingenta a raspunsurilor.
De acord |
Abtinere |
Dezacord |
Total |
|
Religiosi Observate Probabile |
30 (64) |
46 (56) |
124 (80) |
200 (200) |
Atei Observate Probabile |
114 (80) |
80 (70) |
56 (100) |
250 (250) |
TOTAL |
144 |
126 |
180 |
450 |
În exemplele anterioare frecventele probabile (teoretice) se determinau din ipoteze rationale sau alte surse de informatii. În tabelul de contingenta valorile probabile se calculeaza din frecventele efectiv aparute fata de totalul raspunsurilor. De exemplu, numarul total de subiecti care au fost de acord cu afirmatia este de 144. Deoarece în total sunt 450 de subiecti care au raspuns la chestionar, atunci procentul celor care au fost de acord cu afirmatia este de 144/450, adica 32% din grup. Astfel, daca nu exista nici o diferenta între grupul persoanelor religioase si non-religioase (ipoteza nula), atunci 32% din religiosi (0,32 x 200 = 64) si 32% din atei (0,32 x 250 =80) sar trebui sa fie de acord cu afirmatia (frecventa teoretica).
c 2 se calculeaza în acelasi mod si în acest exemplu.
O - E |
E |
(O E) ² |
(O E) ² / E |
R (Rezidul standardizat) |
-34 |
64 |
1156 |
18,06 |
-4,25 |
34 |
80 |
1156 |
14,45 |
3,77 |
-10 |
56 |
100 |
1,79 |
-1,33 |
10 |
70 |
100 |
1,43 |
1,19 |
44 |
80 |
1936 |
24,20 |
4,88 |
-44 |
100 |
1936 |
19,36 |
-4,40 |
c 2 = 79,29
Gradele de libertate pentru tabelul de contingenta sunt (r-1) (c-1), unde r este numarul de rânduri (în acest caz doua, religios vs. ateu) iar c numarul de coloane (în acest caz trei, de acord, abtinere, dezacord). Astfel, df = (2-1) (3-1) = 2.
Cautând în tabelul de semnificatii la df = 2, observam ca c 2 ar avea valoarea 9, 21 la un p <.01. Valoarea obtinuta a lui hi patrat de 79,29 este categoric semnificativa. Aceasta ne spune ca ipoteza nula trebuie respinsa.
Pentru a determina care categorie a adus contributii majore la obtinerea unei diferente semnificative se calculeaza rezidul standardizat (R). Formula sa este:
Aceasta formula este aplicata în cadrul fiecarei situatii. Daca rezidul standardizat este mai mare decât 2 (în valoare absoluta, indiferent de semn) putem considera ca acel element a adus un rol important în obtinerea unui c 2 semnificativ. În cazul de fata atât valorile din dreptul sintagmei "de acord" cât si cele din dreptul sintagmei "dezacord" au iesit relevante. Nu se observa însa diferente semnificative între cele doua grupe în ce priveste alternativa "nu stiu".
Restrictiile de utlizare a testului c 2
Desi am afirmat ca testele neparametrice nu necesita aceleasi ipoteze asupra populatiei ca cele parametrice, exista totusi o serie de restrictii si în utilizarea acestui tip de teste.
Concluzii în ce priveste utilizarea lui c 2:
Testul U al lui Mann-Whitney
Este analog testului parametric t independent, fiind una din cele mai puternice probe neparametrice. Poate fi utilizat atât cu esantioane mici de subiecti, cât si cu esantioane mari si necesita numai masuratori de tip rang sau când nu îndeplinim conditiile aplicarii testului t independent. Acest test opereaza cu numere ordinale.
Exista doua modalitati de calculare a acestui test în functie de marimea esantioanelor (n1 si n2 mai mici de 20 de persoane, respectiv, n1, n2 mai mari de 20).
Testul U a lui Mann-Whitney pentru N< 20
Exemplu: Un psiholog social este interesat sa afle daca exista diferente între doua categorii de femei (angajate, respectiv casnice) în ce priveste atitudinea lor asupra miscarii feministe.
Pasi în rezolvarea problemei:
Date: Atitudinea femeilor asupra miscarii feministe |
|||
Grupul 1 (femei angajate) |
Grupul 2 (femei casnice) |
||
Rezultat |
Rang |
Rezultat |
Rang |
19 |
3 |
16 |
1 |
22 |
5 |
18 |
2 |
28 |
8 |
21 |
4 |
32 |
11 |
26 |
6 |
34 |
13 |
27 |
7 |
37 |
14 |
29 |
9 |
40 |
17 |
31 |
10 |
42 |
18 |
33 |
12 |
43 |
19 |
38 |
15 |
46 |
20 |
39 |
16 |
S R1=128 S R2=82
Unde:
n1= numarul de subiecti din prima grupa;
n2= numarul de subiecti din a doua grupa;
S R1=suma rangurilor din prima grupa;
S R2=suma rangurilor din a doua grupa.
Dupa calcularea celor doi U se alege acea valoarea absoluta mai mica. În acest caz U1 este 27, iar U2 73. Se alege prima valoare de 27 care devine generic U. Urmatorul pas este consultarea din tabel a valorii lui U pe diagonala tinând cont de n1=10 si n2=10 la un prag de 0,05. Se observa ca valoarea corespunzatoare este U=27 pentru p<.05.
Pentru a respinge ipoteza nula U obtinut trebuie sa fie mai mic sau egal cu valoarea corespondenta din tabel. În problema data am obtinut un U de 27 care este egal cu valoarea corespondenta din tabel, ca urmare ipoteza nula este respinsa. Exista asadar o diferenta semnificativa în ce priveste atitudinea femeilor din cele doua grupe.
Testul U a lui Mann-Whitney pentru N>20
In acest caz, exista o procedura usor diferita de calcularea a lui U. Pasii sunt urmatorii:
Pâna aici se observa ca se realizeaza acelasi demers matematic în aflarea lui U. Din acest moment însa, intervine un pas suplimentar.
În aceasta situatie se consulta z în tabel si se urmareste daca valoarea obtinuta este mai mare decât cea din tabel. Daca z obtinut este mai mare decât z din tabel (la un prag de semnificatie de minim 0,05) atunci ipoteza nula este respinsa si se demonstreaza ca exista o diferenta reala, semnificativa între cele doua grupe.
Testul Wilcoxon al rangurilor pereche
Exista studii comparative între doua grupe dependente (corelate) care nu îndeplinesc conditiile parametrice. În astfel de situatii trebuie aplicat acest test care are aceleasi principii cu testul t dependent. Prin testul Wilcoxon se determina marimea diferentelor dintre rezultate (spre exemplu înainte si dupa o actiune), ordonate dupa rang.
Exemplu: Un psihopedagog special este interesat de efectul unor sedinte de consiliere asupra comportamentului agresiv la copiii cu dificultati de învatare. Alege un numar de 12 subiecti pe care îi testeaza înainte si dupa aceste sedinte. Rezultatele sunt prezentate în tabel.
Date:Agresivitatea copiilor cu dificultati de învatare |
||||||
S |
Pre |
Post |
Pre-Post |
Rangul diferentei |
Rezultat cu semn |
Minus |
1 |
36 |
21 |
15 |
11 |
11 |
|
2 |
23 |
24 |
-1 |
1 |
-1 |
1 |
3 |
48 |
36 |
12 |
10 |
10 |
|
4 |
54 |
30 |
24 |
12 |
12 |
|
5 |
40 |
32 |
8 |
7 |
7 |
|
6 |
32 |
35 |
-3 |
3 |
-3 |
3 |
7 |
50 |
43 |
7 |
6 |
6 |
|
8 |
44 |
40 |
4 |
4 |
4 |
|
9 |
36 |
30 |
6 |
5 |
5 |
|
10 |
29 |
27 |
2 |
2 |
2 |
|
11 |
33 |
22 |
11 |
9 |
9 |
|
12 |
45 |
36 |
9 |
8 |
8 |
T = 4
Pasii de calculare a acestui test sunt urmatorii:
Testul ANOVA Kruskal-Wallis al rangurilor
Este un test nonparametric utilizat când exista mai mult de doua grupe independente. Este comparabil cu o ANOVA simpla din statistica parametrica. Pentru analiza, datele sunt convertite în ranguri.
Exemplu: Un cercetator este interesat de diferentele care exista în ce priveste exercitarea unui comportament autoritar la trei grupe de dascali ( scoala primara; gimnaziu, respectiv liceu). În acest caz exista 17 subiecti împartiti în 3 grupe (6;5;6).
Iata rezultatele obtinute la scala de evaluare a autoritarismului în comportament:
Date: Scala de Evaluare a Autoritarismului |
|||||
Dascali ciclu primar(1) |
Dascali ciclu gimnazial(2) |
Dascali ciclu liceal(3) |
|||
Scor |
Rang |
Scor |
Rang |
Scor |
Rang |
52 |
4 |
66 |
13 |
63 |
10 |
46 |
1 |
49 |
3 |
65 |
12 |
62 |
9 |
64 |
11 |
58 |
8 |
48 |
2 |
53 |
5 |
70 |
15 |
57 |
7 |
68 |
14 |
71 |
16 |
54 |
6 |
73 |
17 |
S R1=29 M1=4,83 S R2=46 M2=9,20 S R3=78; M3=13
Pasi în rezolvarea problemei:
Testarea semnificatiei diferentelor dintre grupe prin testul ANOVA K-W simbolizat cu H, iata formula:
Unde N= totalul rezultatelor;
(S Ri)² / ni = raportul dintre suma rangurilor ridicata la patrat al unei grupe si numarul de subiecti din grupa respectiva;
S [(S Ri)² / ni] = Suma raporturilor obtinute la toate grupele;
ni= este numarul de rezultate din fiecare
grupa.
Efectuarea calculelor:
H=7,86.
Unde: N = numarul total de subiecti;
n = numarul de subiecti din grupele care se compara.
Pentru cele trei comparatii ale noastre, eroarea standard a diferentei
este:
idem a.
7.Se stabileste un interval de încredere pentru fiecare comparatie
în parte. El este egal cu diferenta mediei dintre grupuri plus sau
minus valoarea lui z pentru a de 0,017, adica
2,39*SE al fiecarei grupe. Astfel:
a) intervalul pentru grupele de elementara versus gimnaziu
9,204,83 +/- 2,39*3,05 = 4,37+/-7,28 = [-2,91; 11,65]
b) intervalul pentru grupele de elementara versus liceu
13 4,83 +/- 2,39*2,91 = 8,17 +/- 6,95 = [1,22; 15,12]
c) intervalul pentru grupele de gimnaziu versus liceu
13 9,20 +/- 2,39*3,05 = 3,80 +/- 7,28 = [-3,48; 11,08]
O comparatie este semnificativa statistic daca intervalul obtinut nu include valoarea zero. Din comparatiile efectuate diferentele semnificative apar doar între grupa de dascali de la ciclul primar si cei de la ciclul liceal (intervalul obtinut nu include si cifra zero). Putem concluziona ca exista o diferenta semnificativa în ce priveste nivelul de autoritarism exercitat de profesori între cei din ciclul primar si cei din ciclul liceal, cei din urma fiind mai autoritari.
Observatie
Atât testul ANOVA Kruskal-Wallis cât si a testul U a lui Mann-Whitney sunt tehnici ce utilizeaza date ordinale, existând posibilitatea unor ranguri egale. Daca acest numar de ranguri egale este prea mare (peste 30%) nu se recomanda utilizarea lor.
Testul Friedman ANOVA biunivoc al rangurilor
Testul este analog tehnicii ANOVA cu masuratori repetate din statistica parametrica. Rezultatele sunt ordonate pe ranguri si se utilizeaza hi patrat ca test de semnificatie.
Exemplu: Un grup de 12 subiecti au fost supusi unei metode de învatare a limbilor straine folosind tehnici sofrologice. Au fost testati de 3 ori: înaintea aplicarii metodei, la o luna si la trei luni de la începerea experimentului. Au fost obtinute rezultatele:
EVALUARE |
RANGURI |
|||||
S |
A |
B |
C |
R(A) |
R(B) |
R(C) |
1 |
16,0 |
15,7 |
15,2 |
3 |
2 |
1 |
2 |
11,6 |
10,9 |
11,5 |
3 |
1 |
2 |
3 |
18,1 |
18,0 |
17,6 |
3 |
2 |
1 |
4 |
16,3 |
16,8 |
17,0 |
1 |
2 |
3 |
5 |
12,0 |
13,1 |
12,8 |
1 |
3 |
2 |
6 |
12,5 |
12,2 |
12,3 |
3 |
1 |
2 |
7 |
9,3 |
8,8 |
9,0 |
3 |
1 |
2 |
8 |
18,8 |
17,5 |
18,0 |
3 |
1 |
2 |
9 |
19,2 |
19,7 |
19,7 |
1 |
2,5 |
2,5 |
10 |
22,3 |
22,8 |
21,6 |
2 |
3 |
1 |
11 |
20,7 |
20,3 |
19,6 |
3 |
2 |
1 |
12 |
24,1 |
23,7 |
24,4 |
2 |
1 |
3 |
Suma rangurilor: 28 21,5 22,5
Pasi în rezolvarea problemei:
Unde: N este numarul de subiecti (în acest caz 12);
K este numarul de evaluari (în acest caz 3);
(S R)² se obtine prin adunarea rangurilor din fiecare coloana în parte si apoi ridicarea lor la patrat (în cazul de fata avem 28 la patrat pentru prima evaluare; 21,5 la patrat pentru cea de a doua evaluare si 22,5 la patrat pentru cea de a treia evaluare.
S (S R)2 se obtine adunând rezultatele amintite în rândul precedent (în cazul de fata 1752,5).
4. Astfel se obtine un hi patrat = 1,46. Consultam acest rezultat în tabelul lui hi patrat la un p mai mic de 0,05 cu doua grade de libertate (k-1) si observam ca este trecuta valoarea de 5,99. Rezultatul obtinut de noi este mai mic decât valoarea din tabel, ca urmare nu exista diferente semnificative între rezultatele obtinute în cele trei evaluari. Când esantioanele sunt prea mici N<10 si k=3 sau N<5 si k=4 se va utiliza un alt tabel, special, pentru a compara valorile lui hi patrat.
Rezumatul testelor neparametrice comparative:
Comparatii de date nominale:
Testul hi patrat (analiza de contingenta).
Comparatii de date ordinale (ordonate pe ranguri)
Grupe independente:
Doua grupe: testul U a lui Mann-Whitney
Mai mult de doua grupe: ANOVA Kruskal-Wallis
Grupe dependente:
Doua grupe: Wilcoxon perechi
Mai mult de doua grupe: ANOVA Friedman
PROBLEME
SUA |
Suedia |
România |
|
Centre de resurse |
4280 |
3500 |
400 |
Clase normale |
2720 |
4100 |
4900 |
Clase speciale |
2440 |
2000 |
500 |
Scoli speciale |
560 |
500 |
3800 |
Centru Resurse |
Clasa Normala |
Clasa speciala |
Scoala speciala |
|
Tulburari de învatare |
270 |
140 |
38 |
8 |
Tulburari de limbaj |
130 |
80 |
10 |
30 |
Deficit intelectual |
20 |
40 |
40 |
70 |
Disabilitati fizice |
2 |
64 |
13 |
1 |
Tulburari emotionale |
10 |
28 |
2 |
10 |
3. Un psihopedagog primeste sarcina de a urmarii evolutia a 15 elevi din clasa I cu deficit intelectual usor în ce priveste rezultatele scolare. Sase elevi sunt integrati în scoala normala(X), ceilalti 9 fiind elevii unei scoli speciale(Y). Divizarea pe cele doua grupe s-a facut aleator. La sfârsitul anului scolar s-au înregistrat urmatoarele rezultate (medii generale):
X |
6,12 |
7,24 |
6,99 |
5,84 |
6,45 |
6,80 |
|||
Y |
7,10 |
5,88 |
7,60 |
7,80 |
8,00 |
7,54 |
7,72 |
6,11 |
6,50 |
Z 7,11; 5,08; 8,14; 6,80; 6,60; 7,80; 6,90; 9,00; 5,20.
I 15; 12; 17; 11; 14; 7, respectiv II 14; 14; 18; 15; 17; 9
Subiecti |
A |
B |
C |
D |
E |
F |
G |
H |
Înainte |
9 |
10 |
6 |
7 |
11 |
6 |
6 |
6 |
Dupa |
5 |
6 |
5 |
5 |
6 |
4 |
7 |
5 |
Stabiliti daca exista un efect de reducere a greselilor, asa cum se astepta psihopedagogul.
7.Un experiment încearca sa lamureasca efectul testosteronului asupra tendintei de dominare masurata prin minute de altercatii verbale. Au fost observati un numar de 14 subiecti din care 7 au primit o doza de testosteron, iar ceilalti 7 au constituit grupul de control. Analizati daca exista vreo diferenta semnificativa, asa cum se asteapta sa gaseasca experimentatorul în favoarea grupului experimental.
Grup experimental: 9,12,7,8,10,15,9 (minute de altercatii);
Grupul de control: 9,11, 13, 8, 7, 8,6 (minute de altercatii).
8.Pornind de la aceeasi idee prezentata în problema nr.8, o alta persoana propune un alt model experimental cu o singura grupa de subiecti (N=9), care sunt testati de 5 ori: înainte de administrarea testosteronului; la o ora dupa administrare; la 12 ore dupa; la un interval de o zi; si la un interval de 5 zile. S-au obtinut urmatoarele rezultate:
Înainte |
4,2 |
5,4 |
7,3 |
4,2 |
7,5 |
8,1 |
5 |
6 |
11 |
1 ora |
6 |
5 |
8 |
5 |
8 |
10 |
6 |
5 |
10 |
12 ore |
11 |
10 |
9,9 |
8,1 |
9,3 |
7,5 |
9 |
10 |
15 |
1 zi |
8,3 |
6,5 |
7,2 |
4,3 |
7,9 |
7,8 |
6 |
6,1 |
11 |
5 zile |
4,9 |
5,9 |
6,9 |
4,1 |
7,9 |
8 |
7 |
6 |
10 |
Stabiliti daca exista diferente semnificative între cele 5 momente în ce priveste nivelul agresivitatii.
I. TEHNICI STATISTICE: Statistica descriptiva,
Studiul corelational, Metode
de comparatie, Tabele,
Formule si raspunsuri la intrebari,
Bibliografie recomandata
II. APLICATII STATISTICE:
Barometre si aplicatii
III. TESTE
IV. LINK-URI RECOMANDATE