Make your own free website on Tripod.com

METODE DE COMPARATIE: Tehnici parametrice t si z
Tehnici parametrice ANOVA
Proceduri ANOVA de comparatii multiple
Tehnici non-parametrice

Tehnici de comparatie între grupuri.

Testele parametrice t si z

 

Pe lânga studiul asocierii dintre variabile, tehnicile statistice pot fi utilizate si pentru determinarea diferentelor dintre grupuri. Aceste medode se utilizeaza frecvent în analiza datelor în cercetarile experimentale.

În acest capitol vom prezenta acele tehnici parametrice care ne permit sa evaluam efectele unei variabile independente (manipulate de cercetator) sau categoriale (vârsta, sex, etc) asupra unei variabile dependente în situatia în care se va lucra cu una sau doua grupe de subiecti.

Cu ajutorul acestor teste statistice se ridica problema daca diferentele constatate între grupele de subiecti sunt datorate interventiei cercetatorului (variabilei independente), caracteristicilor variabilei categoriale sau dimpotriva, întâmplarii.

Exista trei tipuri de tehnici principale care vor fi discutate în acest capitol:

  1. Tehnici care privesc diferenta dintre un esantion si media populatiei din care acesta face parte - "the one simple t Test";
  2. Tehnici care privesc diferenta dintre doua grupe independente de subiecti – "the t test for independent samples";
  3. Tehnici care privesc diferenta dintre doua grupe dependente de subiecti – "the t test for correlated samples".

În acest caz dorim sa aflam daca un esntion de subiecti difera de o populatie mai mare. Sa presupunem ca un test de empatie a fost administrat pe o populatie mare de subiecti elevi abia intrati la liceu (N= 1000), iar media obtinuta pe întreaga populatie testata a fost de 76. Când s-a efectuat acelasi test pe o clasa de elevi de n=32 subiecti, s-a obtinut media de 81 si o estimare a abaterii standard de 9(s). Se pune problema daca elevii din aceasta clasa au un nivel de empatie diferit de media specifica pentru clasa a IX-a.

Pentru solutionarea acestei probleme exista doua teste statistice adecvate, si anume testele z si t.

Vom utiliza testul z daca:
           se cunoaste abaterea standard a variabilei dependente la nivelul populatiei;
          daca numarul de subiecti cuprinsi în esantionul comparativ este suficient de mare (de regula peste 30 de subiecti).

În situatia în care una din cele doua conditii nu sunt îndeplinite, utilizam testul t pentru un esantion.

În problema de fata se observa ca nu putem aplica testul z desi avem un esantion comparativ destul de mare n=32 (mai mare decat 30) deoarece nu se cunoaste abaterea standard a populatiei din care face parte esantionul.

Ca urmare, calculam testul t care valideaza sau infirma ipoteza nula potrivit careia, nu exista nici o diferenta între media (m) obtinuta pe esantion de subiecti (n= 32) si media (m ) obtinuta pe populatia din care a fost extras esantionul.

Matematic, ipoteza nula si cea de lucru (alternativa) se formuleaza astfel:

Ho: M = m

H1a: M > m < M

H1b: M > m ori M < m

În cazul H1a ipoteza alternativa specifica ca exista o diferenta între cele doua medii fara a arata directia acestei diferente. În acest caz avem de a face cu un test t bilateral (two-tailed test).

În cazul H1b ipoteza alternativa specifica directia diferentei între cele doua medii - o medie este mai mica (mare) decât cealalta datorita unor considerente teoretice. Aceasta situatie necesita un test t unilateral (one-tailed).

Cele doua tipuri de test t utilizeaza aceeasi formula, specificul unilateral vs. bilateral influentând doar valorile comparative prezente în tabelul lui t.

Formula lui t este:

[Image]

Unde: M este media esantionului

          miu este media populatiei din care face parte esantionul;

         EEM este eroarea standard a mediei esantionului;

[Image]

Unde: s este estimarea abaterii standard a esantionului (s=9); n este volumul (marimea) esantionului (n=32)

Înlocuind datele problemei prezentate în formula lui t data mai sus obtinem:

[Image]

Urmatorul pas care trebuie facut dupa calcularea lui t este de a compara valoarea obtinuta cu cea corespunzatoare în tabelul lui t. Daca valoarea calculata este mai mare decât cea din tabel ipoteza nula este respinsa. Pentru aceasta sunt necesari trei pasi:

  1. Stabilirea gradelor de libertate. Numarul de grade de libertate notate cu df se obtine din numarul de subiecti cuprinsi în esantionul de comparatie, asupra caruia se opereaza cu o corectie de deviere. Calcularea gradelor de libertate pentru acesta situatie se face astfel: df = n-1. Pentru exemplul dat avem 31 df (32-1) grade de libertate.
  2. Al doilea pas intermediar este alegerea tipului de situatie a lui t, între t unilateral sau t bilateral. Aceasta alegere se face dependent de cunostintele teoretice implicate în problema. Daca avem motive sa credem datorita unor caracteristici speciale ca media esantionului comparativ este mai mare (sau mai mica) decât media populatiei din care face parte esantionul vom utiliza valorile testului t unilateral din tabel. Daca consideram ca cele doua medii difera semnificativ, fara a putea anticipa ca una ar fi mai mare decât cealalta dintr-o perspectiva teoretica exprimata în ipoteza de lucru vom utiliza valorile lui t bilateral din tabelul lui t. În exemplul dat nu exista nici o premisa care sa ne îndreptateasca sa consideram ca una din medii este mai mare decât cealalta, de aceea vom consulta valorile lui t bilateral.
  3. Stabilirea pragului de semnificatie p. Practica statistica considera necesara stabilirea unui nivel de încredere de maxim 0,05(.05).

Revenind la problema data, urmeaza sa consultam tabelul lui t pentru a compara valoarea obtinuta de noi t=3,14 cu valoarea prezentata în tabel pentru 31 df (grade de libertate) pentru t bilateral la un prag de semnificatie de p£ .05.

Deoarece în tabel nu sunt prezentate valorile lui t pentru 31 df, ne uitam la valoarea cea mai apropiata, dar anterioara acestor grade de libertate. Astfel, la 30 df, valoarea lui t bilateral pentru un p < .05 este 2,042.

Se poate observa ca valoarea obtinuta de noi t=3,14 este mai mare decât valoarea din tabel t=2,042, situatie care se interpreteaza astfel: ipoteza nula este respinsa, ca urmare rezultatele obtinute nu pot fi puse în totalitate pe seama întâmplarii, deci exista o diferenta semnificativa din punct de vedere statistic în ce priveste diferenta dintre cele doua medii. Rezultatul obtinut se noteaza matematic astfel:

t(31)=3,14, p < .05.

Marimea efectului

Verificarea ipotezelor raspunde la întrebarea daca esantionul extras are caracteristici diferite fata de populatia specificata în ipoteza nula. Daca obtinem o diferenta semnificativa statistic ne putem pune o întrebare suplimentara: Cât de mare este aceasta diferenta? Pentru aceasta se calculeaza marimea efectului propus de Cohen si notat cu d.

Indexul marimii efectului pentru testul t în cazul de fata este dependent de datele oferite în problema:

a) Daca se cunoaste abaterea standard a populatiei, iar esantionul comparativ este sub 30 de subiecti (testul t), vom utiliza urmatoarea formula:

[Image]

Unde: M este media esantionului supus comparatiei;

m este media populatiei în ce priveste variabila urmarita;

s este abaterea standard a variabilei de interes la nivelul populatiei.

Daca nu se cunoaste abaterea standard a populatiei, iar esantionul de comparatie are sub 30 de subiecti (testul t) -cazul problemei data exemplu- avem o formula apropiata de calcul a marimii efectului:

[Image]

Unde: M si m au aceeasi semnificatie;

         s reprezinta estimarea abaterii standard a variabilei de interes la nivelul populatiei pornind d la grupul comparativ (în problema data s=9 ).

Putem calcula marimea efectului înlocuind datele problemei prezentate.

[Image]

Interpretarea acestei valori obtinute se face prin raportarea ei la conventia propusa de Cohen si adoptata de cercetatori:

Efect mic d=.20;

Efect mediu d=.50;

Efect mare d=.80

Marimea efectului obtinuta de noi a fost de .55 ceea ce înseamna ca am obtinut o valoare medie. Revenind la întrebare: Cât de mare este aceasta diferenta? Putem afirma ca diferenta statistica are o valoare medie.

Valoarea lui d are o importanta deosebita în determinarea puterii experimentului si în calcularea marimii esantionului necesar pentru a da credibilitate cercetarii efectuate.

Calcularea testului z necesita utilizarea formulei:

[Image]

Unde: M este media esantionului comparat;

          m este media populatiei;

         EEm este eroarea standard a mediei populatiei.

[Image]

Unde: s (sigma) este abaterea standard a populatiei; N este volumul esantionului comparat.

Sa presupunem ca în problema anterioara pe lânga media (m = 76) obtinuta la proba de empatie la nivelul populatiei era specificata si abaterea standard (s = 8).

[Image]

În acest caz, se aplica testul z pentru ca stim valoarea abaterii standard a populatiei , iar volumul esantionului de comparatie n era peste 30 subiecti (n=32).

Interpretarea valorii lui z obtinute se face raportând aceasta valoare la valorile standardizate ale lui z. Spre deosebire de testul t, care necesita consultarea tabelului t în vederea admiterii sau respingerii ipotezei nule, în cazul testului z, valoarea obtinuta se confrunta cu patru valori standardizate:

Testul bilateral: z = 1,96 pentru un p < .05

                        z = 2,58 pentru un p < .01

Testul unilateral: z = 1,65 pentru un p < .05

                         z = 2,33 pentru un p < .01

În cazul de fata am obtinut un z = 3,53, valoare superioara celor prezentate mai sus. Acest fapt înseamna ca ipoteza nula este respinsa, existând o diferenta semnificativa între mediile celor doua grupe de subiecti care nu poate fi datorata în întregime întâmplarii.

Si în acest caz poate fi calculata marimea efectului, formula fiind asemanatoare cu prima cu exceptia înlocuirii abaterii standard a esantionului comparat (s) cu abaterea standard a populatiei (s ).

[Image]

Interpretarea lui d se face asemanator cu modelul explicat anterior. Putem trage concluzia ca rezultatul obtinut, d=0,62, înseamna un efect de valoare medie.

Testele t si z pentru doua esantioane independente

Testele t si z aplicate anterior pentru a determina daca un esantion difera de o populatie nu se aplica prea frecvent. Mai des sunt utilizate testele z si t pentru esantioane independente pentru a determina daca mediile a doua esantioane difera semnificativ.

Doua probleme trebuie clarificate de la început. Când aplicam testul t si când aplicam testul z? Cum diferentiem esantioanele independente de cele dependente?

La prima întrebare, utilizam aceleasi criterii prezentate în cazul unui singur esantion comparat cu o populatie anume. Se iau în considerare cunoasterea abaterii standard a celor doua esantioane si a volumului acestora. În cazul esantioanelor dependente sau independente, prima conditie este atinsa mult mai usor, de aceea criteriul hotarâtor în alegerea tipului de test (t sau z) este volumul esantionului. Exista conform teoremei limita centrala o evolutie a distributiei datelor în functie de numarul de subiecti. Se considera si se accepta de majoritatea cercetatorilor, ca un esantion de 30 de subiecti sau mai mult are o distributie normala a datelor z. Un numar mai mic de 30 de subiecti determina o distributie asimetrica a datelor de tip t. Chiar daca se utilizeaza o împartire grosiera, s-a stabilit de catre cercetatori urmatoarea clauza pentru cazul a doua esantioane:

  1. Daca n1 < 30 (numarul de subiecti din prima grupa) si n2 < 30 (numarul de subiecti din a doua grupa) se aplica testul t.
  2. Daca n1 ³ 30 si n2 ³ 30 se aplica testul z.

În ce priveste diferentierea între testele independente si dependente, aceasta se face în functie de natura esantionului cuprins în experiment. Apar doua situatii:

  1. Daca cele doua esantioane sunt alese la întâmplare pe baza situatiei lor naturale (ex. Doua clase paralele, doua grupe de vârsta etc) se utilizeaza testele independente.
  2. Daca cele doua esantioane sunt în relatie unul cu celalalt prin interventia experimentatorului se utilizeaza testele dependente. Uzual, exista doua situatii în care avem de a face cu esantioane dependente:

Testul t independent

Exemplu: Un cercetator doreste sa studieze daca strategiile sintetice conduc la rezultate diferite fata de strategiile analitice în ce priveste deprinderea citirii la elevii de clasa I. El utilizeaza în acest sens 2 clase (esantioane) de câte 15 elevi fiecare, în care deprinderea citirii s-a facut diferit (într-o clasa analitic, în cealalta sintetic). Variabila dependenta din acest studiu a constat într-o proba de performanta de citire (numar de cuvinte pe minut / numarul de erori).

Primul grup de elevi a fost învatat sa citeasca analitic (începând cu litera si terminând cu cuvântul) a obtinut o medie de 12,4 cuvinte/minut si o abatere standard de 1,5. Cel de-al doilea grup a fost învatat sa citeasca într-o maniera sintetica (pornind de la asocierea cuvântului cu o imagine pentru fiecare litera). S-a obtinut o medie de 10 cuvinte pe minut si o abatere standard de 0,9. Se pune problema daca exista o diferenta semnificativa între cele doua medii, implicit între cele doua strategii de învatare a citirii.

Pentru a rezolva aceasta problema trebuie sa identificam mai întâi metoda statistica care trebuie utilizata. Observam ca grupele sunt independente, ca numarul subiectilor din fiecare grupa este mai mic decât 30, ca urmare putem utiliza testul t independent.

[Image]

Unde: M1 si M2 reprezinta mediile celor doua esantioane; EEM1-M2 reprezinta eroarea standard a diferentei dintre cele doua medii.

[Image]

Unde: s1² reprezinta dispersia primului grup (abaterea standard la patrat); s2² reprezinta dispersia celui de-al doilea grup; n1 - numarul de subiecti din primul grup; n2 - numarul de subiecti din al doilea grup.

Daca n1 este egal n2 avem o formula (a), aplicabila si în exemplul oferit, daca n1 este diferit de n2 vom utiliza o alta formula (b).

a)

[Image]

(b) Pentru n1 diferit de n2 avem:

[Image]

În cazul problemei date referitoare la deprinderea de a citi în clasa I dupa cele doua metode, numarul de elevi din cele doua esantioane este egal (n1=n2=15), de aceea vom aplica una din cele doua formule de calcul a erorii standard a diferentelor dintre medii (nu si formula prezentata la punctul b). Deoarece se cunosc dispersiile (patratul abeterii standard) si mediile esntioanelor la proba de performanta vom aplica prima formula, pe care o vom integra în formula de calcul al testului t independent.

[Image]

Dupa calcularea lui t independent va trebui sa comparam valoarea obtinuta cu valoarea data în tabelul lui t. Pentru aceasta sunt necesari pasii intermediari descrisi în cazul lui t pentru un esantion:

  1. Stabilirea gradelor de libertate (pentru a cunoaste valoarea din tabel a lui t care va fi comparata cu valoarea obtinuta de noi). Calcularea gradelor de libertate pentru testul t independent se face astfel: df = (n1 + n2) - 2. În cazul de fata avem 28 df (15 + 15 - 2) grade de libertate.

  2. Al doilea pas intermediar este alegerea tipului de situatie a lui t, adica avem un test t unilateral sau bilateral. În acest caz se utilizeaza testul t independent bilateral. Daca cercetatorul dorea sa demonstreze ca strategia analitica este mai eficienta decât cea sintetica (sau invers), adica M1 > M2 sau M1 < M2 s-ar fi aplicat testul t independent unilateral.

  3. Stabilirea valorii lui t conform pragului de semnificatie ales. Practica statistica considera necesara stabilirea unui nivel de încredere de maximum 0,05(.05).

Urmarind în tabel valoarea lui t bilateral pentru 28 df si p de .05, gasim valoarea 2,048. Deoarece valoarea gasita de noi t= 5,314 este mult mai mare decât cea din tabel respingem ipoteza nula Ho: M1 = M2 si concluzionam ca exista o diferenta semnificativa statistic în ce priveste performantele elevilor în citire în functie de strategia adoptata în învatarea citirii de catre copii. Matematic vom scrie:

t(28) = 5,314, p< .05 test bilateral.

Inspectând datele problemei se constata ca elevii care au utilizat strategia analitica în deprinderea citirii, au obtinut rezultate mai bune la citire decât grupul de elevi care au utilizat o strategie globala (sintetica) în deprinderea citirii.

Deoarece rezultatul obtinut (5,314) este mai mare decât valorile tabelare a lui t pentru p =.02 (2,467); p=.01 (2,763); sau p=.001 (3,674) putem prezenta rezultatul obtinut ca fiind semnificativ si la acesta din urma valoare (exista 1 la 1000 sanse ca rezultatul obtinut sa se datoreze întâmplarii). În acest caz notam: t(28) = 5,314, p< .001 test bilateral.

În cazul în care numarul de subiecti din cele doua grupe nu era egal (n1 ¹ n2) am fi aplicat o alta formula pentru calculul lui t (formula ce includea dispersiile celor doua grupe sau formula prezentata la punctul b). Dupa aflarea valorii lui t, se urmareste acelasi algoritm prezentat mai sus.

Marimea efectului

Ea ofera informatii importante pe care testul t nu le ofera. Acesta din urma arata doar daca ipoteza nula este respinsa si daca exista sau nu o diferenta semnificativa între mediile celor doua grupe de subiecti. Marimea efectului arata care este efectul variabilei independente în determinarea diferentei dintre medii. În cazul testului t independent avem mai multe formule de calcul ale marimii efectului (d):

[Image]

Unde : M1 si M2 sunt mediile celor doua grupe de subiecti; s înseamna estimarea abaterii standard (la numnaratorul lui s vom avea N-1).

Întrebarea care se pune este care abatere standard trebuie aplicata. Exista o mare controversa între statisticieni. Unii cred ca trebuie utilizata abaterea standard a grupului de control daca acesta exista.

Atunci când nu exista un grup de control (cazul exemplului nostru), se recomanda utilizarea unor formule mediate de abatere standard.

a) daca n1 = n2, atunci:

[Image]

Unde: M1 si M2 sunt mediile celor doua grupe; n1 este numarul de subiecti dintr-o grupa (n1 egal cu n2); s1² si s2² sunt dispersiile celor doua grupe (abaterile standard la patrat).

În cazul problemei oferite drept model se observa ca cele doua esantioane sunt egale (n1 = n2) si nu exista un grup de control (strategii analitice vs. strategii sintetice). Astfel vom obtine:

[Image]

Interpretarea lui d se face identic cu cea prezentata în cazul lui t pentru un esantion. Se observa în acest sens ca valoarea obtinuta înseamna un efect mare al variabilei independente (strategii analitice vs. sintetice) în determinarea rezultatelor la proba performantiala de citire.

b) daca n1 ¹ n2 se utilizeaza o alta formula de calcul a abaterii standard mediate:

[Image]

Unde: s1 si s2 sunt dispersiile grupelor 1 respectiv 2; N1 si n2 sunt numarul de subiecti din grupele 1, respectiv 2.

Pentru a calcula d (marimea efectului) în acest caz se înlocuieste simbolul s de la numitor cu formula prezentata mai sus.

Testul z pentru esantioane independente

În situatia în care n1 > 30 si n2 > 30 si a doua esantioane independente aplicam testul z. Formula de calcul este:

[Image]

Dupa cum se observa formula de calcul a lui z în aceasta situatie este identica cu cea a lui t independent pentru n1 = n2. Spre deosebire de testul t independent, testul z are aceeasi formula si în cazul în care n1 ¹ n2.

Rezultatul obtinut este comparat cu cele doua valori standardizate z (1,96 pentru p < .05, respectiv 2,58 pentru p < .01 pentru testul bilateral, respectiv cu 1,65 pentru p < .05, respectiv 2,33 pentru p < .01 pentru testul unilateral). Algoritmul rezolvarii problemelor care necesita testul z este asemanator cu cel prezentat în cazul lui z pentru un esantion.

OBSERVATII: Se observa ca formula pentru testul z este identica cu cea a testului t independent pentru esantioane egale. De altfel, tendinta ultimilor ani este de a înlocui testul z cu testul t. Acestea sunt si recomandarile revistelor de cercetare stiintifica patronate de Asociatia Psihologilor Americani. Tot în acest sens programe de statistica computerizate precum SPSS au renuntat la testul z în favoarea testului t.

Testul t poate fi utilizat prin formulele prezentate mai sus si în cazul esantioanelor mai mari decât 30 de subiecti fiecare.

Testele t si z pentru esantioane dependente

Pâna acum am luat în considerare utilizarea testelor t si z pentru a evalua daca un esantion difera de populatia din care se presupune ca face parte (testele t si z pentru un esantion) si situatia compararii a doua esantioane independente (testele t si z independent).

O a treia aplicatie este cazul a doua esantioane dependente. Aceasta înseamna ca elementele componente ale celor doua grupe sunt în relatie de corespondenta.

Exista trei situatii în care se aplica testele de comparatie dependente (corelate):

  1. Perechile naturale: acestea nu sunt realizate de experimentator ci exista în mod natural. Spre exemplu, o cercetare care ar privi nivelul de rasism pe doua grupe de subiecti de sex masculin: o grupa formata din tati, iar o alta din fiii lor. Acestia trebuie grupati în concordanta astfel încât fiecarui tata sa-i corespunda fiul sau. Apropiat de aceasta situatie este si studiul gemenilor care trebuie împartiti în mod randomizat în doua grupe. Diferenta care apare între cele doua exemple este data de simetria relatiei gemenilor (care pot fi împartiti aleator în grupe, pastrând însa criteriul familial) si asimetria relatiei tata-fiu (care trebuie sa fie separati în doua grupe tati, respectiv fii, pastrând însa acelasi criteriu familal).

  2. Perechile artificiale: acestea sunt realizate de catre experimentator pentru a egaliza cât mai mult grupele de subiecti. Daca un cercetator doreste sa studieze efectul atmosferei de lucru asupra rezolvarii de probleme, el poate decide sa împarta subiectii pe grupe în perechi. Criteriul de divizare are la baza rezultatul obtinut la testul de inteligenta deoarece acest factor influenteaza capacitatea de rezolvare a problemelor. Pentru aceasta cercetatorul ia primii doi subiecti în ce priveste nivelul de inteligenta si îi împarte randomizat în cele doua grupe (o grupa care lucreaza într-o atmosfera amiabila; cealalta grupa care va lucra într-o atmosfera tensionanta); apoi trece la urmatorii doi subiecti din perspectiva rezultatelor la testul de inteligenta pe care-i împarte în cele doua grupe. Se continua algoritmul pâna sunt divizati toti subiectii. Este necesar un numar par de subiecti, astfel încât grupele obtinute sa fie egale ca volum.

  3. Masuratori repetate: reprezinta cazurile mai des întâlnite în special în terapie si recuperare. Este vorba în aceasta situatie de un singur grup de subiecti care vor fi testati de doua ori (înainte si dupa introducerea variabilei independente). Pentru clarificare vom prezenta o problema care necesita utilizarea testului t dependent si care se încadreaza în aceasta ultima categorie amintita.

Testul t dependent

(n1 < 30 si n2 < 30)

Un cercetator doreste sa studieze influenta metodelor de relaxare asupra reducerii conduitelor agresive la adolescenti. O grupa de 12 subiecti cu tulburari comportamentale este testata initial (pre-test) în ce priveste nivelul agresivitatii. Dupa acest moment, cei 12 adolescenti sunt învatati sa practice relaxarea si urmeaza sedinte de relaxare de câte 1 ora de 5 ori pa saptamâna.

Dupa o perioada de 2 luni subiectii sunt retestati (post-test) utilizând aceeasi proba pentru a observa daca nivelul lor de agresivitate a scazut în urma practicarii metodelor de relaxare.

Prezentam mai jos datele obtinute de cei 12 adolescenti la chestionarul de agresivitate pe parcursul celor doua testari.

Subiectul

Pre

Post

Pre-Post

Diferenta²

1

21

15

6

36

2

18

13

5

25

3

15

16

-1

1

4

11

13

-2

4

5

24

13

11

121

6

23

12

11

121

7

17

11

6

36

8

19

10

9

81

9

19

15

4

16

10

17

17

0

0

11

20

14

6

36

12

15

16

-1

1

M1=18,25 M2=13,75                      S d= 54 S d patrat=478

Formula lui t dependent este:

[Image]

Unde: M1 si M2 sunt mediile celor doua grupe;

          EEd este eroarea standard a diferentei (d)

Pentru a calcula EEd utilizam una din formulele:

[Image]

Unde: d este diferenta dintre pre-test si post-test, între pozitia unu în prima grupa si pozitia unu din a doua grua s.a.m.d.;

          N este numarul de perechi de subiecti (în cazul problemei date 12).

sau

[Image]

Unde: s1 patrat si s2 patrat sunt dispersiile celor doua grupe;

         n1 si n2 sune egale si reprezinta numarul de perechi de subiecti;

         r12 este coeficientul de corelatie între datele celor doua grupe; s1 si s2 sunt abaterile standard a celor doua grupe.

Observând datele care ne sunt cunoscute în problema trebuie sa calculam t dependent utilizând prima formula a lui EEd.

[Image]

Dupa calcularea lui t dependent va trebui sa comparam valoarea obtinuta cu valoarea data în tabelul lui t. Pentru aceasta vom utiliza acelasi algoritm descris în cazul lui t pentru un esantion si t independent:

  1. Stabilirea gradelor de libertate (pentru a cunoaste valoarea din tabel a lui t care va fi comparata cu valoarea obtinuta de noi). Calcularea gradelor de libertate pentru testul t dependent se face astfel: df = n-1. În cazul de fata avem 11 df (12 perechi de date - 1) grade de libertate.
  2. Al doilea pas intermediar este alegerea tipului de situatie a lui t, adica avem un test t unilateral sau bilateral. Observam ca cercetatorul a presupus ca metodele de relaxare vor conduce la scaderea nivelului agresivitatii. Ipoteza de lucru (alternativa) este: H1: M1 > M2, în timp ce ipoteza nula este M1 = M2. În acest caz se utilizeaza testul t independent unilateral. Daca cercetatorul dorea sa demonstreze ca nivelul agresivitatii înainte de utilizarea relaxarii este diferit de nivelul agresivitatii post-test adica M1 ¹ M2 ca ipoteza de lucru, atunci s-ar fi aplicat testul t independent bilateral.
  3. Urmarirea valorii lui t conform pragului de semnificatie ales. Practica statistica considera necesara stabilirea unui nivel de încredere de maxim 0,05(.05).

Se compara valoarea obtinuta de noi t=0,973 cu cea exprimata în tabelul de distributie a lui t unilateral pentru 11 df (grade de libertate) si un prag de semnificatie stabilit de p< .05. Valoarea din tabel este de 1,796 (mai mare decât valoarea gasita de noi) ceea ce înseamna ca ipoteza nula nu poate fi respinsa, deci nu s-a gasit o diferenta semnificativa statistic între cele doua grupe. Transpusa la problema de fata înseamna ca relaxarea nu a avut un efect semnificativ în reducerea nivelului agresivitatii.

Marimea efectului.

Se calculeaza si în cazul testului t dependent dupa urmatoarea formula:

[Image]

Algoritmul de interpretare a marimii efectului (d) este asemanator cu cel prezentat la celelalte categorii de test t descrise anterior. Trebuie însa reamintit ca acest index al efectului variabilei independente asupra celei dependente se calculeaza numai în situatiile în care testul t a fost semnificativ, iar ipoteza nula a fost respinsa.

În cazul problemei date anterior nu putem calcula marimea efectului deoarece rezultatul obtinut de noi nu a fost semnificativ statistic.

Testul z dependent

(n1 > 30; n2 > 30)

Acesta poate fi utilizat în cazul esantioanelor mai mari de 30 de subiecti fiecare. În aceasta situatie EEd (eroarea standard a diferentei se calculeaza utilizând formula prezentata pentru t dependent care contine coeficientul de corelatie r12.

Interpretarea rezultatului obtinut se face dupa acelasi algoritm prezentat si la celelalte teste z pentru un esantion si doua esantioane independente.

Consideratiile facute în cazul testului z independent cu privire la tendinta actuala de a înlocui testul z cu testul t chiar în cazul esantioanelor mai mari de 30 de subiecti ramâne valida si pentru testelor dependente.

Asumptiile distributiei t

Pentru ca testele t studiate în acest capitol sa fie aplicate trebuie îndeplinite mai multe conditii:

Testul t pentru un esantion

  1. Esantionarea sa fie simpla aleatoare;
  2. Datele masurate sa fie pe scala de interval sau raport;
  3. Rezultatele variabilei dependente sa fie normal distribuite (în cazul în care n este mai mic de 30, se urmareste forma distributiei datelor, astfel încât indicatorii de oblicitate (skewness) si de boltire (kurtosis) sa fie cât mai apropiate de zero (maxim doi).

    Testul t pentru doua esantioane independente

    Ramân valabile primele trei asumptii la care se adauga înca doua:

  4. Independenta grupurilor;
  5. Omogenitatea variantei, adica grupurile trebuie sa provina din esantioane cu dispersii egale (raportul lor sa fie cât mai apropape de unu).

Testul t pentru doua esantioane dependente

Ramân valabile primele trei asumptii la care se adauga o conditie suplimentara.

4. Normalitatea diferentelor dintre scorurile obtinute la pre-test si post-test. Aceasta se constata pe baza consultarii indicatorilor de oblicitate (skewness) si de boltire (kurtosis).

PROBLEME

  1. Cititi valorile tabelare ale lui t pentru:
    a) alfa = .01 df = 17 (t bilateral);

           b) alfa = .05 df = 26 (t bilateral);

          c) alfa = .05 df = 7 (t unilateral).

2. Daca un cercetator alege sa utilizeze un nivel alfa de .01 ¾n locul unui alfa de .05 ¾nseamna ca el stabileste un criteriu:

a) mai conservator; b) la fel de strict; c) mai permisiv.

3. Valoarea medie pentru populatia pe care s-a etalonat o proba de extraversie este de 50, iar abaterea standard este 10,2. Sa presupunem ca 16 persoane care lucreaza în comert cu succes au obtinut o medie de 56,10 si o abatere standard de 10 la acelasi test. Calculati testul t si scrieti concluziile.

4. Un grup de 49 de subiecti au participat timp de un an de zile la un program de promovare a drepturilor minoritatilor. La final au fost rugati sa completeze o scala de evaluare a atitudinilor fata de minoritati. Au obtinut o medie de 12,50 si o abatere de 3. La nivelul populatiei generale media a fost de 12 si abaterea de 2. Utilizati metoda adecvata pentru a verifica ipoteza urmatoare: programul a fost eficient (a crescut toleranta fata de minoritati), existând diferente în plan atitudinal între cele doua rezultate la un prag p de .05.

5. Pentru situatia prezentata la punctul 4, calculati marimea efectului.

6. Identificati variabilele independente si cele dependente în urmatoarele situatii:

  1. comparati persoanele cu o personalitate de tip A fata de cea de tip B, în ce priveste gradul de satisfactie în viata;
  2. comparati o metoda didactica noua cu una veche din perspectiva randamentului scolar.

    7. Stabiliti numarul de grade de libertate adecvate pentru testul t în cazul a doua esantioane independente:

a) N b) N-1 c) N1+N2-2 d) N-2

8. Stabiliti numarul de grade de libertate adecvate pentru testul t în cazul a doua esantioane dependente:

a) N b) N-1 c) N1+N2-2 d) N-2

9. Decideti daca în urmatoarele cazuri avem nevoie de un test t independent sau de un test t dependent:

  1. compararea rezultatelor la proba de audiometrie pentru fiecare ureche utilizând aceeasi subiecti;
  2. compararea rezultatelor la audiometrie în conditiile în care o parte a subiectilor au fost testati aleator la urechea stânga, cealalta parte fiind evaluata la urechea dreapta;
  3. comparati stilul de comunicare la gemeni, în conditiile în care acestia au fost despartiti în doua grupe diferite echivalente;
  4. comparati capacitatea de rezolvare a problemelor, în conditiile în care cele doua grupe au fost formate pe baza unui test de inteligenta dat anterior pentru a egaliza grupele din perspectiva acestui criteriu.

10. Stabiliti daca valoarea t sau z este semnificativa statistic în conditiile a doua esantioane independente si în cazul testului bilateral:

  1. n1 = 23; n2 = 23; s1 = 4; s2 = 5; m1 = 14,5; m2 = 12,8;
  2. n1 = 32; n2 = 31; s1 = 6; s2 = 5; m1 = 20,1; m2 = 23,4;
  3. n1 = 31; n2 = 29; s1 = 2; s2 = 2; m1 = 11; m2 = 11,9;

d)

A

7

8

6

8

9

7

8

6

8

6

B

6

7

5

6

7

6

7

6

6

5

e)

A

7

8

6

8

9

7

8

6

8

6

B

6

7

5

6

7

6

7

6

   

11. Stabiliti daca valoarea t sau z este semnificativa statistic în conditiile a doua esantioane corelate (dependente) în care:

a) n1 = 28; n2 = 28; s1 = 6; s2 = 5; m1 = 20,1; m2 = 23,5; r = -.61;

b)

A

34

22

25

31

27

32

29

26

B

38

19

36

40

36

31

36

37

c). n1 = 36; n2 = 36; s1 = 1; s2 = 1; m1 = 7; m2 = 6; r = .41.

I. TEHNICI STATISTICE: Statistica descriptiva, Studiul corelational, Metode de comparatie, Tabele, Formule si raspunsuri la intrebari, Bibliografie recomandata
II. APLICATII STATISTICE: Baze de date - Exemple
III. TESTE
IV. LINK-URI RECOMANDATE

PAGINA DE START
afsava@socio.uvt.ro