Date post: | 05-Jul-2015 |
Category: |
Documents |
Upload: | iulia-mati |
View: | 396 times |
Download: | 1 times |
GIRU Lecţia 8GIRU Lecţia 8
Elemente de analiză statisticăTerminologii statistice şi înţelegerea unor elemente Terminologii statistice şi înţelegerea unor elemente fundamentale de statistică fundamentale de statistică Caracteristicile statisticeCaracteristicile statistice reprezintă însuşirile fenomenelor reprezintă însuşirile fenomenelor studiate. Astfel putem deosebi caracteristici variabile ca formă studiate. Astfel putem deosebi caracteristici variabile ca formă de manifestare sau ca nivel de dezvoltare.de manifestare sau ca nivel de dezvoltare.
Caracteristicile statistice care pot avea mai mult decât o Caracteristicile statistice care pot avea mai mult decât o singură valoaresingură valoare cu care variază în funcţie de o serie de factori cu care variază în funcţie de o serie de factori se mai numesc şi se mai numesc şi variabile statisticevariabile statistice iar formele de manifestare iar formele de manifestare ale acestor caracteristici se numesc ale acestor caracteristici se numesc variantevariante..
Variabilele pot fi:Variabilele pot fi: dependentedependente dacă sunt spuse influenţei altor variabile; dacă sunt spuse influenţei altor variabile; independenteindependente dacă sunt variabile ce influenţează alte dacă sunt variabile ce influenţează alte
variabile;variabile; continuecontinue dacă au un număr infinit al nivelurilor de dacă au un număr infinit al nivelurilor de
măsurare;măsurare; discretediscrete dacă au un număr finit al nivelurilor de măsurare dacă au un număr finit al nivelurilor de măsurare
Elemente de analiză statisticăScalele de măsurareScalele de măsurare se referă la modalitatea de măsurare. Programul SPSS utilizează următoarele scale de măsurare:Programul SPSS utilizează următoarele scale de măsurare:
ScalăScală – valorile numerice ale datelor se reprezintă pe un interval sau printr- un raport. Exemplu: vârsta, venitul, temperatura, lungimea, timpul de răspuns. Variabilele reprezentate şi măsurate pe scală trebuie să aibă valori numerice.
NominaleNominale – se utilizează atunci când valorile datelor unei variabile reprezintă valori de ordin neintrinsec în funcţie de existenţa sau inexistenţa unei caracteristici. Exemplu: apartenenţa la o anumită categorie de funcţii de încadrare sau sexul: 1 – masculin, 2 – feminin.
OrdinaleOrdinale (de ordin sau de rang) – se folosesc atunci când valorile datelor reprezintă categorii de ordin intrinsec care pot fi puse într-o anumită ordine de măsurare. Exemplu nivelul de pregătire: scăzut, mediu, înalt.
Elemente de analiză statisticăMărimile medii, indicatorii variaţiei şi asimetriei
Mărimile mediiMărimile medii
În analiza statistică se utilizează foarte frecvent mărimile medii, deoarece pe baza lor se poate exprima într-o anumită măsură tendinţa unor fenomene.
Acestea sunt: media aritmetică, media armonică, media pătratică şi media geometrică.
Toate aceste medii se pot calcula ca medii simple sau ca medii ponderate.
Elemente de analiză statisticăValorile medii de poziţie şi de structură
Cele mai frecvent utilizate valori medii de poziţie şi de structură sunt: mediana, modulul, cuartilele şi decilelemediana, modulul, cuartilele şi decilele.
MedianaMedianaMediana (Me) reprezintă valoarea centrală a unei serii statistice care împarte termenii unei seriei în două părţi egale. Jumătatea inferioară va conţine termenii ale căror valori sunt mai mici decât valoarea medianei iar jumătatea superioară va conţine termenii care au o valori mai mari decât valoarea medianei.
ModululModululModulul (Mo) reprezintă valoarea termenului dintr-o serie care are frecvenţa maximă.
Elemente de analiză statisticăValorile medii de poziţie şi de structură
Cuartile, decileCuartile, decile
Pentru seriile cu asimetrie mare şi care au o amplitudine mare a Pentru seriile cu asimetrie mare şi care au o amplitudine mare a variaţiei se calculează şi alţi indicatori de poziţie cum sunt: variaţiei se calculează şi alţi indicatori de poziţie cum sunt: quartilele, decilele, centilele şi percentilele.quartilele, decilele, centilele şi percentilele.
QuartileleQuartilele sunt acele valori ale termenilor care separă seria în sunt acele valori ale termenilor care separă seria în patru părţi egale. Deosebim astfel quartila inferioară (Q1) care patru părţi egale. Deosebim astfel quartila inferioară (Q1) care delimitează sfertul inferior (25%) al termenilor, quartila a doua delimitează sfertul inferior (25%) al termenilor, quartila a doua (medie) (Q2) care este egală cu mediana deoarece împarte (medie) (Q2) care este egală cu mediana deoarece împarte termenii în două părţi egale (50%) şi quartila superioară (Q3) care termenii în două părţi egale (50%) şi quartila superioară (Q3) care delimitează sfertul superior (75%). delimitează sfertul superior (75%).
În mod similar În mod similar decilele decilele împart seria în 10 părţi egale iar împart seria în 10 părţi egale iar centilelecentilele în 100 de părţi egale. Rezultă că vor exista 9 decile şi 99 centile.în 100 de părţi egale. Rezultă că vor exista 9 decile şi 99 centile.
Programul SPSS. Analze şi aplicaţii
DescDescăărcarea produsului:rcarea produsului:
http//http//80.96.80.180/decizie80.96.80.180/decizie
SAU
http//www.comunicare.ro/resurse/SPSS16.0EvalVersion-a.exehttp//www.comunicare.ro/resurse/SPSS16.0EvalVersion-a.exe
Programul SPSS. Analze şi aplicaţii
Încărcarea, editarea şi transformarea datelor. Componenta Încărcarea, editarea şi transformarea datelor. Componenta
Data EditorData Editor
În SPSS tabela bazei de date este împărţită în linii şi coloane.
Liniile reprezintă înregistrările acesteia sau cazurile (cases)
cum sunt denumite în SPSS.
Coloanele (câmpurile) reprezintă variabilele distribuţiei. În
celulele de intersecţie se află valorile corespunzătoare
variabilelor pentru fiecare caz (case).
Elemente de analiză statisticăRelaţiile dintre două sau mai multe variabile
Tabele şi diagrame
Analize statisice: O analiză univariantă ce poate fi utilizată pentru
analiza, practic a oricăror date. Totuşi, o mare
parte a cercetării studiază relaţiile dintre două sau
mai multe variabile.O analiză statistică bivariantă completă a datelor,
necesită studierea tendinţelor fundamentale ale
datelor utilizând tabele şi diagrame.
Metodele de prezentare a relaţiilor bivariante, includ
crearea tabelelor de asociere, histograme compuse
(diagrame cu bare grupate) şi diagrame scatter.
Elemente de analiză statisticăRelaţiile dintre două sau mai multe variabile
Tabele şi diagrame
Tipul tabelului sau diagramei, care este cel mai
eficient pentru comunicarea relaţiilor dintre date,
depinde foarte mult de tipul datelor implicate.
Două variabile numerice, în general, vor fi cel mai
eficient prezentate sub forma unei diagrame scatter.
Două variabile nominale sunt prezentate sub forma
unui tabel de asociere.
Elemente de analiză statisticăRelaţiile dintre două sau mai multe variabile
Tabele şi diagrameExemplu: Elaborarea unui tabel de asociere şi a unei diagrame cu bare compusă. Aceasta va prezenta numărul de barbaţi şi femei care au fost spitalizaţi sau nu anterior.
Bărbaţi Femei
Spitalizaţi 20 25
Nespitalizaţi 30 14
Elemente de analiză statisticăRelaţiile dintre două sau mai multe variabile
Tabele şi diagrame
Rezolvare:1. Introducerea datelor
- Definirea variabilelor in modul de lucru Variable ViewVariable View din Data View.Data View.- Etichetarea celor două valori pentru stare_pacient si gen.- Trecerea în modul de lucru Data ViewData View din Data EditorData Editor.
2. Ponderarea datelor în funcţie de frecvenţă- Se activează DataData şi se selectează Weight CasesWeight Cases...- Se selectează frecvenţa şi se bifează caseta Weight cases by.Weight cases by.
3. Crearea tabelelor asociate- Se selectează Analyze-Tables- Basic –Tables...Analyze-Tables- Basic –Tables...
4. Afişarea frecvenţelor cu procentaj din numărul total- Analyze-Tables- Basic –Tables...- Statistics...- Tables% - Add –Analyze-Tables- Basic –Tables...- Statistics...- Tables% - Add – Continue –OK.Continue –OK.
Elemente de analiză statisticăRelaţiile dintre două sau mai multe variabile
Tabele şi diagrame Rezolvare:
5. Afişarea frecvenţelor cu procentaj din suma coloanei- Analyze – Tables - Basic –Tables...- Statistics...- Col% - Add –Analyze – Tables - Basic –Tables...- Statistics...- Col% - Add –
Continue –OK.Continue –OK.
Dacă se adună procentele de pe fiecare coloană, ele vor însuma
100%.100%.
6. Diagrama procentuală compusă cu bare (suprapuse).
- Se introduc cifrele de procentaj (col. numită ColPerCentColPerCent) pentru
cele două bare şi se ponderează.
- Se selectează opţiunea Graphs – Bar... – Stacked – DefineGraphs – Bar... – Stacked – Define
- Se selectează stare_pacient şi se activeatză butonul de pe langă
eticheta Category Axis Category Axis şi apoi Butonul şi apoi Butonul OKOK..
Elemente de analiză statisticăRelaţiile dintre două sau mai multe variabile
Tabele şi diagrame Rezolvare:
7. Histogramă compusă (diagramă cu bare grupate). - Se ponderează cazurile după frecventă Se activează DataData şi se selectează Weight CasesWeight Cases... Se selectează frecvenţa şi se bifează caseta Weight cases by.Weight cases by.
- Se selectează opţiunea Graphs – Bar... – Clustered – DefineGraphs – Bar... – Clustered – Define.
- Se selectează Stare_pacientStare_pacient şi se activeatză butonul de pe langă eticheta Category AxisCategory Axis.
-- Se selectează GenulGenul şi apoi butonul de pe lângă eticheta Define Define StacksStacks.
- Se selectează % of cases% of cases şi apoi OKOK.
Elemente de analiză statisticăCoeficienţi de corelaţie
Coeficienţii de corelaţie Pearson şi Spearman
Există mai mulţi coeficienţi de corelaţie. Dar cel mai comun şi cel mai folositor este pe departe coeficientul de corelaţie PearsonPearson.Un coeficient de corelaţie este o măsură numerică sau un indice al grdului de asociere între două seturi de scoruri. Intervalul de valori este de la maximum +1,00, prin 0,00, pînă la -1,00.Semnul „+“ indică o corelaţie pozitivă, adică scorurile unei variabile se măresc odată cu creşterea scorurilor celeilalte variabile. Semnul „–“ indică o corelaţie negativă, adică în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă descresc.Coeficientul de corelaţie Pearson presupune o relaţie în linie Coeficientul de corelaţie Pearson presupune o relaţie în linie dreaptă între două variabiledreaptă între două variabile.Diagrama scatter prezintă, de regulă, datele incluse într-un coeficient de corelaţie.
Elemente de analiză statisticăCoeficienţi de corelaţie
Coeficienţii de corelaţie Pearson şi Spearman
O corelaţie de 1,00corelaţie de 1,00 indică o asociere perfectă între două variabile. Cu alte cuvinte, o diagramă scutter a celor două variabile va arăta că toate punctele sunt conţinute de o singură dreaptă. O valoare de 0,00valoare de 0,00, indică faptul că toate punctele din diagrama scutter sunt dispersate aleatoriu în jurul oricărei drepte desenate pe această diagramă a datelor sau sunt aranjate într-o manieră curbilinie. O corelaţie de -0,5-0,5 ar indica o relaţie moderat negativă între cele două variabile.Coeficientul SpearmanCoeficientul Spearman este coeficientul de corelaţie Pearson aplicat unor scoruri, după ce acestea au fost ordonate crescător pentru cele două variabile în parte. Este folosit atunci când premisele coeficientului de corelaţie Pearson nu sunt îndeplinite de către date. Această situaţie se petrece, în special, în momentul în care scorurile pentru o variabilă au o asimetrie pronunţată.
Elemente de analiză statisticăCoeficientul de corelaţie Pearson
Coeficientul de corelaţie PearsonCoeficientul de corelaţie Pearson se va utiliza atunci când se doreşte
măsurarea valorilor a două variabile din acelaşi eşantion pentru a se afla
dacă între acestea există o relaţie şi care este intensitatea relaţiei.
Dacă relaţia există, vom deosebi două feluri de corelaţie: pozitivă şi corelaţie: pozitivă şi
negativă.negativă.
Corelaţia este pozitivăCorelaţia este pozitivă atunci când creşterea valorilor unei variabile
determină creşterea valorilor celeilalte variabile.
Corelaţia negativăCorelaţia negativă apare atunci când creşterea valorilor unei variabile
determină scăderea valorilor pentru a doua variabilă.
Felul corelaţiei se exprimă prin semnul coeficientului de corelaţie Felul corelaţiei se exprimă prin semnul coeficientului de corelaţie
Pearson (r)Pearson (r),, iar intensitatea legăturii dintre cele două variabile se
exprimă prin valoarea acestuia. Cu alte cuvinte atunci când avem o
valoare pozitivă a lui r spunem că între variabile există o corelaţie
pozitivă şi invers. Cu cât valoarea lui r este mai mare cu atât legătura Cu cât valoarea lui r este mai mare cu atât legătura
dintre variabile este mai puternicădintre variabile este mai puternică.
Elemente de analiză statisticăCoeficientul de corelaţie Pearson
N
N
iyx zz
1
r =
N
N
iyx zz
1
Expresia coeficientului de corelaţie este:
unde
rr este coeficientul de corelaţie pentru variabilele x şi y;
zzxx este scorul z al variabilei x;
zzyy este scorul z al variabilei y;
N N este volumul eşantionului.
Este de reţinut faptul că valorile lui r pot varia doar în intervalul [-1, +1].valorile lui r pot varia doar în intervalul [-1, +1].
Numărul gradelor de libertate df = N – 2df = N – 2. Atunci când se analizează corelaţia se va
alege şi un nivel de risc acceptat (în mod convenţional 5%) sau un nivel minim de
încredere (în mod convenţional 95%).
O reprezentare grafică interesantă a corelaţiei poate fi obţinută în SPSS prin
intermediul unui grafic de tip Scatter – PlotScatter – Plot..
Elemente de analiză statistică Coeficienţii de corelaţie Pearson şi Spearman
Exemplu: Calculul corelaţiei Pearson, o diagramă scutter şi coeficientul de corelaţie Spearman pentru scorurile abilităţilor muzicale şi matematice a 10 copii.
Scoruri_muzicale Scoruri_matematice
2 8
6 3
4 9
5 7
7 2
7 3
2 9
3 8
5 6
4 7
Elemente de analiză statistică Coeficientul de corelaţie Pearson
Rezolvare:1. Introducerea datelor
- Definirea variabilelor in modul de lucru Variable ViewVariable View din Data View.Data View.- Trecerea în modul de lucru Data ViewData View din Data EditorData Editor.
2. Corelaţia Pearson- Analyze – Correlate – Bivariate...- Analyze – Correlate – Bivariate...- - Se selectează împreună sau separat ScoruriScoruri__muzicale muzicale şi şi ScoruriScoruri__matematice matematice şi se introduc în lista de variabile, apoi clic pe butonul OKOK.
3. Interpretarea output-ului Corelaţia dintre cele două scoruri este de - 0,900- 0,900. La un test de semnificaţie, 2-tailed la nivelul de probabilitate este de 0,001 sau mai mic, corelaţia este statistic semnificativă. Numărul cazurilor pe care este bazată corelaţia este 1010.
Elemente de analiză statistică Coeficientul de corelaţie Pearson
Elemente de analiză statistică Coeficientul de corelaţie Pearson
4. Raportarea output-ului
Corelaţia dintre abilitătile muzicale şi cele matematice este
- 0,900- 0,900. Se obijnuieşte să se rorunjească cu două zecimale,
deci va deveni - 0,900,90. Acesta este un rezultat mai mult decât
precis pentru majorarea măsurătorilor psihologice.
Nivelul de semnificaţieNivelul de semnificaţie exact, cu trei zecimale, este 0,0000,000.
Înseamnă că nivelul de semnificaţie este mai mic decât 0.0010.001.
Nu folosiţi un şir de zerouri, deoarece derutează. Întotdeauna
schimbaţi ultimul zero în 1. Aceasta înseamnă că nivelul de nivelul de
semnificaţie poate fi raportat ca fiind p semnificaţie poate fi raportat ca fiind p << 0,0010,001..
Elemente de analiză statistică Coeficientul de corelaţie Pearson
Se obişnuieşte să fie prezentate gradele de libertate (dfdf) în
locul numărului de cazuri, când se prezintă corelaţiile.
Gradele de libertate sunt egale cu numărul de cazuri minus 2Gradele de libertate sunt egale cu numărul de cazuri minus 2,
adică 8 8 pentru această corelaţie. Nu este nimic greşit în a
raporta numărul de cazuri în schimb.
Într-un raport se scrie: Există o relaţie negativă semnificativă Există o relaţie negativă semnificativă
între abilităţile muzicale şi cele matematice. (rîntre abilităţile muzicale şi cele matematice. (r = - 0,90, = - 0,90, df df = 8, = 8,
p < 0,001.).p < 0,001.). CopiiCopiiii cu nivel cu nivel ridicat la abilităţi muzicale au nivel ridicat la abilităţi muzicale au nivel
scăzut la abilităţi matematicescăzut la abilităţi matematice..
Elemente de analiză statistică Coeficientul de corelaţie Spearman
Rezolvare:1. Introducerea datelor
- Definirea variabilelor in modul de lucru Variable ViewVariable View din Data View.Data View.- Trecerea în modul de lucru Data ViewData View din Data EditorData Editor.
2. Corelaţia Spearman- Analyze – Correlate – Bivariate... - Analyze – Correlate – Bivariate... -- Se selectează împreună sau separat ScoruriScoruri__muzicale muzicale şi şi ScoruriScoruri__matematice matematice şi se introduc în lista de variabile.- Se selectează opţiunea SpearmanSpearman şi apoi clic pe OKOK.
3. Interpretarea output-ului Coeficientul de corelaţie Spearman între ScoruriScoruri__muzicale muzicale şi şi ScoruriScoruri__matematicematematice este - 0,894. - 0,894. Nivelul de semnificaţie, luând în calcul două ipoteze este 0,001 sau mai mic, deci corelaţia este 0,001 sau mai mic, deci corelaţia este statistic semnificativă. statistic semnificativă. Numărul cazurilor este 10. 10.
Elemente de analiză statistică Coeficientul de corelaţie Spearman
Elemente de analiză statistică Coeficientul de corelaţie Spearman
4. Raportarea output-ului
Corelaţia raportată cu două zecimale este - 0,89- 0,89.
Probabilitatea de a obţine această corelaţie din întâmplare
este mai mică de 0,0010,001 (p < 0,001p < 0,001).
Într-un raport se scrie: Există o relaţie negativă semnificativă Există o relaţie negativă semnificativă
între abilităţile muzicale şi cele matematice. (Coeficientul între abilităţile muzicale şi cele matematice. (Coeficientul
Spearman = - 0,90, DF = 8, p < 0,001).Spearman = - 0,90, DF = 8, p < 0,001). Copiii cu nivel ridicat la Copiii cu nivel ridicat la
abilităţi muzicale au nivel scăzut la abilităţi matematiceabilităţi muzicale au nivel scăzut la abilităţi matematice şi şi
invers.invers.
Elemente de analiză statistică Diagrama scatter
Rezolvare:
1. Se selectează Graphs – Scatter –DefineGraphs – Scatter –Define.
2. În fereastra Simple ScatterplotSimple Scatterplot,, pentru a avea variabila Scoruri Scoruri __muzicalemuzicale ca axă verticală, se selectează şi se apasă butonul de lângă caseta YAxisYAxis.
3. În fereastra Simple Scatterplot,Simple Scatterplot, pentru a avea variabila ScoruriScoruri__matematicematematice ca axă orizontală, se selectează şi se apasă butonul de lângă caseta X AxisX Axis.
4. Se apasă butonul OKOK.
Elemente de analiză statistică Diagrama scatter
Elemente de analiză statistică Diagrama scatter
Interpretarea output-ului
În diagrama scatter, răspândirea punctelor este relativ
îngustă, ceea ce indică o corelaţie mare.
Forma împrăştierii rezultatelor este relativ în linie dreaptă
indicând mai degrabă o relaţie în linie dreaptă decât o relaţie
curbilinie. Linia este de la colţul stânga sus până în dreapta jos, ceea ce
indică o corelaţie negativă. Dacă relaţia este curbilinie, atunci corelaţiile Pearson şi
Spearman pot fi înşelătoare.
Elemente de analiză statistică Diagrama scatter
Raportarea output-ului
Nu ar trebui să raportaţi niciodată un coeficient de corelaţie
fără a examina diagrama scatter, din cauza unor probleme
cum ar fi relaţiile curbilinii sau valori atipice.
Am putea scrie: A fost examinată o diagramă scatter pentru A fost examinată o diagramă scatter pentru
relaţia dintre abilităţi_muzicale şi abilităţi_matematice. Nu relaţia dintre abilităţi_muzicale şi abilităţi_matematice. Nu
există nicio dovadă privind o relaţie curbilinie sau asupra există nicio dovadă privind o relaţie curbilinie sau asupra
influenţei avute de rezultate atipiceinfluenţei avute de rezultate atipice.
Elemente de analiză statistică Coeficienţii de corelaţie Pearson şi
Spearman
Exemplu: Se doreşte să se afle dacă rezultatele obţinute de 9 studenţi la un test aplicat pe parcurs, influenţează notele lor finale la examen.
Număr de puncte obţinute la test
(variabila x)
Nota la examen (variabila y)
230,00 8 310,00 10 250,00 9 310,00 10 150,00 7 180,00 7 80,00 6 350,00 10 220,00 8
Elemente de analiză statistică Coeficientul de corelaţie Pearson
Raportarea output-ului
Coeficientul de corelaţie Pearson calculat pentru cele două
variabile este r = 0,976r = 0,976. Valoarea acestuia arată că între cele
două variabile există o legătură puternică şi o corelaţie
pozitivă. Graficul Scatter redă foarte sugestiv aceste
informaţii.
În concluzie se poate afirma că studenţii care au obţinut un În concluzie se poate afirma că studenţii care au obţinut un
număr mare de puncte la test au obţinut note mari la număr mare de puncte la test au obţinut note mari la
examenul finalexamenul final.
Elemente de analiză statistică Coeficientul de corelaţie Pearson
Elemente de analiză statistică Coeficientul de corelaţie Pearson
6,00 7,00 8,00 9,00 10,00
z
50,00
100,00
150,00
200,00
250,00
300,00
350,00
x