+ All Categories
Home > Documents > C3-Biostatistica-2

C3-Biostatistica-2

Date post: 17-Jan-2016
Category:
Upload: alina-alina
View: 3 times
Download: 0 times
Share this document with a friend
Description:
j
19
1 BIOSTATISTICA Indicatori de variabilitate
Transcript
Page 1: C3-Biostatistica-2

1

BIOSTATISTICA

Indicatori de variabilitate

Page 2: C3-Biostatistica-2

Proprietăţile seriilor de variaţie

sunt:

- tendinţa centralăIndicatori: media aritmetică, media armonică, media cronologică, media pătratică, media geometrică, modulul.

- variabilitatea Indicatori: amplitudinea, abaterea valorilor individuale, cuartilele, dispersia, abaterea medie patratica (abaterea standard), coeficientul de variatie.

- forma distribuţiilorIndicatori: excentricitate (skewness), curbura (kurtosis)

Page 3: C3-Biostatistica-2

Variabilitatea

Caracterizarea unei colectivitati statistice prin indicatorii tendintei centrale (mediile) ne ajuta sa depistam ceea ce este comun în manifestarea unui fenomen. Orice colectivitate are o organizare interna specifica, definita prin felul în care valorile individuale se distribuie în jurul valorii centrale. Astfel se poate întâmpla ca doua colectivitati analizate dupa aceeasi variabila sa fie diferite prin tendinta centrala (Fig. a), prin dispersie (Fig. b) sau prin amândoua (Fig. c). În felul acesta o valoare centrala poate fi credibila, o alta nu. Din acest motiv se impune ca analiza prin indicatorii tendintei centrale sa fie completata cu indicatori ai variatiei si ai formei de distributie.

a) Distributii cu tendinta centrala diferita; b) Distributii cu variabilitate diferita;c) Distributii cu tendinta centrala si variabilitate diferite.

Prin notiunea generala de variabilitate se au în vedere abaterile masurabile ale valorilor individuale fata de o valoare centrala (medie).

Page 4: C3-Biostatistica-2

exemplu: seriile {2, 2, 2, 10, 18, 18, 18} si {9, 9, 9, 9, 10, 11, 11, 11, 11} au aceeasi medie si mediana (10) dar dispersie diferita. Acest fapt este evidentiat de abaterile înregistrate fata de medie (10) sau mediana (10). Seria a doua este mai omogena (înregistreaza o variabilitate mai mica a valorilor individuale), iar valorile sale tipice sunt mai reprezentative. Calculul si analiza indicatorilor variatiei valorilor individuale fata de medie ofera posibilitatea de rezolvare a unor probleme de cunoastere statistica. Dintre acestea se disting:

- analiza gradului de omogenitate a datelor din care s-au calculat indicatorii tendintei centrale si verificarea reprezentativitatii acestora;

- compararea mai multor serii de distributie dupa caracteristici independente si/sau interdependente;

- selectarea obiectiva a factorilor semnificativi de influenta dupa care se structureaza unitatile unei colectivitati statistice;

- separarea actiunii factorilor esentiali de factorii întâmplatori;

- concentrarea valorilor individuale ale caracteristicilor si deplasarea acestora fata de valorile tipice;

- aplicarea diferitelor teste ale statisticii matematice.

Page 5: C3-Biostatistica-2

Indicatori de variabilitate

Amplitudinea variatiei (A)

Se mai numeste câmp de variatie sau amplitudine absoluta. Se determina prin diferenta dintre cea mai mare si cea mai mica valoare individuala înregistrata.- în forma absoluta:

- în forma relativa:

Exemplu: Un grup de bolnavi înregistreaza urmatoarele durate de tratament în zile:

8, 7, 9, 8, 9, 9, 10, 11, 12, 11, 10, 10, 9, 9, 7, 8, 10,10,11,10

Amplitudinea absoluta a variatiei pentru durata tratamentului: 12 – 7 = 5 zile. Amplitudinea relativa a variatiei pentru durata tratamentului: (5/9) x 100 = 55,5%

Page 6: C3-Biostatistica-2

Observatii:

- Amplitudinea nu tine seama de toate valorile, ci numai de cele extreme, care adeseori sunt aberante;- Este sensibila la valorile aberante, se considera un indicator mai putin relevant nepermitând cunoasterea structurii interne de variatie. De exemplu, urmatoarele trei serii vizualizate au aceeasi amplitudine, dar prezinta variatii diferite:

Aceasta înseamna ca amplitudinea variatiei este un indicator rezonabil numai daca valorile individuale ale seriei sunt repartizate în mod uniform;- În cazul seriei de distributie pe intervale valorice calculul amplitudinii este lipsit de sens;- Amplitudinea se utilizeaza frecvent la alegerea numarului de intervale de grupare a datelor si la stabilirea marimii intervalelor.

Page 7: C3-Biostatistica-2

Abaterea valorilor individuale de la medie (di)

Exprima cu câte unitati de masura sau de câte ori valoarea caracteristicii individuale a colectivitatii se abate de la marimea unui indicator al tendintei centrale:

- în forma absoluta:

- în forma relativa:

Exemplu:Considerând aceleasi date din exemplul anterior, bolnavul care s-a tratat 12 zile se abate de la media grupei cu 3 zile ceea ce reprezinta 33,3% din medie iar pacientul care s-a tratat 7 zile se abate de la medie cu 2 zile, ceea ce reprezinta 22,2% din medie. Cu cât se obtin mai multe abateri relative mari în analiza unui volum de date (catre 100% sau peste acest nivel) cu atât colectivitatea statistica respectiva este mai eterogena.

Page 8: C3-Biostatistica-2

Observatii:

- valorile individuale se compara cu valoarea lor medie, dar la fel de bine poate fi utilizat pentru comparare oricare alt indicator al tendintei centrale (de ex. mediana);

- În seriile de distributie pe intervale valorice pentru calculul abaterilor individuale se iau în considerare centrele de interval;

- Abaterea valorilor individuale nu poate da informatii decât la nivelul fiecarei variante pierzând imaginea împrastierii pe ansamblul distributiei.

- În analizele statistice se urmaresc în mod deosebit abaterile maxime pozitive (d+max) si

abaterile maxime negative (d-max) calculate în cifre absolute sau relative astfel:

sau

Page 9: C3-Biostatistica-2

Cuartilele

Sunt valori care impart seria statistica in patru zone:

Cuartila Q1 este acea valoare dintr-o serie de valori, pentru care 25% din valorile seriei

sunt sub Q1 şi 75%, peste Q1.

Cuartila Q2 este acea valoare dintr-o serie de valori, pentru care 50% din valorile seriei

sunt sub Q2 şi 50%, peste Q2.

Cuartila Q3 este acea valoare dintr-o serie de valori, pentru care 75% din valorile seriei

sunt sub Q3 şi 25%, peste Q3.

Page 10: C3-Biostatistica-2

Dispersia (2)

Valorile dintr-o serie statistica pot fi mai aglomerate în jurul mediei sau mai dispersate. Un mod de a măsura aceste abateri de la medie este să se facă diferenţa între toate aceste valori şi media lor. Deoarece unele abateri pot fi pozitive, altele negative si prin adunare dau suma nula, ele sunt ridicate la pătrat înainte de a fi adunate, facand astfel să dispară diferenta de semn. Suma obţinută, împărţită la numărul de abateri este o medie care se numeşte dispersie, fiind un indicator al gradului de împrăştiere al seriei. Se calculeaza ca medie aritmetica a patratelor abaterilor valorilor individuale de la tendinta centrala (media seriei).

Pentru o serie simpla formula dispersiei este:

Pentru o serie de distributie pe frecvente formula dispersiei este:

În cazul în care numarul cazurilor observate este mai mic de 120, numitorul formulelor dispersiei devine n-1. Are dezavantajul că are în general valori foarte mari comparativ cu abaterea medie; de exemplu pentru o medie a abaterilor în jurul lui 10, dispersia va avea o valoare în jurul lui 100.

Page 11: C3-Biostatistica-2

Abaterea standard (abaterea medie patratica )

Este calculata ca o medie patratica din abaterile valorilor individuale de la media lor. Se calculeaza dupa urmatoarele formule:

În seriile statistice simple:

În seriile grupate pe frecvente:

În cazul în care numarul cazurilor observate este mai mic de 120, numitorul formulelor abaterii standard devine n-1. Abaterea standard este cel mai util si mai important indicator de variatie, punand în evidenta intervalul valoric din jurul mediei în care s-au distribuit valorile individuale ale variabilei studiate. O abatere standard cu valoare mica, semnifica o distributie strânsa a valorilor individuale în jurul mediei, deci un esantion omogen. O valoare mare a abaterii standard pune în evidenta o dispersie mare a valorilor individuale în jurul mediei, dovedind ca esantionul este neomogen si ca atare rezultatele obtinute nu pot fi generalizate.În general, cu cât abaterea standard are valori mai mari, cu atât media caracterizeaza mai putin fenomenul cercetat. Abaterea standard are o valoare semnificativa atunci când esantionul pe care s-a lucrat are o distributie normala, conform curbei Gauss – Laplace.

Page 12: C3-Biostatistica-2

Distributia normala - Gauss – Laplace

În cadrul unei asemenea repartitii, între valoarea mediei si cea a abaterii standard se distribuie 68,26% din totalul valorilor unei colectivitati statistice; între medie si de doua ori valoarea abaterii standard se distribuie 95,45% din valori, iar între medie si de trei ori valoarea abaterii standard sunt cuprinse 99,73% din valori. Practic, întreaga arie de sub grafic (99,73%) se afla între medie si de trei ori valoarea abaterii standard. Aceasta este asa-numita „regula celor sase sigma”: pornind de la presupunerea ca populatia este distribuita normal, abaterea standard este estimata la 1/6 din diferenta dintre valoarea maxima si cea minima, valori ce sunt obtinute dintr-un esantion suficient de mare.

Page 13: C3-Biostatistica-2

Exemplu de calcul:

S-a măsurat zilnic tensiunea arterială sistolică la doi pacienţi timp de 10 zile, obţinând pentru fiecare următoarele valori:•170, 180, 160, 180, 190, 190, 180, 190, 170, 190, pentru primul pacient şi•160, 170, 190, 160, 190, 190, 200, 180, 180, 180, pentru al doilea.Sa se determine care pacient are tensiunea cu valori mai împrăştiate, indiferent de evoluţia în timp. Notând prima serie cu X iar pe a doua cu Y se constată că ambele au media 180. Atunci, abaterile de la medie şi pătratele lor vor avea următoarele valori:

Abaterile standard vor fi:

Deci, este mai împrăştiată seria Y.

Page 14: C3-Biostatistica-2

Coeficientul de variatie (Cv)

Abaterea standard, fiind exprimata în unitati de masura specifice fenomenelor cercetate, nu poate fi utilizata în aprecierea comparativa a esantioanelor exprimate în unitati de masura diferite. De exemplu, pentru înaltimea si greutatea unui lot de 30 de elevi s-au gasit valorile: - înaltime: media =145 cm; abatere standard = ± 5 cm, - greutate: media = 35 kg; abaterea standard = ± 3 kgPe baza valorilor abaterii standard, exprimate în centimetri si kilograme, nu se poate aprecia sub ce aspect, al înaltimii sau al greutatii, lotul de elevi este mai uniform dezvoltat. În aceasta situatie se recurge la coeficientul de variatie - raportul procentual dintre valoarea abaterii standard si media aritmetica:

Coeficientul de variatie arata cât la suta din medie reprezinta abaterea standard. În exemplul anterior, coeficientul de variatie este:- pentru înaltime Cv = ± (5cm/145cm) ×100 = ± 3,4% - pentru greutate Cv = ± (3kg/35kg) ×100 = ± 8,6%Deci lotul de copii este mai omogen dezvoltat sub aspectul înaltimii si nu al greutatii cum ar rezulta din compararea valorilor abaterii standard. Cu cat valoarea coeficientului de variatie este mai mica, cu atât esantionul este mai omogen. Se considera ca un coeficient de variatie cu valori sub ± 10% indica o variatie mica, ceea ce ne permite sa generalizam rezultatele.

Page 15: C3-Biostatistica-2

Indicatori de forma

Excentricitatea (skewness - sk)

O distribuţie (ce poate fi reprezentata sub forma grafica ca un poligon al frecventelor) este excentrică dacă una din lateralele sale este mai lungă decât cealaltă. Prima distribuţie din figura urmatoare este cu excentricitate pozitivă, avand laterala mai lunga in partea pozitiva a axei orizontale. A doua distribuţie este asimetrică negativ, deoarece are o laterala mai lunga în direcţia negativă. Cea de-a treia distribuţie este simetrică, mbele laterale fiind aproximativ egale.

Distribuţii cu excentricitate pozitivă, negativă şi distribuţie simetrică

Excentricitatea unei serii de valori se calculează cu formula:Daca numarul cazurilor observate este mai mic de 120, numitorul formulei devine (n-1)3

Cu cât o distribuţie este mai simetrică cu atât sk tinde la 0

Page 16: C3-Biostatistica-2

Curbura (kurtosis)

Denumirea indicatorului vine din limba greaca: kurtos = curbat, arcuit si apreciaza gradul de curbura al distributiei statistice. Formula de calcul a curburii este:

Daca numarul cazurilor observate este mai mic de 120, numitorul formulei devine (n-1)

Page 17: C3-Biostatistica-2

Reprezentari graficeGraficul histogramă

Ca şi concept, histograma este echivalentul grafic al tabelului de frecvenţe. Exemplu:In tabelul urmator este sintetizată evolutia parametrului Greutate corporală la 1014 pacienţi:

Histograma greutăţilor corporale a 1014 pacienţi

Greutatea corporală a 1014 pacienţipe clase din 5kg în 5kg

Page 18: C3-Biostatistica-2

Histograma ne ajută să înţelegem mai bine realitatea.Pentru a realiza diferenţa dintre o distribuţie simetrică şi una asimetrică, să transpunem într-o histogramă situaţia din tabelul urmator, care sistematizează situaţia supravieţuirilor în cazurile de cancer mamar pe un lot de 2456 de pacienţi.

Se observă ca histograma are o asimetrie puternică spre dreapta. Tendinţa observată în această histogramă este normală, având în vedere fenomenul surprins. Procesele de supravieţuire sunt de obicei marcate de o distribuţie a valorilor cu excentricitate spre dreapta, adică durata supravietuirii este relativ scazuta.

Pentru o familiarizare cu acest tip de grafic foarte important, să urmărim câteva situaţii culese din practica medicală.

Page 19: C3-Biostatistica-2

În figura alaturata este histograma valorilor hemoglobinei la 738 de pacienţi cu diferite afecţiuni. Se observă o distribuţie a valorilor mai simetrică decât în figurile anterioare.

În figura alaturata, este reprezentată histograma tensiunii arteriale la 593 de pacienţi cu diferite afecţiuni. Se observă o excentricitate puternică, spre dreapta.

În figura alaturata este histograma valorilor hemoglobinei la 738 de pacienţi cu diferite afecţiuni. Se observă o distribuţie a valorilor mai simetrică decât în figurile anterioare.


Recommended