+ All Categories
Home > Documents > Biostatistica MG - Cursul IV

Biostatistica MG - Cursul IV

Date post: 27-Feb-2018
Category:
Upload: silviu-petronel
View: 274 times
Download: 1 times
Share this document with a friend

of 17

Transcript
  • 7/25/2019 Biostatistica MG - Cursul IV

    1/17

    Biostatistic - Cursul al IV-lea

    CURSUL AL IV-LEA

    1 Reprezentarea grafic a datelor statistice - Consideraii generale

    Sunt dou metode de baz n statistic: numeric i grafic. Folosind metoda numeric putem calculastatistici ca media i deviaia standard. Aceste statistici poart informaie despre tendina central ivariabilitate, altele poart alt tip de informaie. Metoda grafic este mai potrivit dect cea numeric pentruidentificarea vizual a tendinei datelor. Metoda numeric este mai obiectiv i mai precis. De vreme ce secompleteaz una pe alta, este util s le folosim combinat.

    Informaia coninut n date culese i nregistrate este dup cum s-a vzut n capitolul despre indicatoristatistici, greu de sintetizat pentru a avea o imagine ct mai clar despre situaia pe care acestea o reflect.Indicatorii statistici ofer o sintez mai mult sau mai puin fidel a informaiei, pierznd inerent dininformaie. Totui, pierderea de informaie datorat nlocuirii unei serii de valori prin indicatorii si nu estetotdeauna o pierdere de care s ne ferim, din contr, de cele mai multe ori, indicatorii statistici ofer oimagine mai util dect datele n sine. De obicei, pierderea de informaie este un ru necesar.

    De la nceputurile statisticii, o metod de sintetizare a informaiei mult folosit este reprezentarea grafic adatelor. Informaia prezentat vizual este mult mai penetrant pentru simuri i chiar pentru intelect i deobicei o imagine bun este mai util ca o mie de cifre. Reprezentarea grafic a datelor se face ns cumult discernmnt cci, aa cum se va vedea mai jos, nu orice grafic ne spune ceva, iar cantitatea deinformaie care se pierde la reprezentare trebuie foarte atent controlat.

    De-a lungul timpului au fost folosite multe tipuri de grafice perntru a reprezenta ct mai bine informaiaconinut n date. Cele mai des folosite grafice sunt histograma, graficul cu bare, poligonul frecvenelor,graficul liniar de evoluie n timp, diagrame, grafice punctuale etc.

    Pentru o mai bun nelegere s discutm nti cazul unui tip de grafic care a fcut carier n toate domeniilede aplicabilitate ale statisticii: histograma.

    2. Graficul histogramCa i concept, histograma este de fapt echivalentul grafic al tabelului de frecvene. Mai nti s lucrm pe unexemplu concret i apoi s urmrim problemele specifice care pot face din histogram un instrument util delucru sau un balast.

    Avem mai jos un tabel care sintetizeaz situaia parametrului Greutate corporal la 1014 pacieni cudiferite afeciuni:

    Tabelul 1 Greutatea corporal a 1014 pacieni cu diferite afeciuni,pe clase din 5kg n 5kg

    Clasa Greutate(Kg)

    Frecvena

    (Nr indivizi)1 35..40 172 40..45 463 45..50 844 50..55 1085 55..60 1306 60..65 1367 65..70 1608 70..75 1139 75..80 10610 80..85 5411 85..90 29

    12 90..95 1213 95..100 9

    1

  • 7/25/2019 Biostatistica MG - Cursul IV

    2/17

    Biostatistic - Cursul al IV-lea

    Acum s privim graficul din figura 1, care reprezint situaia din tabel:

    Figura 1 Histograma greutilor corporale a 1014 pacieni cu diferite afeciuni

    Mai nti, ce s-a reprezentat de fapt? Se oserv c pe orizontal sunt figurate clasele din tabel n ordine,

    fiecreia fiindu-i alocat un segment de aceeai lungime, iar pe vertical, dreptunghiurile au nlimiproporionale cu frecvenele absolute ale claselor. Mulimea barelor verticale este cea care ne d impresiavizual pe care trebuie s o interpretm n sensul sitetizrii informaiei. Observm:

    Din stnga se ncepe cu bare scunde care cresc n nlime pe msur ce ne apropiem de clasa din centru,dup care are loc un proces invers. Este tendina natural la cele mai multe situaii. Datele au de cele maimulte ori tendina de a se situa n stnga i drepta mediei, din ce n ce mai puine pe msur ce ne deprtmde medie. Pe acest grafic nu este figurat media dar este de bun sim s ne gndim c este situat undeva nclasele de mijloc.

    Indivizii care au sub 35 Kg i cei peste 100 Kg, probabil foarte puini, nu au fost luai n calcul. Seobinuiete totui ca ei s fie luai n considerare prin introducerea a dou clase speciale. n acest caz, claselespeciale de introdus ar fi fost: clasa sub 35i clasa peste 100. De obicei aa este bine s se procedeze.

    Modul cum cresc barele este diferit de modul cum descresc. Aceasta este ceea ce se numea la indicatoriistatistici asimetria. Aceast histogram arat o uoar asimetrie la dreapta. Dac indivizii de la care s-aucules datele ar fi fost normali, histograma ar fi avut un aspect mai simetric. Asimetria acestei hitograme nearat c n clasele de la 40 la 65 kg sunt mai muli indivizi dect n clasele simetrice lor de la 75 la 90 kg.Avnd n vedere c majoritatea lor sunt brbai, acest asimetrie ne spune c un numr de indivizi augreutatea mai mic dect ar fi normal. Acest lucru este explicabil n acest caz, deoarece cei mai muli auafeciuni hepatice grave ca ciroz hepatic, cancer hepatic, i sunt ntr-o stare fizic mult slbit.

    n acest caz, am explicat forma histogramei pe baza realitii. De obicei ns se ntmpl exact invers.Histograma este aceea care ne ajut s nelegem mai bine realitatea.

    Pentru a realiza diferena dintre o distribuie simetric i una asimetric, s transpunem ntr-o histogram

    situaia din tabelul 2, care sistematizeaz situaia supravieuirilor n cazurile de cancer mamar pe un lot de2456 de pacieni.

    Tabelul 2 Situaia supravieuirilor n cazurile de cancer mamar. Gruparea n clase de 12 luni

    Nr.Crt Perioada Nr.cazuri Procent % Procent Cumulat %1 0..12 luni 672 27.36 27.362 12..24 luni 446 18.16 45.523 24..36 luni 368 15.00 60.524 36..48 luni 249 10.14 70.665 48..60 luni 196 8.00 78.666 60..72 luni 172 7.00 85.667 72..84 luni 126 5.13 90.798 84..96 luni 98 4.00 94.79

    9 96..108 luni 45 1.83 96.6210 108..120 luni 31 1.26 97.8811 Peste 120 luni 52 2.12 100.00

    2

  • 7/25/2019 Biostatistica MG - Cursul IV

    3/17

    Biostatistic - Cursul al IV-lea

    n figura 2, este reprezentat histograma corespunztoare pentru tabelul 2. Se observ c barele histogrameiau nlimi descresctoare ntocmai ca i frecvenele absolute ale claselor.

    Figura 2 Histograma corespunztoare pentrutabelul 2. Se observ c barele histogramei au nlimidescresctoare ntocmai ca i frecvenele absolute ale claselor

    Se observ la aceast histogram c are o asimetrie foarte puternic spre dreapta. Vom considera totdeauna(ca o convenie), s spunem c o histogram arat asimetria spre partea unde descreterea este mai lent.Tendina observat n aceast histogram este normal, avnd n vedere fenomenul surprins. Procesele desupravieuire sunt de obicei marcate de o distribuie a valorilor cu excentricitate spre dreapta, adic spresupravieuiri lungi.

    Pentru o familiarizare cu acest tip de grafic foarte important, s urmrim cteva situaii culese din practicamedical. n figura 3, avem reprezentat histograma tensiunii arteriale la 593 de pacieni cu diferiteafeciuni. Se observ o excentricitate puternic, spre dreapta. n figura 4 avem histograma valorilorhemoglobinei la 738 de pacieni cu diferite afeciuni. Se observ o distribuie a valorilor mai simetric dectn figurile 2 i 3. n figura 5se vede histograma taliei la 1042 pacieni pe clase din 5cm n 5cm. Este unexemplu de distribuie cu o uoar asimetrie spre stnga, mai rar ntlnit n practic. Figura 6prezint

    histograma vrstelor la 308 pacieni cu afeciuni hepatice. Se observ c graficul are dou vrfuri. Se spunedespre acest tip de distribuie a datelor c este bimodal. Este un lot neomogen, alctuit din dou subloturi,unul cu maximul n jurul vrstei de 45 50 de ani i cellalt n jurul vrstei de 65 70 de ani. n practic sentlnesc rar astfel de situaii. n modnormal, ntr-un asemenea caz, se studiaz fiecare sublot n parte din

    punctul de vedere al vrstei

    Figura 3 Histograma tensiunii arteriale la 593 de pacieni cu diferite afeciuni. Se observ oexcentricitate puternic, spre dreapta

    3

  • 7/25/2019 Biostatistica MG - Cursul IV

    4/17

    Biostatistic - Cursul al IV-lea

    Figura 4 Histograma valorilor hemoglobinei la 738 de pacieni cu diferite afeciuni. Se observ odistribuie a valorilor ma simetric dect n figurile 5.2 i 5.3.

    Figura 5 Histograma taliei la 1042 pacieni pe clase din 5cm n 5cm. Este un exemplu de distribuie cu ouoar asimetrie spre stnga, mai rar ntlnit n practic.

    Figura 6 Histograma vrstelor la 308 pacieni cu afeciuni hepatice. Se observ c graficul are dou vrfuri. Se spunedespre acest tip de distribuie a datelor c este bimodal. Este un lot neomogen, alctuit din dou subloturi, unul cumaximul n jurul vrstei de 45 50 de ani i cellalt n jurul vrstei de 65 70 de ani. n practic se ntlnesc rarastfel de situaii.n mod normal, ntr-un asemenea caz, se studiaz fiecare sublot n parte.

    4

  • 7/25/2019 Biostatistica MG - Cursul IV

    5/17

    Biostatistic - Cursul al IV-lea

    Poligonul frecvenelor

    Este un grafic care reprezint frecvenele absolute dintr-un tabel de frecven printr-o linie frnt. Clasele serealizeaz ca i la histogram. Linia frnt, leag puncte din plan care au ca ordonate frecvenele dereprezentat, iar ca abscise, mijloacele claselor. Graficul se poate realiza i din histogram, prin unireamijloacelor laturilor superioare ale barelor.

    n figura 7 este reprezentat un exemplu de modul cum se obine poligonul frecvenelor din histogram.

    Figura 7 Poligonul frecvenelor obinut prin unirea mijloacelor laturilor superioare ale barelor unei histograme.

    n figura 8 este reprezentat poligonul frecvenelor pentru greutatea a 1042 de pacieni cu diferite afeciuni,din 5 n 5 Kg.

    Figura 8 Poligonul frecvenelor pentru greutatea a 1042 de pacieni cu diferite afeciuni, cu clase din 5 n 5 Kg.

    Dei ofer o imagine vizual foarte bun a modului cum sunt distribuite valorile din serie pe clase, poligonulfrecvenelor este mai puin folosit dect histograma, care ofer i ea tot informaia despre distribuia valorilor din serie

    pe clase. Aceasta deoarece histograma pare ochiului un grafic mai bogat. n realitate, ntre cele dou grafice, nu exist o

    diferen calitativ. Ele ofer aceeai informaie.ATENIE! Graficul histogram i graficul poligonul frecvenelor, conin exact aceeai cantitate deinformaie, dac au la baz acelai tabel de frecvene.

    Semnificaia statistic a histogramei

    Histograma este influenat de factori aleatori n ce privete forma, deci ne poate da o informaie mai multsau mai puin valoroas n funcie de aceti factori. Ca i n cazul celorlali indicatori statisitici, vomconsidera histograma ca avnd nmagazinat informaie cu att mai corect cu ct avem un numr mai marede indivizi n lotul pe care ea l reprezint.

    n figurile urmatoare sunt reprezentate o serie de histograme construite pe un lot de 738 de pacieni, la care s-a msurat hemoglobina.

    5

  • 7/25/2019 Biostatistica MG - Cursul IV

    6/17

    Biostatistic - Cursul al IV-lea

    n figura 9, este exemplificat influena lungimii claselor asupra aspectului unei histograme. La fiecarehistogram, s-au folosit 738 de valori. Ceea ce se modific de la histogram la histogram estelungimea claselor i, implicit numrul de clase. Se observ c lungimi prea mari (din 5 n 5, din 4 n 4,din 3 n 3, din 2 n 2 i din1,5 n 1,5) dau histograme care ascund distribuia. Lungimi prea mici ( din0,5 n 0,5, din 0,25 n 0,25) dau prea multe detalii inutile. Cele mai potrivite lungimi n acest caz suntdin 1 n 1 i din 0,75 n 0,75.

    Figura 9 Influena lungimii claselor asupra aspectului unei histograme. Lungimea corect n acest cazeste din 1 n 1

    Alegerea numrului de clase. De obicei, programele de calculator realizeaz histograme dup ceutilizatorul a furnizat lungimea clasei. Pentru a nu ajunge n situaii cnd un astfel de tabel are un numr totalneindicat de clase, de obicei se calculeaz lungimea aproximativ a unei clase n aa fel nct numrul declase s fie cel dorit. Acest lucru se poate realiza dac se caut cea mai mic i cea mai mare valoare dinseria de date (notate mai jos cu min i max), i se ia ca lungime a unei clase, aproximativ rezultatulurmtorului calcul:

    Lnr clase

    =max min

    .

    De exemplu, dac n seria vrstelor unor pacieni, cel mai tnr pacient are 26 de ani, iar cel mai vrstnic are78, pentru a obine 6 clase (numr de clase indicat pentru vrste de aduli), avem L= (78 - 26) / 6 = 8,6. Decieste indicat s se ia clase de 10 ani, prin rotunjire. Dac ns se doresc mai multe clase, s zicem 10, atunciobinem: L = (78 - 26) / 10 = 5,2 i este indicat s se ia clase din 5 n 5 ani. Prima clas va fi [25,30), iarurmtoarele: [30, 35), [35, 40),.[75, 80).

    Numrul de clase nu este neaprat 10, el se alege de fapt de ctre cel care face histograma, astfel ca s sepiard ct mai puin informaie, dar i numrul de clase s nu fie prea mare cci atunci lum n considerareaspecte prea nesemnificative.

    Ca regul general, este bine s se rein c:

    Se pierde cu att mai mult informaie cu ct numrul de clase este mai mic. Nu se recomandhistograme cu 2-4 clase

    Un numr prea mare de clase duce la o ascundere a esenialului de ctre aspectele nesemnificative

    6

  • 7/25/2019 Biostatistica MG - Cursul IV

    7/17

    Biostatistic - Cursul al IV-lea

    ntruct cei care nu au experien nu tiu cum s aleag numrul de clase, recomandm:

    Pentru cteva zeci de valori, s se aleag maximum 6 8 clase

    Pentru cteva sute de valori, s se aleag ntre 10 i 15 clase

    Pentru cteva mii de valori, s se aleag peste 15 clase

    Nu se recomand folosirea a mai mult de 20 30 de clase dect n cazuri speciale, n studii cu multe mii de

    cazuri. Nici mai puin de 4 6 clase nu este recomandat s se foloseasc. Nu se recomand folosireahistogramelor dac nu avem cel puin cteva zeci de valori. De exemplu, pentru o serie de 15 valori, nu seface o histogram.

    Alte exemple: Dac avem de reprezentat printr-o histogram valorile pentru hemoglobin, iar minimul este8,13 iar maximul este 16,23, atunci, pentru a obine 10 clase, vom face calculul:

    81,010

    1,8

    10

    13,823,16

    .

    minmax==

    =

    =

    clasenrL

    n acest caz, vom rotunji la 1 i vom lua clasele din 1 n 1, ncepnd de la 8: [8, 9), [9,10), [16,17).

    n cazul Imunoglobulinei G, din cei 235 de pacieni, valoarea minim a fost 112, n timp ce maximul a fost900. Dac dorim tot 10 clase, atunci calculul este

    8,8810

    888

    10

    112900

    .

    minmax==

    =

    =

    clasenrL

    Vom lua clasele din 100 n 100, ncepnd de la 100: [100,200), [200,300) . [800,900), [900-1000).

    3. Curba densitii de probabilitateS-a vzut c histograma este un grafic care d informaii despre repartizarea valorilor dintr-o serie de valori,care arat dac valorile din serie sunt repartizate simetric sau asimetric i dac repartiia are un singur vrfsau este multimodal.

    S ne imaginm c pe msur ce mrim indefinit numrul de valori din serie, lungimea claselor scade foarte

    mult, astfel nct obinem histograme din ce n ce mai fine. Cese obine prin acest proces? O apropiere dince n ce mai accentuat de repartiia real a datelor, repartiie pe care histogramele o aproximeaz din ce n cemai bine. Histogramele ofer imaginea repartizrii valorilor dintr-o serie, deci o imagine incomplet arealitii. ntr-adevr, valorile dintr-o serie de date sunt culese pe un eantion sau lot, care este de obiceiextras dintr-o populaie mult mai numeroas. Ceea ce ne intereseaz de obicei ns, este modul cum serepartizeaz valorile din ntreagapopulaie.

    n figura 10, este dat un exemplu de serie de valori foarte mare, alctuitdin 10000 de valori. n acest caz,lotul pe care s-au fcut msurtorile poate fi numit populaie, numrul de indivizi fiind foarte mare.

    Figura 10 Folosind o serie de 10000 de valori, se pot face histograme din ce n ce mai fine, care trec de la aspectul detreapt, la acela de curb

    7

  • 7/25/2019 Biostatistica MG - Cursul IV

    8/17

    Biostatistic - Cursul al IV-lea

    Pe msur ce histogramele devin din ce n ce mai fine, ele tind s se asemene cu o curb. Dac volumulseriei ar fi mult mai mare, asemnarea cu o curb ar fi att de clar nct ochiul nu ar mai putea observaaspectul de treapt. Acest proces este vizibil n special atunci cnd n locul histogramelor folosim

    poligoane ale frecvenelor.n figura 11,sunt reprezentate poligoanele frecvenelor efectuate pe valorile dinseria folosit n figura 10. La fiecare grafic s-au folosit o parte din valorile seriei, anume: la primul grafic1000 de valori, la al doilea grafic 2000 de valori, i aa mai departe pn la ultimul grafic, care este ex ecutat

    folosind toate cele 10000 de valori din serie.

    Figura 11. Procesul de trecere de la poligonul frecvenelor la curba de distribuieAcest mod de a ajunge la o curba densitii de probabilitate(sau o curb de repartiie) este instructiv prinfaptul c ofer o imagine intuitiv a diferenei dintre o histogram sau un poligon al frecvenelor i o curbde repartiie. n plus, ofer o ideie despre cum arat curba de repartiie.

    Strict vorbind ns, noiunea de curb a densitii de probabilitate, trebuie introdus folosind un aparatteoretic mai complex. Deoarece o introducere fundamentat ar depi nivelul cursului de fa, vomconsidera, intuitiv, fr a pretinde c aceasta este o definiie riguroas, c:

    O curb a densitii de repartiie este curba care are acelai aspect cu curba ctre care tindepoligonul frecvenelor relative, atunci cnd numrul de valori dintr-o serie tinde la infinit, iarlungimea fiecrei clase tinde la 0.

    Pentru o exprimare mai clar, atunci cnd nu exist pericolul unor confuzii, n locul termenului de curb adensitii de probabilitate, vom folosi termenul de curb de repartiie, sau mai simplu, repartiie.

    8

  • 7/25/2019 Biostatistica MG - Cursul IV

    9/17

    Biostatistic - Cursul al IV-lea

    n medicin i biologie, ca i n celelalte domenii de activitate, exist o varietate larg de curbe ale densitiide probabilitate. n figura 12, sunt prezentate cteva forme de astfel de curbe, simetrice, asimetrice cuasimetri stng, cu asimetrie dreapt, etc.

    Figura 12Diverse forme ale curbei densitii de probabilitate

    Pe msur ce statistica a evoluat ca tiin, s-a demonstrat c unele din curbele densitii de probabilitatejoac un rol central n tiin n general i n medicin n special. Astfel, multe fenomene din tiin se petrecastfel nct deviaiile stnga-dreapta de la medie ale msurtorilor pe care le facem sunt repartizate simetrici nu oricum, ci tind s fie repartizate foarte asemntor cu o anumit curb, mult studiat, care se numetecurba densitii normalesau curba Gauss.

    Astfel, aa cum se va vedea n cursul despre eantionare, media de eantionare, adic media calculat aacum a fost descris n cursul 1, are n anumite condiii o repartiie normal. n subcapitolele care urmeaz vorfi descrise cteva din curbele de repartiie mai folosite i mai des ntlnite n practic .

    Curbele de repartiie se bucur de cteva proprieti care le fac extrem de utile n statistic, aa cum se vavedea n capitolele despre eantionare i despre testele statistice.

    Aria cuprins ntre curb i axa orizontal este 1 sau 100% (vezi figura 13).

    Probabilitatea ca, extrgnd aleator un individ dintr-o populaie a crei repartiie are o curbcunoscuti fcnd msurarea pe acel individ, valoarea obinutx, s fie situat ntre dou numere ai bfixate (xaixb), este exact aria cuprins ntre curb, axa orizontal i cele dou verticale

    naib(Vezi figura 14).

    Figura 13. Aria cuprins ntre o curb de repartiie i axa orizontaleste totdeauna 1 sau 100%

    Figura 14. Dac extragem aleator un individ dintr-o populaie care are curba de repartiie cunoscut, valoarea

    msurat la acel individ este cuprins ntre dou numere reale a i b cu o probabilitate egal cu aria cuprinsntre curb, axa orizontal i cele dou verticale n a i b.

    9

  • 7/25/2019 Biostatistica MG - Cursul IV

    10/17

    Biostatistic - Cursul al IV-lea

    4. Densitatea Normal(Gauss)Curba Gauss, sau clopotul lui Gauss a jucat n istoria tinei i joac i acum un rol foarte importa nt, iar nmedicin foarte muliparametri legaide organismul uman, de legile fundamentale ale viului, sunt repartizaidup aceast curb. Ce este de fapt aceast curb?

    Formula curbei lui Gauss, este:

    2

    2)(

    2

    1)( s

    mx

    es

    xf

    =

    (facultativ!!!)

    Se observ c aceast curb depinde de doi parametri, mi s, i ea este perfect determinat n momentul ncare se cunosc aceti parametri. Deoarece curba descrie repartiia unei populaii, cei doi parametri reprezintmedia (m)i abaterea standard (s)ale populaiei respective.

    Graficul din figura 15, care este graficul unei curbe Gauss, ne arat c, spre centru probabilitilesunt cu attmai mari cu ct suntem mai aproape de medie, iar spre margini probabilitilescad apropiindu-se de zero pemsur ce ne ndeprtm din ce n ce mai mult de medie. Curba este simetric, niciodat ns simetria nu este

    perfect pe o histograma particular sau pe un poligon al frecevenelor, dar curba ideal este perfectsimetric. Subliniem c prin curb ideal nelegem curba ctre care se ndreapt poligonul frecvenelorcnd numrul de cazuri tinde la infinit iar lungimea claselor se apropie de zero. Uneori, graficul funciei estedenumit clopotul lui Gauss datorit formei lui deosebite, asemntoare unui clopot.

    Figura 15 Curba repartiiei normale, sau curba lui Gauss. Are un maxim n dreptul mediei, dou puncte deinflexiune (n dreptul valorilor m-s i m+s), tinde la zero pe msur ce nendeprtm de medie la stnga i la

    dreapta.

    ***(Facultativ). n analiza matematic se arat c graficul acestei funcii, cel din figura 15, are un maxim pentru

    x=mi dou puncte de inflexiune (n care devine din concav, convex), la m-si la m+s. Curba normalmai este cunoscut sub denumirea de legea Gauss-Laplace sau legea normal i apare pentru prima dat ntr-o lucrare a matematicianului Moivre (1667 1754), apoi n lucrrile luiPierre Simon de Laplace (1749 1827). Celebr este fcut de lucrrile matematicianului Gauss (1777 1855). Utilitatea acestei repartiii sedatoreaz mai multor cauze, printre care:

    Multe fenomene aleatoare din natur se supun exact sau aproximativ acestei legi. Astfel, deviaiile

    stnga-dreapta de la medie ale erorilor de msurare urmeaz aceast lege simetric i cu proprietateac, erori din ce n ce mai mari sunt din ce n ce mai rare.

    10

  • 7/25/2019 Biostatistica MG - Cursul IV

    11/17

    Biostatistic - Cursul al IV-lea

    O teorem foarte important, teorema limit central, asigur acestei repartiii un rol privilegiat prinfaptul c suma unui numrmare de variabile aleatoare independente una de alta, dar identicrepartizate, este repartizat Gauss sau aproximativ Gauss. Aceast teorem ne asigur deexemplu, de faptul c, media calculat pe un lot are o repartiie Gauss sau apropiat.

    S-a demonstrat c multe repartiii empirice ntlnite n practic pot fi aduse la o repartiie Gauss printransformri simple i n felul acesta devin mai uor de studiat.

    ***Trebuie reinut c repartiia Gauss are urmtoarele proprieti importante:

    Este simetric fa de media m

    Are dou puncte de inflexiune, la m-si m+s

    Are maximul pentrux = m

    Are dou cozispre + i infinit care se apropie din ce n ce mai mult de axa orizontal, fr s oating

    Mediana i modul, coincid cu media

    Deoarece mediana coincide cu media, jumtate din aria de sub curb se afl n stnga mediei ijumtate n dreapta. Deci, ntr-o populaie repartizat Gauss, 50% din indivizi sunt sub medie i 50%peste medie

    Aria cuprins ntre curb i axa orizontal este 1 indiferent de medie i de deviaia standard.

    Aria cuprins ntre curb, axa orizontal i dou verticale n dreptul numerelor a i b, esteprobabilitatea ca, extrgnd aleator un individ dinpopulaie i fcnd msurtoarea pe acel individ,valoarea obinutx, s fie ntre a i b(Vezi figura 16).

    Figura 16 Aria cuprins ntre curb, axa orizontal i dou verticale n dreptul numerelor a i b, esteprobabilitatea ca, extrgnd aleator un individ din populaie i fcnd msurtoarea pe acel individ, valoarea

    obinut x, s fie ntre a i b

    Repartiia Gauss, este de fapt o famile de repartiii ce depinde cei doi parametri: mediai deviaia standard.n figura 17, sunt desenate cteva curbe de repartiie Gauss, mai mult sau mai puin aplatizate, dup cumdeviaia standard este maimic sau mai mare.

    11

  • 7/25/2019 Biostatistica MG - Cursul IV

    12/17

    Biostatistic - Cursul al IV-lea

    Figura 17 Diferite curbe Gauss mai mult sau mai puin aplatizate, aplatizarea fiind dat de valoarea deviaieistandard, s. Cu ct valoarea lui s este mai mare, cu att curba este mai aplatizat. Cnd s ia valori mici, curba

    este mai nalt.

    Avem de asemenea, o infinitate de curbe Gauss care au aceeai deviaie standard dar au medii diferite. Elesunt identice ca form, doar sunt localizate diferit n plan i pot fi suprapuse prin translaii stnga -dreapta. nfigura 18, sunt desenate cteva curbe Gauss care difer numai prin medie. Avnd toate aceeai deviaiestandard, au aceeai aplatizare.

    Figura 18. Curbe Gauss cu aceeai deviaie standard. Ele sunt la fel de aplatizate i pot fi suprapuse printranslaii stnga-dreapta.

    Dac fixm media dar permitem orice deviaie standard, exist o infinitate de curbe Gauss care au aceeaimedie. Ele sunt localizate identic stnga-dreapta, dar difer prin aplatizare mai mult sau mai puinaccentuat.n figura 19, sunt desenate 3 curbe Gauss cu aceeai medie i cu deviaiile standard 1, 1.2 i 1.5.

    Figura 19. Trei curbe Gauss cu aceeai medie i deviaii standard diferite

    ***(Facultativ). Aa cum am artat, repartiia normal sau Gaussian este des ntlnit n studiul fenomenelor

    biologice iare uneleproprieti utile. n biologie, una din problemele importante care se pun n legtur cudatele pe care le msurm este aceea dac se ncadreaz sau nu n limitele de normalitate. Repartiianormal ne poate ajuta s dm un rspuns acestei ntrebri, cel puin pentru acele date care sunt distribuite

    normal. Dac o variabil are repartiie Gauss, atunci se poate stabili ct de plauzibil este media i deviaiastandard gsite prin msurtori pe un lot i se pot face comparaii cu mediile care ar trebui s fie obinute icare sunt cunoscute din literatura de specialitate (vezi cursul despre eantionare i cel despre teste statistice

    pentru amnunte).

    Cunoscnd despre o variabil c are repartiieGauss, se pot deduce unele afirmaiidespre valorile pe care lepoate lua. Cum folosim aceast repartiie pentru a deduce anumite concluzii despre variabila care neintereseaz? Dup cum am mai afirmat, pentru o variabil repartizatnormal, procentul din populaie situatntre dou limite date este aria cuprins ntre curba Gauss, axa orizontal i cele dou verticale la limitelefixate. De obicei se consider intervalele n jurul mediei, simetrice, cu limite situate la o distan de una saumai multe abateri standard de medie.

    ***Sunt eseniale urmtoarele proprieti ale curbei Gauss, proprieti care nu sunt valabile la alte tipuri dedistribuii:

    12

  • 7/25/2019 Biostatistica MG - Cursul IV

    13/17

    Biostatistic - Cursul al IV-lea

    n intervalul [m-s, m+s]se afl aproximativ 68% din indivizii unei populaii repartizate normal (vezi figura20). Aceasta ns nu este o majoritate suficientde mare pentru a fi aproape de siguran dac ne ntrebmntre ce limite sunt situate valorile msurate pentru indivizii din populaie.

    Figura 20. ntre [m-s, m+s]se afl aproximativ 68% din indivizii uneipopulaii repartizate normal

    De aceea se ia cel mai adesea n considerare intervalul [m-2s, m+2s]n care se situeaz aproximativ 95% dinindivizii unei populaiei repartizate normal. Acest interval este suficient de larg i cuprinde o majoritatezdrobitoare a populaiei aa c este cel mai indicats fie folosit ca interval de normalitate.

    Figura 21. ntre [m-2s, m+2s]se afl aproximativ 95% din indivizii uneipopulaii repartizate normal

    Uneori, se iau intervale mai cuprinztoare, ca [m-3s, m+3s], interval n care se situeaz peste 99% dinpopulaia considerat(vezi figura 22).

    Figura 22. ntre [m-3s, m+3s]se afl peste 99% din indivizii uneipopulaii repartizate normal

    Chiar dac se consider de obicei c pentru variabilele folosite uzual n practica medical valorile medii suntcunoscute i se cunosc i aa-numitele intervale de normalitate, n realitate se cunosc doar foarte buneaproximri ale lor obinute pe baza unor studii foarte atente, pe loturi largi. Valorile reale ale mediei i

    deviaiei standard pentru o populaie distribuit normal, notate cu mi s, sunt aproximate cu X i care suntindicatorii medie i abatere standard pentru un lot extras din populaia respectiv.

    Cum se stabilete ct de bune sunt aceste aproximri, care se mai numesc estimri, se va vedea n cursuldespre estimaii. Oricum, se folosesc din plin proprietile distribuiei Gaussiene.

    5 Graficul cu bare

    Este graficul care reprezint prin bare verticale, frecvenele unui tabel de frecvene pentru variabile calitative (datenominale) sau variabile ordinale. Dei pare asemntor cu histograma, ntre cele dou tipuri de grafice exist diferene.Ca aspect, histograma are barele lipite, n timp ce graficul cu bare las o oarecare distan ntre bare. Nu esterecomandat folosirea graficelor unul n locul celuilalt.

    n figura 9 sunt reprezentate frecvenele de apariie a unor afeciuni maligne, pe stadii.

    13

  • 7/25/2019 Biostatistica MG - Cursul IV

    14/17

    Biostatistic - Cursul al IV-lea

    Figura 9 Clasificarea pe stadii a unui numr de pacieni cu afeciuni maligne

    Pentru a evidenia diferenedintre cele dou tipuri de grafic, s lum tabelul 3, care d frecvenele cu care au fostnregistrate decese n timpul operaiei ntr-o secie de spital. Graficele corespunztoare sunt prezentate n figura10.

    Tabelul 3 Frecvenele deceselor n timpul operaiei ntr-o secie de spital

    Anul Nr. Cazuri

    1997 3

    1998 5

    1999 4

    2000 2

    2001 0

    2002 1

    2003 0

    0

    1

    2

    3

    4

    5

    6

    1997 1998 1999 2000 2001 2002 2003

    Anul

    Frecvena

    0

    1

    2

    3

    4

    5

    6

    1997 1998 1999 2000 2002

    Anul

    Frecvena

    Figura 10 Graficul histogram i graficul cu bare, cu datele din tabelul 3

    Informaia coninut de tabelele de inciden se reprezint de obicei prin grafice cu bare pe perechi sautriplete, n funcie de tipul tabelului. Pentru tabelele 2x2, graficul are dou perechi de bare (vezi graficul 11).

    Figura 11. Repartiia a190 de pacieni cu accidente vasculare cerebrale dup sex i dup mediul de provenien(rural, urban)

    14

  • 7/25/2019 Biostatistica MG - Cursul IV

    15/17

    Biostatistic - Cursul al IV-lea

    Uneori, graficul este reprezentat n spaiul tridimensional, pe cteva rnduri, astfel nct ochiul are o vederecomparativ a categoriilor pe care le reprezint tabelul (vezi figura 12i figura 13).

    Figura 12 Clasificarea dup grupa de vrst i starea civil a unui numr de pacieni.

    Figura 13 Clasificarea dup sex i fumat a 469 de indivizi

    6 Graficul PIE

    Este un grafic care reprezint prin sectoare circulare frecvenele dintr-un tabel de frecven. Sectoarele suntproporionale ca numr de grade cu frecvenele absolute din tabel, sau cu frecvenele relative. Pe grafic pot apare ndreptul fiecrui sector, fie frecvena absolut, fie cea relativ,fie ambele. Ca form, pot fi sectoare dintr-un cerc vzutntr-un plan, sau sectoare ale unui disc tridimensional (vezi figurile 14 17).

    Repartizarea tuturor celor 190 de pacienipe sexe

    masculin

    56%

    feminin

    44%107

    83

    Figura 14 Repartiia a 190 de pacieni dup sex

    15

  • 7/25/2019 Biostatistica MG - Cursul IV

    16/17

    Biostatistic - Cursul al IV-lea

    Repartizarea tuturor celor 190 de pacieni pe mediu

    de provenien

    rural

    39%

    urban

    61%

    11575

    Figura 15Repartiia a 190 de pacieni dup mediul de provenien

    Masculin

    97%

    Feminin

    3%

    Masculin

    Feminin

    Distribuia pacienilor pe sexe

    Figura 16 Repartiia unui numr de pacieni dup sex. Grafic tridimensional

    Distribuia pacienilor dup mediul de

    provenien

    Rural63%

    Urban

    37% Rural

    Urban

    Figura 17 Repartiia unui numr de pacieni dup mediul de provenien. Grafic tridimensional

    Chestiuni de examen:1. Histograma este un grafic ce reprezint:

    A. Frecvenele absolute ale unui tabel de frecven

    B. Fiecare valoare n parte dintr-o serie de valoriC. Frecvena cu care valorile seriei sunt cuprinse n clasele stabilite la construcia eiD. Indicatorii tendinei centrale a seriei

    16

  • 7/25/2019 Biostatistica MG - Cursul IV

    17/17

    Biostatistic - Cursul al IV-lea

    2. O histogram reprezint informaia dintr-o serie de valori :A. Fr pierdere de informaieB. Cu pierdere de informaieC. Se pierde cu att mai mult informaie cu ct sunt mai puine claseD. Se pierde cu att mai mult informaie cu ct clasele au lungimi mai mari

    3. Valorile hemoglobinei la 250 de pacieni sunt cuprinse ntre un minim de 7,9 i un maxim de 15,95. Dac

    dorim s avem n jur de 9 clase i deci, 9 bare, vom lua lungimea claselor:A. Din 2 n 2B. Din 3 n 3C. Din 1 n 1D. Din 0,5 n 0,5

    4. Seria de valori ce conine talia a 1132 de indivizi, are ca minim talia de 1,44m iar ca maxim, talia de2,06m. Dorind s efectum o histogram cu cel puin 12 bare (deoarece numrul de indivizi este mare), vo mlua lungimea claselor :

    A. Din 2 cm n 2 cmB. Din 5 cm n 5 cmC. Din 10 cm n 10 cm

    D. Din 1 cm n 1 cm5. Dac la efectuarea unei histograme, am ales din greal un numr de clase (i deci de bare) prea mare,efectul este:

    A. Se pierde mai puin informaieB. Se vd inclusiv aspecte nesemnificativeC. Se pierde prea mult informaieD. Se vor vedea doar aspectele eseniale, eliminndu-se aspectele nesemnificative

    6. Poligonul frecvenelor este:A. Un indicator statistic care arat dispersia valorilor dintr-o serie de valoriB. Un grafic care reprezint printr-o linie frnt frecvenele claselor dintr-un tabel de frecvenC. Un grafic care conine exact aceeai informaie ca i histogram corespunztoare

    D. Un grafic care conine mai puin informaie ca i histograma corespunztoare7. Curba lui Gauss este o curb care este:

    A. Simetric fa de medieB. Simetric fa de axa verticalC. Are un maxim n dreptul medieiD. Tinde asimptotic la 0 spre plus infinit i spre minus infinit

    8. n ce privete curba Gauss este adevrat c:A. n intervalul [ ]smsm + , se afl aproximativ 68% din indivizii populaieiB. n intervalul [ ]smsm 2,2 + se afl aproximativ 95% din indivizii populaieiC. n intervalul [ ]smsm 3,3 + se afl aproximativ 99% din indivizii populaiei

    D. n intervalul [ ]smsm 2,2 + se afl aproximativ 90% din indivizii populaiei

    9. Dac comparm o histogram i poligonul frecvenelor corespunztor, atunci:A. Conine mai mult informaie histogramaB. Conine mai mult informaie poligonul frecvenelorC. Conin amndou aceeai cantitate de informaie

    17


Recommended