+ All Categories
Home > Documents > Studiu Statistic Practic.docx

Studiu Statistic Practic.docx

Date post: 06-Feb-2016
Category:
Upload: mirela-sonea
View: 51 times
Download: 6 times
Share this document with a friend
Description:
punerea in practica a unui studiu statistis, exemplu
25
Transcript
Page 1: Studiu Statistic Practic.docx
Page 2: Studiu Statistic Practic.docx

CuprinsObiectivul proiectului..........................................................................................................................3

Crearea bazei de date..........................................................................................................................5

Descrierea variabilelor statistice.........................................................................................................6

Variabila categoriala................................................................................................................6

Proportii.......................................................................................................................6

Modul..........................................................................................................................6

Diagrama de structura.................................................................................................6

Variabila numerica..................................................................................................................7

Nivelul mediu..............................................................................................................7

Dispersia....................................................................................................................10

Forma distributiei......................................................................................................10

Indicatori ai concentrarii...........................................................................................12

Inferenta statistica............................................................................................................................14

Estimarea prin interval de încredere a unei medii…………………………………………………14

Estimarea prin interval de încredere a unei proportii…………………………………………….14

Testarea unei valori medii cu o valoare fixă…………………………………………………………..14

Testarea unei proportii cu o valoare fixă……………………………………………………………….15

Analiza legaturilor dintre variabile....................................................................................................16

Analiza variantei (ANOVA)…………………………………………………………………………………………….….16

Analiza de corelatie……………………………………………………………………………………………………..……16

Analiza de regresie…………………………………………………………………………………………………..……….17

Concluzii............................................................................................................................................19

2

Page 3: Studiu Statistic Practic.docx

Bibliografie........................................................................................................................................20

1.Obiectivul proiectului

Tema pe care am ales-o pentru acest proiect se refera la sistemul de sanatate din Romania.Consider ca este o tema foarte actuala datorita modificarilor care s-au produs si se produc in ultima perioada de timp. Sistemul de sănătate românesc trebuie reformat din două puncte de vedere: pentru a face faţă problemelor complexe pe care le implică fenomenul de îmbătrânire a populaţiei şi pentru a se orienta spre activităţi de prevenire care pun accent pe întărirea schimbării comportamentelor în rândul populaţiei generale.

În prezent, în România lipsesc programe sau servicii de sănătate adaptate nevoilor specifice populaţiei vârstnice. Procesul inevitabil de îmbătrânire a populaţiei va antrena o creştere foarte mare a consumului de servicii de sănătate şi la o creştere a cheltuielilor publice pentru sănătate de aceea trebuie luate o serie de masuri de reglementare a acestei situatii.

A doua direcţie pe care trebuie să o urmeze reforma sistemului de sănătate vizează concentrarea politicilor pe partea de prevenire a îmbolnăvirilor. Mortalitatea specifică pe cauze arată o tendinţă de creştere a numărului deceselor prin boli cardio-vasculare, atât la adultul tânăr cât şi la vârstnici, precum şi o creştere importantă a ponderii deceselor prin tumori, în special la vârste tinere şi la femei. Pentru schimbarea acestor tendinţe este nevoie de promovarea unui stil de viaţă sănătos, a unei nutriţii echilibrate, de combatere a sedentarismului şi stresului, precum şi a consumului de tutun şi alcool.

Datele pe care le-am folosit le-am preluat din Anuarul Statistic al Romaniei editia 2009, din sectiunea Sanatate, “Paturile din spitale si personalul medico-sanitare pe macroregiuni, regiuni de dezvoltare si judete anul 2008”.

3

Page 4: Studiu Statistic Practic.docx

Macroregiunean /Judeţul Paturi în spitale MediciMACROREGIUNEA 1 37029 12612 Bihor 4272 1544 Bistriţa-Năsăud 1573 400 Cluj 7056 3284 Maramureş 3290 790 Satu Mare 1880 523 Sălaj 1517 318 Alba 2521 682 Braşov 3593 1240 Covasna 2013 349 Harghita 2211 417 Mureş 4250 2052 Sibiu 2853 1013MACROREGIUNEA 2 36473 11386 Bacău 3398 1017 Botoşani 2609 558 Iaşi 6743 3088 Neamţ 2700 719 Suceava 3320 935 Vaslui 2552 496 Brăila 2095 516 Buzău 2715 550 Constanţa 4211 1865 Galaţi 3315 809 Tulcea 1234 337 Vrancea 1581 496MACROREGIUNEA 3 38035 16051 Argeş 3888 1321 Călăraşi 1290 272 Dâmboviţa 2188 625 Giurgiu 855 279 Ialomiţa 891 284 Prahova 4428 1157 Teleorman 2159 525 Ilfov 1594 573 Municipiul Bucureşti 20742 11015MACROREGIUNEA 4 26647 10218 Dolj 4481 2114 Gorj 2269 601 Mehedinţi 1645 479 Olt 2227 690 Vâlcea 2279 711 Arad 2493 940

4

Page 5: Studiu Statistic Practic.docx

Caraş-Severin 2080 556 Hunedoara 3509 1153 Timiş 5664 2974TOTAL 138184 50267

2.Crearea bazei de date

Am ales ca variabile numerice “numarul de paturi din spitale” si “numarul de medici” iar ca variabila categoriala “macroregiuni”.

Esantionul pe care l-am ales este format din 16 judete.

MacroregiunePaturi din

spitale MediciMACROREGIUNEA 1 19588 6859 Bihor 4272 1544 Bistriţa-Năsăud 1573 400 Cluj 7056 3284 Maramureş 3290 790 Satu Mare 1880 523 Sălaj 1517 318MACROREGIUNEA 2 15450 5382 Bacău 3398 1017 Botoşani 2609 558 Iaşi 6743 3088 Neamţ 2700 719MACROREGIUNEA 3 25920 12608 Argeş 3888 1321 Călăraşi 1290 272 Municipiul Bucureşti 20742 11015MACROREGIUNEA 4 8395 3194 Dolj 4481 2114 Gorj 2269 601 Mehedinţi 1645 479Total 69353 28043

5

Page 6: Studiu Statistic Practic.docx

3.Descrierea variabilelor statistice

1.Pentru variabila categoriala macroregiune determinam:

a.Proportiile:

Vrem sa determinam proportia judetelor din macroregiunea 2 in totalul judetelor.Folosim

formula :

b.Valoarea dominanta :

-ne folosim de urmatorul tabel:

Macroregiunea ni

MACROREGIUNEA 1 6

MACROREGIUNEA 2 4

MACROREGIUNEA 3 3

MACROREGIUNEA 4 3

Total 16

Mo = 3

c.Diagrama de structura :

6

Page 7: Studiu Statistic Practic.docx

2.Pentru variabila numerica “numar de medici” determinam:

a.Nivelul mediu

Grupam datele in 4 intervale egale (l=3000 ) astfel:

Medici in spitale xi ni xi` xi`*ni Ni0 - 3000 13 1500 19500 133000- 6000 2 4500 9000 156000 - 9000 0 7500 0 159000 - 12000 1 11500 11500 16Total 16 - 40000 -

-Media aritmetica :

Stabilim mijlocul intervalului dupa formula :

Calculam media aritmetica dupa formula:

In medie fiecare judet are cate 2500 medici.

-Modul:

a.aflăm valoarea frecvenţei maxime : nmax=13

b.aflam intervalul modal corespunzător frecvenţei maxime : (0 - 3000)

c.calculam modul astfel : =1624 , unde ∆1=𝑛i−𝑛i-1= ,

;

Cel mai des se intalneste un numar de 1624 medici in judetele investigate.

- Mediana

a.aflăm valoarea unităţii mediane :

b.calculăm frecvenţa cumulată crescător evidentiata in coloana 5 a tabelului de mai jos:

Medici in spitale xi ni xi` xi`*ni Ni

7

Page 8: Studiu Statistic Practic.docx

0 - 3000 13 1500 19500 13

3000- 6000 2 4500 9000 156000 - 9000 0 7500 0 159000 - 12000 1 11500 11500 16Total 16 40000

c.găsim Ni ≥ Ume : 13

d.intervalul median corespunzător (0 – 3000 )

e.calculam mediana:

,

unde :xi-1 - limita inferioară intervalului median;

Ni-1 - frecvenţa cumulată anterior intervalului median;

ni – frecvenţa intervalului median;

d – mărimea intervalului median;

50% din judete pana la 3270 medici, cealaltă jumătate având peste acest numar.

Pentru construirea histogramei si a curbei frecventelor, am folosit informaţiile din tabelul anterior.

Curba freceventelor

8

3000 6000 9000 12000

14

12

10

8

6

4

2

0

Page 9: Studiu Statistic Practic.docx

Pentru realizarea diagramei BOX-PLOT calculam quartilele Q1, Q2 şi Q3 şi decilele 1 şi 9.

Quartilele se determină astfel:

unde : xi-1 - limita inferioară intervalului quartilic;

d – mărimea intervalului quartilic;

Ni-1 - frecvenţa cumulată anterior intervalului quartilic;

nQ1 – frecvenţa intervalului quartilic;

Decilele se determină după relaţiile :

9

3000 6000 9000 12000

Page 10: Studiu Statistic Practic.docx

Diagrama BOX PLOT arata că 25% din judeţe au un număr de sub 923 medici, jumătate din au până la 1961, iar 75% din acestea au până la 1769 medici.

b.Dispersia

-Varianţa

Medici in spitale xi ni xi` x`i-x (x`i-x)2 (x`i-x)2*ni ni

3000 13 1500 -1000 1000000 13000000 130006000 2 4500 2000 4000000 8000000 40009000 0 7500 5000 25000000 0 0

12000 1 11500 9000 81000000 81000000 9000Total 16 - - - 102000000 26000

*Am folosit datele din acest tabel pentru calculul indicatorilor dispersiei.

-Intervalul mediu de variaţie

Rezultatul arată că 68% numărul medicilor din spitale variaza in intervalul (875 , 4125)

-Coeficientul de variaţie

65

Coeficientul de variaţie este mai mare ca 50%, ceea ce înseamnă că media este nereprezentativă.10

1000 2000 3000 4000 5000 6000

D1 Q1 Q2 Q3 D9

Page 11: Studiu Statistic Practic.docx

c.Indicatori ai formei

Asimetria

Media aritmetică este valoarea cea mai mare,asimetria fiinD pozitivă, ceea ce înseamnă o extindere a frecvenţelor spre dreapta.

-Coeficientul Yule

Deoarece Cay < 0, distribuţia este asimtrică la stanga.Este o distribuţie moderat asimtrică deoarece se apropie de 0.1.

-Coeficientul empiric de asimetrie Pearson

Cas > 0 , rezultă că distribuţia este asimetrică la dreapta.

-Coeficientul de asimetrie Pearson

,

unde 𝜇2= σ2=6375000

Medici in spitale xi ni xi` x`i-x (x`i-x)3 (x`i-x)3*ni3000 13 1500 -1000 -1000000000 -130000000006000 2 4500 2000 8000000000 160000000009000 0 7500 5000 125000000000 0

12000 1 11500 9000 729000000000 729000000000Total 16 732000000000

>0 → distribuţia este asimetrică spre dreapta.

-Coeficientul de asimetrie Fisher

11

Page 12: Studiu Statistic Practic.docx

>0 →asimetrie moderată spre dreapta.

Boltirea

-Coeficientul de boltire Pearson

unde ,

xi ni x`i-x (x`i-x)4 (x`i-x)4*ni0-3000 13 -1000 1E+12 1.3E+133000-6000 2 2000 1.6E+13 3.2E+136000-9000 0 5000 6.25E+14 09000-12000 1 9000 6.56E+15 6.561E+15Total 16 6.606E+15

.

-Coeficientul de boltire Fisher

γ2=β2-3=10.16- 3= 7.16

β2=10.16 > 3, γ2= 7.16 > 0 , distribuţia este leptocurtica.

d.Indicatori ai concentrării

-Abaterea mediană – medială

Mediala se calculează dupa formula:

Medici in spitale xi ni xi` xi`*ni Li0-3000 13 1500 19500 195003000-6000 2 4500 9000 285006000-9000 0 7500 0 285009000-12000 1 11500 11500 40000Total 16 - 40000 -

Abaterea medială-mediană se determină după formula :

∆Mc=Ml-Me=3166.67-1961= 1205.67

12

Page 13: Studiu Statistic Practic.docx

Valoarea coeficientului calculat este foarte mare ceea ce înseamnă că, în acest caz, concentrarea este puternica.

-Coeficientul de concentrare ∆M(%)

Valoarea coeficientului de concentrare tinde spre 0 ceea ce înseamnă o concentrare slabă de 10% .

-Coeficientul abaterii medii Gini

unde

Medici in spitale xi ni Ni n-Ni (Ni-n)*Ni0-3000 13 13 3 393000-6000 2 15 1 156000-9000 0 15 1 159000-12000 1 16 0 0Total 16 - - 69

G=0.32→ Coeficientul abaterii medii Gini tinde spre 0, concentrarea fiind foarte slabă.

-Curba de concentrare

Pentru reprezentarea grafică a curbei de concentrare este necesara cunoasterea valorilor variabilelor p şi q

;

Medici in spitale xi ni xi` xi`*ni Li qi Ni pi

0-3000 13 1500 19500 19500 0.49 13.00 0.813000-6000 2 4500 9000 28500 0.71 15.00 0.946000-9000 0 7500 0 28500 0.71 15.00 0.949000-12000 1 11500 11500 40000 1.00 16.00 1.00Total 16 40000

13

Page 14: Studiu Statistic Practic.docx

Curba de concentrare

-Indicele de concentrare Gini - iG

Pentru aflarea indicelui de concentrare Gini am folosit metoda trapezelor.

Medici in spitale xi ni fi xi` xi`*ni Li qi qi-1+qi (qi-1+qi)fi

0-3000 13 0.81 1500 19500 19500 0.49 0.49 0.403000-6000 2 0.12 4500 9000 28500 0.71 1.20 0.156000-9000 0 0 7500 0 28500 0.71 1.43 0.009000-12000 1 0.06 11500 11500 40000 1.00 1.71 0.11Total 16 - - 40000 - - - 0.65

4.Inferenţa statistică

a.Estimarea prin interval de încredere a unei medii

Pentru determinarea intervalului de încredere folosim urmatoarea formula :

, unde - este valoarea statisticii t care urmează o distribuţie de probabilitate

Student cu n-1 grade de libertate.

14

Page 15: Studiu Statistic Practic.docx

- Daca riscul α=0.05 şi v = n-1=15 se citeşte în tabelul Student valoarea statisticii t0.025;15 =2.131

Intervalul de încredere : → ( 1050.77 ; 3949.23)

Concluzie : Cu un risc de 5% se poate afirma că numărul mediu de medici este cuprins în intervalul ( 1050.77 ; 3949.23).

b.Estimarea prin interval de încredere a unei proporţii

Estimam proporţia judeţelor cu un număr de medici sub 6000. Folosim formula :

, unde

este valoarea statisticii t care urmează o distribuţie de

probabilitate Student cu n-1 grade de libertate.

Daca riscul α=0.05 şi v = n-1=15 se citeşte în tabelul Student valoarea statisticii t0.025;20 =2.131

Intervalul de încredere este : 0.12→(0.82 ; 1.06)

Concluzie :Se poate afirma cu o probabilitate de 95% că proporţia judeţelor cu un număr de sub 6000 de medici in spitale este acoperită de intervalul (82% , 106%).

c.Testarea unei medii cu valoare fixă

Dispunem de urmatoarele date :

n=16, s=2720.3, μ0=1196.83

Ipoteze statistice : H0:μ=μ0 ;

H1:μ≠μ0

= 1.92 t teor se citeşte în Tabelul Student pentru un risc α=0.05 şi v= 15 grade de libertate →tteor = 2.131

15

Page 16: Studiu Statistic Practic.docx

tcalc < t teor → Se acceptă ipoteza Ho.Astfel se poate garanta cu o probabilitate de 95% că nu există diferenţe semnificative între numărul mediu de medici in spitale la nivelul eşantionului şi cel la nivelul tuturor judeţelor.

d.Testarea unei proporţii cu valoare fixă

Folosim următoarele date : f=0.94 ; α=0.05 ; po=0.97

tteor=2.131

< tteor→ se acceptă ipoteza H0. Se poate garanta cu o probabilitate de 95% că nu există

diferenţe semnificative între proporţia judeţelor cu un număr de medici sub 6000 la nivelul eşantionului şi proporţia la nivelul tuturor judeţelor.

16

Page 17: Studiu Statistic Practic.docx

5.Analiza statistică a legăturilor între variabile

a.Analiza varianţei ANOVAAm realizat urmatorul tabel , pe baza caruia am lucrat in Excel.

Macroregiunea 1 Macroregiunea 2 Macroregiunea 3 Macroregiunea 41544 1017 1321 2114

400 558 272 6013284 3088 11015 479

790 719 - -523 - - -318 - - -

Am obtinut:

Anova: Single Factor

SUMMARYGroups Count Sum Average Variance

Macroregiunea 1 6 6859 1143.167 1297273Macroregiunea 2 4 5382 1345.5 1385626Macroregiunea 3 3 12608 4202.667 35081014Macroregiunea 4 3 3194 1064.667 829546.3

ANOVASource of Variation SS df MS F P-value F crit

Between Groups 22319612 3 7439871 1.082631 0.393508 3.490295Within Groups 82464363 12 6872030

Total 1.05E+08 15

Fcalc= 1.08

Fteor = 3.490

Concluzie : Fcalc< Fteor → Se acceptă ipoteza Ho. Se garanteaza cu o probabilitate de 95% că factorul „ macroregiuni„ nu are o influenţă semnificativă asupra numărului de medici in spitale.

b.Analiza de corelaţie

În Excel am obţinut:

17

Page 18: Studiu Statistic Practic.docx

Paturi în

spitale Medici Paturi în spitale 1

Medici 0.98939652

4 1După cum se observă coeficientul de corelaţie ryx= 0.99

Daca α=0.05 şi ipotezele statistice Ho:p=0

H1:p≠0

calculăm valoarea statisticii t: Valoarea teoretica a statisticii t o citim din tabela Student pentru α=0.05 , v=n-2=14 grade de libertate → t=2.145

Concluzie : tcalc > tteor → se respinge ipoteza H0.Coeficientul de corelatie este semnificativ statistic ,între variabilele “număr de medici” şi “număr de paturi in spitale” există o legătură puternică ce se poate garanta cu o probabilitate de 95%.

c.Analiza de regresie:

SUMMARY OUTPUT

Regression StatisticsMultiple R 0.99672258

R Square0.99345590

1Adjusted R Square

0.993292298

Standard Error 1723.745Observations 42

ANOVA

df SS MS FSignificance

FRegression 1 18042833721 1.8E+10 6072.377 2.61E-45Residual 40 118851873.1 2971297Total 41 18161685594

CoefficientsStandard

Error t Stat P-valueLower 95.0%

Upper 95.0%

Intercept112.977688

4 278.240781 0.406043 0.686875-

449.368 675.3233

Medici2.70078732

3 0.034658601 77.92546 2.61E-45 2.63074 2.770835

18

Page 19: Studiu Statistic Practic.docx

Rsquare= 0.99

Intervalul de încredere pentru β0= (449.368; 675.3233)

Intervalul de încredere pentru β1= (2.63074; 2.770835 )

Pentru α=0.05 şi următoarele ipoteze statistice Ho: β0=0

H1: β0≠0

→tcalc =Valoarea teoretică a statisticii test o citim din Tabela Student pentru un risc de α=0.05 şi v=n-2=19 grade de libertate→ t teor=2.093.

Concluzie : tcalc< t teor se acceptă ipoteza Ho şi se respinge ipoteza H1.Cu o probabilitate de 0.95 se poate garanta că parametrul nu e semnificativ diferit de zero,iar între cele doua variabile există o legatură directă.

19

Page 20: Studiu Statistic Practic.docx

6.Concluzii

Putem concluziona ca cea mai dezvoltata din punctul de vedere al sistemului sanatatii este Macroregiunea 3 in care se regaseste si orasul Bucuresti cu cel mai ridicat numar de medici si paturi in spitale , avand si o dotare pe masura.

In Romania, la o populatie de aproximativ 22 milioane , exista peste 50 000 si peste

138 000 de locuri in spitale.Aceste rezultate s-au obtinut la sfarsitul anului 2008 insa in prezent numarul acestora s-a diminuat dramatic din cauza desfiintarilor de spitale.

Rezultatele pe care le-am obtinut la nivelul esantionului pot fi generalizate datorita rezultatelor pozitive obtinute in urma testarii parametrilor.

20

Page 21: Studiu Statistic Practic.docx

7.Bibliografie

 

1)Anuarul Statistic al Romaniei 2008. www.insse.ro;2)Jaba,Elisabeta -Statistica,Ed.a 3-a,revizuita si adaugita Bucuresti; Editura Economica,2002

21


Recommended