Date post: | 20-Feb-2016 |
Category: |
Documents |
Upload: | raysa-danyela |
View: | 302 times |
Download: | 4 times |
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
Universitatea Creștină Dimitrie Cantemir
Facultatea Management Turistic și Comercial
UTILIZAREA SONDAJULUI ÎN CARACTERIZAREA
FENOMENELOR ECONOMICO-SOCIALE
Titular disciplină:
Conf. univ. dr. Emilia Gogu
Iovu Marcela, gr. V
Bucuresti, 2015
Pag. 1 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
Proiectul de statistică
“UTILIZAREA SONDAJULUI ÎN CARACTERIZAREA FENOMENELOR
ECONOMICO-SOCIALE”
TEMA PROIECTULUI:
Un agent economic dispune de o reţea de unităţi economice cu profilul alimentaţie
publică în care sunt angajaţi 500 de vânzători.
Pentru cei 500 de vânzători, consideraţi ca o colectivitate generală s-a întocmit o bază
de sondaj. Înscrierea în baza de sondaj a vânzătorilor s-a făcut în ordine alfabetică, ceea ce
constituie un criteriu aleator şi li s-a dat un cod (nr. crt.)
Considerând cei 500 de vânzători ca formând o colectivitate statistică, se cere:
1. să se extragă printr-un procedeu de sondaj un eşantion de 60 de unităţi şi să se centralizeze
nivelurile individuale ale fiecăreia din variabilele prezentate potrivit conţinutului lor;
2. să se grupeze datele înregistrate la punctul precedent folosind grupările simple pentru toate
caracteristicile înregistrate pe intervale egale şi neegale (se vor folosi minim 8 grupe pentru
intervale egale şi minim 3 grupe pentru intervale neegale) şi să se centralizeze datele
condiţionate de grupările folosite. Să se reprezinte grafic seriile obţinute;
3. să se calculeze toate mărimile relative posibile;
4. să se calculeze indicatorii tendinţei centrale, indicatorii variaţiei şi ai asimetriei pentru
variabilele înregistrate;
5. să se aplice metoda corelaţiei şi regresiei pentru datele din eşantion. Să se măsoare gradul de
intensitate al corelaţiei. Pentru date negrupate se vor lua în calcul primele 10 unităţi din
eşantion, la care se vor calcula şi coeficienţii de corelaţie a rangurilor.
Pag. 2 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
REZOLVARE:
1. Din baza de sondaj se extrage un eşantion format din 60 de vânzători. La extragere vorm
utiliza procedeul selecției mecanice cu pasul de numărare:
k=Nn
în care: N - volumul colectivităţii generale
n – volumul eşantionului
k=Nn
=50060
=8 , 33≈8
Ca primă unitate de eșantionare vom utiliza ultimele două cifre ale numărului matricol
personal (89).
Tabelul 1
Nr. crt SexVârsta Zile
lucrateOre
lucrate
Valoarea încasărilor
Salariul brut lunar
(ani) lunare(lei) (lei)1. (89) F 26 17 135 11050 23622. (97) F 24 23 193 15525 3377
3. (105) F 26 17 135 11050 2362 4. (113) M 24 22 192 15620 3360 5. (121) M 21 21 150 11550 2625 6. (129) F 27 20 163 13200 2852 7. (137) M 25 21 173 15540 3027 8. (145) F 23 22 182 17160 3185 9. (153) F 27 20 163 13200 285210.(161) F 19 17 140 12325 220011. (169) M 22 24 211 18960 3692
12. (177) F 22 17 147 11900 257213. (185) F 24 22 158 15400 276514. (193) F 19 17 140 12325 220015. (201) F 23 24 183 16800 320216. (209) F 22 17 147 11900 257217. (217) F 22 17 147 11900 2572
Pag. 3 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
18. (225) M 23 18 166 12510 290519. (233) M 23 18 142 11880 248520. (241) F 20 19 165 15200 288721. (249) M 23 22 187 14960 327222. (257) F 24 22 158 15400 276523. (265) M 21 22 196 16500 343024. (273) F 21 23 191 17940 334225. (281) F 19 17 140 12325 220026. (289) F 26 23 180 17250 315027. (297) M 24 22 179 16390 313228. (305) M 19 18 160 13410 280029. (313) M 24 22 192 15620 336030. (321) M 25 21 173 15540 302731. (329) F 19 18 150 13410 262532. (337) F 24 21 175 14760 306233. (345) F 20 19 165 15200 288734. (353) F 22 21 190 15645 332535. (361) F 25 23 178 18170 311536. (369) F 21 24 184 16590 294437. (377) F 24 21 175 14760 306238. (385) F 22 17 147 11900 257239. (393) M 23 22 176 15620 308040. (401) M 24 18 141 13140 246741. (409) F 22 17 147 11900 257242. (417) F 20 21 157 15645 274743. (425) F 21 21 170 16800 297544. (433) F 23 22 176 16060 308045. (441) M 25 23 184 13800 322046. (449) F 25 23 178 18170 311547. (457) M 24 18 141 13140 246748. (465) M 21 22 196 16500 343049. (473) M 25 21 173 15540 302750. (481) F 22 21 190 15645 332551. (489) M 20 20 153 13000 267752. (497) F 27 20 163 13200 2852
Pag. 4 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
53. (01) F 26 23 180 17250 315054. (13) F 20 22 157 14520 274755. (21) F 19 18 146 14400 2555
56. (29) M 22 24 211 18960 369257. (37) F 25 23 178 18170 311558. (45) F 26 17 135 11050 236259. (53) M 23 18 166 12510 2905
60. (61) F 20 23 170 18400 2975Total - 1368 1226 10040 884185 174659
Interpretare: Cei 60 de vânzători extraşi din baza de sondaj ne oferă pentru început
următoarele informaţii: au lucrat în total într-o lună 1226de zile – 10040de ore; realizând o
valoare a încasărilor de 884185 lei. Iar fondul de salariu în această lună pentru cei 60 de
vânzători a fost 174659lei.
2. Gruparea datelor înregistrate
2.1. Gruparea pe intervale de variaţie egale
Gruparea pe intervale egale implică următoarele etape:
a) calculul amplitudinii absolute de variaţiei (A) care exprimă împrăştierea maximă a valorilor
serei.
Axa = Xmax – Xmin
Observaţie: Dacă variaţia este foarte mică (în cazul nostru Axa 10) se va forma o distribuţie pe
variante (valabil în cazul caracteristicilor: vârsta; zile lucrate).
b) stabilirea în parametrii într-un anumit număr de grupe (r) se poate stabili astfel:
dacă variaţia caracteristicii este relativ uniformă şi volumul de unităţi nu este suficient de
mare numărul de grupe se poate fixa anterior (din cerinţele proiectului se vor folosi
minimul 8 grupe pentru intervale egale);
iar dacă numărul grupelor nu este anterior cunoscut şi volumul unităţilor este suficient de
mare se recomandă stabilirea grupelor conform relaţiei lui Sturgers,
r = 1+3,322log n
Pag. 5 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
unde: n - nr. caracteristicilor.
b) determinarea mărimii intervalului de grupare (h), se calculează ca raport între amplitudinea
absolută a variaţiei şi numărul de grupe:
h=A A
X
r sau h=
xmax−xmin
1+3 , 222 log n
Notă: Mărimea intervalului (h) se rotunjeşte la întreg în plus (ex.3,254)
Prima grupă se porneşte de la xmin adăugându-se succesiv mărimea intervalului de grupare
(h) rezultat din calculul anterior. Valoarea din stânga intervalului va fi considerată ca limită
inferioară, iar valoarea din dreapta ca limită superioară. Valorile care formează limitele
intervalelor se înregistrează fie numai ca limită superioară fie ca limită inferioară pentru a evita
înregistrări duble a caracteristicilor.
Analog se rezolvă pentru orice variabilă.
2A. Gruparea pe intervale egale avânzătorilor după vârstă
a) amplitudinea variaţiei Axa = Xmax – Xmin= 27 – 19 = 8
Repartiţia vânzătorilor după vârstă(Tabelul 2)
Vârsta
(ani)
Nr.
vânzători
Valori centralizate pentru:
Zile lucrate Ore lucrateValoarea încasărilor
(lei )
Fondul de salariu
lunar (lei)
19 6 105 876 78195 14580
20 6 124 967 91965 16920
21 6 133 1087 95880 18746
22 9 175 1537 128710 26894
23 8 166 1378 117500 24114
24 10 211 1704 149755 29817
25 7 155 1237 114930 21646
26 5 97 765 67650 13386
27 3 60 489 39600 8556
TOTAL 60 1226 10040 884185 174659
Pag. 6 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
Reprezentarea grafică a repartiţiei vânzătorilor după vârstă se poate ilustra prin poligonul
frecvenţelor (Figura 1) şi curba cumulativă a frecvenţelor (Figura 2).
1 2 3 4 5 6 7 8 90
2
4
6
8
10
12
6 6 6
98
10
7
5
3
Repartiția vânzătorilor după vârstă
Vârsta (ani)
Nr.
vânz
ător
i
Figura 1. Repartiția vânzătorilor după vârstă
Frecvențele cumulate crescător și descrescător (Tabel 3)
VârstaNr. vânzători
Frecvențe cumulate(ani) crescător descrescător19 6 6 6020 6 12 5421 6 18 4822 9 27 4223 8 35 3324 10 45 2525 7 52 1526 5 57 827 3 60 3
TOTAL 60 - -
Pag. 7 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
19 20 21 22 23 24 25 26 270
10
20
30
40
50
60
70
612
18
2735
4552
57 606054
4842
3325
158
3
Curba cumulativă a frecvențelor
Vârsta
Frec
venț
e cu
mul
ative
Figura 2. Curba cumulativă a frecvențelor
2B. Gruparea pe intervale egale a vânzătorilor după zile lucrate
Amplitudinea variaţiei Axa = Xmax – Xmin= 24 – 17 = 7
Repartiţia vânzătorilor după numărul zilelor lucrate (Tabelul 4)
Zile
lucrate
Nr.
vânzători
Valori centralizate pentru:
Ore lucrate Valoarea încasărilor
lunare (lei )
Fondul de salariu
lunar (lei)
17 11 1560 129625 26546
18 8 1212 104400 21209
19 2 330 30400 5774
20 4 642 52600 11233
21 10 1726 151425 30202
22 12 2149 189750 37606
23 9 1632 154675 28559
24 4 789 71310 13530
TOTAL 60 10040 884185 174659
Reprezentarea grafică a repartiţiei vânzătorilor după zilele lucrate, se poate ilustra prin
poligonul frecvenţelor (Figura 3) şi prin curba cumulativă a frecvenţelor (Figura 4).
Pag. 8 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
17 18 19 20 21 22 23 240
2
4
6
8
10
12
14
11
8
2
4
10
12
9
4
Repartiția vânzătorilor pe zile lucrate
Zile lucrate
Nr.
vânz
ător
i
Figura 3. Repartiția vânzătorilor după zile lucrate
Frecvențe cumulate crescător și descrescător (Tabel 5)
Zilelucrate
Nr.vânzatori
Frecvente cumulate
crescator descrescator
17 11 11 60
18 8 19 49
19 2 21 41
20 4 25 39
21 10 35 35
22 12 47 25
23 9 56 13
24 4 60 4
Total 60 - -
Pag. 9 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
17 18 19 20 21 22 23 240
10
20
30
40
50
60
70
11
19 2125
35
47
566060
49
41 3935
25
13
4
Curba cumulativă a frecvențelor
Zile lucrate
Frec
venț
e cu
mul
ative
Figura 4. Curba cumulativă a frecvențelor
2C. Gruparea pe intervale egale avânzătorilor după ore lucrate
a) Amplitudinea variaţiei Axa = Xmax – Xmin= 211 – 135 = 76
b) Nr de grupe r = 8
c) Mărimea intervalului h=
A AX
r= 76
8 = 9,5 10
Centralizarea valorilor după orele lucrate se obţine astfel:
Repartiţia vânzătorilor după numărul de ore lucrate(Tabelul 7)
Grupe după nr. ore
lucrate
Nr.
vânzători
Valori centralizate pentru:
Zile
lucrate
Valoarea încasărilor
lunare
Fondul de salariu
lunar (lei)
135 – 145 9 1249 123895 21105
145 – 155 9 1334 124020 23342
155 – 165 10 1609 151255 28154
165 – 175 9 1541 139695 26847
175 – 185 12 2158 178215 37606
Pag. 10 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
185 – 195 7 1335 106975 23361
195 - 205 2 392 29220 6860
205 - 215 2 422 30910 7384
Total 60 10040 884185 174659
Nota: Limita superioară inclusă în interval.
Reprezentarea grafică a repartiţiei vânzătorilor după numărul de ore lucrate, se poate
ilustra prin histogramă, poligonul frecvenţelor (Figura 5) şi prin curba cumulativă a frecvenţelor
(Figura 6).
135 – 145 145 – 155 155 – 165 165 – 175 175 – 185 185 – 195 195 - 205 205 - 2150
2
4
6
8
10
12
14
9 910
9
12
7
2 2
Repartiţia vânzătorilor după numărul de ore lucrate
Nr. de ore lucrate
Nr.
vânz
ător
i
Figura 5. Repartiția vânzătorilor după numărul de ore lucrate
Frecvențe cumulate crescător și descrescător (Tabel 8)
Grupe după nr. ore lucrate
Nr. vânzători
Frecvențe cumulate
crescător descrescător
135 – 145 9 9 60145 – 155 9 18 51155 – 165 10 28 42165 – 175 9 37 32
Pag. 11 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
175 – 185 12 49 23185 – 195 7 56 11195 - 205 2 58 4205 - 215 2 60 2
Total 60 - -
135 – 145 145 – 155 155 – 165 165 – 175 175 – 185 185 – 195 195 - 205 205 - 2150
10
20
30
40
50
60
70
9
18
28
37
49
56 58 6060
51
42
32
23
11
4 2
Curba cumulativă a frecvențelor
Nr. de ore lucrate
Frec
venț
e cu
mul
ative
Figura 6. Curba cumulativă a frecvențelor
2D. Gruparea pe intervale egale a vânzătorilor după salariul brut lunar
a) Amplitudinea variaţiei Axa = Xmax – Xmin= 3692 – 2200 = 1492
b) Nr de grupe r = 8
c) Mărimea intervalului h=
A AX
r= 1472
8 = 186,5 187
Pag. 12 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
Repartiţia vânzătorilor în funcţie de salariul brut lunar (lei) (Tabelul 9)
Grupe după salariul brut
lunar
Nr.
vânzători
Valori centralizate pentru:
Zile
lucrateOre lucrate
Valoarea încasărilor
lunare (lei )
2200 – 2387 6 968 77995 13686
2387 – 2574 9 1497 133610 22834
2574 – 2761 5 767 63390 13421
2761 – 2948 11 1906 168745 31414
2948 – 3135 13 2181 196190 39792
3135 – 3322 6 1062 92795 19179
3322 – 3509 8 1323 120550 26949
3509 – 3696 2 336 30910 7384
Total 60 10040 884185 174659
Nota: Limita superioară inclusă în interval.
Reprezentarea grafică a repartiţiei vânzătorilor după salariul brut lunarse poate ilustra
prin histogramă (Figura 9) şi curba cumulativă a frecvenţelor (Figura 10) .
2200 – 2387
2387 – 2574
2574 – 2761
2761 – 2948
2948 – 3135
3135 – 3322
3322 – 3509
3509 – 3696
0
2
4
6
8
10
12
14
6
9
5
11
13
6
8
2
Repartiția vânzătorilor în funcție de salariul brut lunar
Salariul brut lunar
Nr.
vânz
ător
i
Figura 9.Repartiția vânzătorilor în funcție de salariul brut lunar
Frecvențe cumulate crescător și descrescător (Tabelul 10)
Grupe după Nr. vânzători Frecvențe cumulate
Pag. 13 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
salariul brut lunar crescător descrescător
135 – 145 9 6 60145 – 155 9 15 54155 – 165 10 20 45165 – 175 9 31 40
175 – 185 12 44 29185 – 195 7 50 16195 - 205 2 58 10
205 - 215 2 60 2Total 60 - -
2200 – 2387
2387 – 2574
2574 – 2761
2761 – 2948
2948 – 3135
3135 – 3322
3322 – 3509
3509 – 3696
0
10
20
30
40
50
60
70
615
20
31
4450
58 606054
4540
29
1610
2
Curba cumulativă a frecvențelor
Salariul brut lunar
Frec
venț
e cu
mul
ate
Figura 10. Curba cumulativă a frecvențelor
2.2. Gruparea vânzătorilor pe intervale neegale
Gruparea pe intervale egale ne-a permis structurarea colectivităţii pe grupe cât mai
omogene. De asemenea, după cum s-a observat gruparea statistică este cea mai semnificativă
modalitate a sistematizării datelor după o caracteristica numerică sau nominativă.
Sistematizarea datelor printr-o grupare pe intervale egale răspunde în primul rând
necesităţii de sistematizare şi omogenizare a datelor unei observaţii statistice de masă şi a
caracterizării independente a fiecărei variabile din propria observare .
Pag. 14 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
Pentru analiza structurii colectivităţii pe grupe tipice se foloseşte gruparea pe intervale
neegale.
Gruparea pe intervale neegale presupune regruparea intervalelor egale.
Un prim principiu al grupării pe intervale neegale este trecerea de la variaţia liniară
(interval de mărime constantă) la variaţia neuniformă a unor intervale de grupare din ce în ce mai
mari. De exemplu, de la 8 grupe se poate trece la 5 grupe Analizând situaţia concretă se pot
păstra primele 3 grupe, grupa a patra de obţine cumulând-o cu grupa a cincia, iar ultimele trei
grupe se pot cupla. În cazul acesta se poate trece de la grupe pe variante la grupe pe intervale.
Un alt principiu de grupare are în vedere separarea unităţilor pe trei grupe: mici, mijlocii şi
mari, se porneşte de la nivelul mediu al caracteristicii, care se calculează ca o medie aritmetică
simplă sau ponderată pentru fiecare variabilă în parte:
x=∑i=1
n
x i
n sau
x=∑i=1
n
x i ni
∑i=1
n
ni
unde : xi - variabila
n – numărul unităţilor înregistrate (în cazul nostru n=60 sau dacă nu
avem datele iniţiale folosim media seriei în care, xi sunt valorile sau
centrele de interval şi cu frecvenţele seriei)
Algoritmul de stabilire a celor 3 grupe cu intervale neegale este următorul:
în grupa a II-a sunt cuprinse grupa care conţine nivelul mediu al variabilei şi intervalele
învecinate cu acesta;
grupa I-a este formată limita inferioară a primului interval şi limita inferioară a intervalului
II, iar
a III-a grupa intre limita superioară a intervalului II şi limita superioară a ultimului interval
de grupare.
2.2.A. Gruparea pe intervale neegale a vânzătorilor după vârstă
Nivelul mediu
Pag. 15 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
x=∑i=1
n
x i
n=
136860 = 22,8 23 ani / vânzător
Tabelul 11
Grupe după
vârstă (ani)
Nr.
vânz.
Valori centralizate pentru:
Zile
lucrate
Ore
lucrate
Valoarea
încasărilor
(lei )
Fondul de
salariu
(lei)
Calificativul
19-22 27 544 4463 385760 77345 Cei mai tineri
22-24 18 369 3040 267970 52920 Tineri
24-27 15 313 2537 230455 44394 Mai puțin tineri
Total 60 1226 10040 884185 174659 -
3. Calculul mărimilor relative de structură
Din cele 5 mărimi relative întâlnite în statistică, în proiectul de faţă se pot determina trei:
3.1. Mărimile relative de structură se obţin ca raport între parte şi întreg. Forma cea mai
obişnuita de exprimare a mărimilor relative de structură este cea a procentelor care arată câte
unităţii din indicatorul raportat revin la 100 unităţi ale indicatorului bază de raportare. Se pot
calcula atât pe baza frecvenţelor absolute şi în acest caz au sens de frecvenţe relative (ni¿
)
ni (% )¿ =
ni
∑i=1
k
ni
⋅100
cât şi pe baza valorilor centralizate privind : vârsta, zilele lucrate, orele lucrate, volumul
desfacerilor şi salariul net, obţinându-se în acest caz pondereasaugreutatea specifică(gi ) a unei
valori (x i ) în totalul valorilor colectivităţii (∑i=1
n
x i):
gi(% )=xi
∑i=1
n
xi
⋅100
Pag. 16 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
3.2. Mărimile relative de coordonare se obţin ca raport între două grupe sau între două
colectivităţi ce coexistă în spaţiu.
Pentru o colectivitate împărţită în două grupe pentru care nivelul pe grupe al variabilei
studiate este xA şi xB :
K A /B=x A
xB sau =
x B
x A¿
Dacă sunt mai multe grupe, se alege una ca bază de comparaţie şi se raportează, pe rând,
fiecare grupă la baza aleasă.
3.3. Mărimile relative de intensitate se obţin prin raportarea a doi indicatori cu conţinut
diferit dar între care există o relaţie de interdependenţă.
la nivel parţial: x i=
y i
zi ; la nivelul ansamblului: x=
∑ y i
∑ zi
3.A. Calculul mărimilor relative pe baza repartiţiei vânzătorilor după vârstă.
Repartiţia timpului lucrat (în zile şi ore), a valorii desfacerii şi a fondului de salarii şi a
structurii acestora în funcţie de vârstă
Tabelul 12
Intervalul de
variaţie al
vârstei
Calificativul
Mărimi relative de structură %
Frecvenţe
relative
ni¿
gi
Zile lucr Ore lucr Val. desf Fond
salariu
19 - 22 Cei mai tineri 45 44,4 44,5 43,6 44,3
22 - 24 Tineri 30 30,1 30,2 30,3 30,3
24 - 27 Mai puțin tineri 24 25,5 25,3 26,1 25,4
Total - 100 100 100 100 100
Interpretare: Cei mai tineri alcătuiesc 45% din totalul angajaţilor, lucrează 44,4% respectiv
44,5% din totalul zilelor şi orelor lucrate, realizează 43,6% din valoarea încasărilor şi primesc
44,3% din fondul de salarii.
Pag. 17 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
4. Caracterizarea statistică a repartiţiilor obţinute
Caracterizarea statistică în cazul dat se referă la determinarea:
a) Indicatorilor tendinţei centrale:
Media aritmetică
x=∑i=1
k
xi ni
∑i=1
k
ni
Modul (modulul, dominanta)
Mo=x0+hΔ1
Δ1+Δ2 Mediana (Me)
Me=x0+h⋅
∑i=1
k
ni+1
2−∑
i=1
m−1
n i
nm
b) Indicatorii sintetici ai variaţiei şi ai asimetriei:
Abaterea medie liniară( d ) :
d=∑i=1
k
|x i− x| ni
∑i=1
k
ni
Dispersia σ2
σ 2=∑i=1
k
(x i− x )2ni
∑i=1
k
ni
Abaterea medie pătratică σ
σ=√σ2
Coeficientul de variaţie (v):
Pag. 18 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
v'= dx⋅100
respectiv v= σ
x⋅100
Coeficientul de asimetrie
Cas=x−Mo
σ sau Cas
' =3( x−Me )
σ
4.A. Repartiţia vânzătorilor după vârstă (Tabelul 13)
Vârsta
(ani)
Nr,
vânzătorixini
Frecvenţe cumulate
crescător(x i− x)2 ni
19 6 114 6 94,57
20 6 120 12 52,93
21 6 126 18 23,28
22 9 198 27 8,47
23 8 184 35 0,0072
24 10 240 45 10,61
25 7 175 52 28,85
26 5 130 57 45,90
27 3 81 60 48,72
TOTAL 60 1368 - 313,34
a) Calculul indicatorilor tendinţei centrale:
Media aritmetică
x=∑i=1
k
x i ni
∑i=1
k
ni
= 136860
= 22,97 ani/ vânzător
Modul (modulul, dominanta)
Fiind o serie pe variante Modul este valoarea cu frecvenţa maximă
Mo=23 ani / vânz Mediana (Me)
Pag. 19 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
locul medianei: U ( Me )=
∑i=1
k
ni+1
2=60+1
2=30 ,5
Variabila 23 ani este prima a cărei frecvenţă cumulată crescător este mai mare de 30,5.
b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei
Dispersia σ2
σ 2=∑i=1
k
(x i− x )2 ni
∑i=1
k
ni
= 313,460
= 5,22 ani/vânzător
Abaterea medie pătratică σ
σ=√σ2= √5,22 = 2,28 ani/vânzător
Coeficientul de variaţie (v):
v= σx⋅100= 2,28
22,97∗100 = 9,93 %
v` şi v< 35% - seria este omogenă şi media este reprezentativă pentru serie
Coeficientul de asimetrie
Cas=x−Mo
σ= 22,97−23
2,28 = -0,01
sau Cas
' =3( x−Me )
σ= 3(22,97−30,5)
2,28 = - 9,90
Rezultă asimetrie negativă foarte moderată
4.C. Repartiţia vânzătorilor după orele lucrate (Tabelul 14)
Pag. 20 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
Grupe după ore
lucrate
Nr,
Vânz.
Centrul
intervalului
xi
xini
Frecvenţe
cumulate
crescător(x i− x)2 ni
135 – 145 9 140 1260 9 6806,25
145 – 155 9 150 1350 18 2756,25
155 – 165 10 160 1600 28 562,5
165 – 175 9 170 1530 37 56,25
175 – 185 12 180 2160 49 1875
185 – 195 7 190 1330 56 3543,75
195 - 205 2 200 400 58 2112,5
205 - 215 2 210 420 60 3612,5
Total 60 - 10050 - 21325
a) Calculul indicatorilor tendinţei centrale:
Media aritmetică
x=∑i=1
k
x i ni
∑i=1
k
ni
=. 1005060
= 167,5 ore/ vânzător
Modul
Locul Mo - intervalul cu frecvenţa maximă (165 – 175)
Mo=x0+hΔ1
Δ1+Δ2=.
165 + 10 9−10
(9−19 )+(9−12) = 43,7 ore/ vânzător
Mediana (Me)
locul medianei: U ( Me )=
∑i=1
k
ni+1
2=60+1
2=30 ,5
Deci intervalul (165 - 175) este primul interval a cărei frecvenţă cumulată crescător este mai
mare de 30,5.
Pag. 21 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
Me=x0+h⋅
∑i=1
k
ni+1
2−∑
i=1
m−1
n i
nm = 165+ 10
30,5−289
= 49
b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei
Dispersia σ2
σ 2=∑i=1
k
(x i− x )2 ni
∑i=1
k
ni
= 2132560
= 355,42
Abaterea medie pătratică σ
σ=√σ2=√355,42 = 18,85 ore/vânzător
Coeficientul de variaţie (v):
v= σx⋅100= 18,85
167,5 * 100 = 11,25 %
v` şi v< 35% - seria este omogenă şi media este reprezentativă pentru serie
Coeficientul de asimetrie
Cas=x−Mo
σ= 167,5−43,72
18,85 = 6,58
Cas' =
3( x−Me )σ
= 3(167,5−49)18,85 = 18,87
Rezultă asimetrie pozitivă.
Pag. 22 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
4. E. Repartiţia vânzătorilor după salariu brut (lei) (Tabelul 15)
Grupe după
salariul brut
lunar
Nr,
vânz.
Centrul
intervalului
xi
xini
Frecvenţe
cumulate
crescător
|x i− x|ni (x i− x)2 ni
2200 – 2387 6 2293,5 13761 6 3665,22 2238972,94
2387 – 2574 9 2480,5 22324,5 15 3814,83 1616991,99
2574 – 2761 5 2667,5 13337,5 20 1184,35 294929,18
2761 – 2948 11 2854,5 31399,5 31 584,57 27357,19
2948 – 3135 13 3041,5 39539,5 44 1431,69 244460,28
3135 – 3322 6 3228,5 19371 50 1944,78 630361,54
3322 – 3509 8 3415,5 27324 58 4089,04 2090031,02
3509 – 3696 2 3602,5 7205 60 1396,26 974770,99
Total 60 - 174262 - 18110,74 8117875
a) Calculul indicatorilor tendinţei centrale:
Media aritmetică
x=∑i=1
k
x i ni
∑i=1
k
ni
= 17426260
=2904,37 lei/vânzător
Modul
Locul Mo - intervalul cu frecvenţa maximă (2948-3135)
Mo=x0+hΔ1
Δ1+Δ2 = 2948 + 187 13−11
(13−11 )+(13−6) = 689,7mii lei/vânzător
Mediana (Me)
locul medianei: U ( Me )=
∑i=1
k
ni+1
2=60+1
2=30 ,5
Pag. 23 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
prin urmare intervalul (2948-3135) este primul interval a cărei frecvenţă cumulată crescător este
mai mare de 30,5.
Me=x0+h⋅
∑i=1
k
n i+1
2−∑
i=1
m−1
ni
nm
= 2948 + 187
30,5−3113
= -125,4
b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei
Dispersia σ2
σ 2=∑i=1
k
(x i− x )2 ni
∑i=1
k
ni
= 811787560
= 135297,92
Abaterea medie pătratică σ
σ=√σ2=√135297,92 = 367,83 mii lei/vânzător
Coeficientul de variaţie (v):
v= σx⋅100= 367,83
2904,37 * 100 = 1,66 %
v` şi v< 35% - seria este omogenă şi media este reprezentativă pentru serie
Coeficientul de asimetrie
Cas=x−Mo
σ= 2904,37−689,7
367,83 = 6,02
Cas' =
3( x−Me )σ
= 3 (2904.37 )−(−125,4)367,83 = 24,71
Rezultă asimetrie pozitivă.
Pentru interpretarea rezultatelor se vor trece indicatorii obţinuţi într-un tabel sintetic (Tabelul 16)
Pag. 24 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
Indicatori Vârsta Ore lucrate
Salariul brut lunar (lei)
Media aritmetică 22,97 167,5 2904,37Dispersie 5,22 355,42 135297,92
Abaterea medie pătratică 2,28 18,85 367,83
Coeficientul de variaţie % 9,93 11,25 24,71
5. Analiza corelaţiei dintre numărul de ore şi salariu brut lunar
5.1 Corelaţia liniară simplă (date negrupate)
Se aplică pentru primele 10 unităţi din eşantion, privind numărul de ore lucrate (xi) şi salariul
brut lunar (yi) - lei. Seria se va ordona crescător după numărul de ore lucrate (xi) menţinându-se
salariul brut lunar (yi) corespunzător.
Dintre metodele simple de cercetare a legaturilor statistice recurgem la :
A) Metoda seriilor paralele interdependente (Tabelul 17);
Nr.
crt
Ore lucrate
(xi)
Salariul brut lunar
(lei) (yi)
1. 135 2263
2. 135 2362
3. 140 2200
4. 150 2625
5. 163 2852
6. 163 2852
7. 173 3027
8. 182 3185
9. 192 3360
10. 193 3377
Concluzie: Valorile xi fiind ordonate crescător se poate observa că şi valorile yi cresc în cea mai
mare parte, ceea ce sugerează o legătură directă.
B) Metoda grafică este o altă cale de a stabili legătura dintre fenomene.
Pag. 25 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
Pentru a obţine graficul de corelaţie, denumit şi corelograma, valorile caracteristicii factoriale
(xi) sau intervalele acesteia se trec pe abscisa, iar pe ordonate valorile caracteristicii rezultative
(yi) sau intervalele respective. Fiecare unitate observată a celor două caracteristici se reprezintă
grafic printr-un punct.
1 3 5 1 3 5 1 4 0 1 5 0 1 6 3 1 6 3 1 7 3 1 8 2 1 9 2 1 9 30
500
1000
1500
2000
2500
3000
3500
4000
Corelaţia dintre salariul brut lunar şi orele lucrate
Figura 11. Corelația dintre salariul brut lunar și orele lucrate
Graficul de asemenea confirmă o legătură directă de formă liniară.
Metoda grafica este utilizată cu bune rezultate pentru alegerea funcţiei analitice care se
studiază (y = 19.876x - 425.62 în cazul regresiei şi corelaţiei)
Metodele de studiere a legaturilor prezentate anterior au ca deficienţă principală faptul că
deşi permit constatarea legăturii şi caracterul ei, nu o pot măsura printr-un indicator sintetic.
Acest inconvenient este înlăturat prin utilizarea metodei regresie.
Metoda regresiei constituie o metoda statistică analitică de cercetare a legăturii dintre
variabile cu ajutorul unor funcţii denumite funcţii de regresie.
Notând cu Y variabile dependenta şi cu x1 , x2 ... xn variabilele independente obţinem
ecuaţia de regresie y = f (x1 , x2 ... xn).
În cazul de fata am apelat la modelul de regresie unifactorială liniar considerând legătura
dintre y şi x de tipul yxi = a +bxi. Parametri ecuaţiei în acest caz se determină prin rezolvarea
următorului sistem de ecuaţii:
Pag. 26 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
{na+b∑ x i=∑ y i¿ ¿¿¿Dacă se foloseşte metoda determinanţilor se obţine:
a=
| ∑ y i ∑ x i
∑ x i y i ∑ xi2|
| n ∑ x i
∑ x i ∑ x i2|
=∑ y i∑ x i
2−∑ x i y i∑ xi
n∑ x i2−(∑ x i )
2
b=
|n ∑ yi
∑ x i ∑ x i y i
|
|n ∑ xi
∑ xi ∑ xi2|
=n∑ xi y i−∑ xi∑ y i
n∑ x i2−(∑ x i )
2
Datele necesare calculării celor doi parametri sunt prezentate în Tabelul 36
a= - 340,61
b= 19,38
Funcţia de regresie este: Yxi=i
Valorile funcţie de regresie se obţin înlocuind xi cu valorile empirice.
Parametrul b=19,38 se interpretează astfel: creşterea numărului de ore cu o unitate, ar determinat
o creştere a salariului net, în medie cu 19,38 lei.
Tabelul 18
Nr ctr. xi yi x i2 xiyi Yxi= - 340,61+18,38xi
1. 135 2263 18225 305505 2140, 69
2. 135 2362 18225 318870 2140, 69
3. 140 2200 19600 308000 2232,59
4. 150 2625 22500 393750 2416,39
5. 163 2852 26569 464876 2655,33
6. 163 2852 26569 464876 2655,33
7. 173 3027 29929 523671 2839,13
8. 182 3185 33124 579670 3004,55
Pag. 27 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
9. 192 3360 36864 645120 3188,35
10. 193 3377 37249 651761 3206,73
Total 1626 28103 268854 4656099 22198,4
a) Raportul de corelaţie liniară simplă se ca calcula cu formula:
R y /x=√1−∑ ( y i−Y x i
)2
∑ ( y i− y )2
Tabelul 19
Nr. crt xi yi Yxi (yi - Yxi)2 (yi - y )2 y i2
1. 135 2263 2140, 69 14959,74 299537,29 51211692. 135 2362 2140, 69 14716,12 200972,89 55790443. 140 2200 2232,59 1062,11 372466,09 48400004. 150 2625 2416,39 43518,13 34336,09 68906255. 163 2852 2655,33 38679,09 1738,89 81339049. 163 2852 2655,33 38679,09 1738,89 81339047. 173 3027 2839,13 35295,14 46958,89 91627298. 182 3185 3004,55 32562,20 140400,09 101442259. 192 3360 3188,35 29463,72 302170,09 1128960010. 193 3377 3206,73 28991,87 321148,89 11404129
1626 28103 22198,4 278170,8 1721468,1 80699329
Unde: y=28103
10 = 2810,3
R y /x=0,9156477023
Se poate spune că legătură este strânsă (Ry/x=0,9156477023).
b) Metoda coeficientului de corelaţie
Intensitatea legăturii se măsoară prin coeficientul de corelaţie (ry/x).
Pag. 28 din 30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
r y /x=n∑ x i y i−∑ x i∑ yi
√ [n∑ x i2−(∑ x i)
2 ]⋅[ n∑ y i2−(∑ y i)
2 ]=
¿ 0,99
Rezultă că legătura dintre aceste două variabile este directă (rz/x>0) şi puternică. Există
legătură liniară intensă deoarece ry/x=Ry/x.
c) Calculul coeficientului de corelaţie a rangurilor
Coeficienul de corelaţie a rangurilorpropus de Spearman:
r s=1−6∑ d i
2
n3−nîn care: di - reprezintă diferenţa între rangurile perechii de valori (xi,yi);
n - numărul de perechi de valori.Coeficientul de corelaţie a rangurilor propus deKendall :
în care S=∑ ( Pi−Qi)în care: Pi - numărul rangurilor mai mari care urmează rangului curent pentru variabila
dependentă; Qi - numărul rangurilor mai mici care urmează rangului curent pentru variabila
dependentă.
Calculul coeficienţilor de corelaţie a rangurilorTabelul 20
Nr crt xi yiRanguri di=rxi-ryi di
2 Pi Qi Pi-Qirxi ryi
1. 135 2263 1 2 -1 1 7 1 62. 135 2362 1 3 -2 4 7 1 63. 140 2200 2 1 1 1 6 0 64. 150 2625 3 4 -1 1 5 0 55. 163 2852 4 5 -1 1 4 0 49. 163 2852 4 5 -1 1 4 0 47. 173 3027 5 6 -1 1 3 0 38. 182 3185 6 7 1 1 2 0 29. 192 3360 7 8 -1 1 1 0 110. 193 3377 8 9 -1 1 0 0 0
Total 1626 28103 -7 37
Pag. 29 din 30
rk=2⋅S
n⋅(n−1)
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Iovu Marcela
rs = 1- 6−(−7)103−10
=¿1,42
rk= 2∗37
10(10−1)=¿0,82
Pag. 30 din 30