Date post: | 17-Apr-2015 |
Category: |
Documents |
Upload: | stefan-sorin-acatrinei |
View: | 159 times |
Download: | 16 times |
UNIVERSITATEA “ AL. I. CUZA ”, IASI
FACULTATEA DE ECONOMIE SI ADMINISTRAREA AFACERILOR
Proiect Statistica
Student: Moise C. Simona
Numar matricol: 31040701sl061288
An: II
Grupa: 1124
Specializarea: Afaceri internationale
Etape ale demersului metodologic al statisticii
1. Punerea problemei presupune definirea problemei in termini precisi indicandu-se scopul si aria de investigatie.
Aici se efectueaza:- documentarea teoretica si faptica a fenomenului;- se emit ipoteze de lucru;- se aleg metode de investigare;- se elaboreaza planul de cercetare.
2. Observarea statistica in care se inregistreaza caracteristicile elementelor unei colectivitati, se obtine materialul faptic.
3. Prelucrarea statistica presupune un set de operatiuni efectuate prin procedee si tehnici de lucru specifice si anume:
a. Sistematizarea materialului obtinut in etapa observarii statistice;b. Prezentarea datelor statistice;c. Calcularea indicatorilor derivati, cum ar fi indicatorii ai valorii centrale, ai
dispersiei, ai formei de repartitie, folosind procedeul mediei, variatiei sau indicatori ai variatiei in timp si spatiu.
- modulul (dominanta)- mediana- mediala- indicatori ai dispersiei
4. Indicatori ai asimetriei5. Indicatori ai boltirii6. Indicatorii concentrarii
1. Punerea problemei
Alegem o serie de date realizate la o societate comerciala care are mai multe subunitati. In exemplul pe care urmez sa-l efectuez am luat in considerare o serie statistica prezentata sub forma unui tabel statistic simplu cu urmatoarele elemente principale:
- Titlul tabelului: Distributia numarului de subunitati dupa profitul obtinut in anul precedent;
- Titlurile interioare: Profit, Numarul subunitatilor, Numarul de personal;- Unitatea de masura: este precizata sub titlurile interioare;- Notele, generale sau particulare, ajuta la interpretarea datelor numerice;- Sursele datelor: - Rubricile tabelului sunt completate cu date aproximative.
Tabelul nr. 1 Distributia subunitatilor firmei ””, dupa profitul obtinut
Nr. Crt. Numarul firmelor
Cifra de afaceri(mii lei)
Total unitate(mii lei)
1 1 100 100
2 3 105 315
3 6 108 648
4 6 110 660
5 5 115 575 21
6 11 121 1331
7 9 125 1125
8 10 130 1300
9 9 135 1215 39
10 10 141 1410
11 12 148 1776
12 9 150 1350 31
13 10 162 1620
14 9 165 1485
15 9 170 1530 28
16 9 181 1629
17 11 185 2035
18 5 195 975 25
19 4 205 820
20 2 210 420 6
TOTAL 150 22319
Se va calcula frecventa relativa, efectivul cumulat si frecventa relativ cumulata a distributiei salariului de baza dupa caracteristica “numar de personal”.
Tabelul nr. 2 Distributia numarului de subunitati dupa profitul obtinut
Profit Numar de firme(Efectivul
)
Frecventa
relativa( )
Efective cumulate
Efective cumulate
Frecvente relative cumulate
Frecvente relative cumulate
Mii lei
100-120 21 0.14 21.00 150.00 0.14 0.98
120-140 39 0.26 60.00 129.00 0.40 0.84
140-160 31 0.21 91.00 90.00 0.61 0.58
160-180 28 0.19 119.00 59.00 0.79 0.39
180-200 25 0.17 144.00 31.00 0.96 0.21
200-220 6 0.04 150.00 6.00 1.00 0.04
TOTAL 150 1.00 - - - -
2. Observarea statistica
Reprezentarea grafica a seriei statistice de timp se poate realiza prin cronograma.Cronograma (historiograma) sub forma liniara cu scara aritmetica, evidentiaza linia de
evolutie a fenomenului si componentele seriei luate in calcul.
Profit Numar de firme(Efectivul
)
100-120 21
120-140 39
140-160 31
160-180 28
180-200 25
200-220 6
TOTAL 150
Cronograma prin benzi si prin coloane. Coloanele se construiesc cu bazele egale si echidistante.
Profit Numar de firme(Efectivul
)
Mii lei
100-120 21
120-140 39
140-160 31
160-180 28
180-200 25
200-220 6
TOTAL 150
Curba frecventelor se mai numeste curba de densitate atunci cand se refera la serii teoretice. Construirea curbei frecventelor se deosebeste de cea a poligonului frecventelor prin faptul ca punctele din plan nu se unesc prin segmente de dreapta, ci printr-o linie curba (obtinuta prin ajustarea
Profit Numar de firme(Efectivul
)
Mii lei
100-120 21
120-140 39
140-160 31
160-180 28
180-200 25
200-220 6
TOTAL 150
punctelor), graficul satisfacand cel mai bine conditiile de continuitate si de compensatie intre abaterile pozitive si abaterile negative.
Profit Frecventa
relativa( )
Mii lei
100-120 0.14
120-140 0.26
140-160 0.21
160-180 0.19
180-200 0.17
200-220 0.04
TOTAL 1.00
Construirea curbei frecventelor cumulate (Poligonul frecventelor cumulate)
Profit Frecvente relative cumulate
Mii lei
100-120 0.14
120-140 0.40
140-160 0.61
160-180 0.79
180-200 0.96
200-220 1.00
TOTAL -
Diagrame de structuraConstruirea diagramelor de structura
necesita gasirea relatiei de proportionalitate corespunzatoare intre volumul colectivitatii si suprafata figurii geometrice folosite. Numarul de subunitati, egal cu 100%, se considera direct proportional cu suprafata figurii geometrice folosita in reprezentare. Profitul se reprezinta in interiorul figurii prin portiuni de suprafete. Portiunile de suprafata se hasureaza sau se coloreaza diferit. Semnificatia hasurilor sau culorilor utilizate se prezinta in legenda graficului.
Profit Numar de firme(Efectivul
)
Mii lei
100-120 21
120-140 39
140-160 31
160-180 28
180-200 25
200-220 6
TOTAL 150
Diagrama de structura
Prelucrarea statistica 1. Sistematizarea materialului faptic brut s-a obtinut in etapa observarii statistice;2. Prezentarea datelor conform tabelelor 1 si 2;3. Calcularea indicatorilor derivati;
3.a. Indicatori ai tendintei centrale (marimi medii)
Tendinta centrala a unei variabile statistice este masurata prin indicatori calculate in marimi medii. In practica, cel mai cunoscut indicator al tendintei centrale este media aritmetica. Media aritmetica este cel mai utilizat indicator al tendintei centrale pentru a exprima sintetic un ansamblu de date. Toti indicatorii au character de medie, media reprezentand categoria metodologica fundamentala a statisticii.
Mediile sunt marimi statistice care exprima, in mod sintetic si generalizat, ceea ce este normal, esential, tipic pentru unitatile unei colectivitati distribuite dupa o anumita caracteristica.
Clasificarea marimii medii
Marimile medii se diferentiaza intre ele in functie de rolul pe care il au in analiza statistica si dupa modul de obtinere a lor.
a. dupa rolul lor in analiza statistica, marimile medii se clasifica in:- marimi medii fundamentale (media aritmetica, modul, mediana)- marimi medii cu aplicatii speciale (media geometrica, media armonica, media
progresiva, mediala, media cronologica, medii mobile, etc.)b. dupa modul de obtinere, marimile medii pot fi:
- marimi medii de calcul (media aritmetica, media geometrica, media armonica, etc.)
- medii de pozitie (modul, mediana, mediala)
Daca consideram seria din tabelul 1, vom calcula media aritmetica, media armonica, media geometrica, media patratica.
Tabelul nr.3 Elemente de calcul pentru indicatorii tendintei centrale
/ log log
100-120 21 110 2310 0.1909 2.04 42.87 12100 254100120-140 39 130 5070 0.3000 2.11 82.44 16900 659100140-160 31 150 4650 0.2067 2.18 67.46 22500 697500160-180 28 170 4760 0.1647 2.23 62.45 28900 809200180-200 25 190 4750 0.1316 2.28 56.97 36100 902500200-220 6 210 1260 0.0286 2.32 13.93 44100 264600TOTAL 150 - 22800 1.0224 - 326.13 - 3587000
Media aritmetica face parte din categoria mediilor fundamentale, a mediilor de calcul. Media aritmetica a unei distributii empirice reprezinta valoarea pe care ar purta-o fiecare
unitate statistica daca distributia ar fi omogena si se calculeaza ca suma a celor , i=1, n
valori individuale impartite la numarul de observari.
Media aritmetica: mii lei
Media armonica este o marime definita ca inverse a mediei aritmetice calculate din inversele valorilor caracteristice.
Media armonica: mii lei
Media geometrica, la fel ca si media aritmetica, ia in calcul fiecare valoare individuala a caracteristicii, dar se aplica numai pentru numere positive. Media geometrica a “n” date se defineste ca radacina de ordin n din produsul acestora.
Media geometrica: logaritmam expresia mediei geometrice si obtinem:
lg
mii lei
Media patratica este definita prin patratul sau, si anume: media patratica ridicata la
patrat este media aritmetica a valorilor .
Modul (Dominanta) este valoarea caracteristicii cea mai frecvent observata intr-o distributie, adica valoarea ce corespunde frecventei dominante.
Aflarea modului in cazul unei variabile continue
In cazul datelor grupate pe intervale de variatie, determinarea modului presupune:
1. aflarea frecventei maxime ( );
2. citirea intervalului modal ( ) corespunzator frecventei maxime;
3. efectuarea interpolarii in intervalul modal dupa relatia:
in care:
: limita inferioara a intervalului modal [120];
: marimea intervalului modal ( )[20];
: diferenta dintre frecventa intervalului modal si frecventa intervalului anterior
celui modal ( )[39-21];
: diferenta dintre frecventa intervalului modal si frecventa intervalului urmator
celui modal ( )[39-31];
Profitul Efectivul
100-120 21
120-140 39
140-160 31
160-180 28
180-200 25
200-220 6
TOTAL 150
mii lei
Mediana(Me) se defineste ca acea valoare a caracteristicii unei serii ordonate, crescator sau descrescator, pana la care si peste care sunt distribuite in numar egal unitatile colectivitatii observate: jumatati din unitati au valori mai mari decat mediana si jumatate au valori mai mici.
Pentru aflarea Me se presupune efectuarea urmatoarelor operatii:
1. determinarea frecventelor cumulate: ;
2. calcularea unitatii mediane ( ) si gasirea locului ei in sirul frecventelor cumulate,
respectand conditia: ;
3. se afla nivelul caracteristicii egal cu Me, in dreptul frecventei cumulate egale sau mai
mare cu .
Tabelul nr.4 Elemente de calcul pentru calculul medianei
100-120 21 110 2310 21
120-140 39 130 5070 60
140-160 31 150 4650 91
160-180 28 170 4760 119
180-200 25 190 4750 144
200-220 6 210 1260 150
TOTAL 150 - 22800 -
In dreptul frecventei cumulate =91, ( ), citim intervalul median: (140-160).
Deci, mediana este: mii lei
Generalizarea medianei: quantilele
Quantilele sunt marimi de pozitie. Se definesc dupa aceeasi logica folosita la mediana: quantilele sunt valori ale caracteristicii care impart seria in r grupe ale caror efecte sunt egale. Numarul r defineste ordinul quantilelor.
Astfel, mediana este quantila de ordin 2, adica imparte efectivul in doua parti egale (50% si 50%). Quantilele folosite in mod obisnuit sunt quantile care impart colectivitatea in patru, zece, o suta de parti egale, numindu-se quartile, decile, centile.
Quantilele sunt folosite in calculul unor indicatori ai dispersiei.
Tabelul nr.5 Elemente pentru calculul quartile
100-120 21 21 150
120-140 39 60 129
140-160 31 91 90
160-180 28 119 59
180-200 25 144 31
200-220 6 150 6
TOTAL 150 - -
Quartilele sunt in numar de trei, notate: .Se definesc ca valori ale
caracteristicii care impart volumul colectivitatii in patru parti egale. Se determina dupa relatiile:
mii lei
mii lei
mii lei
firme
Mediala (Ml)
Mediana este un indicator de pozitie egal cu acel nivel al caracteristicii ( ) care
imparte suma termenilor seriei in parti egale.
Mediala nu se confunda cu mediana, care reprezinta acel nivel al caracteristicii care
imparte efectivul total ( ) al unei serii in doua parti egale.
Determinarea medialei presupune efectuarea urmatoarelor operatii:
1. se ordoneaza crescator termenii ( ) si seriei;
2. se determina sirul valorilor individuale cumulate ale caracteristicii: ;
3. se determina unitatea mediala dupa formula:
4. se afla mediala, adica se gaseste acel nivel al caracteristicii corespunzator primului
nivel cumulate ( ) egal sau mai mare decat ( ).
Tabelul nr.6 Elemente de calcul pentru calculul medianei
100-120 21 110 2310 2310 21
120-140 39 130 5070 7380 60
140-160 31 150 4650 12030 91
160-180 28 170 4760 16790 119
180-200 25 190 4750 21540 144
200-220 6 210 1260 22800 150
TOTAL 150 - 22800 -
Din tabelul nr.5 calculam:
Pentru [ ]=12030 citim intervalul medial: (140-160), in care se gaseste
valoarea mediala. Aflam valoarea medialei prin interpolare, dupa relatia:
mii lei
Indicatori ai dispersiei
Dispersia exprima gradul de imprastiere a valorilor individuale ale unei distributii in jurul valorii centrale si este datorata influentei factorilor aleatori.
Tabelul nr.7 Elemente de calcul necesare obtinerii indicatorilor dispersiei
- ( - ) ( - )
100 -120 21
110
2310
-42
42
882
1764
37044
120-140
39 130 5070 -22 22 858 484 18876
140-160 31
150
4650
-2
2
62
4
124
160-180 28
170
4760
18
18
504
324
9072
180-200 25
190
4750
38
38
950
1444
36100
200-220 6
210
1260
58
58
348
3364
20184
TOTAL 150
- 22800
- - 3604
- 121400
Indicatori simpli ai dispersiei
Amplitudinea varoatiei: mii lei
Rezultatele obtinute arata un camp de variatie a cifrei de afaceri egal cu 120 mii lei, valoare ce reprezinta 78.94% din nivelul mediu al intregii distributii.
Indicatori sintetici ai dispersiei
Indicatorii sintetici ai dispersiei exprima, in mod sintetic, imprastierea tuturor nivelurilor individuale ale unei caracteristici fata de nivelul lor mediu.
Ca indicatori sintetici ai dispersiei se calculeaza:
1. abaterea medie liniara;
2. varianta(dispersia);
3. abaterea medie patratica(deviatia standard);
4. coeficientul de variatie.
1. Abaterea medie liniara ( ) se calculeaza ca medie aritmetica a valorilor absolute
ale abaterilor individuale si arata variatia medie in plus sau in minus, de la valoarea medie a distributiei si este cu atat mai mica cu cat valorile sunt mai grupate in jurul mediei.
mii lei
Intervalul mediu de variatie stabilit cu ajutorul acestui indicator are urmatoarele limite:
mii lei
2. Varianta (dispersia) se calculeaza ca medie aritmetica a patratelor abaterilor fata de media lor, dupa relatia:
Se observa ca varianta, fiind o valoare la patrat, este o marime abstracta. Este un indicator folosit ca baza de calcul al abaterii mediei patratice, al indicatorilor de corelatie si al altor indicatori ai variatiei.
3. Abaterea mediei patratica (deviatia standard) – acest indicator sintetic al dispersiei se calculeaza ca medie patratica a abaterilor individuale.
mii lei
Intervalul mediu de variatie stabilit cu ajutorul are urmatoarele limite:
mii lei
Abaterea medie patratica, fiind calculata ca o medie patratica, reflecta intr-o masura mai mare influenta factorilor aleatori comparative cu abaterea medie liniara. Acest lucru se explica prin faptul ca abaterile externe prin ridicarea la patrat au o influenta mai mare decat abaterile intermediare, mai apropiate de medie.
4. Coeficientul de variatie se calculeaza ca raport procentual intre abaterea medie patratica si media aritmetica, dupa relatia:
Valoarea coeficientului de variatie este mai mare decat 17%, ceea ce inseamna ca este o medie moderat reprezentativa.
Asimetria
Asimetria reprezinta o deviatie de la forma simetrica de distributie. O distributie este considerate simetrica daca observatiile, exprimate prin frecventele lor, sunt distribuite identic de o parte si de alta a valorii centrale. Ca valori centrale, pentru aprecierea asimetriei, sunt folosite: media aritmetica, modul si mediana.
Avand in vedere ca , rezulta ca asimetria in
valoare absoluta se calculeaza dupa formula: si vom avea o extindere a frecventelor spre dreapta.
Asimetrie la dreapta
Coeficientul Yule ( ), masoara asimetria in functie de pozitia quartilelor ( ).
Se calculeaza dupa relatia:
Deci , rezultand ca distributia este asimetrica la dreapta.
Coeficientul de asimetrie Pearson ( ) se calculeaza ca raport intre marimea asimetriei
(As) si dispersia distributiei, exprimata prin abaterea patratica ( ), dupa relatia:
distributia este asimetrica la dreapta
Coeficientul de asimetrie Fisher ( )
Fisher propane un coefficient de asimetrie calculat ca radacina patrata din coeficientul Pearson:
Tabelul nr.8 Elemente de calcul pentru coeficientii de asimetrie Fisher
100-120 21 110 2310 -42 42 882 1764 37044 74088 1555848
120-140 39 130 5070 -22 22 858 484 18876 10648 415272
140-160 31 150 4650 -2 2 62 4 124 8 248
160-180 28 170 4760 18 18 504 324 9072 5832 163296
180-200 25 190 4750 38 38 950 1444 36100 54872 1371800
200-220 6 210 1260 58 58 348 3364 20184 195112 1170672
TOTAL 150 - 22800 - - 3604 - 121400 4677136
Valoarea coeficientului =1.35, releva o asimetrie pozitiva.
Boltirea se defineste prin raportarea unei distributii empirice la distributia normala sub
aspectul variatiei variabilei X si a frecventei relative ( ).
Boltirea respectiv aplatizarea apare cand distributia prezinta o variatie slaba a variabilei X insotita de o variatie puternica a frecventei relative (si invers) in comparatie cu o dostributie normala, de aceeasi medie si dispersie.
Indicatori ai boltirii
Boltirea se masoara cu ajutorul coeficientilor de boltire.
Coeficientul de boltire Pearson ( ) se calculeaza pe baza momentelor centrate, dupa
relatia:
Tabelul nr.9 Elemente de calcul pentru indicatorii boltirii
100-120 21 110 2310 -42 42 882 1764 37044 3111696 65345616
120-140 39 130 5070 -22 22 858 484 18876 234256 9135984
140-160 31 150 4650 -2 2 62 4 124 16 496
160-180 28 170 4760 18 18 504 324 9072 104976 2939328
180-200 25 190 4750 38 38 950 1444 36100 2085136 52128400
200-220 6 210 1260 58 58 348 3364 20184 11316496 67898976
TOTAL 150 - 22800 - - 3604 - 121400 197448800
Am calculat la coeficientul Fisher valoarea lui :
Deci
Coeficientul de boltire Pearson ( ) este mai mic decat 3, deci distributia este platicurtica.
Coeficientul de boltire Fisher ( ) masoara excesul fata de boltirea unei distributii
normale Gauss-Laplace.
Stiind ca pentru o distributie normala ( )=3, gradul de exces se calculeaza dupa relatia:
1. Daca ( )=3 , atunci distributia este mezocurtica;
2. Daca ( )>3 , atunci distributia este leptocurtica;
3. Daca ( )<3 , atunci distributia este platicurtica.
Curba platicurtica
In cazul nostru , deci suntem in cazul 3.
Indicatorii concentrarii
Prin concentrare se exprima aglomerarea unitatilor unei colectivitati sau a valorilor globale ale unei distributii in jurul unei valori.
Masurarea gradului de concentrare prin procedee numerice consta in calculul unor indicatori ai concentrarii cum ar fi:
a. Abaterea mediala-mediana
b. Coeficienti ai gradului de concentrare
Masurarea concentrarii pe cale grafica consta in construirea curbei de concentrare – curba Lorentz-Gini si, pe baza ei aflarea gradului de concentrare, prin determinarea unui coeficient – indicele Gini.
a. Abaterea mediala-mediana, simbolizata prin , se calculeaza dupa relatia:
- mediana s-a calculat si are o valoare de 150mii lei, iar mediala are o valoare de 157.29 mii lei, rezultand:
mii lei
b. coeficienti ai gradului de concentrare
Coeficientul de concentrare
Calculul coeficientului de concentrare consta in compararea sub forma de raport a
marimii abaterii mediala-mediana cu amplitudinea de variatie a caracteristicii de
grupare , dupa relatia:
Raportul poate lua valori in intervalul [0,100]. Cu cat valoarea raportului tinde spre zero cu atat concentrarea este mai slaba, adica nu exista mari disparitati si invers, daca valoarea raportului tinde spre 100, exista mari disparitati intre valorile globale pe clase de variatie.
Coeficientul de concentrare, comparative cu abaterea mediala-mediana, are avantajul expresiei relative, si anume, da posibilitatea compararii gradului de concentrare al diferitelor distributii statistice indifferent de unitatile de masura folosite pentru exprimarea variabilelor de grupare.
Coeficientul abaterii Gini se calculeaza ca raport intre diferenta medie si
dublul mediei aritmetice , dupa relatia:
- marimea claselor de variatie
Tabelul nr. 10 Elemente de calcul pentru coeficientul Gini
Efectivul
100-120 21 21 129 2709
120-140 39 60 90 5400
140-160 31 91 59 5369
160-180 28 119 31 3689
180-200 25 144 6 864
200-220 6 150 0 0
TOTAL 150 - - 18031
Calculul diferentei mediei Gini:
Valoarea obtinuta reflecta o concentrare slaba a masei cifrei de afaceri a unitatilor descentralizate de profit pe intreaga firma.
Indicele de concentrare se afla dupa relatia:
Tabelul nr. 11 Elemente de calcul al indicelui Gini, procedeul triunghiurilor
100-120 21 21 0,140 110 2310 2310 0.1013 0.0453 0.0405 0.0048
120-140 39 60 0,400 130 5070 7380 0.3237 0.2111 0.1964 0.0147
140-160 31 91 0,607 150 4650 12030 0.5276 0.4468 0.4186 0.0282
160-180 28 119 0,793 170 4760 16790 0.7364 0.7495 0.7069 0.0425
180-200 25 144 0,960 190 4750 21540 0.9447 0.9600 0.9447 0.0153
200-220 6 150 1.000 210 1260 22800 1.0000
TOTAL 150 - - 22800 - - - - 0.1054
Estimarea mediei prin interval de incredere
Daca parametrul cautat ar fi µ - media unei populatii, iar - media de selectie,
construirea I.C. pleaca de la o ipoteza asupra distributiei mediilor de selectie, deci si a abaterilor medii patratice ale acestora, fata de media populatiei, respectiv, fata de media lor.
Estimarea mediei prin I.C., in cazul in care se cunoaste legea populatiei si aceasta
este o lege normala N( ), pot aparea doua situatii:
1. cand se cunoaste varianta unei populatii, construirea I.C. se bazeaza pe variabila normala centrata redusa Z.
Intervalul de incredere construit pe baza datelor unui esantion este:
unde:
- este o valoare a variabilei normale centrate reduse Z;
- este un nivel al probabilitatii, cuprins intre zero si unu.
2. cand varianta este necunoscuta, construirea intervalului de incredere se bazeaza pe variabila t Student.
Intervalul de incredere construit pe baza datelor unui esantion este:
Statistici test folosite in testarea ipotezelor cu privire la un parametru
Parametru Legea populatiei Statistica test Legea statisticii
1 2 3 4
Media Normala -
cunoscut
-
necunsocut
Oricare lege -
cunoscut
-
necunsocut
Dispersia Normala -
cunoscut
-
necunoscut
Proportia -