Date post: | 13-Dec-2015 |
Category: |
Documents |
Upload: | robert-evans |
View: | 92 times |
Download: | 9 times |
2
CUPRINS
Modulul 1……………………………………………………………………………..5
Capitolul 1 Noțiuni introductive....................................................................7
Capitolul 2 Colectarea datelor.........................................................................10
2.1 Tipuri de date și scale de măsurare ......................................10
2.2 Surse de date statistice...............................................................11
2.3 Planul observării statistice.......................................................12
2.4 Recensământul statistic.............................................................12
2.5 Sondajul statistic...........................................................................12
Capitolul 3 Sistematizarea si prezentarea datelor...............................15
3.1 Sistematizarea datelor...............................................................15
3.2 Prezentarea datelor statistice.................................................17
3.3 Distribuții statistice unidimensionale ...............................20
3.4 Histograma..................................................................................24
3.5 Diagrame de structură............................................................25
3.6 Reprezentări grafice specifice seriilor de timp.............. 26
3.7 Cartograme și cartodiagrame...............................................29
3.8 Distribuții statistice bidimensionale .................................30
Teste…………………………………………………………………………………………..34
Bibliografie………………………………………………………………………………….35
Modulul 2……………………………………………………………………………..36
3
Capitolul 4 Indicatori statististici în mărimi absolute
şi relative.....................................................................................37
4.1 Indicatori în mărimi absolute ..............................................37
4.2 Indicatori în mărimi relative ...............................................38
Capitolul 5 Indicatori ai tendinței centrale. ( Mărimi medii)..........40
5.1 Probleme generale ale mărimilor medii...........................40
5.2 Media aritmetică........................................................................41
5.3 Media unei caracteristici alternative..................................43
5.4 Medii cu aplicație specială.......................................................44
5.5 Modul (Dominanta)..................................................................45
5.6 Mediana..........................................................................................47
5.7 Quantilele .......................................................................................50
5.8 Mediala...............................................................................................53
5.9 Relații între valorile tendinței centrale ...............................55
Teste…………………………………………………………………………………………….56
Bibliografie…………………………………………………………………………………..57
Modulul 3………………………………………………………………………………58
Capitolul 6 Indicatori ai dispersiei și asimetriei………….......................60
6.1 Indicatori simpli si sintetici ai dispersiei.............................60
6.2 Indicatori ai dispersiei unei variabile alternative............64
6.3 Măsurarea dispersiei în sistemul medianei........................65
6.4 Dispersia unei variabile nominale (atributive)................67
4
6.5 Indicatori ai formei........................................................................68
Capitolul 7 Indicatori ai seriilor cronologice..............................................72
7.1 Indicatori pentru caracterizarea nivelului şi
variației în timp...............................................................................72
7.1.1 Indicatori absoluţi……………………………………………………..72
7.1.2 Indicatori relativi………………………………………………………..73
7.1.3 Indicatori medii…………………………………………………………..74
Capitolul 8 Testare unei ipoteze statistice.....................................................78
8.1 Probleme ale testării unei ipoteze statistice………………...78
8.2 Ipoteze statistice…………………………………………………………78
Test..………………………………………………………………………………………………81
Bibliografie……………………………………………………………………………………..81
5
MODULUL 1
Noţiuni introductive
Colectarea datelor
Sistematizarea şi prezentarea
datelor
OBIECTIVE
- cunoaşterea noţiunilor de bază din statistică
- însuşirea metodelor de prezentare şi sistematizare a unui set de date
CUVINTE CHEIE
- caracteristică statistică, date statistice, distribuţii statistice
6
CUPRINS MODUL 1
Capitolul 1 Noțiuni introductive....................................................................7
Capitolul 2 Colectarea datelor.........................................................................10
2.1 Tipuri de date și scale de măsurare ......................................10
2.2 Surse de date statistice...............................................................11
2.3 Planul observării statistice.......................................................12
2.4 Recensământul statistic.............................................................12
2.5 Sondajul statistic...........................................................................12
Capitolul 3 Sistematizarea si prezentarea datelor...............................15
3.1 Sistematizarea datelor...............................................................15
3.2 Prezentarea datelor statistice.................................................17
3.3 Distribuții statistice unidimensionale ...............................20
3.4 Histograma..................................................................................24
3.5 Diagrame de structură............................................................25
3.6 Reprezentări grafice specifice seriilor de timp.............. 26
3.7 Cartograme și cartodiagrame...............................................29
3.8 Distribuții statistice bidimensionale .................................30
Teste…………………………………………………………………………………………..34
Bibliografie………………………………………………………………………………….35
CAP.1 Noțiuni introductive.
Statistica:
7
- știința colectării și înțelegerii datelor ce caracterizează fenomenele de masă .
- instrument de cunoaştere a particularităților de volum, structură și dinamică a
fenomenelor și proceselor economico-sociale.
Fenomene care au condus la apariţia si dezvoltarea statisticii.
- Nevoile guvernelor de a calcula date privind cetățenii și activitățile țărilor pe care
le conduc.
- Dezvoltarea teoriei probabilităților.
- Apariția și extinderea utilizării calculatoarelor.
Datele au fost permanent colectate de-a lungul istoriei. (civilizațiile egiptene,
romane, grecești : pentru taxe și înrolare; din evul mediu:nașterile, decesele,
căsătoriile )
Ȋn zilele noastre, progresele calculatoarelor au determinat schimbări profunde în
statistică. Există soft-uri statistice specializate cu care se pot face analize foarte
complexe.
Obiectul de studiu:
Fenomenele și procesele ce prezintă următoarele particularități:
- Se produc în număr mare de cazuri (fenomene de masă)
- Variază de la un element la altul.
- Sunt forme individuale de manifestare.
Fenomenele de masă se supun acțiunii legilor statistice. Pentru a evidenţia o
lege statistică este necesar studiul unui număr mare de cazuri individuale.
Un principiu fundamental al statisticii este Legea numerelor mari, dată de
Bernoulli (,, frecvența apariției unui eveniment converge în probabilitate la
probabilitatea producerii acelui eveniment’’)
Metode speciale de cercetare:
- Observarea de masă.
8
- Centralizarea și gruparea.
- Procedee și metode de analiză și interpretare statistică.
Etapele cercetării statistice:
- Observarea statistică: se culeg datele
- Prelucrarea statistică: se sistematizează datele, se calculează indicatorii
primari, derivați, absoluți și sintetici.
- Analiza și interpretarea rezultatelor: se verifică ipotezele, se formulează
concluziile, se elaborează deciziile. Pasul dificil este transpunerea problemei în
termeni statistici.
Statistica descriptivă: Totalitatea metodelor de culegere, prezentare și
caracterizare a unui set de date.
Statistica inferențială: Totalitatea metodelor de estimare a caracteristicilor unei
populații pe baza rezultatelor obținute pe un eșantion.
Utilizează metode de sistematizare, rezumare și prezentare a datelor.
De exemplu:- Metoda grafică
Statistica inferențială este formată dintr-un grup de metode ce pot da
concluzii ample caracteristicilor unei populații pe baza datelor din eșantioane. Dar
acestea nu se pot afla cu o probabilitate de 100%.Probabilitatea de estimare corectă
este de obicei 90%, 95% sau 99%.
Elemente de bază ale statisticii.
1. Populaţia (colectivitatea) statistică.
Totalitatea elementelor de aceeași natură ce au trăsături comune. Dacă
colectivitatea e numeroasă, cercetarea este foarte grea.
2. Eșantion: submulţime de elemente selectate dintr-o colectivitate (populație)
statistică:
Colectivități statistice: - statice(stare la un moment dat)
-dinamice (proces, devenire în timp)
3. Unitatea statistică ( individ ): - simplă
9
-complexă (ex. familia)
4. Caracteristica statistică: trăsătura comună tuturor unităților. E numită și
variabilă statistică.
5. Datele statistice: Caracteristica numerică obținută de statistică privind
colectivitatea studiată. Mesajul lor este informația statistică.
6. Indicatorul statistic: Expresia numerică a unor fenomene.
7. Parametrul statistic: Indicator statistic descriptiv calculat pentru o
colectivitate totală.
Exemplu:
- Populația statistică: cetățenii dintr-o localitate.
- Eșantionul: persoanele selectate pentru anchetă.
- Scopul anchetei: descrierea diverselor caracteristici ale colectivității.
- Parametru: venit mediu.
CAP. 2 Colectarea datelor.
2.1 Tipuri de date și scale de măsurare:
10
Clasificarea datelor:
- Date univariate: (o singură variabilă statistică)
- Date bivariate: (două variabile statistice)
- Date multivariate( mai mult de două variabile statistice)
Caracteristicele statistice se pot clasifica după mai multe criterii:
a) După modul de exprimare:
- Calitative ( nu se exprimă numeric: profesie, locul de domiciliu)
- Cantitative (se exprimă numeric: salariu, greutate, înălțime)
b) În funcție de variantele de răspuns:
- Alternative (binare) cu doua variante de răspuns.
- Nealternative , cu mai multe răspunsuri (se pot transforma în
alternative.
c) În funcție de natura caracteristicilor.
- Caracteristici continue : greutate, înălțime.
- Caracteristici discrete: număr de orașe, număr de copii.
d) În funcție de conținutul caracteristicii, caracteristicile calitative se impart in;:
- Caracteristici de timp.
- Caracteristici de spațiu.
- Caracteristici atributive (altul decât spațiul și timpul)
e) În funcție de modul de obținere și caracterizare a fenomenelor.
- Caracteristici primare.
- Caracteristici derivate.
Scale de măsurare:
Sunt patru scale principale de măsurare:
- Scala nominală :(scala denumirilor) se atribuie nume pentru
variabile. Se face o diferențiere de specie dar nu și de grad.
11
Exemplu: ocupația, sexul, profesia.
- Scala ordinală: sunt măsurate variabile de tip nenumeric dar care
pot fi ordonate. Diferenţiere de specie şi de grad.
Exemplu: nivelul de studii, categorii de hoteluri, ratinguri, etc.
- Scala de intervale (cardinală). Diferenţiere de specie şi de grad, în
plus folosește unități de măsură egale. Absența unui punct zero
absolut pentru scală.
Exemplu: temperatura.
- Scala proporțională ( de raport)
Are toate calitățile celor anterioare iar în plus are un punct fix zero
absolut.
Pentru compararea şi măsurarea opiniilor, a comportamentelor, s-au elaborat scale
specifice de intensitate.
Ȋn cercetările de marketing se foloseşte scala de opinie sau de rating.Se fixează 4
până la 10 gradaţii pentru gradarea răspunsurilor.
2.2 Surse de date statistice
Sursele de date pot fi:
- Primare ( date obținute direct prin organizarea de observări
statistice, ex: recensământul statistic)
- Secundare ( datele sunt prelucrate în tabele și grafice) ex: buletinul
statistic pe anul…… în care găsim de exemplu: mișcarea populației
în oraș, veniturile salariale, numărul de șomeri, nivelul producției la
unele bunuri, etc.
2.3 Planul observării statistice:
12
- Observarea statistică: Acțiunea de culegere a datelor de la unitățile
statistice.
Condițiile ce trebuie îndeplinite de observare:
- Condiția de cantitate (obținerea în timpul stabilit a tuturor datelor)
- Condiția de calitate (asigurarea veridicității conținutului datelor)
Observarea se face după un plan riguros ce trebuie să conțină:
- Scopul observării.
- Delimitarea colectivității și unității de observare.
- Stabilirea caracteristicilor de observare.
- Alegerea formularelor de observare.
- Delimitarea timpului și locului observării.
- Stabilirea măsurilor organizatorice.
2.4 Recensământul statistic.
Este o metodă de observare totală cu caracter periodic ce surprinde un fenomen în
mod static.
Exemplu: recensământul populației, a locuințelor,a animalelor.
2.5 Sondajul statistic.
Este o metodă parțială de observare statistică; avantajul unei economii de timp și
bani.
Exemple: CTC. ,pentru a estima rezervele de zăcăminte, în analiza
macroeconomică, demografie, agricultură, comerț, anchete sociale, etc.
13
A. Sondajul aleator simplu:
Condiții:
- Fiecare unitate statistică are probabilitatea egală de a fi aleasă.
- Unitățile sunt alese independent, fără legătură una cu alta.
Sondajele pot fi repetate( cu revenire în populaţie pentru populaţii infinite)sau
nerepetate (fară revenire în populaţie pentru populaţii finite)
Procedee de selecție aleatoare.
1) Procedeul urnei cu bile: fiecare unitate se numerotează de la 1 la N. Se
foloseşte o urnă cu N bile numerotate de la 1 la N din care se fac n extrageri
fără revenire.
2) Procedeul tabelului cu numere întâmplătoare: numărul de ordine al unității
este ales din tabelul cu numere aleatoare.
3) Procedeul mecanic de selecție: se stabileşte pasul de numărare k. De
exemplu dacă volumul populaţiei este N=1000, iar volumul eşantionului
este n=50, atunci k=
=20;se va selecta tot a 20-a unitate.
B) Sondajul stratificat.
Se divizează colectivitatea generală în ,, straturi’’ cât mai omogene
C) Sondajul în cuiburi.
Cuib sau Cluster : grupare de unități statistice concentrate și strict delimitate.
Exemplu: familia.
Avem trei niveluri de cercetare:
- Unități statistice
- Cuiburile (grupurile)
- Populația în ansamblu
Etape:
- Stabilirea cuiburilor
- Extragerea unui eșantion din cuiburile stabilite
14
- Examinarea fiecărei unități statistice din cele ce compun cuibul.
Alte tipuri de sondaj:
- Eşantionarea concentrată – selectarea în eșantion a acelei părți ce
prezintă majoritatea cazurilor individuale.
- Selecţie dirijată – se iau elementele (unitățile) reprezentative
apropiate de media ce trebuie estimată. Rezultatele nu sunt obiective.
- Eșantionarea multifazică: - se ia un eșantion, de la unele elemente se
iau anumite caracteristici iar de la altele se studiaza alte
caracteristici.
- Eșantionarea pe cote: - alegerea unităților statistice este lăsată pe
seama operatorilor.
Cap.3 Sistematizarea si prezentarea datelor
Prelucrare statistică – fenomen complex prin care datele înregistrate sunt
sistematizate şi tratate statistic.
Sistematizarea datelor – ordonarea acestora în funcție de omogenitatea lor.
15
3.1. Sistematizarea datelor
- se realizează prin centralizare si grupare
3.1.1. Procedee de sistematizare
-Centralizarea – (totalizarea unităților statistice sau a valorilor unei
caracteristici la nivelul grupelor tipice sau al colectivitații).
-Se face prin sumare directa.Rezultă astfel indicatori statistici de nivel.
Exemplu: numărul populației unei localitați la un moment dat, valoarea
producției unei firme pe o perioada dată.
-Gruparea - (centralizare pe grupe a unitaților statistice).
Rezultă șiruri de date ordonate crescător sau descrescător.
3.1.2. Tipuri de grupări statistice :
a) După numărul caracteristicilor de grupare :
-grupare simplă – după o singură caracteristică.
- exemplu – gruparea intreprinderilor industriale după numărul muncitorilor.
- gruparea combinată – separarea unei colectivități în grupe omogene după variația
simultană a două sau mai multe caracteristici;
Se face o grupare după o caracteristică principală, apoi, fiecare grupă se divizează
în subgrupe după variația unei alte caracteristici (secundare)
b) Dupa natura caracteristicii:
- grupare după o variabilă calitativă:
- grupare după o variabilă nominală (clasificare)
- grupări după variabila “timp” şi după variabila “spaţiu” ;
- Exemplu: gruparea populației pe ocupații, rezultatele acestei grupări fiind cuprinse
în nomenclatoare.
16
- după o variabilă exprimată numeric.
Se poate face pe:
- variante (număr redus de posibilitati);
exemplu:gruparea familiilor din cartier dupa numărul de copii);
-intervale de variație (număr mare de variante);
exemplu: gruparea populației din localitate după vârstă)
3.1.3. Probleme ale grupării statistice
1. Scopul grupării statistice :
- pentru sistematizarea materialului în vederea prelucrării (grupe egale ca mărime);
- pentru analiza directă in cazul grupelor bine determinate.
2. Alegerea variabilei de grupare (variabilă după care se face separarea unităților in
grupe omogene). Funcție de scopul grupării se va decide gradul de esențializare a
caracteristicilor.
3. Stabilirea numărului de grupe.( Funcţie de scop).
- exemplu: gruparea statistică a unei populații după vârstă : se folosesc în general
intervale cincinale, adică intervale tipice egale: 0-4; 5-9; 10-14; 95-99 ; 100 și peste.
Se folosesc pentru unele cercetări intervale tipice neegale:0-19 (populație tânără);20-
59 (populație adultă);60 și peste (populație vârstnică).
Numărul k al grupelor folosite în practică , dacă volumul eșantionului este n, se
poate face după formula Sturges: , 1 3 322 -
4. Determinarea mărimii intervalului de grupare ( )
Fie X caracteristica de grupare cu valorile xi, i=1
Numărul: A = xmax – xmin se numește amplitudinea de varianţie a lui X
Atunci =
sau =
17
( numărul obținut se rotunjeşte în plus)
5. Delimitarea grupelor de variație și separarea unităților colectivității pe
intervale de variație
- dacă variabila este continuă atunci limita superioară a unui interval va fi limita
inferioară a intervalului următor.Se face o notă explicativă (care limită e inclusă în
interval)
- dacă variabila e discretă atunci limita inferioară a intervalului următor este
deplasată cu o unitate față de limita superioară a intervalului precedent.
- intervalele pot fi închise sau deschise
3.2. Prezentarea datelor statistice
Distribuție statistică – rezultatele sistematizate prin grupare.
3.2.1. Tabele statistice
Elementele unui tabel:
- titlul general si titlurile interioare;
- unitatea de măsură generală;
- notele explicative;
- sursa datelor;
- rubricile tabelului.
Tipuri de tabele :
- simplu (distribuție univariată)
- cu dublă intrare (tabel de corelație) ( distribuție bivariată)
3.2.2. Repezentări grafice
18
Metodă de prezentare sub forma unei imagini a datelor unei distribuții într-un
sistem de coordonate dat. Principiul de bază : proporționalitatea
Elementele reprezentării
a. Axele de coordonate
b. Scara
c. Rețeaua graficului
d. Legenda
a. Axele de coordonate
Axe rectangulare:
Ȋn plan:
y
yi Ai(xi,ni)
ni
0 xi X
Ȋn spaţiu:
Z nij este frecvenţa absolută a perechii (xi,yj)
Ai(xi,yj,nij)
19
nij 0 xi
yi x
Y
Coordonate polare
Ai
0 x
Ai ( 𝜚i , j) 1
1
grade sau radiani
𝜚 - proporțional cu
-proporțional cu intervalul de timp ce separă două valori succesive.
De exemplu: 2 = anul
atunci
= luna
= trimestrul
b) Scara :
- uniformă (aritmetică, cu diviziuni echidistante);
- neuniformă (logaritmică) – punem în corespondență biunivocă numărul cu
logaritmul său zecimal.
0,001 0,01 0,1 1 10 100 1000
⬇ ⬇ ⬇ ⬇ ⬇ ⬇ ⬇
20
-3 -2 -1 0 1 2 3
c)Reţeaua graficului –se construiesc paralele la axe prin punctele respectiv
yj . Este utilă pentru distribuţii bidimensionale.
d)Legenda – alături de figură; se reprezintă la scară redusă elemente de
construcție cu explicații.
3.3. Distribuții statistice unidimensionale
3.3.1. Definitie notații.
Definiție : Se numește distribuție statistică unidimensională, corespondența dintre
șirul valorilor unei caracteristici și cel de al doilea: șirul frecvențelor absolute.
Acestea se prezintă sub forma unui tabel.
X:( x1,x2,…,xm )unde x1<x2<…<xm
Dacă: n1=n2=…=nm
respectiv: X . …… … . .
/ . / 1 , dacă n1≠n2≠∙∙∙ ≠ nm.
Dacă avem distribuții de interval notăm:
X: ( , ) 1
3.3.2. Frecvențe relative si frecvențe cumulate
Definiția 1. Se numește frecvență relativă a valorii xi numărul =
∑ unde :
∑ = n - volumul colectivității
Evident ∑ 1
21
Definiția 2. Se numește frecvență absolută cumulat crescătoare a valorii xi,
Numărul ( ) ∑ ( ) 1 .
Se numește frecvență relativă cumulat crescătoare a valorii xi, numărul
( ) ∑ 1 ; evident 1
Se pot calcula şi valorile ( ) ( ) frecvența absolută cumulat
descrescătoare, respectiv frecvenţa relativă cumulat descrescătoare a valorii xi
( )
( )
( )
( ) ∑
ţ
Intervalul 1 2 3 4 5
3. 3.3 Prezentarea în tabel a unei distribuții unidimensionale
Modelul unui tabel simplu:
Interval de
grupare
Frecvența
absolută
Frecvența
relativă
Frecvența
absolută
Frecvența
relativă
22
cumulată cumulată
x0-x1
|
|
xi-1-xi
|
|
xk-1-xk
n1
|
|
ni
|
|
nk
f1
|
|
fi
|
|
fk
N1
|
|
Ni
|
|
Nk
F1
|
|
Fi
|
|
Fk
Total N 1 - -
Exemplu: Inregistrarea unui eșantion de 100 persoane dupa caracteristica “vârstă”
Grupa de
vârstă
Efectivul
(ni)
Frecvenţa
absolută
fi
frecvenţa
relativă
Frecvenţa
absolută
cumulată
Frecvența
cumulată
relativă
Ni ( ⬆) Ni (⬇ ) Fi (⬆ ) Fi (⬇ )
0 – 14
15 – 59
60 si
peste
(din care
65 de ani
şi peste)
17
61
22
(10)
0,17
0,61
0,22
(0,1)
17
78
100
-
100
83
22
-
0,17
O,78
1
-
1
0,83
0,22
-
Total 100 1
Poligonul și curba frecvențelor
Poligonul frecvențelor – specific variabilelor discrete.
Se unesc prin segmente punctele Ai (xi,ni), i=1 , unde X: (xi, ni) 1
23
Curba frecvențelor: punctele Ai( xi,ni) se unesc prin arce de curbă. Este
aproximată mai bine forma distribuţiei colectivității după caracteristica cercetatată.
Curba frecvențelor cumulate : se unesc punctele Ai(xi,Ni) prin arce de curbă.
Poligonul frecvenţelor cumulate : este reprezentarea grafică a funcției
empirice de repartiţie: Fn(x)=∑
Exemplul : distribuția familiilor dintr-un bloc după numărul de copii.
3.4. Histograma:
Folosită pentru serii cu distribuție continuă X: ( ) unde =(xi-1, )
1
24
Dacă intervalele sunt inegale se folosesc frecvențele reduse
,
Construcția histogramei
Se construiesc dreptunghiuri cu baza aşezată pe abscisă, lungimea acesteia
fiind proporțională cu lungimea a intervalului .
Înălțimea dreptunghiurilor va fi proporțională cu . Se poate obține poligonul frecvențelor dacă se unesc prin segmente mijloacele
intervalelor duse prin ordonatele .
Exemplul1: Ȋn tabelul de mai jos avem distribuţia unui eşantion de 200
persoane după timpul de deplasare zilnică ( în minute).
25
Exemplul 2: Ȋn tabelul de mai jos avem distribuţia unui eşantion de 100
persoane după vârstă
3.5. Diagrame de structură.
Proporționalitate între volumul colectivităţii( 100% )și suprafața din figură.
-dreptunghiul de structură ;
26
- pătratul de structură;
- cercul de structură.
Exemple:
3.6 Reprezentări grafice specifice seriilor de timp
Diagrama polară :pentru fenomene cu evoluţie ciclică( serii cronologice)
- Prin segmente de dreaptă,
- Prin sectoare de cerc;
Exemplu:
27
Construcție:
- Se construiește un cerc cu raza proporțională cu nivelul maxim al
fenomenului;
- Se împarte cercul într-un număr de sectoare egale cu numărul perioadelor de
variație;
- Se trasează sectoare de cerc cu raza proporțională cu nivelul atins de fenomen
în perioadele considerate.
Cronograma reprezentare grafică specifică seriilor de timp. Poate fi liniară
sau prin benzi sau coloane.
Exemple:
29
3.7 Cartograme și cartodiagrame
Reprezentări grafice specifice seriilor teritoriale
Cartograma: intensitatea de manifestare a unui fenomen
Cartodiagrama: structura unui fenomen.
Exemple:
30
3.8 Distribuții statistice bidimensionale
Definiție : Fie C o colectivitate de volum n
X – variabila cu valorile xi , 1
Y – variabila cu valorile , = 1
Fie numărul elementelor din colectivitate corespunzătoare perechii
( ) (frecvența absolută a perechii)
Se numește distribuție bidimensională (bivariată) șirul de triplete
( ) 1 1
Această distribuție se prezintă într-un tabel cu dublă intrare (tabel de
corelație).
31
|
|
|
|
|
|
|
|
I
I
I
..
∑ ( . ) 1 și
∑ ( , ) 1
= ∑ ∑
distribuții marginale
Frecvențele relative marginale :
Frecvențele relative parțiale :
Frecvențele relative condiționate:
1
1
32
a) Distribuții bidimensionale cu ambele variabile cantitative.
Exemplu: Prezentarea unui eșantion de 50 de persoane dintr-o întreprindere după
producția individuală (bucăți) și salariul lunar ( euro / lună)
,
( ; )
200-400 400-600 600-800 800-1000 1000-
1200
20-30 2 - - - - 2
30-40 1 1 5 - - 7
40-50 - 5 7 10 - 22
50-60 - 1 2 4 5 12
60-70 - 1 1 3 2 7
3 8 15 17 7 50
Reprezentări grafice – norul de puncte – într-un sistem de axe se trasează
rețeaua corespunzătoare valorilor , . Se construiesc apoi punctele ( ) în
celulele reţelei.
Diagrama paralelipipedelor – în sistem de 3 axe . Se construiesc
paralelipipede cu baza în planul ( X0Y), iar înălțimea proporţională cu .
b)Distribuţie bidimensională, cu o variabilă cantitativă și una atributivă.
33
Distributia după vârstă și sex a populației României.
Reprezentarea grafică : piramida vârstelor.
c)Distribuţie bidimensională cu ambele variabile atributive.
Exemplu: Distributia populatiei Romaniei dupa mediu si sex in 2011( date
conventionale).
Mediu
Sex
Urban Rural Total
Masculin 6000000 4000000 10000000
Feminin 7000000 5000000 12000000
Total 13000000 9000000 22000000
34
Reprezentarile grafice sunt diagrame de structura. Ex dreptunghi:
Teste
Distribuţia unui eşantion de 150 de persoane după caracteristica „timpul de
deplasare zilnică”, este:
Timpul de
deplasare(minute)
Ji=xi-1 - xi
0-30
30-60
60-90
90-120
120-180
Număr persoane
ni
15
40
50
35
10
a) să se reprezinte grafic histograma, poligonul şi curba frecvenţelor.
b) să se reprezinte grafic structura pe intervalele 0-60, 60-120, 120-180, folosind
cerc, respectiv dreptunghi de structură.
35
Bibliografie:
1. D. Deac, „Statistică Economică”, suport de curs.
2. E. Jaba, “Statistică, Ediţia a-3-a”, Ed. Economică, Bucureşti, 2002.
3. C. Anghelache ş.a., “Bazele Statisticii Teoretice şi Economice”, Ed. Economică,
Bucureşti, 2005.
4.V. Voineag, ş.a., “Statistică. Baze teoretice şi aplicaţii”, Ed. Economică,
Bucureşti, 2007.
36
MODULUL 2
Indicatori statistici în mărimi
absolute şi relative
Indicatori ai tendinţei centrale
OBIECTIVE
- cunoaşterea semnificaţiei şi a relaţiilor matematice de definire a indicatorilor în
mărimi absolute şi relative
- cunoaşterea semnificaţiei şi a relaţiilor matematice de definire a indicatorilor
tendinţei centrale
- înţelegerea rolului şi importanţei acestor indicatori în caracterizarea unui set de
date
- însuşirea modului de calcul a acestor indicatori în diverse situaţii practice
CUVINTE CHEIE
- indicator statistic, mărimi absolute, mărimi relative, medie, modul, mediană,
medială, quantile
37
CUPRINS MODUL 2
Capitolul 4 Indicatori statististici în mărimi absolute
şi relative.....................................................................................37
4.1 Indicatori în mărimi absolute ..............................................37
4.2 Indicatori în mărimi relative ...............................................38
Capitolul 5 Indicatori ai tendinței centrale. ( Mărimi medii)..........40
5.1 Probleme generale ale mărimilor medii...........................40
5.2 Media aritmetică........................................................................41
5.3 Media unei caracteristici alternative..................................43
5.4 Medii cu aplicație specială.......................................................44
5.5 Modul (Dominanta)..................................................................45
5.6 Mediana..........................................................................................47
5.7 Quantilele .......................................................................................49
5.8 Mediala...............................................................................................53
5.9 Relații între valorile tendinței centrale ...............................55
Teste…………………………………………………………………………………………….56
Bibliografie…………………………………………………………………………………..57
Cap.4. Indicatori statististici în mărimi absolute şi relative.
4.1 Indicatori în mărimi absolute
Indicatorii de nivel – sunt indicatori individuali, rezultat al centralizării pe
grupe. Se obțin prin sumare directă în cadrul unei grupe: ∑ ∑ ∑
Indicatori ai variației absolute :
38
Fie ( ) 1
Numărul se numește spor.
Sau ∑ ∑ 1
4.2 Indicatori în mărimi relative:
Exprimă rezultatul comparării a doi indicatori statistici sub formă de raport.
Arată câte unități din indicatorul de la numărător revin la o unitate a indicatorului
considerat ca bază de raportare.
Probleme ale folosirii mărimilor relative.
- alegerea bazei de comparare: funcție de gradul de independență dintre
caracteristici sau funcție de scopul cercetării;
- asigurarea comparabilității datelor ce formează raportul;
- alegerea formei de exprimare a mărimilor relative (procente, promili,
prodecimili etc.) arată de câte ori se cuprinde indicatorul de raportat în baza de
raportare.
Tipuri de mărimi relative:
Mărimile de structură : (ponderi sau greutăți specifice ).
Exprimă raportul dintre parte și întreg.
Notaţii : 1
Exemplu :
∑ ∑ 1
∑ . 100 ∑
100
Mărimi relative de corespondență (mărimi relative de coordonare)
. 100
39
. 1000
nivelul grupei A respectiv B.
Arată câte unități dintr-o grupă revin la 100 sau 1000 unități din cealaltă grupă a
colectivității.
Mărimi relative de intensitate :
K =
K = marimea relativă de intensitate.
X = variabila (fenomenul) de raportat.
Y = variabila (fenomenul) ales ca bază de raportare.
Arată gradul, intensitatea de răspândire a unui fenomen în raport cu variabila la
care se raportează.
Se utilizează în demografie (caracterizează mișcările populației), economie.
40
Cap.5 Indicatori ai tendinței centrale. ( Mărimi medii).
5.1 Probleme generale ale mărimilor medii.
Mediile, sunt mărimi statistice care exprimă în mod sintetic si generalizant,
ceea ce este esențial pentru unitățile unei colectivități distribuite dupa o anumită
caracteristică.
Trăsături caracteristice :
- media exprimă în mod sintetic valorile unei serii statistice şi are un caracter
abstract;
- este o mărime generalizantă (înlocuind fiecare termen al seriei cu nivelul
mediu, suma termenilor va fi aceeași);
- media sintetizează normalul, adică exprimă nivelul purtat de majoritatea
unităților colectivității. Se mai numește și speranța matematică (poziția centrală
spre care tind unitățile unei colectivități);
- este rezultatul acțiunii factorilor esențiali, exprimă legicul. Abaterile de la
nivelul mediu se datorează factorilor aleatori.
Condiții de calitate ale unei mărimi medii(Principiul lui Yule)
1.Media trebuie definită obiectiv printr-o definiție sau formulă;
2.Media trebuie să fie reprezentativă pentru toți termenii seriei;
3.Media trebuie să aibe o semnificație concretă ușor de observat;
4.Media trebuie să fie simplu de calculat;
5.Media trebuie să se preteze la calcule algebrice ulterioare;
6.Media trebuie să fie puțin sensibilă la fluctuațiile de eșantionare.
41
Clasificarea mărimilor medii
a)După rolul lor n analiza statistică :
- mărimi medii fundamentale : - media aritmetică;
- modul;
- mediana;
- mărimi medii cu aplicații speciale:
- media geometrică;
- media armonică;
- media pătratică;
- media progresivă;
- media cronologică;etc
b)După modul de obținere:
- medii de poziție: modul, mediana, mediala;
- medii de calcul
– medii simple pentru distribuții de tipul:
X: ( ) 1
- medii ponderate pentru distribuții de tipul
X: ( ) 1
5.2 Media aritmetică ( )
Definiție -mod de calcul.
Media simplă:
Dacă : X: ( ) 1
42
atunci:
. ∑ ; ăț .
Observăm că: ∑ .
Media ponderată :
Dacă: X: ( ) 1
atunci: ∑ .
∑
∑
unde
∑
ș ∑ 1
Dacă seria este prezentată pe intervale de variație:
X: ( ) ( ) 1
atunci: ∑
∑
= ∑
unde: x i=
( )
Proprietăți ale mediei aritmetice:
1. Dacă:
2. ( ă ă)
3. ∑ ( ) 0 ( ă ă)
4. ∑ ( )
ă
5. a) ∑ ( )
( ă ă)
b) ∑
c) ∑
∑
( ș ă )
43
6. dacă: Z = X+Y , X,Y variabile aleatoare independente, atunci:
Calculul simplificat al mediei.
Din propietățile 5) punctul a) și b), c
∑
ă
Respectiv:
∑
∑
ă
5.3 Media unei caracteristici alternative:
Distribuția de frecvență pentru o caracteristică alternativă.
Valori ale caracteristicii
( )
Frecvența de apariție
Efectiv ( ) Pondere ( )
Da (1)
Nu (0)
Unitați ce posedă
caracteristica
Unități ce nu posedă
caracteristica
p=
=
Total n =1
∑ ∑
1 0 ( )
44
Media unei caracteristicii alternative = ponderea unităților ce posedă caracteristica.
5.4 Medii cu aplicație specială
Media geometrică.
– Se aplică doar pentru numere strict pozitive.
Media geometrică simplă:
√ … . . ă .
Media geometrică ponderată :
√
… .
∑
… .
Observații : logaritmând relațiile celor două medii obținem:
1)
2) =
∑
Proprietăți:
1) este mărime internă, normală și translativă.
2) = unde .
3)
unde
.
Exemplu: Cifra de afaceri a unei firme crește cu 10% în primul an; cu 15% în
următorii doi ani și cu 18% în ultimul an pe o perioada de observare de patru ani.
Să se calculeze creșterea medie anuală.
45
√
∑ √1 10 1 15 1 18
√1 716605
1 144635 1 145
ș ă 14 5
Media de ordin r :
1
∑
Media aritmetică de ordin r:
√
Observație:
Dacă: 1
2 =
1
Inegalitatea mediilor:
5.5 Modul (Dominanta)
Notat Mo sau Do. Este o mărime fundamentală de pozitie.
Modul este valoarea caracteristicii cu frecvența absolută ă.
Determinarea modului:
) ( ) 1 ă ă.
-se determină .
-se citește valoarea corespunzătoare =
b)dacă X: ( ) 1 ă ă ( )
46
-se determină
- Se citește intervalul modal ( ) ă .
-
Dacă intervalele sunt inegale se folosesc în loc de frecvențele reduse:
Determinarea grafică : cu histograma.
Propietățile modulului.
1. ă ă.
2. ă 0
3. Dacă
4. Dacă:
Media armonică:
∑1
ă
∑
∑
ponderată.
Media pătratică:
47
a)Simplă:
√∑
∑
b)Ponderată:
√∑
∑
∑
∑
5.6 Mediana( )
Definiție : Se numește mediană acea valoare a caracteristicii unei serii
ordonate, până la care și peste care sunt distribuite în număr egal unitățile
colectivității, respectiv valoarea caracteristicii care împarte seria dată în două
grupe cu efective egale.
Dacă volumul colectivității este m, atunci locul medianei corespunde valorii
, dacă m este impar, respectiv
dacă m este par
unde este unitatea mediană.
Calculul medianei pentru diferite tipuri de distribuții.
a) X= ( ) 1
i) dacă m=2p+1, atunci: =
1
Deci :
Exemplu: 5 10 15 25 35
5 2 2 1 2;
3 =15
48
ii) dacă m=2p, atunci :
Avem doi termeni centrali ai seriei: și
Exemplu: 4 6 9 10 4 2 2
=
7.5
b) ( ) 1
1) Se calculează ( ) ∑
2) Se determină
ă 2
ă 2 1
Se determină ă ( ) â ( )
3) Se determină
Exemplu:
( )
0
1
2
3
4
5
6
7
6
18
23
20
14
6
2
1
6
24
47
67
81
87
89
90
m=90=2p
=
45
Observăm că:
( ) 47 45
2
total 90 -
c) ( ) 1
( )
1) Se calculează ( )
2) Se determină și cea mai mică valoare ( ) , astfel încât ( )
49
3) Se determină intervalul median ( )
4) ( )
, unde:
( ) ț ă
ț ă
Exemplu:
Să se determine mediana pentru distribuția următoare
( - ( ) ( )
(0;30]
(30;60]
(60;90]
(90;120]
(120;150]
(150;180]
25
50
60
45
15
5
25
75
135
180
195
200
200
175
125
65
20
5
Total 200 - -
100 ( ) 135 100
(60 90) .
( )
60 30
100 75
60 60 12.5 72.5
5.7 Quantilele(generalizări ale medianei)
Sunt valori ale caracteristicii ce împart seria în r grupe ale căror efective
sunt egale. Numărul r se numește ordinul quantilelor.
Quantile uzuale:
r=2 - quantila este mediana
50
r=4 – quartilele
r=10 – decilele
r=100 – centilele
În continuare vom calcula aceste quantile uzuale pentru distribuții de intervale,
fiind cele mai utilizate în practică.
Quartilele: Q1 , Q2 , Q3
0 Q1 Q2 Q3
Q1=
( )
Q2=
*1 2 3+ Q3=
51
Unde: ∑
∑
,
∑
, d- lungimea
intervalului quartilic .
Decilele: D1 , D2 , ..., D9
D1 =
D5=
D9=
∑
, ……….
∑
( ăț )
( ) 1 9
ț , 1 9
Centilele: C1 , C2 , … ,C99
C1 =
C50= =
C99=
unde: ∑
, ………,
∑ ( ăț )
Exemplu: Să se calculeze quartilele,decilele şi centilele extreme pentru seria de
intervale prezentată în tabelul următor:
( ; ] ( ) ( )
(0,30]
(30 ; 60]
(60 ; 90]
(90 ; 120]
(120 ; 150]
(150 ; 180]
25
50
60
45
15
5
25
75
135
180
195
200
200
175
125
65
20
5
Total 200 - -
52
Quartilele:
∑ 4 200
4 50
Observăm că: ( ) 75 50 (30 60- 1
Q1= ( )
30 30
30 15 45
∑ 2 200
2 100
( ) 135 100 (60 90- 2
Q2= ( )
60 30
60 30
60
60
60 12.5 72.5
3
4∑
3
4 200 150
Observăm că: ( ) 180 150 (90 120- 3
Q3= ( )
90 30
90 30
90 10 100
Decilele:
∑ 10
200
10 20
Observăm că: ( ) 25 20 (0 30- 1
D1= ( )
0 30
30
24
9
10 ∑
9
10 200 180
Observăm că: ( ) 180 (90 120- 9
53
D9= ( )
90 30
90
120
Diagrama ‘’box-plot’’ (Tukey 1972)
∗ ∣ ∣ ∗
D1 Q1 Me Q3 D9
∗ - valorile minime și maxime ale distribuției.
D1 , D9 - decilele extreme.
5.8 Mediala ( )
Indicator de poziție egal cu acel nivel al caracteristicii ce împarte suma
∑ în două părți egale.
Notaţie: .
Avem că: ≥ . Egalitatea are loc doar în cazul unei echirepartiții.
a) Determinarea medialei pentru serii simple : ( ) 1
1.Se ordonează crescător termenii
2.Se determină șirul ∑ 1
3. ∑
ă
4. = ≥
54
Exemplu: Să se determine mediala pentru seria cu valorile :2, 4, -3, 5, 8, 6, 1, 9
=8
=-3; =1; =2; =4; =5; =6; =8; 9
= =-3
= + =-2
2 2 0
4
9
15
16
23
23 >16= , deci = =8
32=∑
b) Determinarea pentru serii cu frecvență: ( ) 1
1. Se determină ∑ 1
2. ∑
=
.
3. = ( )
c) Determinarea pentru serii de intervale: ( ) 1
1. Se determină: ∑ – , 1
2. ∑
ş
3.
55
5.9 Relații între valorile tendinței centrale:
1) Dacă distribuția este unimodală simetrică atunci:
2) Dacă distribuția este unimodală asimetrică atunci are loc relația
3( )
Ex: Pt. distribuţia după timpul de deplasare în minute a eşantionului de 200
persoane, avem: =73,5; =72; =72,5
73,5-72=3(72,5-72), adevărat.
56
TESTE
1) Populaţia ocupată (mii persoane) pe sectoare de activitate în România, în anii
1993 şi 2001 este dată în tabelul de mai jos:
Sectorul de activitate 2003 2001
Industrie 3030 2017
Construcţii 574 340
Agricultură şi silvicultură 3614 3498
Alte ramuri 2844 2708
Total 10062 8563
Sursa: Anuarul Statistic al României, 1994, C.N.S. , p.158, 2002, p.94
a) Să se întocmească un tabel cu ponderea populaţiei ocupate pe sectoare de
activitate, în anul 1993 comparativ cu anul 2001.
b) Să se întocmească un tabel cu modificările de structură în 2001 faţă de 1993 pe
sectoare de activitate, în mărime absolută.
2) Numărul de salariaţi pe sexe la nivelul economiei naţionale a Romăniei, la
31.12.1999, este dat în tabelul următor:
Total personal muncitor 2.976.000
Bărbaţi 1.781.000
Femei 1.195.000
Sursa: Anuarul Statistic al României, I.N.S., 2000, p.110
Se cere să se calculeze mărimile relative de corespondenţă( coordonare).
3) Distribuţia muncitorilor unei firme după caracteristica „timpul necesar realizării
unui produs”, este dată în tabelul următor:
57
Timpul
(min)
Ji= xi-1-xi
0-30 30-60 60-90 90-120 120-150 150-180
Număr
muncitori
ni
25 50 60 45 15 5
Să se calculeze:
a) Media aritmetică
b) Modul
c) Mediana
d) Diagrama Box-Plot
e) Mediala
Bibliografie:
1. D. Deac, „Statistică Economică”, suport de curs.
2. E. Jaba, “Statistică, Ediţia a-3-a”, Ed. Economică, Bucureşti, 2002.
3. C. Anghelache ş.a., “Bazele Statisticii Teoretice şi Economice”, Ed. Economică,
Bucureşti, 2005.
4.V. Voineag, ş.a., “Statistică. Baze teoretice şi aplicaţii”, Ed. Economică,
Bucureşti, 2007.
58
MODULUL 3
Indicatori ai dispersiei şi ai
formei
Indicatori ai seriilor
cronologice
OBIECTIVE
- cunoaşterea semnificaţiei şi a relaţiilor matematice de definire a indicatorilor
simpli şi sintetici ai dispersiei
- cunoaşterea semnificaţiei şi a relaţiilor matematice de definire a indicatorilor de
asimetrie
- cunoaşterea semnificaţiei şi a relaţiilor matematice de definire a indicatorilor
specifici seriilor cronologice
- înţelegerea rolului şi importanţei acestor indicatori în caracterizarea unui set de
date
- însuşirea modului de calcul a acestor indicatori în diverse situaţii practice
CUVINTE CHEIE
- dispersie, asimetrie, serie cronologică
59
CUPRINS MODUL 3
Capitolul 6 Indicatori ai dispersiei și asimetriei………….......................60
6.1 Indicatori simpli si sintetici ai dispersiei.............................60
6.2 Indicatori ai dispersiei unei variabile alternative............64
6.3 Măsurarea dispersiei în sistemul medianei........................65
6.4 Dispersia unei variabile nominale (atributive)................67
6.5 Indicatori ai formei........................................................................68
Capitolul 7 Indicatori ai seriilor cronologice..............................................72
7.1 Indicatori pentru caracterizarea nivelului şi
variației în timp...............................................................................72
7.1.1 Indicatori absoluţi……………………………………………………..72
7.1.2 Indicatori relativi………………………………………………………..73
7.1.3 Indicatori medii…………………………………………………………..74
Capitolul 8 Testare unei ipoteze statistice.....................................................78
8.1 Probleme ale testării unei ipoteze statistice………………...78
8.2 Ipoteze statistice…………………………………………………………78
Test..………………………………………………………………………………………………81
Bibliografie……………………………………………………………………………………..81
60
Cap.6 Indicatori ai dispersiei şi asimetriei
6.1 Indicatori simpli şi sintetici ai dispersiei
Dispersia – exprimă gradul de mprăștiere a valorilor individuale ale unei distribuții
în jurul valorii centrale:
6.1.1 Indicatorii simpli ai dispersiei
Măsoară câmpul de împrăștiere al caracteristicii și împrăștierea fiecărui nivel
individual al caracteristicii față de nivelul mediu.
a) Amplitudinea variației
Daca X variabila asociată caracteristicii unei populații :
X: ( ) 1 ă
=
100, se numește amplitudinea variației absolută respectiv
amplitudinea variației relativă.
b)Abaterea individuală
Numărul: =
100, se numește abaterea
individuală absolută respectiv abaterea individuală relativă.
6.1.2 Indicatorii sintetici ai dispersiei
Exprimă în mod sintetic, împrăștierea tuturor nivelurilor individuale ale
caracteristicii față de nivelul mediu.
a) ă ( ) : X=( ) 1
= ∑ | |
∑∣ ∣
dacă
= ∑ | |
∑
∑ ∣ ∣
∑
ă … .
Observație: Dacă nu se pune modul, atunci ∑( ) 0
61
b) Dispersia. Numărul: σ2
∑
∑ ( )
= ∑
∑
.
c)Abaterea medie pătratică (derivația standard).
Este ă √
d)Intervalul mediu de variație .
Acesta este:
I. ( ) 68.27 ( )
II. ( 2 2 ) 95.65
III. ( 3 3 ) 99.97 ț .
e) Coeficientul de variație ( )
100
100
(0 100 )
este folosit ca test de reprezentativitate a mediei.
0< <17% , media strict reprezentativă.
(17%; 35%) ; media moderat reprezentativă.
(35%; 50%); media reprezentativă în sens larg.
>50% - media nu este reprezentativă.
Exemplu : Un produs se vinde în 5 magazine cu prețuri diferite : 10; 11; 12;
13; 14(lei).
Să se calculeze prețul mediu şi gradul de dispersie cu ajutorul indicatorilor simpli
si sintetici:
62
1
5 ∑
10 11 12 13 14
5 60
5 12
Prețul mediu este 12 lei
14 10
Amplitudinea variației:
14 10 4
∙100=
100 33 3
Abaterea individuală: , 1 5
100
10 12 2
11 12 1
12 12 0
13 12 1
14 12 2
∙100=
∙100=
100 16.67
∙100=
∙100=
100 8.33
∙100=
∙100=
100 0
∙100=
∙100=
100 8.33
16.67
63
Indicatori sintetici ai dispersiei.
Abaterea medie liniară ( )
∑ | |
∑ | |
=
1 2
Deci: = 1,2 lei
{ 12 1 2 13 2
12 1 2 10 8} ț
(10 8 13 2)
Dispersia (σ2)
∑ ( )
5 ∑
5 2 4 2 1
5 10
5 2
Abaterea medie patratică. σ
√ √2 1 4142 1 4142
Observăm că:
Intervalul mediu de variație.
=12-1,4142=10,5858
=12+1,4142=13,4142
deci 68% din unităţile colectivităţii (magazine) practică un preț cuprins între
10,5858 lei și 13,4142 lei
Coeficientul de variatie ( )
100
1 4142
12 100 11 78 17
=>media este semnificativă pentru distribuție.
64
6.2 Indicatori ai dispersiei unei variabile alternative
O caracteristică alternativă are doar două variante. Variantele se exprimă prin
cuvinte, pot fi cuantificate cu ,,0’’ si ,,1”
Dispersia unei caracteristici alternative.
(1 ) (0 )
(1 )
ăţ ă
1
Abaterea mediei patratică.
√ √
Coeficientul de variație ( )
100
√
100 √
∙100
Exemplu :
Din 300 piese examinate, 270 sunt bune.
Să se determine :
i) procentul mediu de piese bune.
ii) procentul mediu de piese rebut.
iii) dispersia.
iv) coeficientul de variaţie.
i)
100
100 90 ( 0 9)
ii) 1 10 (0 1)
iii) 900. √
100 33 33 .
65
6.3 Măsurarea dispersiei în sistemul medianei
Indicatori ai dispersiei n sistemul medianei.
1) Intervalul interquartilic. ( )
2) ă
3) Semiinterquartila. ( ) ă.
2
Observație :
ă 25 ț ș 25
4) Intervalul interdecilic. ( )
5) Abaterea interdecilică
ă 80 ț
6) Semiinterdecila =
Frecvență
cumulată
IQ
ID
D1 Q1 Me Q3 D9 xi
* *
66
Coeficientul de variație interquartilic: ( )
100
2
100
∑ 2
Q1 - 1 Q1=
∑
Q3 - 3 Q3=
∑
Coeficientul de variație interdecilic ( )
2
100
Aplicație: Considerând datele din tabelul următor:
Timpul consumat
pentru realizarea unei
piese ( -
Număr muncitori
( ) ( )
(110 ; 120]
(120 ; 130]
(130 ; 140]
(140 – 150]
(150 – 160]
12
16
28
24
20
12
28
56
80
100
Total 100 -
67
Să se determine gradul de variație cu ajutorul indicatorilor de variație în
sistemul medianei.
100
2
100
100
2
100
Se calculează : ș
6.4 Dispersia unei variabile nominale (atributive)
Măsurarea dispersiei se bazează pe diferențele calitative dintre unitățile
studiate.
Definiție: Se numește indice de variaţie calitativ.
Numărul:
ă ț .
∑∑
∑
ă .
ț .
68
( 1)
2 . .
/
Exemplu: Avem un grup de =60 studenți.
1=40 copii de muncitori.
2=10 copii de intelectuali.
3=10 copii de țărani.
Să se studieze gradul de omogenitate al grupului după originea socială a părinților.
=3
∑∑
=40∙10+40∙10+10∙10=900
3(3 1)
2(60
3) 1200
900
1200 0 75 75
ț ă ă ă ț .
6.5 Indicatori ai formei
Forma unei distribuții statistice se poate aprecia cu ajutorul indicatorilor de
asimetrie şi a indicatorilor de boltire.
Indicatori de asimetrie: dau informaţii asupra modului de repartizare a
frecvențelor de o parte și de alta a valorii centrale.
∑ ∑
( 1)2
. . /
69
Indicatori de boltire: măsoară aglomerarea frecvenţelor în zona centrală.
6.5.1 Asimetria
Definiție: Se numește asimetrie, deviația de la forma simetrică a distribuției.
Valorile centrale folosite pentru aprecierea asimetriei :
.
- Grafic, asimetria se poate aprecia cu ajutorul curbei frecvențelor și a
diagramei box – plot.
- Se compară curba frecvențelor cu modelul teoretic al distribuției normale
(clopotul Gauss
( ț ă)
Asimetrie la stânga
70
Asimetrie la dreapta
Indicatori ai asimetriei
a) Asimetria n mărime absolută ( )
sau
dacă: 0 â
dacă: 0
b) Coeficientul de asimetrie Yule ( )
, 1 1 -
dacă 0 ț ă.
dacă 0 ț ă .
dacă 0 ț ă .
dacă 0 1 – ț ă.
dacă 0 3 – ț ț ă.
3( )
2
71
E xemplu:
128 13
137 86
147 92
128 13 147 92 2 137 86
147 92 128 13 0 0141
ț ă .
c) Coeficientul de asimetrie Pearson ( )
, , 1 1 -
Dacă: 0 ț ă.
dacă 0 ț ă .
dacă 0 ț ă
dacă 0 1 – ț ă.
dacă 0 3 – ț ț ă.
Exemplu:
Pentru distribuția de la exercițiul anterior sa se afle
| 137 5 137 4
|
0 0078. .
72
Cap. 7 Indicatori ai seriilor cronologice
7.1 Indicatori pentru caracterizarea nivelului şi variației în timp
Serie cronologică – serie de timp ce prezintă un șir de observații la diferite
momente sau intervale de timp.
Avem : serie de timp de momente : ( ) 0
serie de timp de intervale : ( ) 1
unde:
ț ă ( )
7.1.1 Indicatori absoluți
Nivelul absolut – valoarea a fiecărui termen al seriei cronologice
Volumul absolut – valoarea ∑ - valoarea nivelurilor absolute.
Sporul absolut – creșterea sau descreșterea unui fenomen într-o perioadă
(moment) față de o altă perioadă (moment)
- sporul cu bază fixă : ⁄ – ț . 0
- sporul cu bază mobilă: ⁄
1
Observația 1:
1) ∑ ⁄
= ⁄
2) ⁄ ⁄
⁄
73
7.1.2 Indicatori relativi :
a) Ritmul sau indicele de variație – arată de câte ori a crescut (scăzut) nivelul
unui fenomen într-o perioadă (moment) față de nivelul aceluiași fenomen într-o altă
perioadă (moment)
- ritmul variației cu baza fixă:
⁄ ⁄
100 0
- ritmul variației cu baza mobilă:
⁄
⁄
100 1
Observaţia 2:
1. ⁄
⁄
2. ⁄
⁄ ⁄
( ) 1
b) Ritmul sporului – arată cu cât s-a modificat în mărime relativă nivelul
fenomenului în perioada raportată față de nivelul fenomenului în perioada de
raportare.
Ritmul sporului cu bază fixă:
⁄ 1 0
100
Ritmul sporului cu bază mobilă:
⁄
⁄
⁄
1
⁄
⁄
100 ⁄
100 1
74
d) Valoarea absolută a unui procent de creștere
- Cu bază fixă:
% ( ⁄ ) ⁄
- Cu bază mobilă:
% ( ⁄ ) ⁄
⁄
7.1.3 Indicatori medii
Nivelul mediu –
Dacă seria este de intervale , atunci nivelul mediu se află calculând o
medie aritmetică a termenilor seriei.
Dacă seria este de timp atunci nivelul mediu se află calculând o medie
cronologică.
Media cronologică simplă (pentru serie cronologică cu momente egal distanțate):
( ) 0
cr=
1
Media cronologică ponderată (pentru seria cronologică cu momente inegal
distanțate)
cr=
cr =
75
Sporul mediu: ( ) ∑ ⁄
⁄
Ritmul mediu al variației ( ) : arată de câte ori s-a modificat în medie pe
an nivelul unui fenomen, într-o perioadă în care fenomenul evoluează după o
progresie geometrică.
a)Metoda mediei geometrice.
= √
100
- dezavantaj: se ignoră termenii seriei, folosindu-se primul si ultimul.
b) Metoda mediei parabolice:
Fie seria: …
1 ∑
= (1 … )
( 1
1 )
1
1 ∑
ă ă .
Dezavantaj: se exagerează importanța primului termen.
Ritmul mediu al sporului ( )
1
100
√ ⁄
√
76
Apl
Se dă seria cronologică ce reprezintă volumul comerțului exterior al României in
perioada 1994 – 1999.
Anii ( ) Exportul (în mil. $)
T0 = 1994
T1 = 1995
T2 = 1996
T3 = 1997
T4 = 1998
T5 = 1999
= 6151
1 = 7910
2 = 8084
3 = 8431
4 = 8302
5 = 8487
47365
a)Să se calculeze indicatorii absoluți și relativi ai variației în timp (și valoarea
absoltă a unui procent de creștere cu bază fixă și cu bază mobilă)
b)Să se calculeze indicatorii medii pentru aceste serii.
Indicatorii absoluți
Anii
Ti Exportul ( ) Sporul absolut
cu bază fixă
(mil. $ )
Cu bază mobilă
⁄
1994
1995
1996
1997
1998
1999
=6151
=7910
=8084
=8431
=8302
=8487
0
1759
= 1993
= 2280
=2151
=2336
-
=1759
=174
=347
=-129
=185
Aplicație
1 :
77
Indicatorii relativi
Ritmul variației și al sporului.
Anul Ritmul
⁄
100
variației(%)
⁄ =
100
ritmul
⁄
=
⁄
100
sporului (%)
⁄
⁄
100
1994
1995
1996
1997
1998
1999
6151
7910
8084
8431
8302
8437
100
128,6
131,43
137,07
134,97
137,98
-
128,6
102,2
104,29
98,47
102,23
O
28,6
31,43
37,07
34,97
37,98
-
28,6
2,2
4,29
-1,53
2,23
Valoarea absolută a unui procent de creștere:
Cu baza fixă %( )
⁄
61 51 .
Cu bază mobilă: % ( ( ))
Indicatorii medii
2
2
5 40021
5 8004 2 .
Nivelul mediu ∑
7894 16 mil.
Sporul mediu
467 2 mil. $
Ritmul mediu al variației = √
√1 3797
1 066 106 6
100 6 66
78
Cap.8 Testarea unei ipoteze statistice
8.1 Probleme ale testării unei ipoteze statistice
1) se verifică dacă valoarea unui parametru este egală cu valoarea estimată pe
baza datelor dintr-un eșantion.
2) se verifică o lege statistică.
Cel mai frecvent: dacă media unei populații este identică cu media obținută
pe un eșantion.
Etapele testării unei ipoteze statistice
1.Se formulează ipotezele (ipoteza Ho)
2.Se alege un test statistic (o funcție statistică) și se alege un estimator pentru
parametrul 𝚹 testat.
3.Se alege un nivel de semnificaţie ∝.
4.Se stabilesc regiunile de ,,acceptare’’ și de ,,respingere’’ a ipotezei .
5.Se calculează valoarea de test pentru funcția statistică cu datele din sondaj.
6.Se ia decizia de respingere sau acceptare a ipotezei.
8.2 Ipoteze statistice
Este o presupunere cu privire la un parametru.
Ipoteza pe care dorim să o testăm se numește ipoteza nulă Ho (este ipoteza care se
dorește a fi negată, eliminată).
Se formuleaza o ipoteza Ha numită ipoteza alternativă în opoziție cu Ho.
Putem avea situațiile:
79
1.
2. teste unilaterale
3.
Regiunea de respingere : Intervalul dintr-o distribuție de probe în care se respinge
ipoteza .
Regiunea de respingere sau regiunea antiză , i se asociază o problemă
∝ [0,01; 0,1]
Regiunea de acceptare : (Intervalul de încredere) nu se respinge .
ă 1 ∝ coeficient de încredere.
Testarea ipotezei
( )
ț ∝
este cunoscut
Se calculează funcția statistică
Unde pentru: ( ) 1
Regiunea de acceptare a ipotezei la nivel de semnificatie α, este intervalul
( ) ț (0 1)
Se determină astfel Ф ( ) 1 ∝
⇒
Concluzie: dacă | | ă
dacă | |
√
80
B) σ este necunoscut
Se calculează
∑ ( )
√
Se calculează funcția statistică √
Regiunea de acceptare este intervalul ( ) unde este cuantila
variabilei t de tip student cu 1 grade de libertate.
( ) ∝ ⇒
Concluzie: dacă | | ă
| |
Aplicaţii:
1000 √
970
N = 25 √25
=5∙
( )
1 5
σ= 100
| | 1 5 ∝ 0 2 ( ) 1 0 2
2 1 0 1 0 9
| | 1 5 1.28
81
TEST
1)
Se cunosc datele privind producția de grâu a unei ferme vegetale
Anul Producția ( ) 1995 1,8
1996 2
1997 2,1
1998 2
1999 2,3
2000 2 3
Sa se calculeze indicatorii absoluți și relativi ai variației în timp, valoarea absolută
a unui procent de creștere cu bază fixă și cu baza mobilă şi indicatorii medii.
Bibliografie:
1. D. Deac, „Statistică Economică”, suport de curs.
2. E. Jaba, “Statistică, Ediţia a-3-a”, Ed. Economică, Bucureşti, 2002.
3. C. Anghelache ş.a., “Bazele Statisticii Teoretice şi Economice”, Ed. Economică,
Bucureşti, 2005.
4.V. Voineag, ş.a., “Statistică. Baze teoretice şi aplicaţii”, Ed. Economică,
Bucureşti, 2007.