+ All Categories
Home > Documents > 2 Indicatorii Tendintei Centrale 11

2 Indicatorii Tendintei Centrale 11

Date post: 25-Jun-2015
Category:
Upload: stelamuresan20047562
View: 617 times
Download: 1 times
Share this document with a friend
26
DESCRIEREA STATISTICĂ A SERIILOR UNIVARIABILE Pentru descrirea unui set de date statistice, numerice, se folosesc trei proprietăţi majore: - tendinţa centrală; - variabilitatea; - forma distribuţiilor. În orice analiză şi interpretare statistică poate fi folosită o varietate de indicatori pentru a caracteriza aceste trăsaturi esenţiale ale setului de date. Dacă indicatorii statistici sunt calculaţi pentru o colectivitate totală, ei se numesc parametri O serie (distribuţie) statistică univariabilă sau univariantă, prezintă corespondenţa dintre două şiruri de date statisitice, sistematizate într-o succesiune logică : - primul şir reprezintă valori ale caracteristicii de grupare, iar - al doilea şir reprezintă frecvenţa de apariţie corespunzătoare. Pentru o colectivitate C cu N elemente ordonate după variabila statistică X, cu valorile x i , M , 1 i = , unde: , la fiecare valoare x M 2 1 x x x < < < L i , corespunde un efectiv n i . Ansamblul valorilor x i cu numărul elementelor n j , asociate fiecărei variabile x i , respectivfiecărei clase J i , ( ) i 1 i x , x formează o serie statistică univariabilă. O serie statistică, definită de ansamblul valorilor ( ) i i n , x se notează : sau ( ) m i 2 1 x , , x , x , x : X K K ( ) M , 1 i cu x : X i = , cînd n , respectiv: n n 2 1 = = = L , sau M j 2 1 M j 2 1 n n n n x x x x : X K K K K M , 1 j , n x : X j j = Dacă se utilizează frecvenţele relative, 1 f ; n n f M 1 j j M 1 j j j j = = = serie statistică se poate scrie sub forma: M j 2 1 M j 2 1 f f f f x x x x : X K K K K care poate fi considerată ca o variabilă aleatoare. Pentru astfel de serii statistice, sunt adevărate toate proprietăţile variabilelor aleatoare discrete. 2_INDICATORII TENDINTEI CENTRALE_11.doc 1
Transcript
Page 1: 2 Indicatorii Tendintei Centrale 11

DD EE SS CC RR II EE RR EE AA SS TT AA TT II SS TT II CC ĂĂ AA SS EE RR II II LL OO RR UU NN II VV AA RR II AA BB II LL EE

Pentru descrirea unui set de date statistice, numerice, se folosesc trei proprietăţi majore: - tendinţa centrală; - variabilitatea; - forma distribuţiilor.

În orice analiză şi interpretare statistică poate fi folosită o varietate de indicatori pentru a caracteriza aceste trăsaturi esenţiale ale setului de date. Dacă indicatorii statistici sunt calculaţi pentru o colectivitate totală, ei se numesc parametri O serie (distribuţie) statistică univariabilă sau univariantă, prezintă corespondenţa dintre două şiruri de date statisitice, sistematizate într-o succesiune logică : - primul şir reprezintă valori ale caracteristicii de grupare, iar - al doilea şir reprezintă frecvenţa de apariţie corespunzătoare. Pentru o colectivitate C cu N elemente ordonate după variabila statistică X, cu valorile xi, M,1i = , unde:

, la fiecare valoare xM21 xxx <<< L i , corespunde un efectiv ni . Ansamblul valorilor xi cu numărul elementelor nj , asociate fiecărei variabile xi , respectivfiecărei clase Ji , ( )i1i x,x − formează o serie statistică univariabilă. O serie statistică, definită de ansamblul valorilor ( )ii n,x se notează : sau ( )mi21 x,,x,x,x:X KK ( ) M,1icux:X i = , cînd n , respectiv: nn 21 === L

, sau

Mj21

Mj21

nnnn

xxxx:X

KK

KKM,1j,

n

x:X

j

j=

Dacă se utilizează frecvenţele relative, 1f;n

nf

M

1jjM

1jj

jj == ∑

∑ −

=

serie statistică se poate scrie sub forma:

Mj21

Mj21

ffff

xxxx:X

KK

KK

care poate fi considerată ca o variabilă aleatoare. Pentru astfel de serii statistice, sunt adevărate toate proprietăţile variabilelor aleatoare discrete.

2_INDICATORII TENDINTEI CENTRALE_11.doc 1

Page 2: 2 Indicatorii Tendintei Centrale 11

VARIABILE ALEATOARE FINITE

Definiţia . Fie X o variabilă aleatoare discretă, avînd tabelul de distribuţie : , atunci funcţia de

n21

n21

ppp

xxx:X

K

K

repartiţie corespunzătoare va fi dată de relaţia :

( )

>

≤<

≤<+≤<

=

∑−

=−

n

1k

1ik1ki

3221

211

1

xx,1........................

xxx,p

........................xxx,ppxxx,p

xx,0

xF

Observaţie: Valorile funcţiei de repartiţie a variabilei aleatoare discrete X se obţin în următorul mod : Dacă x < x1 ,atunci : ( ) ( ) ( ) 0xXPxXPxF 1 =<<=<=

Dacă x1< x ≤ x2 , are loc : ( ) ( ) ( )[ ] ( ) 11211 pxXPxXxxXPxXP ===<<∪≤=< Dacă x1< x ≤ x , are loc : 2

( ) ( ) ( ) ( )[ ]( ) ( ) ( ) ( ) ( ) 212132211

32211

ppxXPxXPxXxPxXxPxXPxXxxXxxXPxXP

+==+==<<+≤<+≤==<<∪≤<∪≤=<

Dacă xk-1< x ≤ xk , ar

,,

e loc : . ( ) ( ) ( ) ( ) ∑−

=− =<<∪∪≤<∪≤=<

1k

1iik1k21 pxXxxXxxXPxXP K

Pentru x > xn , . ( ) 1pxXPn

1ii ==< ∑

=

Exemplul

Fie variabila aleatoare discretă

5.03.02.0321

:X

Funcţia de repartiţie este o funcţie în scară: x≤1 F(x)=P(X<x)=P(Φ)=0 1< x ≤2 F(x)=P(X<x)=P(X=1)=0.2 2< x ≤3 F(x)=P(X<x)=P(X=1UX=2)=P(X=1)+P(X=2)=

=0.2+0.3=0.5 x>3 F(x)=P(X<x)=P(Ω)=1. Deci F(x) va fi de forma :

( )F x

xxxx

=

≤< ≤< ≤

>

0 10 2 1 205 2 31 3

, ,. ,. ,

, .

2_INDICATORII TENDINTEI CENTRALE_11.doc 2

Page 3: 2 Indicatorii Tendintei Centrale 11

Graficul funcţiei F(x) : (0,1) (0,1/2) (0,1/5) 0 1 2 3

Valori medii

Definiţie :

Dacă variabila aleatoare simplă X ia valorile x1,x2,….,xn cu probabilităţile p1,p2,…,pn, , atunci numărul:

=∑

=

1pn

1ii

M(X) = p1x1+p2x2+ ⋅⋅⋅ +pnxn se numeşte valoarea medie (sau speranţa matematică) a variabilei aleatoare X. Definiţie Dacă X este o variabilă aleatoare de tip continuu avînd densitatea de repartiţie f, atunci numărul :

se numeşte valoarea medie a variabilei aleatoare X, dacă integrala este convergentă. ∫∞

∞−

⋅= dx)x(fx)X(M

Observaţie: Dacă variabila aleatoare X ia valori în intervalul ( a , b ) , -∞ < a < b < ∞, atunci f(x)=0 pentru x ∉ ( a , b ), deci:

. dx)x(fx)X(Mb

a∫ ⋅=

Proprietăţi Dacă X şi Y sunt variabile aleatoare simple, numărabile sau de tip continuu, şi există M(X) şi M(Y), atunci: M1. Există M(X+Y) şi M(X+Y) = M(X) + M(Y) M2. Există M(c X) şi M(c X) = c M(X) , c constantă. Are loc şi următoarea proprietate: M.1.2.Fie X1, X2, … ,Xn variabile aleatoare şi c1,c2, … ,cn constante.

Dacă există M(Xi), i = 1,2, … ,n atunci există şi şi are loc relaţia :

⋅∑

=

n

1iii XcM

. ( )∑∑==

⋅=

n

1iii

n

1iii XMcXcM

M3. X ≤ Y ⇒ M(X) ≤ M(Y) M4. Dacă X şi Y sunt variabile aleatoare independente şi există M(X) şi M(Y), atunci există şi M(X ⋅Y) şi are loc relaţia: M(X ⋅Y) = M(X) ⋅ M(Y) M5. Dacă f este densitatea de repartiţie a variabilei aleatoare X, iar g:R→R este o funcţie continuă,

atunci : există M(g(X)) şi are loc relaţia : . ∫∞

∞−

⋅= dx)x(f)x(g))X(g(M

Exemplu :

Fie variabila aleatoare X cu densitatea de repartiţie f, ( ) ( )

( )

−∉

−∈+⋅π=

1,1x,0

1,1x,x1

2)x( 2f

2_INDICATORII TENDINTEI CENTRALE_11.doc 3

Page 4: 2 Indicatorii Tendintei Centrale 11

Valoarea medie a variabilei aleatoare X este :

( ) ( ) ( ) .0dxx1

x2dxx1

x2dxxfxXM1

122

=⋅+

⋅π

=⋅+⋅π

=⋅= ∫∫∫−

∞−

∞−

Valoarea medie a variabilei aleatoare X2 este :

( ) ( ) ( ) ( )[ ] . 14arctgxx2dxx1

112dxx1

x2dxxfxXM 11

1

122

222 −

π=−⋅

π=⋅

+−⋅

π=⋅

+⋅π=⋅= +

∞−

∞−∫∫∫

Dispersia

Definiţie Se numeşte dispersia sau varianţa variabilei aleatoare X, care are valoarea medie m, numărul : 2 (X) = M [ (X-m)2 ] = σ2 , (dacă variabila aleatoare X are medie!). µ2 (X) = D Dacă X este o variabilă aleatoare de tip continuu, care are media m, cu densitatea de repartiţie f, atunci dispersia se scrie sub forma :

. ( )∫∞

∞−

⋅−==σ dx)x(fmX)X(D22

Proprietăţi: D2(X) = M(X2) - [ M(X) ]2 D0.

D1. D 0 , pentru orice variabilă aleatoare X. 2(X) ≥D2. Egalitatea D2(X) = 0 are loc dacă şi numai dacă X este o variabilă aleatoare constantă cu probabilitatea egală

cu 1, sau D ⇔ X ≡ m ( sau mai exact : P (X = m) = 1 ). 2(X) = 0 D3. D2( c⋅X ) = c2⋅ D2(X) , unde c este o constantă. D4. Dacă variabilele aleatoare X1,X2, … ,Xn sunt independente două cîte două, atunci : D ⋅⋅⋅ +Xn) = D2(X1)+ D2(X2)+ ⋅⋅⋅ + D2(Xn). 2(X1+X2+ D.3.4. Dacă variabilele aleatoare X1,X2, … ,Xn sunt n variabile aleatoare independente două cîte două, şi c1,c2, … ,cn

sunt n constante atunci are loc relaţia :

( )[ ]∑∑==

⋅=

n

1ii

22i

n

1iii

2 XDcXcD

Demonstraţie: Se aplică proprietatea D.0. şi se obţine :

=

⋅−

⋅=

⋅ ∑∑∑

===

2n

1iii

2n

1iii

n

1iii

2 XcMXcMXcD

=

⋅−

⋅⋅⋅⋅+⋅= ∑∑∑=

≠==

2n

1iii

n

ji1j,i

jiji2i

n

1i

2i XcMXXcc2XcM

( ) ( ) ( )[ ] n

ji1j,i

i

n

1i

2i

2i

n

ji1j,i

jiji

n

1i

2i

2i c2XMcXXMcc2XMc ⋅−−⋅+= ∑∑∑∑

≠==

≠==

( ) ( )jij XMXMc ⋅

Dar variabilele aleatoare Xi sunt independente,două cîte două,deci conform cu M4 se deduce :

( ) ( )[ ] ( ) ( )[ ][ ] ( )∑∑∑∑∑=====

=−=−=

n

1i

2i

n

1i

2i

2ii

n

1i

2i

2i

n

1i

2i

2i

n

1iii XDcXMXMcXMcXMcXcD

Definiţie

Numărul ( ) ( )XDXD 2= se numeşte abaterea mediei pătratice şi măsoară gradul de “împrăştiere” a variabilei aleatoare în jurul valorii sale medii.

Inegalitatea lui CEBÎŞEV

Propoziţie : Dacă variabila aleatoare X are valoarea medie m şi dispersia σ2, atunci pentru orice ε,

ε > 0 are loc: ( )2

2mXP

εσ

≤ε≥−

2_INDICATORII TENDINTEI CENTRALE_11.doc 4

Page 5: 2 Indicatorii Tendintei Centrale 11

(sau sub forma echivalentă : ( ) 0k,Rk,k1

kmXP2

>∈∀≤σ⋅≥− )

Demonstraţie: Dacă variabila aleatoare X are funcţia de densitate de repartiţie f, atunci:

( ) ( ) ( ) ( ) ( ) ≥−+−+−=−= ∫∫∫∫∞

ε+

ε+

ε−

ε−

∞−

∞− m

2m

m

2m

22 dx)x(fmxdx)x(fmxdx)x(fmxdx)x(fmxXD

( ) ( ) .dx)x(fmxdx)x(fmxm

2m

2 ∫∫∞

ε+

ε−

∞−

−+−≥

Pentru x ∉ ( m-ε , m+ε), adică | x-m | ≥ ε, are loc :

( )

[ ] ( ).mXP)mX(P)mX(P

dx)x(fdx)x(fdx)x(fdx)x(fXD

22m

m2

m

2m

2

ε≥−⋅ε=ε+≥+ε−≤ε

=

+ε=⋅ε+⋅ε≥ ∫∫∫∫

ε+

ε−

∞−

ε+

ε−

∞−

S-a demonstrat astfel că : ( )2

2mXP

εσ

≤ε≥− , sau forma echivalentă: ( ) .1mXP 2

2

εσ

−≥ε<−

Inegalitatea lui Cebîşev poate fi scrisă şi sub alte forme :

( ) 0a,Ra,a

amXP 2

2>∈∀

σ≤≥−

( ) 0a,Ra,a

1amXP 2

2>∈∀

σ−>≤−

Inegalitatea lui Cebîşev precizează marginea superioară pentru probabilitatea ca variabila aleatoare X, care are valoarea medie m şi abaterea medie pătratică σ2 , să ia valori în intervalul ( m-a , m+a ).

Momente de ordin superior

Definiţie

Se numeşte moment de ordinul r al variabilei aleatoare finită X, numărul , unde variabila

aleatoare X ia valorile x

( ) ∑=

⋅==N

1i

riirr xpXMm

i respectiv cu probabilităţile pi, cu condiţia ca seria din membrul drept să fie absolut convergentă. Dacă variabila aleatoare X este continuă şi are densitatea de repartiţie f, atunci se numeşte moment de ordinul , numărul:

, dacă integrala din membrul drept este convergentă. ( ) ∫∞

∞−

⋅= dx)x(fxXM rr

Definiţie. Se numeşte moment centrat de ordinul r al variabilei aleatoare X, care are media m = M(X), numărul µr = Mr (X - m). Definiţie Se numeşte moment absolut de ordinul r al variabilei aleatoare discrete X,numărul :

mar = Mr ( | X | ), iar numărul:

( )mXMm rr −= se numeşte moment centrat absolut de ordinul r al variabilei aleatoare X. Comentarii : 1.Media (speranţa matematică) a unei variabile aleatoare X este momentul de ordinul întîi al variabilei aleatoare, iar dispersia - momentul centrat de ordinul doi. 2.Valoarea medie este una dintre cele mai importante caracteristici numerice ataşate variabilei aleatoare, care va permite în anumite situaţii, să tragem unele concluzii asupra variabilei aleatoare, fără a apela la legile lor de probabilitate. 3.Valoarea medie este un fel de valoare centrată a variabilei aleatoare, valoare în jurul căreia se situează celelalte valori posibile, astfel ca media abaterilor de la această valoare să fie nulă.

2_INDICATORII TENDINTEI CENTRALE_11.doc 5

Page 6: 2 Indicatorii Tendintei Centrale 11

4.Alte caracteristici de poziţie sunt : modulul şi mediana. 4.1.Modulul - este valoarea cea mai probabilă în cazul unei variabile aleatoare discrete sau punctul de maxim al funcţiei f în cazul variabilei aleatoare de tip continuu care au densitatea de repartiţie f. 4.2.Mediana - variabilei aleatoare X este valoarrea Me pentru care: P( X < M e ) . e ) = P( X > M

Dacă X are densitatea de repartiţie f, atunci Me este valoarea pentru care : ∫∞−

=eM

21dx)x(f .

Geometric, Me , este un număr real cu proprietatea că dreapta x = Me împarte aria cuprinsă între graficul funcţiei y = f(x) şi axa Ox în două părţi egale. 5.Dacă o variabilă aleatoare are densitate de repartiţiem, F(x) şi valoare medie (finită) , atunci : ( )( ) 0xF1

x=−

∞→xlim ⋅ şi ( ) 0xFxlim

x=⋅

−∞→.

6. Dacă o variabilă aleatoare are densitate de repartiţiem, F(x) şi valoare medie (finită), m , atunci :

( )( ) ( )∫ ∫∞

∞−

⋅−⋅−=0

0

.dttFdttF1m

Proprietăţi

P.1. . Inegalitatea lui SCHWARTZ. Dacă X şi Y sunt două variabile aleatoare pentru care există M(X2) şi M(Y2), atunci :

( ) ( ) ( )22 YMXMXYM ≤ Demonstraţie: Fie variabila aleatoare Z=(X-λY)2 , unde λ este un parametru real. Valoarea medie a variabilei aleatoare Z va fi :

M(Z) = M(X2) - 2λM(XY) + λ2 M(Y2) Cum Z ≥ 0, avem M(Z) ≥ 0, ∀λ∈R, deci :

M(X2) - 2λM(XY) + λ2 M(Y2) ≥ 0. Dacă considerăm funcţia de gradul doi, în variabila λ, cum M(Y2) ≥ 0, discriminantul ecuaţie va fi negativ, deci :

[ M(XY) ]2-M(X2)M(Y2) ≤ 0 , de unde rezultă inegalitatea lui Schawartz. P.2. Inegalitatea lui HÖLDER. Fie X o variabilă aleatoare pentru care există M(|X|r ) şi Y o variabilă aleatoare pentru care există M(|Y|s ), unde r>1 şi

.1s1

r1

=+ Atunci : ( ) ( )[ ] ( )[ ]s1

sr1

r YMXMYXM ⋅≤⋅

Demonstraţie:

Se foloseşte inegalitatea:s

br

aab

sr

+≤ în care se alege : ( )[ ] r1

rXMXa−

⋅= şi ( )[ ] s1

sYMYb−

⋅=

Se obţine :

( )[ ] ( )[ ]s1sr1

r YMXM

XY

( )r

r

XMr

X

⋅≤ + ( )s

s

YMs

Y

Aplicînd operatorul de mediere, în ambii membri ai inegalităţii, obţinem :

( )

( )[ ] ( )[ ]s1sr1

r YMXM

YXM

⋅ ( )( )r

r

XMr

XM

⋅≤ +

( )( )s

s

YMs

YM

⋅1

s1

r1

=+= ,

de unde rezultă imediat inegalitatea lui Hölder. Inegalitatea lui Hölder este o generalizare a inegalităţii lui Schwartz. Inegalitatea lui Schwartz se deduce din inegalitatea P.3.2. în se consideră r=s=2. P.3. Dacă k > h > 0 şi dacă X este o variabilă aleatoare pentru care există M(|X|k ) şi M(|X|h) , atunci are loc :

( )[ ] ( )[ ]k1

kh1

h XMXM ≤ Demonstraţie:

Dacă în inegalitatea lui Hölder se pune Y = 1, se obţine relaţia : ( ) ( )[ ]r1

rXMXM ≤ , dacă r > 1.În această inegalitate se

substituie |X| cu kX şi r cu .1hk

>

2_INDICATORII TENDINTEI CENTRALE_11.doc 6

Page 7: 2 Indicatorii Tendintei Centrale 11

Rezultă relaţia : ( ) ( )[ ]kh

kh XMXM ≤ , de unde se deduce P.3. P.4. Inegalitatea lui MARKOV. Fie X o variabilă aleatoare pozitivă , casre admite voloarea medie M(X) = m, atunci pentru orice λ > 0 , are loc inegalitatea :

( )λ

≤⋅λ≥1mXP .

Demonstraţie: Pentru 0 < λ ≤ 1,1/λ > 1 şi inegalitatea P.3.4. este evidentă. Dacă λ > 1, X este o variabilă aleatoare continuă strict pozitivă cu funcţia de densitate de repartiţie f, atunci :

. Deci ∫∞

⋅=0

dx)x(fxm ( )∫∫∫∫∞

⋅λ

⋅λ

⋅λ

⋅λ

=⋅⋅λ≥⋅≥⋅+⋅=mmm

m

0

dxxfmdx)x(fxdx)x(fxdx)x(fxm

( )[ ] ( mXPmmF1mm

)x(Fm λ≥⋅⋅λ=⋅λ−⋅⋅λ=

⋅λ∞

⋅λ= ) , de unde rezultă inegalitatea P.4.

P.5. Inegalitatea lui KOLMOGOROV. Fie X1,X2, …,Xn, n variabile aleatoare independente,cu mediile nule, M(Xk) = 0, şi dispersiile finite, D2(Xk) < ∞, k = 1,2, … ,n.

Atunci pentru ∀ε>0 are loc inegalitatea: ( )∑∑==

≤≤⋅

ε≤

ε≥

n

1kk

22

n

1ii

nk1XD1XmaxP .

Inegalitatea lui Kolmogorov este o generalizare a inegalităţii lui Cebîşev. Exemple :

1.Variabila aleatoare X are densitatea de repartiţie ( ][ ),1,1x,

21

1,1x,0)x(f

−∈

−∉=

Să se calculeze valoarea medie şi dispersia variabilei aleatoare Z=2X2+1. Soluţie:

( )( ) ( ) ( ) .Rx,1x2)x(g,dxxfxgXgM 2 ∈+== ∫∞

∞−

( ) ( ) ( ) ( ) .35dx

211x2dxxfxgZM

1

1

2 =⋅⋅+== ∫∫−

∞−

Dispersia se calculează astfel :

( )

−=

−+=

−=

22

22

22

32x2M

351x2M

35ZMYD

Pentru calculul dispersiei vom considera funcţia ( )2

32x2xg

−= şi se va obţine :

( ) . 4516dx

21

32x2ZD

1

1

222 =⋅⋅

−= ∫

2.Dacă evenimentele A1,A2, …,An sunt independente cu propritetăţile de realizare cunoscute, pi = P( Ai ) , i = 1,2,…,n , să se determine valoarea medie şi dispersia variabilei aleatoare definite de sistemul de mai sus. Soluţie: Fie X numărul de evenimente care se realizează.

P( X = k ), coeficientul lui xk din polinomul: (1) unde :( ) ( ),qxpxQn

1iii∏

=

−⋅= ii p1q −= . Dacă :

(2) , atunci distribuţia li X este : care are valoare medie :

şi dispersia

( ) nn

2210 xPxPxPPxQ ⋅++⋅+⋅+= L

( ) ∑=

⋅=n

1iiPiX ( )

n210 PPPPn210

XK

K

M ( ) ( )[ ]22 XM−2 XMXD = .

2_INDICATORII TENDINTEI CENTRALE_11.doc 7

Page 8: 2 Indicatorii Tendintei Centrale 11

În urma derivării relaţiei (2) se obţine : , de unde : . ( ) n1n

21 PnxxP2PxQ −+++=′ L ( ) ( )XMPi1Qn

1ii =⋅=′ ∑

=Dacă se deriveză relaţia (1) se obţine:

(3) , deoarece , deci : ( ) ( )∑ ∏= ≠

+⋅=′

n

1k kiiik qxppxQ ( ) ∑

=

=′⇒=+n

1kkii p1Q1qp

M(X) = p1+ p2+ ⋅⋅⋅ + pn . Pentru a calcula dispersia D2(X) se va determina prima dată M(X2),

( ) ∑=

⋅=n

1kk

22 PkXM

Se va deriva polinomul ( ).xQx ′⋅

( )( ) ( )′+++=′′⋅ nn

221 xnPxP2xPxQx L

( )( ) ( ) ( ) 1nn

22

21 xPnxP2PxQxxQxQx −+++=′′+′=′′⋅ L

Pentru x =1 relaţia de mai sus devine: Q . ( ) ( ) ( )2n

1kk

2 XMPk1Q1 =⋅=′′+′ ∑=

Derivînd relaţia (3) (se calculează a doua derivată a polinomului (1)) , pentru x=1 rezultă :

( ) ( )[ ] =−⋅=⋅++⋅+⋅=′′ ∑∑∑∑=≠≠≠

n

1kkk

niin

2ii2

1ii1 pXMpppppppxQ L

( ) ( )[ ] ,pXMppxMn

1k

2k

2n

1k

2k

n

1kk ∑∑∑

===

−=−

= de unde rezultă

( ) ( ) ( )[ ] ∑=

−+=n

1k

2k

22 pXMXMXM .

Dispersia va avea forma :

( ) ( ) ( )[ ] ( )[ ] ( ) ( )[ ] =−=−−+=−= ∑∑∑===

n

1k

2k

n

1kk

2n

1k

2k

2222 ppXMpXMXMXMXMXD

( ) ( ) 2211

n

1kkk

n

1kkk

2n

22

21n21 qpqpqpp1ppppppp ++==−=+++−+++= ∑∑

==

LLL nn qp+ .

2_INDICATORII TENDINTEI CENTRALE_11.doc 8

Page 9: 2 Indicatorii Tendintei Centrale 11

II NN DD II CC AA TT OO RR II II TT EE NN DD II NN TT EE II CC EE NN TT RR AA LL EE

MM EE DD II II

Deoarece statistica operează cu un număr mare de variante, este necesar să se găsească o singură expresie numerică pentru a sintetiza toate aceste valori individuale. Mărimile medii constituie instrumente principale de cunoaştere a fenomenelor de masă şi au un grad mare de aplicabilitate în activitatea practică. Ele redau ceea ce este tipic, comun şi general în variaţia sau în evoluţia fenomenelor. Pentru a asigura un conţinut cât mai real mediilor calculate, se impune ca valorile individuale din care se obţin să fie cât mai apropiate între ele. Totodată, trebuie să se ţină seama de gradul de omogenitate al colectivităţii supuse cercetării. În cazul eterogenităţii se vor calcula medii parţiale, iar media pe ansamblu va apărea ca o sinteză a acestora. Pentru aplicarea corectă a metodei mediilor este necesar să se respecte următoarele condiţii: calculul mediilor să se bazeze pe folosirea unui număr mare de cazuri individuale sub care s-a înregistrat caracteristica, a căror variaţie este întâmplătoare în raport cu fenomenul în totalitatea lui - valorile din care se va calcula media să fie omogene ; - alegerea acelei forme de medie care corespunde cel mai bine formei de variaţie a caracteristicii cercetate şi informaţiilor de care se dispune. Prin definiţie, media valorilor individuale ale unei variabile este expresia sintetizării într-un singur nivel reprezentativ, a tot ceea ce este esenţial, tipic şi obiectiv în evoluţia acesteia. În condiţiile în care media este o valoare reprezentativă pentru toate nivelele pe care le sintetizează, înseamnă că le poate substitui. Substituirea poate fi privită sub două aspecte: - cantitativ, care constă în faptul că nivelul total al caracteristicii calculat prin totalizarea nivelurilor individuale nu trebuie să se schimbe atunci când aceste niveluri sunt substituite cu media lor; - calitativ, legat de semnificaţia şi conţinutul mediei calculate, conţinut care este asigurat atunci când unităţile au un grad înalt de omogenitate. Rezultă că media măsoară influenţa cauzelor esenţiale, făcând abstracţie de cauzele întâmplătoare. În statistică, media poate fi interpretată ca nivelul la care ar fi ajuns caracteristica înregistrată, dacă în toate cazurile factorii esenţiali şi neesenţiali ar fi acţionat constant, deci s-ar fi obţinut o valoare identică. Diversitatea largă a fenomenelor social-economice, precum şi complexitatea variabilităţii acestor fenomene, condiţionează alegerea tipului de medie adecvat. Mediile cele mai frecvent întâlnite sunt: aritmetică, armonică, pătratică, geometrică şi cronologică, calculate ca medii simple sau ponderate.

Indicii ca indicatori derivaţi În mod frecvent apare necesitatea de a compara sub formă de raport două sau mai multe valori înregistrate pentru acelaşi fenomen în funcţie de timp, de spaţiu sau de diferite structuri economico-sociale. Astfel de mărimi relative au fost denumite indici. Metoda indicilor este larg utilizată în teoria şi practica economică.

Indicatorii statici calculaţi ca mărimi medii Fenomenele de masã social-economice supuse acţiunii legitãţilor statistice prezintã forme de manifestare dintre cele mai diferite.Aceastã variabilitate a formelor individuale de manifestare este generatã de multiple cauze asociate între ele, ale cãror influenţe se modificã în funcţie de condiţii obiective şi specifice, de la una la alta. În aceste condiţii, când complexul dinamic de influenţe ale unui fenomen de masã determinã pentru fiecare unitate a colectivitãţii nivele diferite ale caracteristicilor studiate, se pune problema determinãrii unei valori care sã substituie toate formele de manifestare individuale. Asemenea valori care substituie valorile individuale diferite, obţinute printr-o metodã statisticã şi cunoscute ca valori tipice sau centrale ale colectivitãţii respective sunt mãrimile medii. 2_INDICATORII TENDINTEI CENTRALE_11.doc 9

Page 10: 2 Indicatorii Tendintei Centrale 11

Media valorilor individuale ale unei caracteristici reprezintã expresia sintetizãrii într-un singur nivel reprezentativ a tot ceea ce este tipic, esenţial şi obiectiv în apariţia, manifestarea şi dezvolatrea fenomenelor de masã. În funcţie de repartiţia frecvenţelor, mediile menţionate se calculeazã ca :

- medii simple sau - medii ponderate.

Mediile simple se calculeazã atunci când se utilizeazã toate variantele înregistrate sau când, în urma operaţiilor de sistematizare, toate valorile individuale prezintã frecvenţe egale. În cazul în care, în urma sistematizãrii (grupãrii), valorile individuale ale caracteristicii prezintã frecvenţe diferite, nivelul mediu se calculeazã ca medie ponderatã.

Media aritmeticã

În sens statistic, media aritmeticã a valorilor individuale x1, x2, ..., xN ale caracteristicii “X”, urmãritã într-o colectivitate, reprezintã acea valoare ( x ) care s-ar fi înregistrat dacã toţi factorii de influenţã ar fi acţionat în mod constant la nivelul fiecãrei unitãţi de înregistrare. Deci, putem spune cã, dacã fiecare valoare individualã “xi” (cu i = 1, ..., n) ar fi înlocuitã cu x , valoarea totalizatã a caracteristicii nu se modificã.

Aceasta înseamnã cã:

xnx...x...xxx...x...xxx ni21n

1ii =+++++=+++++=∑

=

simpla_aritmetica_median

xx

n

1ii

⇒=∑=

Media aritmeticã simplã se utilizeazã atunci când, pentru aflarea nivelului mediu, se apeleazã la variantele înregistrate într-o colectivitate, iar mãrimea colectivitãţii nu este foarte mare.

Într-o colectivitate statisticã mare, unde multe unitãţi prezintã aceeaşi valoare individualã şi seria statisticã obţinutã în urma prelucrãrii prezintã frecvenţe diferite, media aritmeticã se calculeazã ca o medie aritmeticã ponderatã, dupã formula:

∑∑==

=+++++=+++++=k

1iiki21kkii2211

n

1iii nxnx...nx...nxnxnx...nx...nxnxnx

ceea ce conduce la:

i

k

i

n

iii

n

nxx

=

==

1

1

unde: - xi = toate cele “k” (i = 1, ..., k) vaolri individuale înregistrate în colectivitate

- xi ni = valoarea centralizatã a caracteristicii la toate unitãţile (ni) care prezintã acelaşi nivel (xi)

- xni = valoarea centralizatã a caracteristicii care s-ar fi înregistrat dacã la fiecare din cele “ni “ unitãţi toţi factorii de influenţã ar fi acţionat constant;

- n = Σni , i = 1, ..., k = volumul colectivitãţii studiate

2_INDICATORII TENDINTEI CENTRALE_11.doc 10

Page 11: 2 Indicatorii Tendintei Centrale 11

În legãturã cu cele douã modalitãţi de calcul ale mediei aritmetice se impun unele observaţii. Astfel: • •

media aritmeticã este precis definitã şi se bazeazã pe toate observaţiile efectuate; nivelul mediei aritmetice depinde nu numai de nivelul variantelor, ci şi de mãrimea frecvenţelor corespunzãtoare; în cazul în care calculul mediei aritmetice este precedat de operaţia de grupare a valorilor individuale pe intervale, atunci valorile “xi “ (i = 1, ..., k) vor fi centrele intervalelor de grupare; în cazul în care pentru valorile individuale dispunem de frecvenţe relative “fi “ (i = 1, ..., k) şi nu de frecvenţele absolute “ni “, media aritmeticã se va calcula dupã relaţia: în care

Media aritmeticã a unei caracteristici numerice prezintã o serie de proprietãţi utile pentru calculul şi

interpretarea valorii sale. Dintre aceste proprietãţi ale mediei aritmetice, cele mai utilizate în analiza statisticã a fenomenelor sociale şi economice sunt urmãtoarele:

1001

∑==

k

iii fx

x100

1

•=

∑=

k

ii

ii

n

nf

a) într-un şir de valori egale, media acestora este egalã cu fiecare dintre ele b) mãrimea mediei aritmetice este întotdeauna cuprinsã şi intervalul de variaţie al caracteristicii

studiate xmin < x < xmax c) într-o serie statisticã suma tuturor abaterilor individuale ale termenilor seriei de la media lor

aritmeticã (luate cu semnul corespunzãtor) este zero. - pentru o serie simplã:

0)(1

=−∑=

n

ii xx

- pentru o serie de frecvenţe:

0)(1

=−∑=

i

n

ii nxx

sau

0)(1

=−∑=

i

n

ii fxx

d) într-o serie statisticã, dacã toţi termenii se mãresc (micşoreazã) cu aceeaşi mãrime constantã “a”, atunci media noilor termeni este mai mare (micã) decât media seriei iniţiale cu constanta “a”;

e) într-o serie statisticã, dacã toţi termenii se mãresc (micşoreazã) cde acelaşi numãr de ori “h”, atunci şi media seriei iniţiale se mãreşte (micşoreazã) de acelaşi numãr de ori “h”.

Prin combinarea acestor douã proprietãţi se poate ajunge la o relaţie de calcul simplificat al mediei aritmetice.

f) dacã într-o serie de distribuţie se reduc proporţional toate frecvenţele, atunci media calculatã pe baza noilor frecvenţe va fi egalã cu media seriei iniţiale;

g) pentru o serie de distribuţie de frecvenţe cu toate frecvenţele egale între ele, media aritmeticã ponderatã se transformã în medie aritmeticã simplã;

h) într-o colectivitate structuratã pe grupe, media acesteia (x) este dependentã de media grupelor (xj cu j = 1, ..., p) şi de frecvenţele grupelor respective (nj sau fj).

j) media produsului a douã variabile aleatoare independente x şi y este egalã cu produsul mediilor celor douã variabile:

În acest caz media generalã nu este o sumã a mediilor parţiale, ci o sintezã a acestora, deoarece pe întreaga colectivitate are loc un proces de compensare a abaterilor mediilor parţiale de la media generalã.

i) Media aritmeticã a sumei (diferenţei) dintre douã variabile aleatoare independente este egalã cu suma (diferenţa ) mediilor celor douã variabile luate în considerare

yxyx +=+

2_INDICATORII TENDINTEI CENTRALE_11.doc 11

Page 12: 2 Indicatorii Tendintei Centrale 11

Media armonicã Media armonicã se defineşte ca valoare inversã a mediei aritmetice, calculatã din inversele valorilor

individuale înregistrate. Relaţia pentru media armonicã simplã:

distribuţie de frecvenţe

Compararea mediei armonice cu media aritmetică permite stabilirea anumitor relaţii utile analizelor nivelelor sintetice.

Astfel: 1) Pentru aceleaşi valori pozitive ale unei caracteristici, media lor armonică este mai mică decât cea

aritmetică.

Dacă valorile individuale sunt egale între ele şi egale cu o constantă “c”, atunci

2) În cazul în care între două variabile interdependente există o relaţie de inversă proporţionalitate

(y = 1/x), aceasta se păstrează şi între mediile calculate pentru fiecare variabilă. Deci, dacă pentru una din variabile, nivelul mediu se calculează ca medie aritmetică, în mod obligatoriu

Asemen ri în care media armonicã apare ca o formã transformatã a mediei aritmetice, se întâlnesmãrimi med edia armonicã se foloseşte , de exemplu, la aclculul preţului mediu şi al indicelui mediu al preţurilor, când lipsesc informaţiile despre volumul fizic al circulaţiei mãrfurilor. De asemenea, se foloseşte media armonicã la calculul salariului mediu pe întreprindere când se cunosc salariile medii şi fondurile de salarii secţiilor; tot mdia armonicã se foloseşte la calculul recoltei medii de grâu pe ţarã, când se cunosc recoltele medii şi recoltele totale la nivelul judeţelor.

pentru o serie de

yxyx •=

nivelul mediu al celei de a doua variabile se calculează ca medie armonică. ea cazucatunci când se calculeazã media unor indicatori derivaţi exprimaţi ca mãrimi relative parţiale sau ca

ii parţiale. M

de la nivelul

3. Media pãtraticã Media pãtraticã reprezintã acea valoare (xp) care, dacã ar înlocui fiecare termen al seriei (xi), i = 1, ..., n, suma pãtratelor term odifica. Relaţia de calcul a mediei pãtratice pentru o serie simplã este:

enilor nu s-ar m

∑i ix1

=nx nh 1

nxi

ii

∑=1

absoluten

x k

k

ii

h ⇒=∑

=1

1=

relativef

x nh ⇒=

∑ 1100

xii

i=1

)( xxh p

cxxh ==

2_INDICATORII TENDINTEI CENTRALE_11.doc 12

Page 13: 2 Indicatorii Tendintei Centrale 11

xx

n

ii∑

== 1

2 ∑== 1

2

iii nx

x

Pentru o serie de frecvenţe, dacã frecvenţele sunt absolute, atunci relaţia de calcul a mediei pãtratice va fi:

sau dacã frecvenţele sunt relative

∑=1i

innp

re econom nu au sens decât dacã toate valorile individuale xi sunt pozitive. Indiferent de sem i, media pãtraticã este m edia lor aritmeticã. Media pãtraticã ndatã pentru calculul nivelului seria analizatã predominã valorile ridicate doreşte sã se acorde o im acelor unitãţi pentru care caracteristica prezintã cele m ari valori absolute. Media pãtraticã e asemenea, în cazul calculãrii valorilor individuale de la nivelul lor mediu, mãrimea sa oferind informaţii utile pentru a ogenitãţii seriei analizate.

. Media geometricã M individu

Dacã xi = term g = media geometricã a acestor termeni, atunci potrivit definiţiei:

edia geometricã simplã:

Câteva observaţii utile:

Media pãtraticã se poate calcula pentru orice valori pozitive, nule sau negative, dar din punct de vede100

=px

p

icnul valorilor individuale xeste recomasau când se

ai mse foloseşte, d

ai mare decât mmediu atunci când

portanţã mai mare

mediei abaterilor precierea om

4

edia geometricã reprezintã acea valoare (xg) a caracteristicii cu care, dacã s-ar înlocui toate valorileale, produsul lor nu s-ar modifica.

enii unei serii statistice şi x

deci rezultã relaţia pentru m

gn2

2∑ ii fx

orindexxxfxxxf gg __),...,,(),...,,( 1 ⇒=

orindexxxxxxx __...... ⇒⋅⋅⋅=⋅⋅⋅=∏ gggni 21n

n

xx ∏=

=i

iig

=1 ∑= = ∏k

ii

in n

ng xx 1 i

1

Pentru o serie de frecvenţe relaţia de calcul a mediei geometrice ponderate este:

- calculul nivelului meriei este posibilã. Se foloseşte frecvent în cazul seriilor dinamice

la calculul mediilor (a indicelui mediu), din mãrimi relative de dinamicã între care existã relaţia de produs. - atunci media geometricã calculatã pentru

diu al unei caracteristici ca medie geometricã are sens economic numai atunci când relaţia de multiplicare a termenilor se

dacã cel puţin un termen al seriei este nul sau negativ, seria analizatã nu are sens. Media geometricã are o serie de proprietãţi dintre care am

ã = 1, ..., n. Produsul acestora este egal cu 1.

2) ai multe subansambluri poate fi

intim: ) În cazul mediei geometrice, abaterile termenilor seriei faţã de medie nu se calculeazã sub form1

de diferenţe, ci sub formã de rapoarte (xi/xg) cu i

Media geometricã a unui ansamblu format din douã sau m

2_INDICATORII TENDINTEI CENTRALE_11.doc 13

n x1...)( 121

1

====∏

∏ =

=ng

ng

ng

n

ii

g

n

ggi g

i

xx

x

x

xx

xx

xx

x

Page 14: 2 Indicatorii Tendintei Centrale 11

3) Media geometricã a raportului dintre douã caracteristici independente este egalã cu raportul mediilor geometrice ale celor douã caracteristici.

4) Media geometricã a unui produs de caracteristici independente este egalã cu produsul mediilor geometrice ale caracteristicilor respective.

În concluzie, atunci când folosim mãrimile medii, o problemã deosebitã de care trebuie sã ţinem seama în evalua nifestare a unui fenomen o reprezintã identificarea celei mai potrivite metode de calcu

calculatã în funcţie de media geometricã a subansamblurilor.

rea esenţei formei de mal a nivelului mediu. Relaţia de ordine între mediile prezentate este urmãtoarea:

pgh xxxx ≤≤≤

2_INDICATORII TENDINTEI CENTRALE_11.doc 14

Page 15: 2 Indicatorii Tendintei Centrale 11

Indicatori de poziţie

Analiza tendinţei centrale în seriile de repartiţie sau de distribuţie presupune luarea în considerare nu numai a valorilor individuale ale caracteristicii, ci şi a formei în care se repartizeazã frecvenţele valorilor individuale. Caracterizarea tendinţei centrale presupune un sistem de indicatori care sã cuprindã pe lângã mãrimile medii şi indicatori de poziţie. Aceasta înseamnã cã în analiza unor serii de repartiţie poate fi valoare tipicã nu numai media, ci şi indicatori de poziţie, ca mediana şi modulul (dominanta). Indicatorii de poziţie, prin locul pe care îl ocupã în cadrul variantelor caracteristicii, evidenţiazã tendinţa de aglomerare, de concentrare a frecvenţelor în zona centralã a distribuţiilor statistice.

Mediana – Me

Mediana reprezintã acea valoare a caracteristicii situatã la mijlocul seriei sau repartiţiei statistice cu valorile individuale aranjate în ordine crescãtoare sau descrescãtoare. Mediana împarte numãrul unitãţilor în douã pãrţi egale; numãrul celor cu valori individuale inferioare medianei este egal cu numãrul celor care au valori individuale superioare medianei. Pentru o serie simplã, ordonatã, cu un numãr impar de termeni, mediana este valoarea corespunzãtoare termenului de rang (n+1)/2; ex: avem seria 5, 6, 13, 20, 34, 40, 61. Mediana este (7+1)/2 = 8/2 = 4, valoarea corespunzãtoare termenului al patrulea din serie fiind 20. Pentru o serie: 5, 8, 6, 7, 4, 1, 1, se face întâi ordonarea crescãtoare sau descrescãtoare: 8, 7, 6, 5, 4, 1, 1, deci Me = 5. În cazul seriei ordonate cu un numãr par de termeni, mediana este valoarea situatã între termenii de rang [n/2] şi [(n+2)/2]. În acest caz, mediana se determinã în mod convenţional ca medie aritmeticã a termenilor de rang [n/2] şi [(n+2)/2].

Ex.: 5, 8, 13, 28, 34, 40, 61, 63 x1, x2, x3, x4, x5, x6, x7, x8

[n/2] [(n+2)/2] Me = (x4 + x5)/2 = 31 ((28+34)/2 = 62/2 = 31)

n cazul unei serii de distribuţie de frecvenţe, pentru determinarea medianei se aplicã urmãtorul principiu: valoarea medianã este acea valoare a caracteristicii corespunzãtoare primei frecvenţe cumulate ascendent care depãşeşte

Modulul sau valoarea dominantã – Mo

Reprezintã acea valoare a caracteristicii care are cea mai mare frecvenţã de apariţie. Pe graficul repartiţiei statistice, Mo corespunde punctului de abscisã corespunzãtor maximului curbei de frecvenţe. Pentru o repartiţie discretã, valoarea modalã se identificã prin examinarea şirului de frecvenţe (absolute sau relative). În cazul în care seria este de distribuţie de frecvenţe pe intervale, determinarea cu aproximaţie a valorii modale implicã desfãşurarea urmãtoarelor etape:

- identificarea intervalului modal. Intervalul modal (cel cãrui îi aparţine modului) este intervalul cu frecvenţa (absolutã sau relativã) maximã; - estimarea valorii modale. Dacã în cadrul intervalului modal frecvenţele sunt simetric

distribuite, atunci Mo coincide cu mijlocul intervalului modal; dacã repartiţia în cadrul intervalului modal este de alt tip, atunci valoarea modalã (dominantã) se determinã în raport cu abaterea frecvenţelor în intervalul premodal şi al celui postmodal, de la frecvenţa intervalului modal. Relaţia de aproximare a valorii modale în aces caz se stabileşte prin interpolare.

2

11∆∆

=+

−−

MoxxMo

j

j

2_INDICATORII TENDINTEI CENTRALE_11.doc 15

Page 16: 2 Indicatorii Tendintei Centrale 11

Un alt procedeu de aproximare se bazeazã pe ipoteza cã, dacã distribuţia este moderat asimetricã, atunci între valoarea modalã (Mo), medianã (Me) şi media aritmeticã (x) se poate stabili urmãtoarea relaţie:

)(3 MexxMo −−=

Observaţii: - în orice repartiţie simetricã unimodalã -în orice repartiţie unimodalã uşor asimetricã mediana se plaseazã între medie şi valoarea modalã;

distanţa medianei faţã de modul este aproximativ dublul distanţei sale de la media aritmeticã. xMeMo ==

În contextul analizei şi determinãrii valorii modale, în practica statisticii se întâlnesc repartiţii unimodale (cu o singurã valoare modalã sau interval modal) şi repartiţii plurimodale (multimodale) cu mai multe valori (intervale) modale. Prezenţa mai multor valori modale (una principalã şi altele secundare) evidenţiazã, în general, caracterul eterogen al repartiţiei.

Indicatori statistici ai variaţiei (împrãştierii)

Caracteristicile statistice care definesc o colectivitate prezintã grade şi forme de variaţie diferite, în funcţie de natura, direcţia şi intensitatea acţiunii factorilor esenţiali şi întâmplãtori la nivelul unitãţilor simple sau complexe ale colectivitãţii. Influenţa acestor factori este sintetic reflectatã de indicatorii tendinţei centrale. Astfel, media unei caracteristici ar putea fi semnificativã în cazul în care acţiunea factroilor esenţiali ar putea fi predominantã. Media este o valoare reprezentativã numai în mãsura în care ea este calculatã din date omogene. Aceasta înseamnã cã determinarea nivelului mediu trebuie sã fie însoţitã de verificarea omogenitãţii valorilor individuale prin calculul indicatorilor de variaţie, de concentrare, de asimetrie şi de exces. Determinarea acestor indicatori oferã, deci, posibilitatea rezolvãrii unor probleme de cunoaştere statisticã deosebit de utile, cum ar fi:

- verificarea reprezentativitãţii mediei ca valoare tipicã a unei serii statistice pentru care a fost calculatã;

- analiza gradului de omogenitate a valorilor individuale ale seriei; - compararea în timp şi în spaţiu a mai multor serii de repartiţie dupã caracteristici

independente sau interdependente; - selectarea factorilor semnificativi de influenţã dupã care se structureazã unitãţile unei

colectivitãţi; - separarea modului de acţiune a factorilor esenţiali de acţiunea factorilor întâmplãtori şi,

în mod implicit, identificarea felului în care acţioneazã factorii esenţiali de la o grupã la alta.;

- caracterizarea statisticã a formei de variaţie a unei caracteristici. Aceşti indicatori sunt clasificaţi dupã mai multe criterii, astfel:

1) dupã numãrul variantelor cuprinse în metodologia lor de generalitate, deosebim: - indicatori simpli - indicatori sintetici

2) dupã metodologia de calcul şi forma de exprimare, deosebim: - indicatori ai variaţiei, calculaţi ca mãrimi absolute (exprimaţi în unitatea de mãsurã a

caracteristicii studiate) - indicatori ai variaţiei, calculaţi ca mãrimi relative

3) dupã modul de sistematizare a datelor complexe, deosebim:

- indicatori ai variaţiei, calculaţi pentru serii de distribuţie unidimensionale - indicatori ai variaţiei, calculaţi pentru serii de distribuţie multidimensionale

2_INDICATORII TENDINTEI CENTRALE_11.doc 16

Page 17: 2 Indicatorii Tendintei Centrale 11

Indicatorii variaţiei calculaţi pentru distribuţii multidimensionale Pentru mãsurarea variabilitãţii valorilor individuale dintr-o distribuţie multidimensionalã, se calculeazã indicatori ai variaţiei simpli şi sintetici exprimaţi în mãrimi absolute şi relative. Din categoria indicatorilor simpli ai variaţiei deosebim:

- amplitudinea variaţiei - abaterile individuale

1) Amplitudinea variaţiei, ca expresie cantitativã a domeniului de variaţie a unui fenomen, se

calculeazã ca mãrime absolutã sau relativã şi se noteazã cu A.

Amplitudinea absolutã a variaţiei (A) se determinã pentru o serie de variante, ca diferenţã între varianta maximã şi varianta minimã, ale aceleiaşi caracteristici:

A = xmax - xmin În cazul unei distribuţii de frecvenţe pe intervale, amplitudinea absolutã a variaţiei se aproximeazã

prin diferenţa dintre limita superioarã a ultimului interval şi limita inferioarã a primului interval. Se observã cã amplitudinea variaţiei se exprimã în unitatea de mãsurã a caracteristicii analizate. Amplitudinea poate fi consideratã o mãsurã a variaţiei numai dacã seriile pentru care se calculeazã se referã la aceeaşi caracteristicã înregistratã şi aceeaşi unitate de timp, dar în unitãţi de spaţiu diferite, sau în aceeaşi unitate de spaţiu, dar pentru perioade de timp diferite.

Amplitudinea relativã a variaţiei (A%) se exprimã sub formã de coeficient sau în procente şi se calculeazã ca

raport între amplitudinea absolutã a variaţiei şi nivelul unui indicator al tendinţei centrale. Ca regulã generalã, se ia ca bazã de comparare pentru calculul amplitudinii relative nivelul mediu al caracteristicii.

Amplitudinea variaţiei se utilizeazã în prelucrarea statisticã la alegerea numãrului de grupe şi la stabilirea mãrimii intervalului de grupare.

100% ⋅=xAA

2) Abaterile individuale ca indicatori ai variaţiei exprimã cu câte unitãţi de mãsurã sau de câte ori

(sau cu cât la sutã) valoarea individualã a caracteristicii este mai mare sau mai micã decât mãrimile unui indicator al tendinţei centrale sau decât mãrimea unui indicator de poziţie. Deci abaterile individuale sunt exprimate în mãrimi absolute sau relative şi se calculeazã în funcţie de fiecare valoare individualã şi nivel mediu. Abaterile individuale absolute (di) se calculeazã ca diferenţã între fiecare variantã înregistratã şi nivelul mediu al acestora.

xxd ii −=pentru i = 1, ..., m.

Abaterile individuale relative (di%) se calculeazã ca raport între abaterile individuale absolute şi nivelul mediu al caracteristicii şi se exprimã sub formã de coeficienţi sau în procente.

pentru orice i = 1, ..., m

100100% ⋅−

=⋅=x

xxxd

d iii

În analiza variaţiei într-o distribuţie unidimensionalã, intereseazã în mod deosebit abaterile maxime pozitive şi negative. În acest sens se calculeazã:

- abateri maxime absolute pozitive (dmax+) şi negative (dmax-)

xxd −=+ maxmax

xxd −=− minmax

2_INDICATORII TENDINTEI CENTRALE_11.doc 17

Page 18: 2 Indicatorii Tendintei Centrale 11

- abateri maxime relative pozitive (dmax+%) şi negative (dmax-%)

100x

d%d max

max ⋅= ++

100x

d%d max

max ⋅= −−

În cazul în care distribuţia este simetricã, (dmax+) = (dmax-), iar în inetriorul seriei la abaterile egale luate în modul le corespund frecvenţe egale de apariţie, se asigurã o compensare a abaterilor nu numai pe total, ci şi la nivelul centralizat al unitãţii. Indicatorii simpli ai variaţiei, calculaţi pe baza relaţiilor dintre doi termeni ai seriei sau dintre fiecare termen şi media lor, permit numai o caracterizare aproximativã a variaţiei unitãţilor colectivitãţii. Din aceastã cauzã este necesarã completarea informaţiilor oferite de aceşti indicatori cu indicatorii sintetici ai variaţiei.

Indicatorii sintetici ai variaţiei

Indicatorii sintetici ai variaţiei cuprind într-o singurã expresie numericã întreaga variaţie a unei

caracteristici urmãritã în colectivitatea analizatã. 1) Abaterea medie (d) absolutã se calculeazã ca o medie aritmeticã simplã sau ponderatã a abaterilor

“absolute” ale termenilor seriei de la media lor. Relaţiile de calcul ale abaterii medii absolute sunt:

- pentru o serie simplã de distribuţie

- pentru o serie de distribuţie de frecvenţe n

xxd i

x

−Σ=

i

iix n

nxxd

Σ

−Σ=

- pentru o serie de frecvenţe relative

100ii fxx

d−Σ

=

Din relaţiile de calcul rezultã cã:

- abaterea medie absolutã se exprimã în unitatea de mãsurã a caracteristicii - în cazul seriilor de distribuţie de frecvenţe pe intervale, în locul variantelor (xi) se vor

lua în considerare centrele intervalelor - în calculul abaterii medii se utilizeazã media deoarece în mod curent tendinţa centralã

se exprimã prin media aritmeticã - deoarece într-o serie de distribuţie suma algebricã a abaterilor pozitive este egalã cu

suma abaterilor negative absolute, pentru calcul ne putem mãrgini numai la valorile individuale ale caracteristicii superioare mediei, sumele de la numitor înmulţindu-se cu 2

- pentru aceeaşi serie statisticã abaterea medie calculatã în raport cu media aritmeticã (dx) este mai mare, de regulã, decât abaterea medie calculatã în raport cu mediana (dMe)

- abaterea medie se calculeazã nu numai pentru seriile de distribuţie, ci şi pentru seriile dinamice sau teritoriale

2_INDICATORII TENDINTEI CENTRALE_11.doc 18

Page 19: 2 Indicatorii Tendintei Centrale 11

2) Dispersia este un indicator sintetic al variaţiei şi se calculeazã ca o medie aritmeticã simplã sau ponderatã a pãtratelor abaterilor valorilor individuale de la media lor aritmeticã. pentru o serie simplã, formula de calcul este:

n)xx( 2

i2x

∑ −=σ

pentru o serie cu frecvenţe absolute

∑∑ −

=σi

i2

i2x n

n)xx(100

f)xx( i2

i2x

∑ −=σ

pentru o serie cu frecvenţe relative Relaţiile de calcul permit o serie de constatãri, şi anume:

- ca mãsurã a variaţiei, cu cât mãrimea dispersiei este mai mare, cu atât este mai mare variaţia valorilor individuale (şi deci omogenitatea va fi mai micã), şi invers, valorile dispersiei vor fi cu atât mai mici cu cât omogenitatea colectvitãţii dupã caracteristica urmãritã este mai mare

- dispersia, spre deosebire de ceilalţi indicatori ai variaţiei, nu are unitãţi de mãsurã cu conţinut economic real

- abaterea medie pãtraticã se calculeazã pe baza dispersiei - în cazul folosirii unei serii de distribuţie pe intervale, mãrimea dispersiei este

aproximativã, întrucât s-a luat în considerare centrul de interval, în baza ipotezei cã frecvenţele urmeazã o repartiţie normalã în cadrul fiecãrui interval

Proprietãţile dispersiei: a) Pentru un şir de valori egale între ele, dispersia este nulã (deoarece media lor aritmeticã este

egalã cu fiecare din variantele înregistrate).

0..._ 2021 =⇒==== xxxxxDaca σ

b) Dacã fiecare valoare individualã a caracteristicii se va modifica într-un sens sau altul cu aceeaşi

constantã “a”, dispersia noii serii este egalã cu dispersia iniţialã c) Într-o serie de distribuţie, dacã fiecare valoare individualã se simplificã de “h” ori, atunci

dispersia noii serii se simplificã faţã de dispersia iniţialã de h2 ori. d) Dacã fiecare frecvenţã de apariţie a valorilor individuale se simplificã sau se multiplicã de un

anumit numãr de ori, mãrimea dispersiei calculatã pentru seria transformatã esteegalã cu mãrimea dispersiei iniţiale.

Prin combinarea proprietãţilor (b, c, şi d) se obţine relaţia de calcul simplificat al dispersiei într-o serie de distribuţie.

- pentru o serie cu frecvenţe absolute:

3) Abaterea medie pãtraticã (σx) se calculeazã ca medie pãtraticã a abaterilor individuale de la media lor aritmeticã.

unde: a = se ia de regulã centrul de interval cu frecvenţa cea mai mare

22

2

2 )()(

axhn

nh

ax

i

ii

x −−

=∑

∑σ

h = se ia divizorul comun al şirului. Din punct de vedere practic, aplicarea relaţiei de calcul simplificat se recomandã atunci când seria

prezintã valori individuale mari, când calculul se efectueazã manual, şi când media aritmeticã s-a calculat dupã relaţia de calcul simplificat.

2_INDICATORII TENDINTEI CENTRALE_11.doc 19

Page 20: 2 Indicatorii Tendintei Centrale 11

Relaţia de calcul:

Deci se extrage rãdãcinaAbaterea medie pãtraticã se unitatea de mãsurã concertã a caracteristicii urmãrite.

Valoare tensã variaţia valorilor individuale ale caracteristicii. Pentru

Chiar dacã conţinutul abaterii medii pãtratice nu este la fel de clar în comparaţie cu abaterile individuale şi liniarã, totuşi ea este prefertaã în analizele statistice. Preferinţa se explicã

distribuţiilor implicate. Din aceastã

serii care se referã la aceeaşi

l de variaţie (omogenitate) (V) se calculeazã ca raport între abaterea medie pãtraticã şi media aritmeticã şi se exprimã sub formã de coeficienţi sau în procente. Sunt ne

(σx) ariaţie (V) reprezintã o mãsurã sinteticã a omogenitãţii distribuţilor

lul (0; 100).

Se observã cã valorile mici ale semnificã faptul cã media aritmeticã calculatã are un grad ridicat de reprezentativitate, iar omogenã. Colectivitatea este eterogenã şi media este

pãtratã din dispersie. exprimã în

a sa este cu atât mai mare cu cât este mai inaceeaşi serie statisticã, abaterea medie liniarã calculatã (dx) este mai micã sau cel mult egalã cu

abaterea medie pãtraticã (σx). Se apreciazã cã, pentru o serie statisticã cu tendinţã de normalitate, abaterea medie liniarã reprezintã 4/5 din valoarea abaterii medii pãtratice:

54

⋅= xxd σ

2xx σσ =

concret al abaterea medie

prin faptul cã ea este parametrul legii normale de repartiţie. Majoritatea modelelor utilizate în analiza statisticã (în analiza dispersionalã, în analiza regresiei şi

corelaţiei) se fundamenteazã pe ipoteza de normalitate a repartiţiei caracteristicii cauzã, abaterea medie pãtraticã se utilizeazã pe scarã largã şi în alte domenii cum ar fi în conducerea

unor procese economice, în prognozã, marketing, studiul calitãţii producţiei, etc. Deoarece abaterea medie pãtraticã este exprimatã în aceeaşi unitate de mãsurã ca şi caracteristica

concretã, aceasta se poate utiliza la compararea gradului de variaţie numai pentru caracteristicã. 4) Coeficientu

cesare urmãtoarele observaţii: - coeficientul de variaţie este expresia relativã a abaterii- coeficientul de v

statistice dupã o anumitã caracteristicã şi ia valori în interva

coeficientului de variaţie colectivitatea este

x100⋅=V x

mai puţin reprezentativã atunci când valoarea lui V este apropiatã de limita maximã (100) sau (1) a mulţimii sale de valori.

statistici ai variaţiei oferã informaţii utile referitoare la amploarea variaţiei valorilor individuale în jurul Calculul indicatorilor

unei valori centrale semnificative, atunci când unitãţile colectivitãţii sunt urmãrite dupã o singurã variabilã, indiferent de natura ei.

u altele referitoare la concentrarea (diversificarea) unitãţilor, la asimetria distribuţiei. În cazul în care unitAceste informaţii trebuie completate c

ãţile colectivitãţii sunt însã structurate pe grupe, în funcţie de douã sau mai multe variabile, calculul indicatorilor variaţiei trebuie adaptat în mod corespunzãtor.

2_INDICATORII TENDINTEI CENTRALE_11.doc 20

Page 21: 2 Indicatorii Tendintei Centrale 11

MMeeddiiaa şşii ddiissppeerrssiiaa ccaarraacctteerriissttiicciilloorr aalltteerrnnaattiivvee ((DDaa//NNuu))

Distribuţia frecvenţelor absolute şi relative pe variantele caracteristicii alternative notate cu 1-dacă există sau se manifestă caracteristica la unitatea statistică supusă cercetării statistice, sau 0- dacă nu există caracteristica avută în vedere, se prezintă astfel:

Variantele caracteristicii Frecvevţele absolute Frecvenţele relative

x1=1 M NMp =

x2=0 M=N NM1q −=

Total ∑ = Nni ∑ =+= 1qpni a) Media caracteristicii alternative este:

( ) pNM

N0NM1M

nnx

xi

ii ==⋅−+⋅

==∑

b) Dispersia caracteristicii alternative este:

( ) ( ) ( )qp

qp0pp1n

nxx 22

i

i2

i2p +

−+−=

−=σ

∑∑

Dacă se ştie că p+q=1 deci 1-p=q atunci:

)p1(ppqqp

)qp(pqqp

qppq 222p −==

++

=++

c)Abaterea medie pătratică a caracteristicii alternative este:

)p1(ppq2pp −==σ=σ

În încercările statistice practice realizate în domeniul social-economic, dacă nu se cunosc

valorile lui p şi q se consideră p=q ceea ce înseamnă că dispersia caracteristicii alternative va fi maximă, σ0

2=0,25.

2_INDICATORII TENDINTEI CENTRALE_11.doc 21

Page 22: 2 Indicatorii Tendintei Centrale 11

APLICATII

1. Repartiţia muncitorilor dupã vechime

Grupe de

dupã vechime

Centrul intervalului xi

Nr. muncitori fi xi - x (xi – x)fi (xi – x)2fi [(xi – a)/h]fi

0 – 5 2,5 10 -15,7 -157 2464,9 90 5 – 10 7,5 40 -10,7 -428 4579,6 160

10 – 15 12,5 60 -5,7 -342 1949,4 60 15 – 20 17,5 80 -0,7 -56 39,2 0 20 – 25 22,5 50 4,3 215 924,5 50 25 – 30 27,5 30 9,3 279 2594,7 120 30 – 35 32,5 20 14,3 286 4089,8 180 35 – 40 37,5 10 19,3 193 3724,9 160

Σfi; i = 1, ..., k 300

- Σ(xi – x)fi -10

Σ(xi – x)2fi 20367,0

Σ[(xi – a)/h]2fi 820

muncitori

5h;5,17a;ani_2,18300

5450ffx

xi

ii =====∑

Calculul indicatorilor variaţiei

Amplitudinea: A = xmax – xmin = 40 – 0 = 40 ani

%8,2191002,18

40100% =⋅=⋅=xAA

Abaterea fiecãrei variaţii: - absolutã di = xi – x = 2,5 – 18,2 = -15,7

i/x)100 = (-15,7/18,2)100 - relativã d% = (d

Indicatori sintetici 1) Abaterea medie liniarã

) Dispersia (σx2)

dx

ani_5,6300

1956f

fxxd

i

iix ==

−=

∑∑

2

89,67300fi

ii2x ===σ

∑20367f)xx( 2−∑

84,67)5,172,18(5300820)ax(h

f

f)h

(2222

i

i2x =−−⋅=−−⋅=σ

∑ax 2i −

2_INDICATORII TENDINTEI CENTRALE_11.doc 22

Page 23: 2 Indicatorii Tendintei Centrale 11

3) Abaterea medie pãtraticã

anixx _2,886,672 === σσ4) Coeficientul de variaţie

%451002,182,8100

xV x =⋅=⋅

σ=

%7,351002,185,6100

xd'V x =⋅=⋅=

mai mari decât 35%. seria neomogenã, media nereprezentativã

2_INDICATORII TENDINTEI CENTRALE_11.doc 23

Page 24: 2 Indicatorii Tendintei Centrale 11

IInnddiiccaattoorriiii vvaarriiaaţţiieeii ddiinn ccaaddrruull ccoolleeccttiivviittăăţţiilloorr îîmmppăărrţţiittee îînn ggrruuppee

2. S-a efectuat o analiză statistică pe un număr de 95 studenţi. În urma distribuţiei pe grupe şi subgrupe în funcţie de vârstă şi sex s-a obţinut următoarea situaţie:

Vârstă 18-20 20-22 22-24 24-26 26-28 28-30 Total

Sex

Masculin 1 8 24 10 5 2 50

Feminin 2 9 21 8 4 1 45

Total 3 17 45 18 9 3 95

Pentru a studia mai uşor variaţiile caracteristicilor ce definesc fenomenele supuse studiului statistic s-au realizat grupări prealabile ale unităţilor colectivităţii. Astfel s-au calculat medii pe fiecare grupare a colectivităţii statistice precum şi o medie pentru întreaga colectivitate.

Pentru a se determina separat, atât la nivelul grupei cât şi la nivelul colectivităţii generale influenţa caracteristicii de grupare xi cât şi a variabilelor caracteristicii yi este necesar a se calcula:

1. Dispersia totală generală: σ0

2;

==⋅

=∑

∑95

2229n

nyy

j

ji0 23,46

Interval ijn iy iij yn ⋅ )yy( 0j − ( )20i yy − ij

20i n*)yy( −

18-20 3 19 57 -4,46 19,92 59,76

20-22 17 21 357 -2,46 6,07 103,14 22-24 45 23 1035 -0,46 0,21 9,65

24-26 18 25 450 1,54 2,36 42,51 26-28 9 27 243 3,54 12,51 112,58

28-30 3 29 87 5,54 30,66 91,97

Total 95 144 2229 419,62

( )==

⋅−

=

=

95419

n

nyy

m

1jj

m

1jj

20j

20

4,417

j0= 23,46 Dispersia totală= 4,417 2_INDICATORII TENDINTEI CENTRALE_11.doc 24

Page 25: 2 Indicatorii Tendintei Centrale 11

2. a. Dispersia de grupă: σI2=4,3908

Grupa I masculin

Grupe de studenţi după

vârstă

Nr.de studenţi Nij

Centrul interva-lului

yi

Nij*ji yj-yo (yj-y0)2 (yj-y0)2*nij

18-20 1 19 19 -4,64 21,53 21,53 20-22 8 21 168 -2,64 6,97 55,76 22-24 24 23 552 -0,64 0,41 9,83 24-26 10 25 250 1,36 1,85 18,50 26-28 5 27 135 3,36 11,29 56,45

28-30 2 29 58 5,36 28,73 57,46 Total 50 1182 219,52

yI= 23,64 yi-y0 = 0,18Dispersia totală = 4,3904

2. a. σII2=4,3733

Grupa a II-a feminin Grupe de studenţi

după vârstă

Nr.de studenţi

Nij

Centrul interva-lului

yi

Nij*ji yj-yo (yj-y0)2 (yj-y0)2*nij

18-20 2 19 38 -4,267 18,204 36,409

20-22 9 21 189 -2,267 5,138 46,240

22-24 21 23 483 -0,267 0,071 1,493

24-26 8 25 200 1,733 3,004 24,036

26-28 4 27 108 3,733 13,938 55,751

28-30 1 29 29 5,733 32,871 32,871

Total 45 1047 196,80

y0= 23,26 yi-y0 = -0,193

Dispersia totală = 4,373

3. Media totală:

46,2395

222995

4526,235064,23

n

nyy k

1ii

k

1iii

0 ==⋅+⋅

==

=

=

4. Media dispersiilor de grupă:

38,495

4537,45039,4n

n

i

i2i

i =⋅+⋅

=⋅σ

=σ∑

5. Dispersia dintre grupe: ( ) ( ) ( ) 034,0

9531,3

954546,2326,235046,2364,23

nnyy 22

i

i2

0i2x/y ==

⋅−+⋅−=

⋅=σ

∑∑ −

6. Regula de adunare a dispersiilor: 2_INDICATORII TENDINTEI CENTRALE_11.doc 25

Page 26: 2 Indicatorii Tendintei Centrale 11

415,4034,038,42

x/y2i

20 =+=σ+σ=σ

7. Coeficientul de determinaţie:

%78,0100415,4034,0100R 2

0

2x/y2 ==

σ

σ=

8. Coeficientul de nedeterminaţie:

%22,99100415,438,4100R1 2

0

2i2 ==

σ

σ=− ⇒ 0,78%+99,22%=100%

Se poate concluziona că R2>1-R2 şi, deci, “sexul” nu reprezintă un factor determinant pentru vârstă, aceasta fiind influenţată de alţi factori.

2_INDICATORII TENDINTEI CENTRALE_11.doc 26


Recommended