Home >Documents >Statistica - Capitolul4

Statistica - Capitolul4

Date post:15-Jun-2015
Category:
View:4,880 times
Download:3 times
Share this document with a friend
Transcript:

Capitolul 4 ANALIZA LEGTURILOR DINTRE FENOMENELE I PROCESELE ECONOMICE4.1. INDICATORI: DEFINIRE, FORMULE DE CALCUL

Metoda regresieiRegresia simpl (unifactorial) Modelul liniar Funcia de regresie:

Yxi = a + bxiParametrul a reprezint ordonata la origine i arat la ce nivel ar fi ajuns valoarea caracteristicii Y dac toi factorii - mai puin cel nregistrat - ar fi avut o aciune constant asupra formrii acesteia. Parametrul b se mai numete i coeficient de regresie i reprezint, n sens geometric, panta liniei drepte. Coeficientul de regresie b arat cu ct se schimb n medie variabila Y n cazul n care variabila X se modific cu o unitate. Acest parametru este pozitiv n cazul legturii directe i negativ n cazul legturii inverse. Parametrii a i b se determin din sistemul de ecuaii normale obinut prin metada celor mai mici ptrate (

(y Yi i =1

n

xi

) 2 = minim ).B B B B

n cazul n care dispunem de un numr mic de perechi de valori (xi, yi):n n na + b xi = yi i =1 i =1 n n n a x + b x 2 = xi yi i i i =1 i =1 i =1

Dac se folosete metoda determinanilor se obine:

i =1 n

n

yii i

xi =1 n

n

i

a=

x y xi =1

2 i

nn i

xi =1 n i =1

i =1 n

=

yii =1 i =1 n

n

n

xi2 2 i

i =1

n

xi yi

xi =1 2

n

i

i

n

xi =1

x xi =1

n xi i =1

2 i

134

nn i

yi =1 n i =1 n

n

i

b=

x x yi =1

i i

n =

i =1

n

xi yi 2i

yxii =1

n

n

i

nn i

xi =1 n i =1

i

n

xi =1

n

x xi =1

n xi i =1

i =1 2

2 i

n cazul n care perechile de valori (xi, yi) se repet de ni ori:B B B B B B

k k yi ni na + b xi ni = i =1 i =1 k k k a x n + b x 2 n = xi yi ni i i i i i =1 i =1 i =1

unde

n=

ni =1

k

i

Dac se folosete metoda determinanilor se obine:

a=

i =1

k

yi ni n

i =1 k

k

xi2 ni

i =1

k

xi yi ni

xni =1 2

k

i i

i =1

k xi2 ni xi ni i =1

n b=

i =1

k

xi yi ni k

i =1

k

xi ni

yni =1 2

k

i i

n

i =1

xi2 ni

k xi ni i =1

n cazul sistematizrii datelor ntr-un tabel cu dubl intrare n care perechile de valori (xi, yj) se repet de nij ori:B B B B B B

k m na + b xi ni. = y j n. j i =1 j =1 k k k m a x n + b x 2 n = i i. i i. x i y j nij i =1 i =1 i =1 j =1

unde:

n = ni. = n. j = niji =1 j =1 i =1 j =1

k

k

k

m

135

x y ni =1 j =1 i j

k

m

ij

= xi y j nij = y j xi niji =1 j =1 j =1 i =1

k

m

m

k

Dac se folosete metoda determinanilor se obine:

a=

j =1

m

y j n. j

i =1 k

k

xi2 ni. xi2 ni.

i =1 j =1

k

m

xi y j nij2

x ni i =1

k

i.

n n b=

i =1

k xi ni. i =1

i =1 j =1

k

m

xi y j nij 2 i i.

i =1

k

xi ni.

y nj =1 2

m

j .j

n

x ni =1

k

k xi ni. i =1

Regresia multipl Modelul liniar Yx1 , x 2 ,..., x n = a0 + a1 x1 + a2 x2 + ... + an xn

n care: a0 - reprezint parametrul care exprim factorii nenregistrai, considerai cu aciune constant, n afara celor considerai drept caracteristici factoriale; a1,a2, ... ,an - coeficienii de regresie care arat ct se modific caracteristica rezultativ dac caracteristica factorial respectiv se modific cu o unitate; x1,x2, ... ,xn - caracteristicile factoriale incluse n raportul de interdependen. Parametrii a1,a2, ... ,an se determin din sistemul de ecuaii normale: na0 + a1 x1i + ... + an xni = yi .......................................................... 2 x1i yi a0 x1i + a1 x1i + ... + an x1i xni = ............................................................ 2 a xni yi 0 xni + a1 x1i xni + ... + an xni =B B B B B B B B B B B B B B B B B B B B

B B

Cunoscnd cei n parametri ai funciei de ajustare, se calculeaz pentru fiecare unitate ecuaia de regresie pe baza valorilor x1, x2,,xn.B B B B

136

Metoda corelaieiCorelaia simpl Covariana (cov(x,y))

cov( x, y ) =

(x x )( y y )i i i =1

n

n

Coeficientul de corelaie

Se folosete pentru msurarea intensitatea legturii liniare dintre dou variabile statisice. n cazul n care dispunem de un numr mic de perechi de valori (xi, yi):B B B B

n x y Coeficientul de corelaie liniar simpl poate s ia valori ntre -1 i +1. ntre -1 i 0, legtura dintre cele dou variabile este de sens invers i este cu att mai intens, cu ct se apropie de 1. ntre 0 i +1, legtura dintre cele dou variabile este direct i este cu att mai intens, cu ct se apropie de 1. Formul de calcul simplificat:

ry / x =

(x x )( y y )i i i =1

n

n ry / x =

i =1

n

xi yi 2

yxii =1 i =1

n

n

i

n n n xi2 xi i =1 i =1

2 n n n yi2 yi i =1 i =1

Dac s-a utilizat coeficientul de corelaie liniar simpl, pentru testarea semnificaiei legturii, se aplic cel mai frecvent testul t:

t=

ry / x 1 ry2/ x

n2 ,

unde n reprezint volumul eantionului. Valoarea calculat se compar cu cea tabelar stabilit probabilistic pentru un nivel de semnificaie P = 1 / 2 i cu n-2 grade de libertate. Dac t calculat > t tabelar se verific ipoteza semnificaiei relaiei de corelaie i dac t calculat < t tabelar legtura este nesemnificativ i trebuie cutat un alt factor esenial cu care s se studieze corelaia.B B B B B B B B

137

Raportul de corelaie

n cazul n care dispunem de un numr mic de perechi de valori (xi, yi):B B

Ry / x =

(Yn i =1 n i =1

xi

y

)

2

(y

i

y)

sau

Ry / x = 1

(yn i =1 n i =1

i

Yx ii

)

2

2

(y

y)

2

unde Y x i reprezint valorile ajustate indiferent de modelul de regresie selectat. Raportul de corelaie poate lua valori de la zero la +1. Dac R y / x = ry / x se confirm ipoteza legturii liniare. Pentru corelaia neliniar, msurarea gradului de intensitate a legturii se face numai prin raportul de corelaie.Corelaia multipl Coeficientul de corelaie multiplry / x1 , x 2 = ry2/ x1 + ry2/ x 2 2 ry / x1 ry / x 2 rx1 x2 1 rx21 x2

dac rx1 , x 2 0

iry / x1 , x2 = ry2/ x1 + ry2/ x 2

dac rx1 , x2 = 0

Raportul de corelaie multipl

R y / x1 , x 2 ,L, x n = 1

(y Yn i i =1 n i =1

x1 , x 2 ,L, x n 2

)

2

(y y)i

Corelaie neparametric Coeficientul de asociere

Aceast metod se utilizeaz pentru msurarea intensitii legturii a dou caracteristici alternative prezentate ntr-un tabel de asociere de forma:y x y1B B

y2B B

Total

x1 x2 TotalB B B B

a c a+c 138

b d b+d

a+b c+d a+b+c+d

Produsul ad arat gradul de realizare a legturii directe dintre X i Y, iar produsul bc gradul de legtur invers ntre aceste dou caracteristici cercetate. Pentru stabilirea valorii numerice a coeficientului de asociere, care s indice existena i intensitatea unei legturi, formula cea mai utilizat este cea propus de Yule: ad bc Q= ad + bc Acest indicator poate s ia valori ntre -1 i +1, artnd nu numai gradul de intensitate al asocierii celor dou caracteristici, dar i sensul ei.Coeficienul de corelaie a rangurilor propus de Spearman

6 rs = 1

di =1

n

2 i

n3 n

,

n care: di - reprezint diferena ntre rangurile perechii de valori (xi,yi); n - numrul de perechi de valori.B B B B B B

Coeficientul de corelaie a rangurilor propus de Kendall: 2S rk = , n (n 1)

n care S =

(P Q )i i i =1

n

unde: Pi - numrul rangurilor mai mari care urmeaz rangului curent pentru variabila dependent; Qi - numrul rangurilor mai mici care urmeaz rangului curent pentru variabila dependent.B B B B

139

4.2. PROBLEME REZOLVATE Problema 1. Pentru 10 uniti economice din acelai sector de activitate se cunosc datele urmtoare: Tabelul 4.1. Nr. crt. A 1 2 3 4 5 6 7 8 9 10 Total Capital fix (mii RON) 1 140 90 110 220 80 60 130 100 150 200 1280 Producia (mii RON) 2 80 50 60 120 40 30 70 60 90 110 710

Se cere: 1. s se argumenteze, cu ajutorul metodelor simple, existena, direcia i forma legturii; 2. s se determine parametrii funciei de regresie; 3. s se calculeze valorile funciei de regresie; 4. s se afle valoarea coeficientului de corelaie. Rezolvare 1. Dintre metodele simple de evideniere a legturilor dintre variabile cele mai indicate pentru acest exemplu sunt: metoda seriilor paralele interdependente i metoda grafic. Metoda seriilor paralele interdependente presupune ordonarea valorilor ( xi ) ale caracteristicii factoriale (capitalul fix) i nregistrarea n paralel a valorilor ( yi ) corespunztoare ale caracteristicii dependente (producie), dup cum se poate vedea n tabelul 4.2. Cele dou iruri de date din tabelul 4.2. indic existena unei legturi directe ntre capitalul fix i mrimea produciei.

140

Tabelul 4.2. Nr. crt. A 1 2 3 4 5 6 7 8 9 10

xi (mii RON)1 60 80 90 100 110 130 140 150 200 220

yi (mii RON)2 30 40 50 60 60 70 80 90 110 120

Pentru a putea aprecia i forma legturii este necesar s se traseze graficul de corelaie (figura 4.1.), care sugereaz o legtur de tip liniar.Producie (mii RON) 140 120 100 80 60 40 20 0 0 50 100 150 200 250

Capital fix (mii RON)

Figura 4.1. Legtura dintre capitalul fix i producie 2. Aflarea parametrilor funciei liniare de regresie necesit rezolvarea urmtorului sistem de ecuaii normale:n n n a + b xi = yi i =1 i =1 n n n a x + b x 2 = xi yi i i i =1 i =1 i =1

141

Calculele necesare rezolvrii sistemului au fost sistematizate n tabelul 4.3., coloanele 3 i 4.Tabelul 4.3. Nr. crt. 0 1 2 3 4 5 6 7 8 9 10 Total

xi1 60 80 90 100 110 130 140 150 200 220 1280

yi2 30 40 50 60 60 70 80 90 110 120 710

xi23 3600 6400 8100 10000 12100 16900 19600 22500 40000 48400 187600

xi yi4 1800 3200 4500 6000 6600 9100 11200 13500 22000 26400 104300

yi25 900 1600 2500 3600 3600 4900 6400 8100 2100 4400 58100

Yxi6 32,6 43,9 49,6 55,2 60,9 72,1 77,8 83,5 111,7 123 710,3

Sistemul de ecuaii normale este:10 a + 1280 b = 710 , 1280 a + 187600 b = 104300

cu soluiile:a = 1,32 b = 0,565 Ecuaia medie de estimare a legturii liniare dintre capitalul fix i producie este: Yxi = 1,32 + 0,565 xi La o cretere cu o mie de lei noi (RON) a capitalului fix, producia se mrete, n medie, cu 0,565 mii RON.3. Valorile ajustate ale produciei se calculeaz nlocuind fiecare variant ( xi ) a caracteristicii factoriale n funcia de regresie (vezi tabelul 4.2., coloana 6).

Yx1 = 1,32 + 0,565 60 = 32,6 M Yx10 = 1,32 + 0,565 220 = 123

142

4.

Coeficientul de corelaie liniar simpl este:

n ry / x =

i =1

n

xi yi 2

yxii =1 i =1

n

n

i

n n n xi2 xi i =1 i =1

2 n n 2 n yi yi i =1 i =1

=

=

10 104300 1280 710 = 0,9928 (10 187600 1638400 )(10 58100 504100 )

Acest rezultat arat o legtur direct foarte puternic, aproape funcional, ntre variabilele nregistrate.Problema 2. Numrul mediu de angajai i profitul anual nregistrat de 10 firme dintr-o subramur industrial se prezint astfel: Nr. crt. 0 1 2 3 4 5 6 7 8 9 10 Total Numr mediu de angajai (persoane) 1 13 4 12 5 6 8 3 4 5 7 67 Tabelul 4.4. Profit anual (mii RON) 2 115 45 100 50 55 85 40 50 45 70 655

Se cere: 1. s se analizeze existena, direcia i forma legturii; 2. s se determine parametrii funciei de regresie; 3. s se calculeze valorile funciei de regresie; 4. s se msoare intensitatea corelaiei dintre cele dou variabile folosind coeficientul i raportul de corelaie.

143

Rezolvare 1. n relaia dintre cele dou variabile factorul de influen este numrul mediu de angajai (x ) , iar variabila rezultativ este mrimea profitului ( y ) . Dintre metodele simple de evideniere a corelaiei dintre dou variabile am ales metoda grafic, aceasta oferind cele mai multe informaii. Din figura 4.2. reiese c ntre numrul de angajai i mrimea profitului exist o legtur direct, de tip liniar.Profit anual (mii RON) 140 120 100 80 60 40 20 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Numr mediu angajai (persoane)

Figura 4.2. Legtura dintre numrul mediu de angajai i valoarea profitului 2. Sistemul de ecuaii normale necesar pentru aflarea parametrilor a i b ai funciei liniare este:

n a + b xi = yi 2 a xi + b xi =

x y

i i

Folosind rezultatele calculelor intermediare prezentate n tabelul 4.5 (coloanele 1 - 4), se obine sistemul:

10 a + 67 b = 655 , cu soluiile: 67 a + 553b = 5170

a = 15,2017 b = 7 ,5072

3. Valorile teoretice ale profitului ( Yxi ) se vor calcula nlocuind fiecare

valoare ( xi ) a variabilei factoriale n funcia de regresie: Yxi = 15,2017 + 7 ,5072 xi144

Rezultatele calculelor efectuate sunt prezentate n tabelul nr. 4.5., coloana 6.Tabelul 4.5. Nr. crt. 0

xi1 13 4 12 5 6 8 3 4 5 7 67

yi2 115 45 100 50 55 85 40 50 45 70 655

xi yi3 1.495 180 1.200 250 330 680 120 200 225 490 5.170

xi24 169 16 144 25 36 64 9 16 25 49 553

yi25 13.225 2.025 10.000 2.500 3.025 7.225 1.600 2.500 2.025 4.900 49.025

Yxi6 112,80 45,23 105,29 52,74 60,24 75,26 37,72 45,23 52,74 67,75 655,00

(y Y )i xi

2

1 2 3 4 5 6 7 8 9 10 Total

7 4,86 0,05 27,96 7,50 27,51 94,88 5,18 22,75 59,87 5,05 225,62

4. Calculele efectuate pentru determinarea parametrilor a i b ai funciei liniare de regresie (tabelul 4.5.) pot fi utilizate i pentru aplicarea formulei de calcul simplificat a coeficientului de corelaie:

n ry / x =

i =1

n

xi yi

yxii =1 i =1

n

n

i

=

[

2 2 n n n 2 n 2 n xi xi n yi yi i =1 i =1 i =1 i =1 10 5170 67 655 = 0,9789 10 553 67 2 10 49025 655 2

=

][

]

Aceast valoare apropiat de 1 indic o legtur foarte puternic ntre cele dou variabile. Raportul de corelaie se determin cu formula: = 1

Ry

(y Y )n i i =1 n xi i =1

2

x

( yi y )2i

,

unde

y=

yi =1

n

n

=

655 = 65,5 mii RON/angajat 10145

Utiliznd datele din tabelul 4.5., calculm: 255,62 Ry x = 1 = 0,9789 6122,50 Coeficientul i raportul de corelaie au valori egale, ceea ce confirm liniaritatea legturii.

Problema 3. Se cunosc urmtoarele date pentru zece firme:Producie (mii tone) 10 12 14 16 17 20 20 21 22 23 Numr de salariai (mii pers.) 1,1 1,3 1,4 1,2 1,5 1,7 1,9 1,9 2,0 2,1 Tabelul 4.6 Capital fix (mil. RON) 2,0 2,1 2,2 2,3 2,3 2,1 2,3 2,4 2,4 2,5

Se cere: 1. dac legtura dintre variabile este liniar, s se estimeze parametrii modelului elaborat; 2. s se testeze semnificaia parametrilor modelului i a modelului liniar; 3. s se calculeze valorile ajustate pentru caracteristica rezultativ, pe baza modelului validat. Rezolvare

Se noteaz cu y producia; x1 numrul de salariai; x2 capitalul fix. Modelul de regresie considerat are forma y = a + bx1 + cx2B B B B

Rezolvare folosind EXCEL: Se introduc datele din tabelul 4.6 ntr-o foaie de calcul Excel; Se selecteaz din meniu Tools Data Analysis Regression; n fereastra de dialog se introduce la Input Y Range cmpul A1:A11 reprezentnd valorile variabilei dependente (producia); la Input X Range se selecteaz cmpurile B1:C11, reprezentnd valorile variabilelor independente (salariai i capital fix). Se bifeaz Labels; Calculele sunt realizate pentru un prag de semnificaie de 0,05. Dac se dorete modificarea pragului se bifeaz Confidence Level i se modific valoarea; 146

Dac se dorete i obinerea valorilor reziduale ( yi yi ) , se bifeaz Residuals. Tastai OK.

Se obin rezultatele:SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations ANOVA df Regression Residual Total 2 7 9Coefficients

0.950237502 0.902951309 0.875223112 1.564293263 10

Significance F 159.3709061 79.68545 32.56437 0.00028475 17.12909389 2.447013 176.5Standard Error t Stat P-value Lower 95% Upper 95%

SS

MS

F

Intercept Numar de salariai Capital fix

-12.69677948 9.033681838 -1.40549 0.202671 -34.0580273 8.6644684 9.388646288 2.233077646 4.204353 0.004014 4.108260507 14.669032 6.673034934 5.057545859 1.319422 0.228544 -5.2861521 18.632222

RESIDUAL OUTPUT Observation 1 2 3 4 5 6 7 8 Predicted Productie 10.97680131 13.52183406 15.12800218 13.91757642 16.73417031 17.27729258 20.48962882 21.15693231 Residuals -0.9768013 -1.5218340 -1.1280021 2.08242358 0.26582969 2.72270742 -0.4896288 -0.1569323

9 10

22.09579694 23.70196507

-0.095796 -0.701965

147

Interpretarea rezultatelor: Raportul de corelaie multipl R y / x1 , x2 (Multiple R) este 0,950. Arat o

legtur foarte puternic ntre variabile. Coeficientul de determinaie R2 (R Square) are valoarea 0,903. Cu ct este mai apropiat de 1 cu att partea din variaia lui y explicat de x1 i x2 este mai mare i deci intensitatea legturii dintre variabile este mai puternic. n acest exemplu putem spune c 90,3% din variaia produciei este explicat de variaia numrului de salariai i a capitalului fix, variabilele factoriale incluse n model. Eroarea standard (Standard Error) este 1,564. Dac aceast valoare ar fi nul, toate punctele observate s-ar afla pe dreapta de regresie, aadar e de dorit ca eroarea standard s fie ct mai apropiat de zero. n cazul nostru, condiia este ndeplinit. Analiza dispersional pentru validarea modelului se regsete n tabelul ANOVA: variana explicat prin model (Regression), variana neexplicat (Residual) i variana total (Total), pentru fiecare fiind calculate numrul gradelor de libertate, suma ptratelor i dispersia. Pentru a verifica, din punct de vedere statistic, modalitatea n care modelul specificat reuete s conduc la reconstituirea valorilor empirice prin valorile teoretice, se folosete testul F. n cazul nostru, valoarea calculat de 32,56 este semnificativ, deci modelul este validat ca fiind acceptabil; Ecuaia modelului este: y = 12,697 + 9,389 xi + 6 ,673 x2 : - Intercept reprezint termenul liber (coeficientul a), care este egal cu 12,697. Aceasta reprezint valoarea variabilei dependente y cnd toate variabilele explicative sunt nule. Astfel, producia care s-ar obine dac nu ar fi nici un salariat i capitalul fix ar fi zero, este 12,697 mii tone. Desigur c n acest caz, nu are nici o semnificaie; - Coeficientul b are valoarea 9,389 (pozitiv, deci legtura e direct), ceea ce nseamn c la creterea cu o mie de persoane a numrului de salariai, producia va crete cu 9,389 mii tone; - Coeficientul c are valoarea 6,673, ceea ce nseamn c la creterea cu un milion de lei a capitalului fix, producia va crete cu 6,673 mii tone; n cazul n care a fost selectat Residuals, sunt calculate i valorile previzionate ( yi ) , n cazul nostru Predicted Producie, pe baza modelului de regresie validat.P P B B B B

148

Problema 4. Cele 10 magazine de acelai profil dintr-o localitate se caracterizeaz prin urmtoarele date: Tabelul 4.7 52 60 74 20 25 34 49 38 45 12 Desfaceri (mii RON) 41 38 72 16 21 22 23 21,5 32 15 Suprafa (mp.) Se cere s se msoare legtura dintre cele dou variabile folosind metode neparametrice. Rezolvare n vederea aplicrii metodei corelaiei vom ordona cresctor valorile caracteristicii factoriale X (suprafa), trecnd ntr-o coloan alturat valorile corespunztoare ale caracteristicii dependente Y (desfaceri), dup cum se poate vedea n tabelul urmtor, coloanele 1 i 2. Vom acorda cte un rang fiecruia din cele 10 magazine, n funcie de mrimea suprafeei comerciale (coloana 3) i nivelul desfacerilor (coloana 4) i vom msura diferenele dintre cele dou ranguri. Aceste diferene vor fi ridicate la ptrat (coloana 5), suma lor urmnd a fi folosit pentru calcularea coeficientului Spearman de corelaie a rangurilor:

rS

d = 1 , n(n 1)62 i i =1 2

n

unde: d i - diferena de rang pentru unitatea i ( di = Rxi Ryi );

n - numrul observaiilor.Se obine rS = 0,9636 (legtur puternic).xi1 Tabelul 4.8 Qi 7 0 0 0 1 0 1 0 1 0 0 3

yi2 12 20 25 38 34 49 45 60 52 74 -

Rxi3 1 2 3 4 5 6 7 8 9 10 -

R yi4 1 2 3 5 4 7 6 9 8 10 149

d i25 0 0 0 1 1 1 1 1 1 0 6

Pi6 9 8 7 5 5 3 3 1 1 0 42

15 16 21 21,5 22 23 32 38 41 72 Total

Pentru a calcula coeficientul Kendall de corelaie a rangurilor vom stabili pentru fiecare magazin i n parte numrul total de magazine care au un nivel superior (coloana 6), respectiv inferior (coloana 7) al desfacerilor. Pentru aceasta vom numra rangurile superioare (respectiv inferioare) R y care apar dup rndul corespunztor magazinului i pn la sfritul tabelului. De exemplu, magazinul cu desfaceri de 49 mii RON are rangul 7 dup desfaceri. Dintre cele patru magazine nscrise pe rndurile urmtoare, 3 au ranguri R y superioare i unul are rang R y inferior. Este obligatoriu ca rangurile Rx s fie ordonate cresctor. Folosind totalurile din coloanele 6 i 7 putem calcula coeficientul Kendall:n n 2 Pi Qi i =1 , rk = i =1 n (n 1)

rk = 0,87

Datele din tabelul iniial pot fi folosite pentru a construi un tabel de asociere. Pentru aceasta am calculat valoarea medie a desfacerilor (41 mii RON) i suprafaa medie a unui magazin (30 mp) i am transformat cele dou variabile analizate n caracteristici alternative prin restrngerea celor 10 nregistrri n dou grupe: valori sub medie, respectiv peste medie.Suprafa (mp) A sub 30 peste 30 Tabelul 4.9 Desfaceri (mii RON) sub 41 peste 41 1 2 5 1 0 4

Pentru a aprecia intensitatea legturii se folosete coeficientul de asociere, calculat cu relaia:Q= a d b c 5 4 1 0 = , a d + b c 5 4 + 10 Q=1

150

4.3. PROBLEME PROPUSE Problema 1. Pentru cei 8 muncitori dintr-o secie a unei uniti economice s-au nregistrat urmtoarele date: Vechime (ani) Producie (buc.) Se cere: 1. s se reprezinte grafic datele i s se aleag funcia de regresie potrivit; 2. s se determine parametrii funciei de regresie; 3. s se interpreteze din punct de vedere economic coeficientul de regresie; 4. s se calculeze coeficientul de corelaie. Rezolvare 1. Reprezentare grafic: corelograma (figura 4.3.).35 Producie (buc.) 30 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 Vechime (ani)

3 22

6 30

4 20

5 25

2 18

5 26

Tabelul 4.10 4 1

22

19

Figura 4.3. Legtura dintre vechime i produce2. Aflarea parametrilor funciei liniare de regresie necesit rezolvarea urmtorului sistem de ecuaii normale:151

n n yi n a + b xi = i =1 i =1 n n n a x + b x 2 = xi yi i i i =1 i =1 i =1

Elementele necesare rezolvrii sistemului se nscriu n tabelul 4.11, coloanele 1-4.Tabelul 4.11 Nr. crt. 0 1 2 3 4 5 6 7 8 Total

xi1 3 6 4 5 2 5 4 1

yi2 22 30 20 25 18 26 22 19

xi23

xi yi4

yi25

Yxi6

Sistemul de ecuaii normale devine:8 a + ............. b = ............. , ...... a + .......... b = ............

cu soluia: a = .............. b = ..............3. Interpretarea coeficientului de regresie 4. Coeficientul de corelaie liniar simpl este:

n ry / x =

i =1

n

xi yi 2

yxii =1 i =1

n

n

i

n n n xi2 xi i =1 i =1

2 n n 2 n yi yi i =1 i =1

=

152

R: 1. funcie liniar; 2. Yi = 14,77 + 2,13 xi ; 3. pentru fiecare an suplimentar de vechime, producia unui muncitor crete, n medie, cu 2,13 buc. 4. 0,8821. Problema 2. ntr-o firm s-au nregistrat urmtoarele date: Vechime (ani) Salariu lunar (RON)

12 950

34 2100

3 700

36 2500

14 1400

22

Tabelul 4.12 5 10

1900 800 900

tiind c legtura dintre cele dou variabile este exprimat prin funcia: Yi = 507 ,48 + 47 ,266 xi se cere: 1. calculai raportul de corelaie; 2. determinai n ce msur influeneaz vechimea salariului lunar; 3. estimai salariul lunar al unei persoane cu 20 ani vechime.Rezolvare 1. Valorile teoretice ale salariului ( Yxi ) se vor calcula nlocuind fiecare

valoare a variabilei factoriale xi (vechime) n funcia de regresie: Yi = 507 ,48 + 47 ,266 xi . Rezultatele calculelor se vor nscrie n tabelul 4.13, coloana 3.

Nr. crt. 0 1 2 3 4 5 6 7 8 Total

xi1 12 34 3 36 14 22 5 10

yi2 950 2100 700 2500 1400 1900 800 900

Yxi3

(y Y )i xi

2

Tabelul 4.13 ( yi y )2 5

4

Raportul de corelaie se determin cu formula:

153

Ry

x

= 1

(y Y )n i i =1 n xi

2

(y y)i i =1

,

2

................. = ................ n 8 Utiliznd datele din tabelul 4.13, calculm: .................... Ry x = 1 = ......................... .................... 2. Se calculeaz coeficientul de determinaie: R 2 = ( Ry x ) 2 = ...................... unde y=i =1

y

n

i

=

3. n funcia de regresie se atribuie valoarea 20 variabilei factoriale xi (vechime): Yi = 507 ,48 + 47 ,266 20 = ............. . R: 1. 0,971; 2. 0,9428 (salariul depinde n proporie de 94,28% de vechime); 3. 452,8 RON. Problema 4. Se cunosc urmtoarele date privind comerul exterior al Romniei cu rile Uniunii Europene (UE15) n anul 2004: Tabelul 4.14 Export (mil. euro) Import (mil. euro) ara Austria 590 919 Belgia 374 393 Danemarca 42 93 Frana 1608 1866 Finlanda 15 78 Germania 2832 3918 Grecia 507 355 Irlanda 31 128 Italia 4014 4515 Luxemburg 4 16 Olanda 603 488 Portugalia 37 78 Regatul Unit 1259 860 Spania 375 578 Suedia 107 280Sursa: Anuarul statistic al Romniei, 2005,INS.

154

Se cere s se calculeze coeficienii de corelaie a rangurilor Spearman i Kendall. Rezolvare

Coeficientul de corelaie a rangurilor Spearman se calculeaz cu formula:

rSB B

d = 1 , n (n 1)62 i i =1 2

n

ar i.

unde di reprezint diferena de rang dintre export i import pentru aceeai

Pentru calcularea coeficientului Kendall se ordoneaz cresctor rile Uniunii Europene dup variabila x (export) nscriind n coloana alturat rangurile corespunztoare dup variabila y (import). Se determin apoi pentru fiecare ar, pe baza rangurilor la import: Pi - numrul de ri (de la rndul i pn la sfritul seriei) avnd la import ranguri superioare rangului rii i; Qi - numrul de ri (de la rndul i pn la sfritul seriei) avnd la import ranguri inferioare rangului rii i.B B B B

ara

xi

yi

Luxemburg Finlanda Irlanda Portugalia Danemarca Suedia Belgia Spania Grecia Austria Olanda Regatul Unit Frana Germania Italia Total

Rang dup: xi yi 1 2 3 4 5 6 7 8 9 10 11 12

Diferena de rang (di)B B

d i2

Tabelul 4.15 Qi PiB B B B

13 14 15 -

155

Se determin apoi diferena:S=

i =1

n

Pi

Qi =1

n

i

= ........... .

Coeficientul Kendall este:

rK =

2S 2 ........ = ............. = n (n 1) 15 (15 1)

4.4. TEMProblema 1. Opt ageni economici din acelai domeniu de activitate au nregistrat urmtoarele realizri: Tabelul 4.16 Cifra de afaceri (mii RON) Profit (mii RON)

540 47

580 59

600 52

640 56

700 64

620 58

610 50

470 40

tiind c legtura dintre cele dou variabile are caracter liniar, msurai intensitatea acesteia prin intermediul: 1. raportului de corelaie; 2. coeficientului de corelaie; 3. coeficientului de corelaie a rangurilor Spearman; 4. coeficientului de corelaie a rangurilor Kendall.R: 1. 0,8857;2. 0,8857; 3. 0,714; 4. 0,571. Problema 2. La o firm s-au nregistrat urmtoarele date privind costurile de producie i profitul obinut: Tabelul 4.17 Costuri 90 30 100 50 45 110 70 55 20 15 (mii RON) 10 15 8 12 14 9 11 13 16 17 Profit (mii RON) Msurai intensitatea legturii dintre cele dou variabile cu ajutorul: 1. coeficientului i raportului de corelaie, dac funcia de regresie este Y i = 17 , 687 0 , 089 x i ; 2. coeficientului de corelaie a rangurilor Spearman; 3. coeficientului de corelaie a rangurilor Kendall. R: 1. 0,9739 i 0,9739; 2. 0,9758; 3. 0,9111.

156

Problema 3. Pentru cincisprezece firme din aceeai ramur s-au

nregistrat urmtoarele informaii referitoare la o lun de activitate:Nr. crt. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Profit (mii RON) 1 15 17 13 23 16 21 14 20 24 17 16 18 23 15 16 Nr. salariai (pers.) 2 10 12 8 17 10 15 10 14 19 10 11 13 16 10 12 Tabelul 4.18 Capital fix (mil. RON) 3 2,40 2,72 2,08 3,68 2,56 3,36 2,24 3,20 3,84 2,72 2,07 2,33 2,98 1,94 2,17

Considernd c variabila dependent y este profitul,iar factorii de influen sunt numrul de salariai ( x1 ) i capitalul fix ( x2 ) s se determine folosind Excel: 1. funcia de regresie multipl care exprim legtura dintre variabile; 2. intensitatea legturilor simple ntre x1 i y , x2 i y , x1 i x2 ; 3. valoarea raportului de corelaie multipl.R: 1. Yx 1 x 2 = 3,53 + 0,84 x1 + 1,44 x2 ; 2. ry / x1 = 0,9684;

ry / x 2 =0,9027;

rx1 / x 2 =0,8697; 3. R y/x1,x2=0,976B B

157

4.5. INTREBRI RECAPITULATIVE 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30.

Prin ce se caracterizeaz legturile statistice? Prin ce se deosebesc legturile statistice de alte tipuri de legturi? Ce nelegei prin legtur simpl? Exemplificai. Ce nelegei prin legtur multipl? Exemplificai. Ce nelegei prin legtur direct? Exemplificai. Ce nelegei prin legtur invers? Exemplificai. Ce nelegei prin asociere statistic? Exemplificai. Ce nelegei prin corelaie statistic? Exemplificai. Ce metode simple se pot utiliza pentru verificarea existenei legturii? Prin ce se reprezint grafic legtura dintre dou variabile statistice? Ce se poate evidenia cu ajutorul metodei grafice cu privire la legturile statistice? Ce este un tabel de corelaie? Ce condiii trebuie s ndeplineasc un tabel de corelaie pentru a permite analiza legturii ntre dou variabile statistice? Ce este un tabel de asociere? Pentru ce se poate utiliza un tabel de asociere? Pentru ce se utilizeaz metoda regresiei? Care este semnificaia statistic a parametrilor modelului liniar de regresie? Care este semnificaia geometric a parametrilor modelului liniar de regresie? Ce arat semnul coeficientului de regresie? Prin ce se msoar intensitatea legturii liniare? Ce semnificaie are valoarea coeficientului de corelaie? ntre ce limite ia valori coeficientul de corelaie? Ce semnificaie are valoarea raportului de corelaie? ntre ce limite ia valori raportul de corelaie? Ce indicator se poate calcula pe baza raportului de corelaie? Cnd se utilizeaz metodele neparametrice pentru analiza legturilor dintre variabilele statistice? Care sunt cele mai utilizate metode neparametrice pentru analiza legturilor dintre variabilele statistice? Cnd se utilizeaz coeficientul de asociere propus de Yule? Ce nelegei prin ranguri i care sunt cei mai utilizai indicatori calculai pe baza acestora? Ce relaie este ntre coeficienii de asociere a rangurilor propui de Spearman i Kendall?

158