Post on 13-Oct-2015
transcript
1
ACADEMIA DE STUDII ECONOMICE
BUCURETI
PROIECT ECONOMETRIE
2014
Profesor coordonator: oan Lavinia-tefania Student: Petru Robert Alin MANAGEMENT, ASE
Grupa: 144
2
CUPRINS
I. PROBLEMA A ...................................................................................................................... 4
1. PREZENTAREA PROBLEMEI A.1. ............................................................................................ 5
2. DEFINIREA MODELULUI DE REGRESIE SIMPL LINIAR ............................................................. 6
2.1. Forma, variabilele i parametrii modelului de regresie .................................................. 6
2.2. Reprezentarea grafic a modelului legturii dintre variabile .......................................... 7
3. ESTIMAREA PARAMETRILOR MODELULUI I INTERPRETAREA ACESTORA .................................. 7
3.1. Estimarea punctual a parametrilor ................................................................................ 7
3.2. Estimarea parametrilor prin interval de ncredere ........................................................ 11
4. TESTAREA SEMNIFICAIEI CORELAIEI I A PARAMETRILOR MODELULUI DE REGRESIE ......... 12
4.1. Testarea seminificaiei corelaiei ................................................................................... 12
4.2. Testarea parametrilor unui model de regresie simplu ................................................... 13
5. APLICAREA ANALIZEI TIP ANOVA PENTRU VALIDITATEA MODELULUI DE REGRESIE SIMPLU I
INTERPRETAREA REZULTATELOR ................................................................................................ 14
6. TESTAREA IPOTEZELOR CLASICE ASUPRA MODELULUI DE REGRESIE SIMPL .......................... 15
6.1. Ipoteze statistice clasice asupra modelului de regresie simpl ...................................... 15
6.2. Testarea liniaritii modelului propus ............................................................................ 15
6.3. Testarea normalitii erorilor ........................................................................................ 17
6.4. Testarea ipotezei de homoscedasticitate ........................................................................ 18
6.5. Testarea ipotezei de autocorelare a erorilor .................................................................. 20
7. PREVIZIUNEA VALORII VARIABILEI Y DAC VARIABILA X CRETE CU 10% FA DE ULTIMA
VALOARE NREGISTRAT (INCLUSIV INTERVAL DE NCREDERE) PENTRU TOATE VARIANTELE
CUNOSCUTE. ............................................................................................................................... 22
1. PREZENTAREA PROBLEMEI A.2. .......................................................................................... 24
2. DEFINIREA MODELULUI DE REGRESIE SIMPL LINIAR ........................................................... 25
2.1. Forma, variabilele i parametrii modelului de regresie ................................................ 25
2.2. Reprezentarea grafic a modelului legturii dintre variabile ........................................ 26
3. ESTIMAREA PARAMETRILOR MODELULUI I INTERPRETAREA ACESTORA ................................ 26
3.1. Estimarea punctual a parametrilor .............................................................................. 26
3.2. Estimarea parametrilor prin interval de ncredere ........................................................ 30
4. TESTAREA SEMNIFICAIEI CORELAIEI I A PARAMETRILOR MODELULUI DE REGRESIE .......... 30
4.1. Testarea seminificaiei corelaiei ................................................................................... 30
4.2. Testarea parametrilor unui model de regresie simplu ................................................... 32
5. APLICAREA ANALIZEI TIP ANOVA PENTRU VALIDITATEA MODELULUI DE REGRESIE SIMPLU I
INTERPRETAREA REZULTATELOR ................................................................................................ 33
6. TESTAREA IPOTEZELOR CLASICE ASUPRA MODELULUI DE REGRESIE SIMPL .......................... 34
6.1. Ipoteze statistice clasice asupra modelului de regresie simpl ...................................... 34
6.2. Testarea liniaritii modelului propus ............................................................................ 34
6.3. Testarea normalitii erorilor ........................................................................................ 35
6.4. Testarea ipotezei de homoscedasticitate ........................................................................ 36
6.5. Testarea ipotezei de autocorelare a erorilor .................................................................. 36
3
7. PREVIZIUNEA VALORII VARIABILEI Y DAC VARIABILA X CRETE CU 10% FA DE ULTIMA
VALOARE NREGISTRAT (INCLUSIV INTERVAL DE NCREDERE) PENTRU TOATE VARIANTELE
CUNOSCUTE. ............................................................................................................................... 38
II. PROBLEMA B .................................................................................................................... 41
1. DEFINIREA MODELULUI DE REGRESIE MULTIPL LINIAR ....................................................... 41
1.1.Forma, variabilele, parametrii modelului de regresie multipl ...................................... 41
1.2. REPREZENTAREA GRAFIC A MODELULUI LEGTURII DINTRE VARIABILE ....................... 42
2. ESTIMAREA PARAMETRILOR MODELULUI I INTERPRETAREA ACESTORA ................................ 42
2.1. Estimare punctual a parametrilor ................................................................................ 42
2.2. Estimarea parametrilor prin interval de ncredere ....................................................... 43
3. TESTAREA SEMNIFICAIEI CORELAIEI I A PARAMETRILOR REGRESIEI MODELULUI DE
REGRESIE MULTIPL ................................................................................................................... 44
3.1. Testarea semnificaiei corelaiei multipl ...................................................................... 44
3.2. Testarea parametrilor modelului de regresie multipl .................................................. 45
4. APLICAREA ANALIZEI DE TIP ANOVA PENTRU VALIDITATEA MODELULUI DE REGRESIE
MULTIPL I INTERPRETAREA REZULTATELOR ........................................................................... 46
6. TESTAREA IPOTEZELOR CLASICE ASUPRA MODELULUI DE REGRESIE MULTIPL ...................... 47
6.1 Ipoteze statistice clasice asupra modelului de regresie multipl .................................... 47
6.2 Testarea liniaritii modelului propus ............................................................................. 47
6.3 Testarea normalitii erorilor ......................................................................................... 48
6.4 Testarea ipotezei de homoscedasticitate ......................................................................... 49
6.5 Testarea ipotezei de autocorelare a erorilor ................................................................... 49
7. PREVIZIUNEA VALORII VARIABILEI Y DAC VARIABILA X CRETE CU 10% FA DE ULTIMA
VALOARE NREGISTRAT (INCLUSIV INTERVAL DE NCREDERE) PENTRU TOATE VARIANTELE
CUNOSCUTE. ............................................................................................................................... 49
III. PROBLEMA C .................................................................................................................... 51
1. TESTAREA IPOTEZEI PRIVIND DIFERENA DINTRE 2 MEDII PENTRU EANTIOANE DE VOLUM
MARE .......................................................................................................................................... 51
1.1 TESTAREA IPOTEZEI PRIVIND RAPORTUL DINTRE 2 DISPERSII ................................................ 52
2. TESTAREA IPOTEZEI PRIVIND DIFERENA DINTRE 2 MEDII PENTRU EANTIOANE DE VOLUM
MARE .......................................................................................................................................... 53
2.1 TESTAREA IPOTEZEI PRIVIND RAPORTUL DINTRE 2 DISPERSII ................................................ 53
4
I. PROBLEMA A
Tabel 1. Date statistice pentru anul 2010
( Statistica Teritorial 2013 Institutul Naional de Statistic)
Jude Salariul mediu nominal net
lunar din agricultur (RON)
Var. dependent (yi)
Numrul mediu al salariailor
Var. independent (xi1)
Numrul omerilor
Var. independent (xi2)
Bihor 1042 2000 16666
Bistria Nsud 1068 1089 8605
Cluj 986 1462 16858
Maramure 1048 1339 12490
Satu Mare 976 2064 9370
Slaj 866 844 8929
Alba 1082 2644 17506
Braov 1159 2555 17742
Covasna 878 1230 8959
Harghita 889 1116 12777
Mure 1031 1838 19740
Sibiu 1261 1229 10780
Bacu 1114 2712 17619
Botoani 916 1340 9837
Iai 1019 3404 21469
Neam 1099 2770 15928
Suceava 1136 2559 18856
Vaslui 999 2344 18563
Brila 953 3042 11738
Buzu 926 2852 18631
Constana 844 4013 17910
Galai 1028 1540 21292
Tulcea 1161 2425 7038
Vrancea 912 1836 11438
Arge 1015 2179 19721
Clrai 1040 3379 9630
Dmbovia 1102 1305 17927
Giurgiu 1001 1847 7861
Ialomia 811 4470 10480
Prahova 985 3157 26873
Teleorman 962 3587 18624
Ilfov 1140 1929 4409
Municipiul
Bucureti 1269 2564 24922
5
Dolj 1055 2893 29167
Gorj 1035 916 14821
Mehedini 942 1058 12219
Olt 921 1753 14467
Vlcea 1107 1527 13921
Arad 961 3295 11068
Cara-Severin 1138 1911 11280
Hunedoara 806 2275 16462
Timi 1266 4893 12367
1. Prezentarea problemei A.1.
Modelul matematic ce explic variaia salariului mediu nominal din agricultur n funcie de
numrul mediu al salariailor din agriculur:
A.1. yi = f(x1i)
Dorim s studiem legtura dintre salariul nominal net lunar din agricultur i numrul salariailor
din agricultur n anul 2010. Pentru acest scop am cules date statistice privind salariul mediu
nominal net lunar din agricultur i numrul mediu al salariailor din agricultur din cele 42 de
judee din Romnia:
Tabel 1.1
Date statistice anul 2010 Salariul mediu nominal net
lunar din agricultur (RON) Numrul mediu al salariailor
din
agricultur
Jude Var. dependent (yi) Var. independent (x1i)
Bihor 1042 2000
Bistria Nsud 1068 1089
Cluj 986 1462
Maramure 1048 1339
Satu Mare 976 2064
Slaj 866 844
Alba 1082 2644
Braov 1159 2555
Covasna 878 1230
Harghita 889 1116
Mure 1031 1838
Sibiu 1261 1229
Bacu 1114 2712
Botoani 916 1340
Iai 1019 3404
6
Neam 1099 2770
Suceava 1136 2559
Vaslui 999 2344
Brila 953 3042
Buzu 926 2852
Constana 844 4013
Galai 1028 1540
Tulcea 1161 2425
Vrancea 912 1836
Arge 1015 2179
Clrai 1040 3379
Dmbovia 1102 1305
Giurgiu 1001 1847
Ialomia 811 4470
Prahova 985 3157
Teleorman 962 3587
Ilfov 1140 1929
Municipiul Bucureti 1269 2564
Dolj 1055 2893
Gorj 1035 916
Mehedini 942 1058
Olt 921 1753
Vlcea 1107 1527
Arad 961 3295
Cara-Severin 1138 1911
Hunedoara 806 2275
Timi 1266 4893
2. Definirea modelului de regresie simpl liniar
2.1. Forma, variabilele i parametrii modelului de regresie
Modelul econometric se prezint sub urmtoarea form:
= + 1 +
Variabile i parametrii:
= salariul mediu nominal net lunar din agricultur (variabila dependent sau rezultativ) 1 = numrul mediu al salariailor din agricultur (variabila independent sau factorial)
i = parametrii modelului. Sunt cei care fac obiectul procesului de estimare i testare statistic. Numii i coeficieni de regresie, sunt mrimi reale, fixe dar necunoscute care apar n
model n diferite expresii alturi de variabile.
7
= variabila rezidual sau eroare. Apar n model ca suma a tuturor influenelor necunoscute sau care nu apar explicit n model. Respect anumite proprieti numite i ipoteze clasice.
2.2. Reprezentarea grafic a modelului legturii dintre variabile
CORELOGRAMA
Din corelogram se observ c legatura dintre salariul mediu nominal net lunar i numrul mediu
al salariailor din agricultur este una liniar i direct.
3. Estimarea parametrilor modelului i interpretarea acestora
3.1. Estimarea punctual a parametrilor
y = 0.0044x + 1012.5R = 0.0014
700
800
900
1000
1100
1200
1300
500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Salariul mediu nominal net
lunar din agricultur
(RON)
Numrul mediu al salariailor din agricultur (persoane)
Legtura dintre salariul mediu nominal net lunar din agricultur i numrul mediu al salariailor din
agricultur
Coefficients Standard Error t Stat P-value
Intercept 1012.52243 46.08401215 21.97123006 6.16877E-24
Numrul mediu al
salariailor din
agricultur 0.00444458 0.018718477 0.237443729 0.813524563
8
- Intercept reprezint coeficientul termenului liber care nu are semnificaie din punct de vedere
economic, semnificnd valoarea lui y dac toi x sunt 0.
reprezint panta de regresie ( coeficientul de regresie pentru numrul mediu al salariailor din
agricultur)
Estimarea parametrului :
=|
1 1
|
| 1
1 12 |
= 0,0044
La creterea numrului mediu de salariai din agricultur cu 1 persoan salariul mediu nominal
net lunar din agricultur va crete cu 0,0044 RON.
Estimarea parametrului :
+ 1 = |1
+
1
=
= 1
1 = 1
=
95185
42= 2266,3095
=
=
42949
42= 1022,5952
} => = 1022,5952 0,0044 2266,3095 = 1012,5
= 0,0044 => > 0 => o legtur direct (foarte slab)
= 1012,5
Dispunnd de estimaiile parametrilor se pot calcula valorile estimate (Predicted) ale variabilei
dependente , cu ajutorul relaiei:
= + 1 = 1012,5 + 0,00441
Valorile reziduale (Residuals) vor rezulta din urmtoarea relaie:
=
9
Pe baza acestor valori se pot calcula abaterea medie ptratic a variabilei reziduale i abaterile medii ptratice ale celor doi estimatori, i .
2 =
()2
1= 13613,1333
(ANOVA MS:Residual)
Observation
Predicted
Salariul
mediu
nominal net
lunar din
agricultur
Residuals
1 1021.4116 20.5883972
2 1017.36259 50.63741405
3 1019.02042 -33.02041612
4 1018.47373 29.52626782
5 1021.69606 -45.69605624
6 1016.27366 -150.2736626
7 1024.27392 57.72608451
8 1023.87835 135.1216526
9 1017.98927 -139.9892724
10 1017.48259 -128.4825897
11 1020.69158 10.30841995
12 1017.98483 243.0151722
13 1024.57615 89.42385274
14 1018.47818 -102.4781768
15 1027.6518 -8.651800023
16 1024.83393 74.16606681
17 1023.89613 112.1038742
18 1022.94054 -23.94054001
19 1026.04286 -73.04286028
20 1025.19839 -99.19838915
21 1030.35855 -186.3585522
22 1019.36709 8.632906257
23 1023.30055 137.6994486
24 1020.68269 -108.6826909
25 1022.20718 -7.207183503
26 1027.54069 12.4593146
27 1018.32262 83.67738371
28 1020.73158 -19.73158131
29 1032.38973 -221.3897275
30 1026.55399 -41.55398755
31 1028.46516 -66.46515906
32 1021.09604 118.9039627
33 1023.91835 245.0816513
34 1025.38062 29.61938287
35 1016.59367 18.40632724
36 1017.2248 -75.22480381
37 1020.31379 -99.31379033
38 1019.30931 87.69068586
39 1027.16734 -66.16734027
40 1021.01603 116.9839653
41 1022.63386 -216.6338637
42 1034.26979 231.730213
10
Unde: k = numrul estimatorilor
= 13613,1333 = 116,6753
(SUMMARY OUTPUT Regression Statistics:Standard Error)
=
2
(1)2
= 46,0840
(Intercept:Standard Error)
= 1
(1)2
= 0,0187
(Numrul mediu al salariailor din agricultur:Standard Error)
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.03751672
R Square 0.0014075
Adjusted R Square -0.02355731
Standard Error 116.675256
Observations 42
ANOVA
df SS MS
Regression 1 767.5009762 767.5009762
Residual 40 544524.6181 13613.11545
Total 41 545292.119
Coefficients Standard Error t Stat
Intercept 1012.52243 46.08401215 21.97123006
Numrul mediu al
salariailor din
agricultur 0.00444458 0.018718477 0.237443729
11
3.2. Estimarea parametrilor prin interval de ncredere
= 0,0044
= 1012,5
( )
(919,3831; 1105,6616)
Parametrul nu este seminificativ statistic deoarece intervalul de ncredere include valoarea nul.
( )
(0,0833; 0,0422)
Parametrul este seminificativ statistic deoarece intervalul de ncredere nu include valoarea nul.
Parametrii n EVIEWS:
Estimation Command: ========================= LS Y C X Estimation Equation: ========================= Y = C(1) + C(2)*X Substituted Coefficients: ========================= Y = 1012.52243298 + 0.00444458491409*X
Lower 95% Upper 95% Lower 95.0% Upper 95.0%
919.3831701 1105.661696 919.3831701 1105.661696
-0.033386868 0.042276038 -0.033386868 0.042276038
12
4. Testarea semnificaiei corelaiei i a parametrilor modelului de regresie
4.1. Testarea seminificaiei corelaiei
Coeficientul de corelaie liniar ( Multiple R):
/ =(; )
= 0,0375
Valoarea coeficientului este > 0 , ceea ce nseamn c ntre cele dou variabile considerate: salariul mediu nominal net din agricultur i numrul mediu de salariai din agricultur exist o legatur direct de intensitate.
Se stabilete ipoteza nul: 0: / = 0
Se stabilete ipoteza alternativ: 1: / 0 Se calculeaz testul z:
/ =/ 1
1 /2=
0,037540
1 0,03752=
0,2371
0,9992= 0,2372
/ = 0,2372 < = 1,96 => se accepta ipoteza nula i se respinge ipoteza alternative,
deci coeficientul de corelatie nu este semnificativ diferit de 0 (nu este semnificativ statistic)
Raportul de corelaie:
/ = ( )2
( )2= 0,0375
Deoarece coeficientul de corelaie = raportul de corelaie, apreciem c exist o legtur liniar de intensitate i direct ntre cele dou variabile.
Testarea seminificaiei raportului de corelaie:
Se stabilete ipoteza nul: 0: / = 0
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.03751672
R Square 0.001407504
Adjusted R Square -0.023557308
Standard Error 116.6752564
Observations 42
13
Se stabilete ipoteza alternativ: 1: / 0 Se calculeaz testul F:
/ =2
1 2
1
=
0,0014
1 0,0014 40 = 0,056
/ = 0,056 < = 4 => se accepta ipoteza nul i se respinge ipoteza alternative,
raportul de corelaie nu este semnificativ diferit de 0 (nu este seminificativ statistic)
Coeficientul de determinaie:
2 =( )2
( )2= 0,0014
2 (0; 1) 0,14% din variaia salariului mediu nominal net lunar din agricultur este explicat prin variaia numrului mediu de salariai din agricultur, restul de 99,86% reprezint influena altor factori.
Testarea semnificaiei coeficientului de determinaie:
Se stabilete ipoteza nul: 0: 2 = 0
Se stabilete ipoteza alternativ: 1: 2 0
Se calculeaz testul F:
2 =2
1 2
1
=
0,0014
1 0,0014 40 = 0,056
4.2. Testarea parametrilor unui model de regresie simplu
= 0,0044
= 1012,5
Testarea semnificaiei lui :
Se stabilete ipoteza nul: 0: = 0 Se stabilete ipoteza alternativ: 1: 0 Se calculeaz testul z:
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 1012.52243 46.08401215 21.97123 6.1688E-24 919.3831701 1105.661696
Numrul mediu al
salariailor din
agricultur 0.00444458 0.018718477 0.237444 0.81352456 -0.033386868 0.042276038
14
= 0
= 21,9712
= 21,9712 > = 1,96 =: se respinge ipoteza nul i se accept ipoteza alternativ, parametrul este semnificativ statistic, este semnificativ diferit de 0.
Testarea semnificaiei lui :
Se stabilete ipoteza nul: 0: = 0 Se stabilete ipoteza alternativ: 1: 0 Se calculeaz testul z:
= 0
= 0,2374
= 0,2374 < = 1,96 =: se accept ipoteza nul i se respinge ipoteza alternativ, parametrul nu este semnificativ statistic, nu este semnificativ diferit de 0.
5. Aplicarea analizei tip ANOVA pentru validitatea modelului de
regresie simplu i interpretarea rezultatelor
Dependent Variable: Y
Method: Least Squares
Date: 05/05/14 Time: 08:45
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.03751672
R Square 0.0014075
Adjusted R Square -0.02355731
Standard Error 116.675256
Observations 42
ANOVA
df SS MS F Significance F
Regression 1 767.5009762 767.501 0.05637952 0.813524563
Residual 40 544524.6181 13613.12
Total 41 545292.119
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0%
Intercept 1012.52243 46.08401215 21.97123 6.1688E-24 919.3831701 1105.661696 919.3831701
Numrul mediu al
salariailor din
agricultur 0.00444458 0.018718477 0.237444 0.81352456 -0.033386868 0.042276038 -0.033386868
15
Sample: 1 42
Included observations: 42 Variable Coefficient Std. Error t-Statistic Prob. C 1012.522 46.08401 21.97123 0.0000
X 0.004445 0.018718 0.237444 0.8135 R-squared 0.001408 Mean dependent var 1022.595
Adjusted R-squared -0.023557 S.D. dependent var 115.3248
S.E. of regression 116.6753 Akaike info criterion 12.40311
Sum squared resid 544524.6 Schwarz criterion 12.48586
Log likelihood -258.4654 Hannan-Quinn criter. 12.43344
F-statistic 0.056380 Durbin-Watson stat 1.946236
Prob(F-statistic) 0.813525
Verificarea verosimilitii modelului:
Pentru a accepta ipoteza de liniaritate se calculeaz coeficientul de corelaie liniar:
/ =(; )
= 0,0375
Se poate observa ca n cazul unei legturi liniare, raportul de corelaie este egal cu coeficientul de corelaie liniar. Raportul de corelaie multipl (Multiple R) este 0,0375 i arat o legtur direct de funcionalitate ntre variabile.
Testarea validitii modelului:
Se stabilete ipoteza nul: 0: modelul nu este valid Se stabilete ipoteza alternativ: 1: modelul este valid Se calculeaz testul F:
= 0,0563 < = 4 => modelul nu este valid (se accept ipoteza nul i se respinge ipoteza alternativ)
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1. Ipoteze statistice clasice asupra modelului de regresie simpl
6.2. Testarea liniaritii modelului propus
Pentru a verifica ipoteza de liniaritate se calculeaz coeficientul de corelaie liniar: ry/ Coeficientul de corelaie liniar ( Multiple R):
16
/ =(; )
= 0,0375
Valoarea coeficientului este > 0 , ceea ce nseamn c ntre cele dou variabile considerate: salariul mediu nominal net din agricultur i numrul mediu de salariai din agricultur exist o legatur direct de intensitate.
Se stabilete ipoteza nul: 0: / = 0
Se stabilete ipoteza alternativ: 1: / 0 Se calculeaz testul z:
/ =/ 1
1 /2=
0,037540
1 0,03752=
0,2371
0,9992= 0,2372
/ = 0,2372 < = 1,96 => se accepta ipoteza nula i se respinge ipoteza alternative,
deci coeficientul de corelatie nu este semnificativ diferit de 0 (nu este semnificativ statistic)
Raportul de corelaie:
/ = ( )2
( )2= 0,0375
Deoarece coeficientul de corelaie = raportul de corelaie, apreciem c exist o legtur liniar de intensitate i direct ntre cele dou variabile.
Testarea seminificaiei raportului de corelaie:
Se stabilete ipoteza nul: 0: / = 0
Se stabilete ipoteza alternativ: 1: / 0 Se calculeaz testul F:
/ =2
1 2
1
=
0,0014
1 0,0014 40 = 0,056
/ = 0,056 < = 4 => se accepta ipoteza nul i se respinge ipoteza alternative,
raportul de corelaie nu este semnificativ diferit de 0 (nu este seminificativ statistic)
Coeficientul de determinaie:
2 =( )2
( )2= 0,0014
2 (0; 1)
0,14% din variaia salariului mediu nominal net lunar din agricultur este explicat prin variaia numrului mediu de salariai din agricultur, restul de 99,86% reprezint influena altor factori.
17
Testarea semnificaiei coeficientului de determinaie:
Se stabilete ipoteza nul: 0: 2 = 0
Se stabilete ipoteza alternativ: 1: 2 0
Se calculeaz testul F:
2 =2
1 2
1
=
0,0014
1 0,0014 40 = 0,056
2 = 0,056 < = 4 => se accepta ipoteza nul i se respinge ipoteza alternativ, coeficientul de determinaie nu este semnificativ diferit de 0 (nu este seminificativ statistic)
Din cele de mai sus reiese ca raportul de corelaie este egal cu coeficientul de corelaie, ceea ce nseamn c modelul simplu de regresie este liniar.
6.3. Testarea normalitii erorilor
= 2,686865
= 0,199561} => =
6( +
4) =
42
6(0,199561 +
2,686865
4) = 0,450366
Se constat c = 0,450367 < 0,052 = 5,99 i c p(JB) = 0,798370. Deoarece valoarea
calculate a testului JB este mai mare dect valoarea lui hi-ptrat, iar probabilitatea ca testul JB s nu depeasc valoarea critic este sufficient de mare, ipoteza de normalitate a erorilor poate fi acceptat.
0
1
2
3
4
5
6
-200 -150 -100 -50 0 50 100 150 200 250
Series: ResidualsSample 1 42Observations 42
Mean 1.23e-13Median 0.712861Maximum 245.0817Minimum -221.3897Std. Dev. 115.2436Skewness 0.199561Kurtosis 2.686865
Jarque-Bera 0.450367Probability 0.798370
18
6.4. Testarea ipotezei de homoscedasticitate
Testarea ipotezei de homoscedasticitate o vom realiza folosind programul Eviews 7.
Testul White:
- estimarea parametrilor modelului initial i calcularea valorilor estimate ale variabilei reziduale
- construirea unei regresii auxiliare, bazat pe presupunerea existenei unei relaii de dependen
ntre ptratul valorilor erorii, variabila exogen inclus n modelul initial i ptratul valorilor
acesteia:
2 = 0 + 1 + 2
2 +
i calcularea coeficientului de determinare, R2, corespunztor acestei regresii auxiliare;
- verificarea semnificaiei parametrilor modelului nou construit, iar dac unul dintre acetia este
nesemnificativ, atunci ipoteza de heteroscedasticitate a erorilor este acceptat.
Exist dou variante de aplicare a testului White:
- utilizarea testului Fisher Snedecor clasic, bazat pe ipoteza nulitii parametrilor, respectiv:
H0: 0210
Dac ipoteza nul, potrivit creia rezultatele estimrii sunt nesemnificative (1;; knkc FF ), este
acceptat, atunci ipoteza de homoscedasticitate se verific, cazul contrar semnificnd prezena
heteroscedasticitii erorilor.
- utilizarea testului LM, calculat ca produs ntre numrul de observaii corespunztoare
modelului, n, i coeficientul de determinare, R2, corespunztor acestei regresii auxiliare. n general,
testul LM este asimptotic distribuit sub forma unui 2
;v , pentru care numrul gradelor de libertate
este egal cu: kv , unde k = numrul variabilelor exogene, respectiv:
2RnLM ~ 2
;k
Dac LM 2
;k , erorile sunt heteroscedastice, n caz contrar, sunt homoscedastice, respectiv
ipoteza nulitii parametrilor, 0210 , este acceptat.
Aplicarea testului White s-a realizat utiliznd pachetul de programe EViews:
Heteroskedasticity Test: White F-statistic 5.639489 Prob. F(2,39) 0.0071
Obs*R-squared 9.421772 Prob. Chi-Square(2) 0.0090
Scaled explained SS 7.207825 Prob. Chi-Square(2) 0.0272
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/05/14 Time: 10:48
Sample: 1 42
19
Included observations: 42 Variable Coefficient Std. Error t-Statistic Prob. C 34893.30 13260.23 2.631426 0.0121
X1 -24.95393 11.00511 -2.267487 0.0290
X1^2 0.005713 0.002066 2.765500 0.0086 R-squared 0.224328 Mean dependent var 12964.87
Adjusted R-squared 0.184550 S.D. dependent var 17042.81
S.E. of regression 15390.04 Akaike info criterion 22.18958
Sum squared resid 9.24E+09 Schwarz criterion 22.31370
Log likelihood -462.9811 Hannan-Quinn criter. 22.23507
F-statistic 5.639489 Durbin-Watson stat 1.915577
Prob(F-statistic) 0.007059
Fcalc = 5.639489 > Fcritic = 4 i LM = 9.421772 > 99,52
2;05,0 iar estimatorii parametrilor
modelului sunt semnificativi pentru un prag de semnificaie =0,05 (z= 1,96), ipoteza de
homoscedasticitate nu se verific.
Corelograma privind valorile factoriale x1 i ale variabilei reziduale (u)
Residuals
Mean 7.30844E-14
Standard Error 17.78247415
Median 0.712861377
Mode #N/A
Standard
Deviation 115.2436039
Sample
Variance 13281.08825
Kurtosis -0.196190642
Skewness 0.207029948
Range 466.4713788
Minimum -221.3897275
Maximum 245.0816513
Sum 3.06954E-12
Count 42
20
Deoarece graficul punctelor empirice prezint o distribuie oscilant se poate accepta ipoteza c cele 2 variabile sunt independente i necorelate.
6.5. Testarea ipotezei de autocorelare a erorilor
Verificarea ipotezei de independen a erorilor n cazul acestui model va fi realizat cu ajutorul testului Durbin-Watson i const n calcularea termenului empiric:
n
i
i
n
i
ii
d
1
2
2
2
1
i compararea acestei mrimi d cu dou valori teoretice d1 i d 2 , preluate din tabela Durbin-
Watson (vezi anexa nr. 1) n funcie de un prag de semnificaie , arbitrar ales, de numrul
variabilelor exogene k i de valorile observate. Acceptarea sau respingerea ipotezei de independen a erorilor se bazeaz pe o anumit regul, care const n:
- dac 0 1 d d autocorelare pozitiv;
- dac d d d1 2 indecizie, recomandndu-se acceptarea autocorelrii pozitive;
- dac d d d2 24 erorile sunt independente;
- dac 4 42 1 d d d indecizie, recomandndu-se acceptarea autocorelrii
negative;
- dac 4 41 d d autocorelare negativ.
Nr. Crt Residuals u^2 u-1 (u-u-1)*2
1 20.5883972 423.8820991 41.17679439
2 50.63741405 2564.147702 19.5883972 964.0414478
3 -33.02041612 1090.347881 49.63741405 6832.316889
-1000
0
1000
2000
3000
4000
5000
6000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41
Residuals Numrul mediu al salariailor din agricultur (persoane)
21
4 29.52626782 871.8004917 -34.02041612 4038.18104
5 -45.69605624 2088.129556 28.52626782 5508.953389
6 -150.2736626 22582.17368 -46.69605624 10728.32055
7 57.72608451 3332.300833 -151.2736626 43680.89431
8 135.1216526 18257.86099 56.72608451 6145.865091
9 -139.9892724 19596.99639 134.1216526 75136.7992
10 -128.4825897 16507.77587 -140.9892724 156.4171117
11 10.30841995 106.2635219 -129.4825897 19541.52639
12 243.0151722 59056.3739 9.308419953 54618.84603
13 89.42385274 7996.625438 242.0151722 23284.11076
14 -102.4781768 10501.77671 88.42385274 36443.58487
15 -8.651800023 74.85364363 -103.4781768 8992.041725
16 74.16606681 5500.605466 -9.651800023 7025.434801
17 112.1038742 12567.27862 73.16606681 1516.152846
18 -23.94054001 573.1494561 111.1038742 18236.99382
19 -73.04286028 5335.259438 -24.94054001 2313.833215
20 -99.19838915 9840.32041 -74.04286028 632.8006325
21 -186.3585522 34729.50999 -100.1983892 7423.573703
22 8.632906257 74.52707045 -187.3585522 38412.6518
23 137.6994486 18961.13815 7.632906257 16917.30544
24 -108.6826909 11811.9273 136.6994486 60212.39438
25 -7.207183503 51.94349404 -109.6826909 10501.22961
26 12.4593146 155.2345203 -8.207183503 427.1041438
27 83.67738371 7001.904545 11.4593146 5215.449506
28 -19.73158131 389.335301 82.67738371 10487.59612
29 -221.3897275 49013.41146 -20.73158131 40263.69165
30 -41.55398755 1726.733881 -222.3897275 32701.56486
31 -66.46515906 4417.617369 -42.55398755 571.7441231
32 118.9039627 14138.15235 -67.46515906 34733.44956
33 245.0816513 60065.01581 117.9039627 16174.16447
34 29.61938287 877.3078415 244.0816513 45994.06458
35 18.40632724 338.7928826 28.61938287 104.3065052
36 -75.22480381 5658.771109 17.40632724 8580.526441
37 -99.31379033 9863.22895 -76.22480381 533.1012983
38 87.69068586 7689.656387 -100.3137903 35345.68307
39 -66.16734027 4378.116918 86.69068586 23365.57615
40 116.9839653 13685.24813 -67.16734027 33911.70333
41 -216.6338637 46930.23088 115.9839653 110634.6201
42 231.730213 53698.89164 -217.6338637 201928.0734
Total - 544524.6181 -272.730213 1060277.865
22
Pe baza datelor problemei, valoarea empiric a variabilei Durbin-Watson este:
n
i
i
n
i
ii
d
1
2
2
2
1
=.
544524.6181= 1.947162
7. Previziunea valorii variabilei Y dac variabila X crete cu 10%
fa de ultima valoare nregistrat (inclusiv interval de ncredere) pentru
toate variantele cunoscute.
+ = 10%
0 = 42 + 10%42 = 4893 + 489,3 = 5382,3 + = + 0 = 1012,5 + 0,0044 5382,3= 1036,18212
Pentru estimarea pe baza unui interval de ncredere vom avea:
+ 2 ;1 + + + 2 ;1
1036,18212-1,96*107,4458 + 1036,18212+1,96*107,4458 +
+ = 2 [1 +
1
+
(+ )2
( )2] = 13613,1333 [1 +
1
42+
(5382,3 2266.3095)2
(4,893)2]
= 107,4458
Intervalul de ncredere pentru salariul mediu nominal net din agricultur:
825.5884 + 1246.776
70,921
1,185,921
2,137,444
1,792,921
4,260,096
712,336
6,990,736
6,528,025
1,512,900
1,245,456
3,378,244
23
1,510,441
7,354,944
1,795,600
11,587,216
7,672,900
6,548,481
5,494,336
9,253,764
8,133,904
16,104,169
2,371,600
5,880,625
3,370,896
4,748,041
11,417,641
1,703,025
3,411,409
19,980,900
9,966,649
12,866,569
3,721,041
6,574,096
8,369,449
839,056
1,119,364
3,073,009
2,331,729
10,857,025
3,651,921
5,175,625
23,941,449
250,641,874
24
1. Prezentarea problemei A.2.
Modelul matematic ce explic variaia salariului mediu nominal din agricultur n funcie de
numrul mediu al salariailor din agriculur:
A.2. yi = f(x2i)
Dorim s studiem legtura dintre salariul nominal net lunar din agricultur i numrul omerilor
n anul 2010. Pentru acest scop am cules date statistice privind salariul mediu nominal net lunar
din agricultur i numrul omerilor din cele 42 de judee din Romnia:
Date statistice anul 2010 Salariul mediu nominal net
lunar din agricultur (RON) Numrul omerilor
Jude Var. dependent (yi) Var. independent (x2i)
Bihor 1042 16666
Bistria Nsud 1068 8605
Cluj 986 16858
Maramure 1048 12490
Satu Mare 976 9370
Slaj 866 8929
Alba 1082 17506
Braov 1159 17742
Covasna 878 8959
Harghita 889 12777
Mure 1031 19740
Sibiu 1261 10780
Bacu 1114 17619
Botoani 916 9837
Iai 1019 21469
Neam 1099 15928
Suceava 1136 18856
Vaslui 999 18563
Brila 953 11738
Buzu 926 18631
Constana 844 17910
Galai 1028 21292
Tulcea 1161 7038
Vrancea 912 11438
Arge 1015 19721
Clrai 1040 9630
Dmbovia 1102 17927
Giurgiu 1001 7861
25
Ialomia 811 10480
Prahova 985 26873
Teleorman 962 18624
Ilfov 1140 4409
Municipiul Bucureti 1269 24922
Dolj 1055 29167
Gorj 1035 14821
Mehedini 942 12219
Olt 921 14467
Vlcea 1107 13921
Arad 961 11068
Cara-Severin 1138 11280
Hunedoara 806 16462
Timi 1266 12367
2. Definirea modelului de regresie simpl liniar
2.1. Forma, variabilele i parametrii modelului de regresie
Modelul econometric se prezint sub urmtoarea form:
= + 2 +
Variabile i parametrii:
= salariul mediu nominal net lunar din agricultur (variabila dependent sau rezultativ) 2 = numrul mediu al salariailor din agricultur (variabila independent sau factorial)
i = parametrii modelului. Sunt cei care fac obiectul procesului de estimare i testare statistic. Numii i coeficieni de regresie, sunt mrimi reale, fixe dar necunoscute care apar n
model n diferite expresii alturi de variabile.
= variabila rezidual sau eroare. Apar n model ca suma a tuturor influenelor necunoscute sau care nu apar explicit n model. Respect anumite proprieti numite i ipoteze clasice.
26
2.2. Reprezentarea grafic a modelului legturii dintre variabile
Din corelogram se observ c legatura dintre salariul mediu nominal net lunar i numrul mediu
al salariailor din agricultur este una liniar i direct.
3. Estimarea parametrilor modelului i interpretarea acestora
3.1. Estimarea punctual a parametrilor
- Intercept reprezint coeficientul termenului liber care nu are semnificaie din punct de vedere
economic, semnificnd valoarea lui y dac toi x sunt 0.
reprezint panta de regresie ( coeficientul de regresie pentru numrul mediu al salariailor din
agricultur)
Estimarea parametrului :
y = 0.0022x + 989.72R = 0.0108
700
800
900
1000
1100
1200
1300
1400
3000 8000 13000 18000 23000 28000
Salariul mediu nominal net
lunar din agricultur
(RON)
Numrul omerilor (persoane)
Legtura dintre salariul mediu nominal net lunar din agricultur i numrul omerilor
Coefficients Standard Error t Stat P-value
Intercept 989.7153272 52.8974058 18.71009197 2.18233E-21
Numrul omerilor
(persoane)0.002202623 0.003334093 0.660636181 0.512632632
27
=|
2 2
|
| 2
2 22 |
= 0,0022
La creterea numrului omerilor cu 1 persoan salariul mediu nominal net din agricultur va
crete cu 0,0022 RON.
Estimarea parametrului :
+ 2 = |1
+
2
=
= 2
2 = 2
=
=
} => = 989,7
= 0,0022 => > 0 => o legtur direct (foarte slab)
= 989,7
Dispunnd de estimaiile parametrilor se pot calcula valorile estimate (Predicted) ale variabilei
dependente , cu ajutorul relaiei:
= + 2 = 989,7 + 0,00222
Valorile reziduale (Residuals) vor rezulta din urmtoarea relaie:
=
28
Pe baza acestor valori se pot calcula abaterea medie ptratic a variabilei reziduale i abaterile medii ptratice ale celor doi estimatori, i .
Observation
Predicted
Salariul
mediu
nominal net
lunar din
agricultur
(RON)
Residuals
1 1026.424235 15.57576476
2 1008.668895 59.33110542
3 1026.847139 -40.84713878
4 1017.226083 30.77391667
5 1010.353901 -34.35390086
6 1009.382544 -143.3825443
7 1028.274438 53.72556179
8 1028.794257 130.2057429
9 1009.448623 -131.448623
10 1017.858236 -128.858236
11 1033.195097 -2.19509707
12 1013.459599 247.5404013
13 1028.523335 85.47666543
14 1011.382526 -95.38252561
15 1037.003432 -18.00343152
16 1024.7987 74.20130023
17 1031.247979 104.7520213
18 1030.60261 -31.60261029
19 1015.569711 -62.56971114
20 1030.752389 -104.7523886
21 1029.164298 -185.1642977
22 1036.613567 -8.613567322
23 1005.217385 155.782615
24 1014.908924 -102.9089244
25 1033.153247 -18.15324724
26 1010.926583 29.07341727
27 1029.201742 72.79825768
28 1007.030143 -6.030143379
29 1012.798812 -201.7988119
30 1048.906404 -63.90640397
31 1030.73697 -68.73697026
32 999.4266902 140.5733098
33 1044.609087 224.3909127
34 1053.95922 1.040779819
35 1022.360397 12.63960343
36 1016.629173 -74.62917261
37 1021.580668 -100.5806682
38 1020.378036 86.62196375
39 1014.093954 -53.09395401
40 1014.56091 123.43909
41 1025.9749 -219.9749002
42 1016.955161 249.0448393
29
2 =
( )2
1= 13485,16
(ANOVA MS:Residual)
Unde: k = numrul estimatorilor
= 13485,16 = 116,1256
(SUMMARY OUTPUT Regression Statistics:Standard Error)
=
2
(1)2
= 52,89
(Intercept:Standard Error)
= 1
(1)2
= 0,0033
(Numrul mediu al salariailor din agricultur:Standard Error)
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.103890515
R Square 0.010793239
Adjusted R Square -0.01393693
Standard Error 116.1256486
Observations 42
ANOVA
df SS MS
Regression 1 5885.468172 5885.468172
Residual 40 539406.6509 13485.16627
Total 41 545292.119
Coefficients Standard Error t Stat
Intercept 989.7153272 52.8974058 18.71009197
Numrul omerilor
(persoane)0.002202623 0.003334093 0.660636181
30
3.2. Estimarea parametrilor prin interval de ncredere
= 0,0022
= 989,71
( )
(882,8056; 1096,624972)
P-Value = 2,1823 > 0,05 => nu este semnificativ statistic
Parametrul nu este seminificativ statistic deoarece intervalul de ncredere include valoarea nul.
( )
(0,0045; 0,0089)
P-Value =0,5126 > 0,05 => nu este semnificativ statistic
Parametrul nu este seminificativ statistic deoarece intervalul de ncredere include valoarea nul.
4. Testarea semnificaiei corelaiei i a parametrilor modelului de regresie
4.1. Testarea seminificaiei corelaiei
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 989.7153272 52.8974058 18.71009197 2.18233E-21 882.8056822 1096.624972
Numrul omerilor
(persoane)0.002202623 0.003334093 0.660636181 0.512632632 -0.004535831 0.008941076
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.103890515
R Square 0.010793239
Adjusted R Square -0.01393693
Standard Error 116.1256486
Observations 42
31
Coeficientul de corelaie liniar ( Multiple R):
/ =(; )
= 0,1038
Valoarea coeficientului este > 0 , ceea ce nseamn c ntre cele dou variabile considerate: salariul mediu nominal net din agricultur i numrul mediu de salariai din agricultur exist o legatur direct de intensitate.
Se stabilete ipoteza nul: 0: / = 0
Se stabilete ipoteza alternativ: 1: / 0 Se calculeaz testul t:
/ =/ 1
1 /2=
0,103840
1 0,10382=
0,6564
0,9893= 0,6634
/ = 0,6634 < = 1,96 => se accepta ipoteza nula i se respinge ipoteza alternative,
deci coeficientul de corelatie nu este semnificativ diferit de 0 (nu este semnificativ statistic)
Raportul de corelaie:
/ = ( )2
( )2= 0,1038
Deoarece coeficientul de corelaie = raportul de corelaie, apreciem c exist o legtur liniar de intensitate i direct ntre cele dou variabile.
Testarea seminificaiei raportului de corelaie:
Se stabilete ipoteza nul: 0: / = 0
Se stabilete ipoteza alternativ: 1: / 0 Se calculeaz testul F:
/ =2
1 2
1
=
0,0107
1 0,0107 40 = 0,4326
/ = 0,4326 < = 4 => se accepta ipoteza nul i se respinge ipoteza alternative,
raportul de corelaie nu este semnificativ diferit de 0 (nu este seminificativ statistic)
Coeficientul de determinaie:
2 =( )2
( )2= 0,0107
2 (0; 1)
32
1,07% din variaia salariului mediu nominal net lunar din agricultur este explicat prin variaia numrului de omeri, restul de 98,93% reprezint influena altor factori.
Testarea semnificaiei coeficientului de determinaie:
Se stabilete ipoteza nul: 0: 2 = 0
Se stabilete ipoteza alternativ: 1: 2 0
Se calculeaz testul F:
2 =2
1 2
1
=
0,0107
1 0,0107 40 = 0,4326
4.2. Testarea parametrilor unui model de regresie simplu
= 0,0022
= 989,7
Testarea semnificaiei lui :
Se stabilete ipoteza nul: 0: = 0 Se stabilete ipoteza alternativ: 1: 0 Se calculeaz testul z:
= 0
= 18.71
= 18,71 > = 1,96 =: se respinge ipoteza nul i se accept ipoteza alternativ, parametrul este semnificativ statistic, este semnificativ diferit de 0.
Testarea semnificaiei lui :
Se stabilete ipoteza nul: 0: = 0 Se stabilete ipoteza alternativ: 1: 0 Se calculeaz testul z:
= 0
= 0,6606
= 0,6606 < = 1,96 =: se accept ipoteza nul i se respinge ipoteza alternativ, parametrul nu este semnificativ statistic, nu este semnificativ diferit de 0.
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 989.7153272 52.8974058 18.71009197 2.18233E-21 882.8056822 1096.624972
Numrul omerilor
(persoane)0.002202623 0.003334093 0.660636181 0.512632632 -0.004535831 0.008941076
33
5. Aplicarea analizei tip ANOVA pentru validitatea modelului de
regresie simplu i interpretarea rezultatelor
Verificarea verosimilitii modelului:
Pentru a accepta ipoteza de liniaritate se calculeaz coeficientul de corelaie liniar:
/ =(; )
= 0,1038
Se poate observa ca n cazul unei legturi liniare, raportul de corelaie este egal cu coeficientul de corelaie liniar. Raportul de corelaie multipl (Multiple R) este 0,1038 i arat o legtur direct de funcionalitate ntre variabile.
Testarea validitii modelului:
Se stabilete ipoteza nul: 0: modelul nu este valid Se stabilete ipoteza alternativ: 1: modelul este valid Se calculeaz testul F:
= 0,4364 < = 4 => modelul nu este valid (se accept ipoteza nul i se respinge ipoteza alternativ)
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.103890515
R Square 0.010793239
Adjusted R Square -0.01393693
Standard Error 116.1256486
Observations 42
ANOVA
df SS MS F Significance F
Regression 1 5885.468172 5885.468172 0.436440163 0.512632632
Residual 40 539406.6509 13485.16627
Total 41 545292.119
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 989.7153272 52.8974058 18.71009197 2.18233E-21 882.8056822 1096.624972
Numrul omerilor
(persoane)0.002202623 0.003334093 0.660636181 0.512632632 -0.004535831 0.008941076
34
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1. Ipoteze statistice clasice asupra modelului de regresie simpl
6.2. Testarea liniaritii modelului propus
Coeficientul de corelaie liniar ( Multiple R):
/ =(; )
= 0,1038
Valoarea coeficientului este > 0 , ceea ce nseamn c ntre cele dou variabile considerate: salariul mediu nominal net din agricultur i numrul mediu de salariai din agricultur exist o legatur direct de intensitate.
Se stabilete ipoteza nul: 0: / = 0
Se stabilete ipoteza alternativ: 1: / 0 Se calculeaz testul t:
/ =/ 1
1 /2=
0,103840
1 0,10382=
0,6564
0,9893= 0,6634
/ = 0,6634 < = 1,96 => se accepta ipoteza nula i se respinge ipoteza alternative,
deci coeficientul de corelatie nu este semnificativ diferit de 0 (nu este semnificativ statistic)
Raportul de corelaie:
/ = ( )2
( )2= 0,1038
Deoarece coeficientul de corelaie = raportul de corelaie, apreciem c exist o legtur liniar de intensitate i direct ntre cele dou variabile.
Testarea seminificaiei raportului de corelaie:
Se stabilete ipoteza nul: 0: / = 0
Se stabilete ipoteza alternativ: 1: / 0 Se calculeaz testul F:
/ =2
1 2
1
=
0,0107
1 0,0107 40 = 0,4326
/ = 0,4326 < = 4 => se accepta ipoteza nul i se respinge ipoteza alternative,
raportul de corelaie nu este semnificativ diferit de 0 (nu este seminificativ statistic)
35
Coeficientul de determinaie:
2 =( )2
( )2= 0,0107
2 (0; 1) 1,07% din variaia salariului mediu nominal net lunar din agricultur este explicat prin variaia numrului de omeri, restul de 98,93% reprezint influena altor factori.
Testarea semnificaiei coeficientului de determinaie:
Se stabilete ipoteza nul: 0: 2 = 0
Se stabilete ipoteza alternativ: 1: 2 0
Se calculeaz testul F:
2 =2
1 2
1
=
0,0107
1 0,0107 40 = 0,4326
Coeficientul de corelaie este = cu raportul de corelaie => c modelul de regresie este liniar.
6.3. Testarea normalitii erorilor
= 2,690034
= 0,293785} => =
6( +
4) == 0,772306
Se constat c = 0,772306 < 0,052 = 5,99 i c p(JB) = 0,679667. Deoarece valoarea
calculate a testului JB este mai mare dect valoarea lui hi-ptrat, iar probabilitatea ca testul JB s nu depeasc valoarea critic este sufficient de mare, ipoteza de normalitate a erorilor poate fi acceptat.
0
1
2
3
4
5
6
-200 -150 -100 -50 0 50 100 150 200 250
Series: ResidualsSample 1 42Observations 42
Mean 1.48e-13Median -7.321855Maximum 249.0448Minimum -219.9749Std. Dev. 114.7007Skewness 0.293785Kurtosis 2.690034
Jarque-Bera 0.772306Probability 0.679667
36
6.4. Testarea ipotezei de homoscedasticitate
Heteroskedasticity Test: White F-statistic 0.435091 Prob. F(2,39) 0.6503
Obs*R-squared 0.916667 Prob. Chi-Square(2) 0.6323
Scaled explained SS 0.702584 Prob. Chi-Square(2) 0.7038
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/05/14 Time: 10:54
Sample: 1 42
Included observations: 42 Variable Coefficient Std. Error t-Statistic Prob. C 22804.74 17977.10 1.268544 0.2121
X2 -0.904592 2.311543 -0.391337 0.6977
X2^2 1.41E-05 6.96E-05 0.202137 0.8409 R-squared 0.021825 Mean dependent var 12843.02
Adjusted R-squared -0.028337 S.D. dependent var 16898.47
S.E. of regression 17136.23 Akaike info criterion 22.40453
Sum squared resid 1.15E+10 Schwarz criterion 22.52865
Log likelihood -467.4951 Hannan-Quinn criter. 22.45002
F-statistic 0.435091 Durbin-Watson stat 1.563507
Prob(F-statistic) 0.650308
Fcalc = 0,43509 < Fcritic = 4 i LM = -0,904582 < 99,52
2;05,0 iar estimatorii parametrilor
modelului nu sunt semnificativi pentru un prag de semnificaie =0,05 (z= 1,96), ipoteza de
homoscedasticitate se verific.
6.5. Testarea ipotezei de autocorelare a erorilor
Verificarea ipotezei de independen a erorilor n cazul acestui model va fi realizat cu ajutorul testului Durbin-Watson i const n calcularea termenului empiric:
n
i
i
n
i
ii
d
1
2
2
2
1
i compararea acestei mrimi d cu dou valori teoretice d1 i d 2 , preluate din tabela Durbin-
Watson (vezi anexa nr. 1) n funcie de un prag de semnificaie , arbitrar ales, de numrul
variabilelor exogene k i de valorile observate. Acceptarea sau respingerea ipotezei de independen a erorilor se bazeaz pe o anumit regul, care const n:
37
- dac 0 1 d d autocorelare pozitiv;
- dac d d d1 2 indecizie, recomandndu-se acceptarea autocorelrii pozitive;
- dac d d d2 24 erorile sunt independente;
- dac 4 42 1 d d d indecizie, recomandndu-se acceptarea autocorelrii
negative;
- dac 4 41 d d autocorelare negativ.
Nr. Crt Residuals u^2 u-1 (u-u-1)*2
1 15.57576 242.604448 242.604448
2 59.33111 3520.18007 14.57576 2003.04052
3 -40.8471 1668.48875 58.33111 9836.32412
4 30.77392 947.033947 -41.8471 5273.8177
5 -34.3539 1180.1905 29.77392 4112.37698
6 -143.383 20558.554 -35.3539 11670.1878
7 53.72556 2886.43599 -144.383 39246.8217
8 130.2057 16953.5355 52.72556 6003.17846
9 -131.449 17278.7405 129.2057 67940.6984
10 -128.858 16604.445 -132.449 12.8908786
11 -2.1951 4.81845115 -129.858 16297.877
12 247.5404 61276.2503 -3.1951 62868.2901
13 85.47667 7306.26033 246.5404 25941.527
14 -95.3825 9097.82619 84.47667 32349.3286
15 -18.0034 324.123546 -96.3825 6143.28239
16 74.2013 5505.83296 -19.0034 8687.12202
17 104.752 10972.986 73.2013 995.448
18 -31.6026 998.724977 103.752 18320.8763
19 -62.5697 3914.96875 -32.6026 898.027134
20 -104.752 10973.0629 -63.5697 1696.01292
21 -185.164 34285.8172 -105.752 6306.25131
22 -8.61357 74.193542 -186.164 31524.2619
23 155.7826 24268.2231 -9.61357 27355.8971
24 -102.909 10590.2467 154.7826 66404.9295
25 -18.1532 329.540385 -103.909 7354.03616
26 29.07342 845.263592 -19.1532 2325.81117
27 72.79826 5299.58632 28.07342 2000.31135
28 -6.03014 36.3626292 71.79826 6057.26001
29 -201.799 40722.7605 -7.03014 37934.8342
30 -63.9064 4084.02847 -202.799 19291.101
31 -68.737 4724.77108 -64.9064 14.6732381
32 140.5733 19760.8554 -69.737 44230.4139
33 224.3909 50351.2817 139.5733 7194.02576
38
34 1.04078 1.08322263 223.3909 49439.5816
35 12.6396 159.759575 0.04078 158.730356
36 -74.6292 5569.5134 11.6396 7442.30172
37 -100.581 10116.4708 -75.6292 622.577131
38 86.62196 7503.3646 -101.581 35420.2307
39 -53.094 2818.96795 85.62196 19242.1058
40 123.4391 15237.2089 -54.094 31517.9817
41 -219.975 48388.9567 122.4391 117247.341
42 249.0448 62023.332 -220.975 220918.556
Total 539406.651 -290.045 1060542.94
Pe baza datelor problemei, valoarea empiric a variabilei Durbin-Watson este:
n
i
i
n
i
ii
d
1
2
2
2
1
=1060542.94
539406.651= 1.9661
7. Previziunea valorii variabilei Y dac variabila X crete cu 10%
fa de ultima valoare nregistrat (inclusiv interval de ncredere)
pentru toate variantele cunoscute.
+ = 10%
0 = 42 + 10%42 = 12367 + 1236,7 = 13603,7 + = + 0 = 989,72 + 0,0022 13603,7 =1019.648
Pentru estimarea pe baza unui interval de ncredere vom avea:
+ 2 ;1 + + + 2 ;1
1019,648-1,96*107,4458 + 1019,648+1,96*107,4458
+ = 2 [1 +
1
+
(+ )2
( )2] =
Intervalul de ncredere pentru salariul mediu nominal net din agricultur:
825.5884 + 1246.776
39
Rezolvare n EVIEWS:
Dependent Variable: Y
Method: Least Squares
Date: 05/05/14 Time: 09:27
Sample: 1 42
Included observations: 42 Variable Coefficient Std. Error t-Statistic Prob. C 989.7153 52.89741 18.71009 0.0000
X 0.002203 0.003334 0.660636 0.5126 R-squared 0.010793 Mean dependent var 1022.595
Adjusted R-squared -0.013937 S.D. dependent var 115.3248
S.E. of regression 116.1256 Akaike info criterion 12.39367
Sum squared resid 539406.7 Schwarz criterion 12.47642
Log likelihood -258.2671 Hannan-Quinn criter. 12.42400
F-statistic 0.436440 Durbin-Watson stat 1.964737
Prob(F-statistic) 0.512633
Actual Fitted Residual Residual Plot
1042.00 1026.42 15.5758 | . |* . |
1068.00 1008.67 59.3311 | . | * . |
986.000 1026.85 -40.8471 | . * | . |
1048.00 1017.23 30.7739 | . |* . |
976.000 1010.35 -34.3539 | . * | . |
866.000 1009.38 -143.383 | *. | . |
1082.00 1028.27 53.7256 | . | * . |
1159.00 1028.79 130.206 | . | * |
878.000 1009.45 -131.449 | * | . |
889.000 1017.86 -128.858 | * | . |
1031.00 1033.20 -2.19510 | . * . |
1261.00 1013.46 247.540 | . | . *|
1114.00 1028.52 85.4767 | . | * . |
916.000 1011.38 -95.3825 | .* | . |
1019.00 1037.00 -18.0034 | . *| . |
1099.00 1024.80 74.2013 | . | * . |
1136.00 1031.25 104.752 | . | *. |
999.000 1030.60 -31.6026 | . * | . |
953.000 1015.57 -62.5697 | . * | . |
926.000 1030.75 -104.752 | .* | . |
844.000 1029.16 -185.164 | * . | . |
1028.00 1036.61 -8.61357 | . * . |
1161.00 1005.22 155.783 | . | . * |
912.000 1014.91 -102.909 | .* | . |
1015.00 1033.15 -18.1532 | . *| . |
1040.00 1010.93 29.0734 | . |* . |
1102.00 1029.20 72.7983 | . | * . |
1001.00 1007.03 -6.03014 | . * . |
811.000 1012.80 -201.799 | * . | . |
985.000 1048.91 -63.9064 | . * | . |
962.000 1030.74 -68.7370 | . * | . |
1140.00 999.427 140.573 | . | .* |
40
1269.00 1044.61 224.391 | . | . * |
1055.00 1053.96 1.04078 | . * . |
1035.00 1022.36 12.6396 | . |* . |
942.000 1016.63 -74.6292 | . * | . |
921.000 1021.58 -100.581 | .* | . |
1107.00 1020.38 86.6220 | . | * . |
961.000 1014.09 -53.0940 | . * | . |
1138.00 1014.56 123.439 | . | * |
806.000 1025.97 -219.975 | * . | . |
1266.00 1016.96 249.045 | . | . *|
Coefficient Confidence Intervals
Date: 05/05/14 Time: 16:18
Sample: 1 42
Included observations: 42 95% CI 95% CI
Variable Coefficient Low High Low High C 989.7153 882.8057 1096.625 882.8057 1096.625
X 0.002203 -0.004536 0.008941 -0.004536 0.008941
Breusch-Godfrey Serial Correlation LM Test: F-statistic 1.096650 Prob. F(2,38) 0.3443
Obs*R-squared 2.291890 Prob. Chi-Square(2) 0.3179
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 05/05/14 Time: 16:19
Sample: 1 42
Included observations: 42
Presample missing value lagged residuals set to zero. Variable Coefficient Std. Error t-Statistic Prob. C 0.070920 52.77027 0.001344 0.9989
X -2.77E-05 0.003327 -0.008318 0.9934
RESID(-1) -0.027559 0.168401 -0.163650 0.8709
RESID(-2) -0.258228 0.177349 -1.456048 0.1536 R-squared 0.054569 Mean dependent var 1.48E-13
Adjusted R-squared -0.020070 S.D. dependent var 114.7007
S.E. of regression 115.8461 Akaike info criterion 12.43279
Sum squared resid 509971.9 Schwarz criterion 12.59829
Log likelihood -257.0887 Hannan-Quinn criter. 12.49345
F-statistic 0.731100 Durbin-Watson stat 1.995313
Prob(F-statistic) 0.539878
41
II. PROBLEMA B
1. Definirea modelului de regresie multipl liniar
1.1.Forma, variabilele, parametrii modelului de regresie multipl
Forma:
= (1 , 2) Variabile:
= salariul mediu nominal net lunar din agricultur
1= numrul mediu al salariailor din agricultur
2 = numrul omerilor
Modelul de regresie are n vedere stabilirea funciei de regresie:
1,2, = 0 + 11 + 22
Parametrii modelului de regresie multipl:
0= termenul liber (intercept)
1= coeficient de regresie (primul factor) = numrul mediu al salariailor din agricultur
2= coeficient de regresie (al doilea factor) = numrul de omeri
Coefficients
Intercept 987.54839
Numarul mediu al salariatilor agricultura 0.00137176
Numarul somerilor 0.00213952
42
1.2. Reprezentarea grafic a modelului legturii dintre variabile
2. Estimarea parametrilor modelului i interpretarea acestora
2.1. Estimare punctual a parametrilor
1,2, = 0 + 11 + 22
1,2, = 987,54839 + 0,001371761 + 0,002139522
0- termenul liber nu are interpretare economic i ne arat c funcia de regresie intersecteaz axa Oy n punctul 987,54839;
1= +0,00137176, ceea ce nseamn c creterea numrului mediu al salariailor din agricultur cu 1, salariul mediu nominal net lunar din agricultur va crete cu +0,00137176 RON.
2= +0,00213952 ne arat c la o cretere cu 1 persoan a numrului omerilor, salariul mediu nominal net lunar va nregistra o cretere cu 0,00213952 RON.
Coefficients
Intercept 987.54839
Numarul mediu al salariatilor agricultura 0.00137176
Numarul somerilor 0.00213952
43
2.2. Estimarea parametrilor prin interval de ncredere
Lower Upper
Interval de ncredere pentru 0:
0 - 2 ;1 0 0 0 + 2 ;1 0
0 -;3 0 0 0 + ;3 0
0 -0,5;39 0 0 0 + 0,5;39 0
987,54839 -1,96 61,8106 0 987,54839 + 1,96 61,8106
862,5245555 0 1112,572224
Interval de ncredere pentru 1:
1 - 2 ;1 1 1 1 + 2 ;1 1
1 -;3 1 1 1 + ;3 1
1 -0,5;39 1 1 1 + 0,5;39 1
0,00137176 -1,96 0,019522311 1 0,00137176 + 1,96 0,019522311
0,038115838 1 0,040859363
Interval de ncredere pentru 2:
2 - 2 ;1 2 2 2 + 2 ;1 2
2 -;3 2 2 2 + ;3 2
2 -0,5;39 2 2 2 + 0,5;39 2
0,00213952 -1,96 0,003493728 2 0,00213952 + 1,96 0,003493728
0,004927207 1 0,009206256
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 987.54839 61.81064693 15.97699488 1.04296E-18 862.5245555 1112.572224
Numarul mediu al salariatilor agricultura 0.00137176 0.019522311 0.070266404 0.944340698 -0.038115838 0.040859363
Numarul somerilor 0.00213952 0.003493728 0.612390213 0.543833951 -0.004927207 0.009206256
44
3. Testarea semnificaiei corelaiei i a parametrilor regresiei modelului de regresie multipl
3.1. Testarea semnificaiei corelaiei multipl
Din tabel avem Multiple R (Raportul de corelaie): R= 0,10449142 0 ceea ce nseamn c legtura dintre salariul mediu nominal net lunar din agricultur, numrul mediu al salariailor din agricultur i numrul de omeri este slab.
Testarea semnificaiei raportului de corelaie:
Ipoteza nul H0: R=0 (raportul de corelaie al colectivitii din care s-a extras eantionul de 42 de uniti, nu difer semnificativ de 0, deci nu este semnificativ statistic);
Ipoteza alternative H1: R0 (raportul de corelaie al colectivitii din care s-a extras eantionul de 42 de uniti, difer semnificativ de 0, deci este semnificativ statistic);
tiind c pragul de semnificaie este =0,05 i k=2 se stabilete:
Valoarea critic: = 4 Regiunea de respingere dac > = 4 atunci se respinge H0
Determinarea statisticii testului ( > ) are la baza relaia:
=2
1 2
1
=
0,104491422
1 0,104491422
42 2 1
2= 0,215260199
Deoarece (0,2152) < = 4, atunci se accept H0 i se respinge H1, ceea ce nseamn ca raportul de corelaie al colectivitii din care s-a extras eantionul de 42 de uniti, nu difer semnificativ de 0, deci nu este semnificativ statistic.
Coeficientul de determinaie (R Square) ne indic ponderea de influen a factorului (x) n variaia rezultatului (y).
= 0,01091846 ne arat c, 1,09% reprezin influena ambilor factori asupra variaiei salariul mediu nominal net lunar din agricultur.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.10449142
R Square 0.01091846
Adjusted R Square -0.03980367
Standard Error 117.597572
Observations 42
45
3.2. Testarea parametrilor modelului de regresie multipl
Testarea semnificaiei parametrului 0:
0: 0 = 0 (panta 0 este 0, adic 0, nu este semnificativ diferit de 0, deci 0 nu este semnificativ statistic)
1: 0 0 (panta 0 nu este diferit de 0, adic 0, este semnificativ diferit de 0, deci 0 este semnificativ statistic)
Deoarece n = 42 > 30 avem eantion de volum mare i pentru testare vom utiliza testul z.
tiind pragul de semnificaie =0,05 i k=2 (2 factori de influen) se stabilete:
Valoarea critic = 1,96
Regiunea Critic: dac || > 2 ;3 sau |0| > 2 ;3 atunci 0 se respinge
Statistica testului este: = 0=0
0=
987,54839
61,81064693= 15,9769948876
Decizia:
Se observ c parametrul 0 este semnificativ statistic deoarece:
Din compararea statisticii testului cu valoarea testului critic rezult c: || = 15,9769 > = 1,96; se respinge H0 i se accept H1
Pragul critic P-Value 0= 1,04296 > =0,05 pragul de semnificaie Limita inferioar a intervalului de ncredere (lower 95% = 862,524555) i limita superioar
a intervalului (upper 95% = 1112,572224); intervalul de ncredere este
862,5245555 987,54839 1112,572224
Testarea semnificaiei parametrului 1:
0: 1 = 0 (panta 1 este 0, adic 1, nu este semnificativ diferit de 0, deci 1 nu este semnificativ statistic)
1: 1 0 (panta 1 nu este diferit de 0, adic 1, este semnificativ diferit de 0, deci 1 este semnificativ statistic)
Statistica testului este: =1 = 0,070266404
Decizia:
Se observ c parametrul 1 nu este semnificativ statistic deoarece:
Din compararea statisticii testului cu valoarea testului critic rezult c:
= 1,96 < 1 = 0,070266404 < = 1,96
Pragul critic P-Value 1= 0,944340698 > =0,05 pragul de semnificaie
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 987.54839 61.81064693 15.97699488 1.04296E-18 862.5245555 1112.572224
Numarul mediu al salariatilor agricultura 0.00137176 0.019522311 0.070266404 0.944340698 -0.038115838 0.040859363
Numarul somerilor 0.00213952 0.003493728 0.612390213 0.543833951 -0.004927207 0.009206256
46
Limita inferioar a intervalului de ncredere (lower 95% = -0,038115838) este cu semn contrar fa de limita superioar a intervalului (upper 95% = 0,040859363); intervalul de
ncredere este 0,038115838 0,00137176 0,040859363
Testarea semnificaiei parametrului 2:
0: 2 = 0 (panta 2 este 0, adic 2, nu este semnificativ diferit de 0, deci 2 nu este semnificativ statistic)
1: 2 0 (panta 2 nu este diferit de 0, adic 2, este semnificativ diferit de 0, deci 2 este semnificativ statistic)
Statistica testului este: =2 = 0,612390213
Decizia:
Se observ c parametrul 2 nu este semnificativ statistic deoarece:
Din compararea statisticii testului cu valoarea testului critic rezult c:
= 1,96 < 2 = 0,612390213 < = 1,96
Pragul critic P-Value 2= 0,543833951 > =0,05 pragul de semnificaie Limita inferioar a intervalului de ncredere (lower 95% = -0,00492721) este cu semn
contrar fa de limita superioar a intervalului (upper 95% = 0,009206256); intervalul de
ncredere este 0,00492721 0,00213952 0,040859363
4. Aplicarea analizei de tip ANOVA pentru validitatea modelului de
regresie multipl i interpretarea rezultatelor
H0: modelul nu este valid statistic (mprtierea valorilor datorate factorului timp nu difer nu difer semnificativ de mprtierea acelorai valori datorate ntmplrii)
H1: modelul este valid statistic
tiind c pragul de semnificaie este =0,05 i k=2 se stabilete:
Valoarea critic: = 4 Regiunea de respingere dac > = 4 atunci se respinge H0
Determinarea statisticii testului ( > ) are la baza relaia:
=
2
2=
2976,873981
13829,189= 0,215260199
Deoarece = 0,215260199 < = 4 H0 se accept H0 i se respinge H1, prin urmare modelul nu este valid.
ANOVA
df SS MS F Significance F
Regression 2 5953.747962 2976.873981 0.215260199 0.807283199
Residual 39 539338.3711 13829.189
Total 41 545292.119
47
6. Testarea ipotezelor clasice asupra modelului de regresie multipl
6.1 Ipoteze statistice clasice asupra modelului de regresie multipl
6.2 Testarea liniaritii modelului propus
Coeficientul de corelaie liniar ( Multiple R):
/ =(; )
= 0,1038
Valoarea coeficientului este > 0 , ceea ce nseamn c ntre cele dou variabile considerate: salariul mediu nominal net din agricultur i numrul mediu de salariai din agricultur exist o legatur direct de intensitate.
Se stabilete ipoteza nul: 0: / = 0
Se stabilete ipoteza alternativ: 1: / 0 Se calculeaz testul t:
/ =/ 1
1 /2=
0,103840
1 0,10382=
0,6564
0,9893= 0,6634
/ = 0,6634 < = 1,96 => se accepta ipoteza nula i se respinge ipoteza alternative,
deci coeficientul de corelatie nu este semnificativ diferit de 0 (nu este semnificativ statistic)
Raportul de corelaie:
/ = ( )2
( )2= 0,1038
Deoarece coeficientul de corelaie = raportul de corelaie, apreciem c exist o legtur liniar de intensitate i direct ntre cele dou variabile.
Testarea seminificaiei raportului de corelaie:
Se stabilete ipoteza nul: 0: / = 0
Se stabilete ipoteza alternativ: 1: / 0 Se calculeaz testul F:
/ =2
1 2
1
=
0,0107
1 0,0107 40 = 0,4326
/ = 0,4326 < = 4 => se accepta ipoteza nul i se respinge ipoteza alternative,
raportul de corelaie nu este semnificativ diferit de 0 (nu este seminificativ statistic)
48
Coeficientul de determinaie:
2 =( )2
( )2= 0,0107
2 (0; 1) 1,07% din variaia salariului mediu nominal net lunar din agricultur este explicat prin variaia numrului de omeri, restul de 98,93% reprezint influena altor factori.
Testarea semnificaiei coeficientului de determinaie:
Se stabilete ipoteza nul: 0: 2 = 0
Se stabilete ipoteza alternativ: 1: 2 0
Se calculeaz testul F:
2 =2
1 2
1
=
0,0107
1 0,0107 40 = 0,4326
Reiese ca Ry/x=ry/x=>modelul de regresie simplu este liniar.
6.3 Testarea normalitii erorilor
= 2,688328 = 0,289512
} => =
6( +
4) == 0,756714
Se constat c = 0,756714 < 0,052 = 5,99 i c p(JB) = 0,684986. Deoarece valoarea
calculate a testului JB este mai mare dect valoarea lui hi-ptrat, iar probabilitatea ca testul JB s nu depeasc valoarea critic este sufficient de mare, ipoteza de normalitate a erorilor poate fi acceptat.
0
1
2
3
4
5
6
-200 -150 -100 -50 0 50 100 150 200 250
Series: ResidualsSample 1 42Observations 42
Mean 1.52e-13Median -7.077160Maximum 247.9123Minimum -219.9433Std. Dev. 114.7000Skewness 0.289512Kurtosis 2.688328
Jarque-Bera 0.756714Probability 0.684986
49
6.4 Testarea ipotezei de homoscedasticitate
Heteroskedasticity Test: White F-statistic 2.105069 Prob. F(5,36) 0.0873
Obs*R-squared 9.501586 Prob. Chi-Square(5) 0.0907
Scaled explained SS 6.915978 Prob. Chi-Square(5) 0.2270
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/05/14 Time: 14:44
Sample: 1 42
Included observations: 42 Variable Coefficient Std. Error t-Statistic Prob. C 46921.03 26461.12 1.773206 0.0847
X1 -25.27318 15.92620 -1.586893 0.1213
X1^2 0.005245 0.002312 2.268568 0.0294
X1*X2 0.000195 0.000726 0.268006 0.7902
X2 -1.388496 2.244792 -0.618541 0.5401
X2^2 2.01E-05 7.39E-05 0.272550 0.7868 R-squared 0.226228 Mean dependent var 12842.85
Adjusted R-squared 0.118760 S.D. dependent var 16889.72
S.E. of regression 15855.12 Akaike info criterion 22.31194
Sum squared resid 9.05E+09 Schwarz criterion 22.56018
Log likelihood -462.5507 Hannan-Quinn criter. 22.40293
F-statistic 2.105069 Durbin-Watson stat 1.764109
Prob(F-statistic) 0.087274
6.5 Testarea ipotezei de autocorelare a erorilor
7. Previziunea valorii variabilei Y dac variabila X crete cu 10%
fa de ultima valoare nregistrat (inclusiv interval de ncredere)
pentru toate variantele cunoscute.
50
Rezolvarea problemei B de exemplificat att n Excel ct i n Eviews.
Rezolvarea n EVIEWS 7.
Dependent Variable: Y
Method: Least Squares
Date: 05/05/14 Time: 09:38
Sample: 1 42
Included observations: 42 Variable Coefficient Std. Error t-Statistic Prob. C 987.5484 61.81065 15.97699 0.0000
X1 0.001372 0.019522 0.070266 0.9443
X2 0.002140 0.003494 0.612390 0.5438 R-squared 0.010918 Mean dependent var 1022.595
Adjusted R-squared -0.039804 S.D. dependent var 115.3248
S.E. of regression 117.5976 Akaike info criterion 12.44116
Sum squared resid 539338.4 Schwarz criterion 12.56528
Log likelihood -258.2644 Hannan-Quinn criter. 12.48666
F-statistic 0.215260 Durbin-Watson stat 1.964868
Prob(F-statistic) 0.807283
C variabila depedent ( salariul mediu nominal net lunar)
X1 variabila independenta 1 numrul mediu al salariailor
X2 variabila independenta 2 numrul omerilor
987.5484 termenul liber care nu este semnificativ 0
0,001372 coeficientul parametrului 1
0,002140 coeficientul parametrului 2
51
III. Problema C
Folosind datele Problemei A, s se testeze dac dispersiile (variaiile) celor dou populaii (variabila exogen i variabila endogen) sunt egale; testai dac mediile celor dou populaii sunt egale. Rezolvarea problemei C de exemplificat n Excel, cu interpretarea rezultatelor i parcurgerea etapelor testrii ipotezelor statistice.
1. Testarea ipotezei privind diferena dintre 2 medii pentru
eantioane de volum mare
Testul bilateral:
0: 1 = 2(1 2 = )
1: 1 2(1 2 )
=12 (12)
2
1+
2
2
Valoarea testului z este -8.2224731005958. Fiind un test bilateral, valoarea critic este
-1.95996398454 => c < => se respinge H0 i se accept H1, mediile nu sunt
diferite.
z-Test: Two Sample for Means
Salariul mediu nominal net lunar
din agricultur (RON)
Numrul mediu al salariailor din
agricultur (persoane)
Mean 1022.595238 2266.309524
Known Variance 13299.80778 947616.6092
Observations 42 42
Hypothesized Mean Difference 0
z -8.222473101
P(Z
52
1.1 Testarea ipotezei privind raportul dintre 2 dispersii
Test bilateral:
0: 12 = 2
2 = 1
1: 12 2
2 1
=1
2
22
Valoarea testului F este 0,014035009. Fiind un test bilateral, valoarea critic este 0,594656101
=> c Fcalc < Fcritic atunci cu o probabilitate de 95% se accept H0 i se respinge H1 deci
dispersiile sunt egale.
F-Test Two-Sample for Variances
Salariul mediu nominal net lunar
din agricultur (RON)
Numrul mediu al salariailor din
agricultur (persoane)
Mean 1022.595238 2266.309524
Variance 13299.80778 947616.6092
Observations 42 42
df 41 41
F 0.014035009
P(F
53
2. Testarea ipotezei privind diferena dintre 2 medii pentru eantioane
de volum mare
Testul bilateral:
0: 1 = 2(1 2 = )
1: 1 2(1 2 )
=12 (12)
2
1+
2
2
Valoarea testului z este -16,56304971. Fiind un test bilateral, valoarea critic este
-1.95996398454005 => c < => se respinge H0 i se accept H1, mediile nu sunt
diferite.
2.1 Testarea ipotezei privind raportul dintre 2 dispersii
Test bilateral:
0: 12 = 2
2 = 1
1: 12 2
2 1
=1
2
22
z-Test: Two Sample for Means
Salariul mediu nominal net lunar
din agricultur (RON)
Numrul omerilor
(persoane)
Mean 1022.595238 14927.61905
Known Variance 13299.80778 29588093.51
Observations 42 42
Hypothesized Mean Difference 0
z -16.56304971
P(Z
54
Valoarea testului F este 0,000449499. Fiind un test bilateral, valoarea critic este 0,594656101
=> c Fcalc < Fcritic atunci cu o probabilitate de 95% se accept H0 i se respinge H1 deci
dispersiile sunt egale.
F-Test Two-Sample for Variances
Salariul mediu nominal net lunar
din agricultur (RON)
Numrul omerilor
(persoane)
Mean 1022.595238 14927.61905
Variance 13299.80778 29588093.51
Observations 42 42
df 41 41
F 0.000449499
P(F