Post on 03-Jul-2015
transcript
REGRESIA LINIARĂ MULTIPLĂ
TEMATICA C4-C5
1. Prezentarea modelului liniar multiplu
2. Estimarea parametrilor modelului liniar multiplu
3. Testarea parametrilor modelului liniar multiplu
4. Testarea modelului
5. Testarea influenţei marginale a unei variabile
6. Exemplu (I)
7. Estimarea indicatorilor de corelaţie
8. Testarea indicatorilor de corelaţie
9. Exemplu (II)
5. Testarea influenţei marginale a unei variabile independente asupra variabilei dependente
1. Formularea ipotezelorH0: variabila independentă nou introdusă în model nu are o
influenţă semnificativă asupra variaţiei variabilei aleatoareH1: variabila independentă nou introdusă în model are o
influenţă semnificativă asupra variaţiei variabilei aleatoare
2. Fixarea pragului de semnificaţie α=0,05
3. Alegerea statisticii test
4. Calcularea statisticii test
5. Criterii de decizie:
Dacă Fcalc≤ Fα, k-1, n-k => se acceptă H0 cu o probabilitate de 1-α.
Dacă Fcalc> F α, k-1, n-k => se respinge H0 cu un risc asumat α.
1ˆ1
ˆˆ2
22
−−⋅
−−=
new
new
new
oldnew
k
knF
ηηη
11 2
22
−−⋅
−−=
new
new
new
oldnew
k
kn
R
RRF
EXEMPLU I (1)Model Summary
.661a .436 .435 $12,833.540 .436 365.381 1 472 .000
.663b .439 .437 $12,815.280 .003 2.346 1 471 .126
Model1
2
R R SquareAdjustedR Square
Std. Error ofthe Estimate
R SquareChange F Change df1 df2 Sig. F Change
Change Statistics
Predictors: (Constant), Educational Level (years)a.
Predictors: (Constant), Educational Level (years), Months since Hireb.
Model Summary
.661a .436 .435 $12,833.540 .436 365.381 1 472 .000
.890b .792 .792 $7,796.524 .356 807.889 1 471 .000
Model1
2
R R SquareAdjustedR Square
Std. Error ofthe Estimate
R SquareChange F Change df1 df2 Sig. F Change
Change Statistics
Predictors: (Constant), Educational Level (years)a.
Predictors: (Constant), Educational Level (years), Beginning Salaryb.
Model Summary
.910a .828 .818 5.2961 .828 83.271 4 69 .000
.907b .822 .814 5.3542 -.006 2.544 1 69 .115
Model1
2
R R SquareAdjustedR Square
Std. Error ofthe Estimate
R SquareChange F Change df1 df2 Sig. F Change
Change Statistics
Predictors: (Constant), Average female life expectancy, People living in cities (%), Daily calorie intake, People who read (%)a.
Predictors: (Constant), Average female life expectancy, Daily calorie intake, People who read (%)b.
Model Summary
,910a ,829 ,807 285,65322 ,829 38,718 2 16 ,000Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
R SquareChange F Change df1 df2 Sig. F Change
Change Statistics
Predictors: (Constant), Nr. ani pregatire, Vechime in munca (ani)a.
ANOVAb
6318646 2 3159323,188 38,718 ,000a
1305564 16 81597,759
7624211 18
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Nr. ani pregatire, Vechime in munca (ani)a.
Dependent Variable: Salariul (RON)b. Coefficientsa
-545,101 224,894 -2,424 ,028
84,315 25,550 ,443 3,300 ,005
85,298 20,394 ,562 4,182 ,001
(Constant)
Vechime in munca (ani)
Nr. ani pregatire
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Salariul (RON)a.
EXEMPLU I (2)
7. Estimarea indicatorilor de corelaţie8. Testarea indicatorilor de corelaţie9. Exemplu (II)
Pentru un model de regresie liniară multiplă, pot fi determinati următorii coeficienţi: - coeficienţi de corelaţie simplă între variabila dependentă şi fiecare variabilă independentă (coeficienţi bivariaţi);- coeficienţi de corelaţie parţială;- coeficientul de corelaţie multiplă şi coeficientul de determinaţie multiplă.
TEMATICA
7. Estimarea indicatorilor de corelaţie (I)
Coeficienţi de corelaţie bivariată şi parţialăPentru un model liniar de forma:
există trei coeficienţi de corelaţie bivariată:ii22i110i xxy εβββ +++=
])(][)([ 2221
21
11
1 ∑ ∑∑ ∑∑∑∑
−−
−=
i iii
i iii
ii
ii
iii
yyynxxn
yxyxnr
])(][)([ 2222
22
22
2 ∑ ∑∑ ∑∑∑∑
−−
−=
i iii
i iii
ii
ii
iii
yyynxxn
yxyxnr
])(][)([ 22
22
21
21
2121
12 ∑ ∑∑ ∑∑∑∑
−−
−=
i iii
i iii
ii
ii
iii
xxnxxn
xxxxnr
7. Estimarea indicatorilor de corelaţie (II)
… şi trei coeficienţi de corelaţie parţială calculaţi cu ajutorul coeficienţilor de corelaţie bivariată:
Corelaţia parţială măsoară dependenţa dintre variabile prin excluderea succesivă a influenţei celorlalţi factori, considerând influenţa lor constantă si menţinând numai influenţa factorului măsurat.
În funcţie de numărul variabilelor a căror influenţă se elimină din calcul, coeficienţii de corelaţie parţială pot fi de ordinul întâi (pentru o variabilă eliminată), de ordinul doi (pentru două variabile) etc.
)1)(1( 212
22
12212.1
rr
rrrr
y
yyy
−−
−=
)1)(1( 212
21
12121.2
rr
rrrr
y
yyy
−−
−=
)1)(1( 22
21
2112.12
yy
yyy
rr
rrrr
−−
−=
7. Estimarea indicatorilor de corelaţie (III)
Raportul de determinaţie multiplă şi raportul de corelaţie multiplă
Parametri
=>
Estimatori
=>
Estimaţiile
=>
T
R
T
E
ii
ix
V
V
V
V
yy
yyi
−==−
−=
∑∑
1)(
)(
2
2
2η 2ηη =
∑∑
−−=−==
ii
ii
T
R
T
E
yyV
V
V
V2
2
2
)(1
ˆ
ˆ1
ˆ
ˆˆ
εη 2ˆˆ ηη =
∑∑
−−=−==
ii
ii
yy
e
TSS
RSS
TSS
ESSR
2
2
2
)(11 2RR =
7. Estimarea indicatorilor de corelaţie (IV)
Coeficientul de corelaţie multiplă
Coeficientul de corelaţie multiplă se calculează numai pentru modelele multiple liniare şi se exprimă cu ajutorul coeficienţilor de corelaţie simplă dintre variabilele perechi.
Astfel, în cazul corelaţiei dintre o variabilă rezultativă Y şi două variabile independente , ,la nivelul unui eşantion, coeficientul de corelaţie multiplă, notat cu r, se calculează după relaţia:
1X 2X
2.122
221.2
21
212
12
122122
21 )1()1(
1
2yyyyyy
yyyy rrrrrrrrr
rrrrrr −+=⇔−+=⇔
−−+
=
8. Testarea indicatorilor de corelaţie
Raportul de determinaţie si raportul de corelatie se testează cu testul F după algoritmul prezentat la modelul liniar simplu, ţinând cont de faptul că k=p+1 reprezintă numărul parametrilor din noul model.
Coeficienţii de corelaţie se testează cu ajutorul testului t . după algoritmul prezentat la modelul liniar simplu, ţinând cont de faptul că k=p+1 reprezintă numărul parametrilor din noul model.
Exemplu 1 -
Coefficientsa
-545,101 224,894 -2,424 ,028
84,315 25,550 ,443 3,300 ,005 ,801 ,636 ,341
85,298 20,394 ,562 4,182 ,001 ,844 ,723 ,433
(Constant)
Vechime in munca (ani)
Nr. ani pregatire
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig. Zero-order Partial Part
Correlations
Dependent Variable: Salariul (RON)a.
ANOVAb
6318646 2 3159323,188 38,718 ,000a
1305564 16 81597,759
7624211 18
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Nr. ani pregatire, Vechime in munca (ani)a.
Dependent Variable: Salariul (RON)b.
Model Summary
,910a ,829 ,807 285,65322Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Nr. ani pregatire, Vechime inmunca (ani)
a.
Exemplu II (1)
În studiul legăturii dintre valoarea vânzărilor unei firme (Y) şi cheltuielile de publicitate (X1), cheltuielile ocazionate de diferite promoţii (X2) şi vânzările anuale realizate de principalul concurent (X3), s-au obţinut următoarele rezultate:
Model Summaryb
,913a ,833 ,787 17,60029 1,879Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Durbin-Watson
Predictors: (Constant), X3, X1, X2a.
Dependent Variable: Yb.
EXEMPLU II (2)
Coefficientsa
65,705 27,731 2,369 ,037
48,979 10,658 ,581 4,596 ,001
59,654 23,625 ,359 2,525 ,028
-1,838 ,814 -,324 -2,258 ,045
(Constant)
X1
X2
X3
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Ya.
ANOVAb
16997,537 3 5665,846 18,290 ,000a
3407,473 11 309,770
20405,009 14
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), X3, X1, X2a.
Dependent Variable: Yb.
ANEXE
Funcţia de consum- cererea sau consumul populaţiei pentru o anumită categorie
de mărfuri este o funcţie de venit: Ci=a+βVi+εi.
unde parametrul β arată de câte ori creşte consumul unui anumit produs (Ci) la o creştere cu o unitate a venitului. Acesta este, de regulă, pozitiv.
Legea cererii- cererea populaţiei pentru o anumită categorie de mărfuri
este o funcţie de preţul acestor produse: Ci=a+βPi+εi.
unde parametrul β este de regulă negativ şi arată cu cât scade cererea la o creştere a preţului cu o unitate