Date post: | 14-Apr-2016 |
Category: |
Documents |
Upload: | mandrulita |
View: | 227 times |
Download: | 5 times |
Modelul de regresie linearăAspecte tehnice în SPSS
[1 - Regresia liniara simplă][2 - Regresia liniara multiplă]
Bibliografie recomandată Agresti & Finley, pp. 243-288 (Ch. 9). Rotariu et. al. (1999), pp. 176-184 Fox, J. 1991. Regression diagnostics, Sage
Întrebarea noastra este: Există diferenţe între venitul mediu al gospodăriei şi capitalul
cultural (total) al membrilor gospoăriei
Întrebarile din BOP 2004 oct care operationalizează conceptele sunt:
(a) capitalul cultural (total) al membrilor gospodăriei
(b) venitul gospodăriei per membru: vengos = pven / nmemVEN. În luna trecută (septembrie), suma totală de bani obţinută de către toţi membrii gospodăriei dvs. incluzând salarii, dividende, chirii, vânzări etc., a fost cam de …
0. nici un venit 98. NŞ 99. NR milioane lei
[1 - Regresia liniara simplă] Ipoteza
BOOK. Aproximativ câte cărţi (în afara manualelor şcolare) aveţi în gospodărie? |__|__|__|__|
NRMEM. Din câţi membri este alcătuită gospodăria dvs.? (inclusiv respondentul)NU ÎNREGISTRA PERSOANELE CARE NU AU FOST PREZENTE ÎN GOSPODĂRIE ÎN ULTIMELE 6 LUNI!
venitul gospodăriei per membru: vengos = pven / nmem
Înainte de a face aste operaţii mai întâi trebuie inspectate frecvenţele acesor variabile pentru a observa dacă există sau nu un număr mare de valori lispă sau non-răspunsuri.
Cum calculăm venitul gospodăriei per membru?
Cum se obţine un model de regresie simplă? 1. reprezentarea vizuală: cum?
Cum se obţine un model de regresie simplă? 1. reprezentarea vizuală: cum?
Dublu click
Cum se obţine un model de regresie simplă? 1. reprezentarea vizuală: rezultate
Cum se obţine un model de regresie simplă? 2. statistici: cum?
Cum se obţine un model de regresie simplă? 2. statistici: rezultate
Modelul de regresie lineară obţinut: r = 0.415 r2 = 0.172
Ecuaţia nestandardizată:VenGosp = 1,245 + 0,007*Book
Ecuaţia standardizată:VenGosp = ,415*Book
Model Summary
.415a .172 .172 1.36540Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Aproximativ câte cãrþi (în afaramanualelor ºcolare) aveþi în gospodãrie?
a.
Coefficientsa
1.641 .046 35.974 .000
.007 .000 .415 16.958 .000
(Constant)Aproximativ câte cãrþi (înafara manualelor ºcolare)aveþi în gospodãrie?
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Venitul gospodariei per membrua.
Cum se obţine un model de regresie simplă? 2. statistici: interpretare
Interpretare r Intensitatea medie a legăturii dintre venitul gospodăriei per membru şi numprul de cărţi în gopsodărie
este de 0,415 (pe o scală de la -1 la 1, unde zero indică lispa unei legături).
Interpretare r2
Dacă utilizăm ecuaţia lineară de predicţie VenGosp = 1,245 + 0,007*Book pentru a estima venitul mediul al gospodăriei per membru comitem cu 17,2% mai puţine erori decât dacă am estima acest venit pe baza mediei sale.
Interpretarea coeficientului b Venitul gospodăriei per membru de familie creşte în medie cu 0,007 milioane de lei vechi = 7000 de lei
vechi cu fiecare carte în plus în biblioteca (admiţând că între cele două variabile există o dependeţă lineară).
Interpretarea coeficientului a cineva care nu are nici o carte în bibliotecă are în medie un venit al gospodăriei per membru de 1,245
milioane de lei = 1.245.000 lei vechi (admiţând că între cele două variabile există o dependeţă lineară).
Interpretarea coeficientului β La o creştere cu o abatere standard a variabilei BOOK îi corespunde o creştere de ,415 abateri
standard a variabilei VenGosp (admiţând că între cele două variabile există o dependeţă lineară)
Întrebarea noastra este: Care sunt factorii care pot explica numărul de cărţi al unei
gospodării (formă a capitalului cultrural obiectivat)? Posibili factori explicativi
(a) nivelul educaţiei subiectului / a capului de gospodărie (b) background familial: educaţia tatălui/educaţia mamei (c) Mediul de origine / mediul de rezidenţă (d) ocupaţie nonmanuală
Ipoteza: capitalul cultural obiectivat (book) este dependent de capitalul cultural institutionalizat al subiectului (educatia
subiectului), capitalul cultural moştenit (educatia tatălui, mediu de origine), tipul de ocupatie: orientat spre manipulari simbolice a obiectelor
sau manuale (ocupaţia nonmanuală) şi rezidenţa urbană
[2- Regresia liniara multiplă] Ipoteză
Model de regresie simplă Educatie -> Book
ANOVAb
6286373 1 6286373.023 406.320 .000a
25620765 1656 15471.47731907138 1657
RegressionResidualTotal
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Subiect - Numar ani scoalaa.
Dependent Variable: Aproximativ câte cãrþi (în afara manualelor ºcolare) aveþi îngospodãrie?
b.
Coefficientsa
-76.700 8.950 -8.570 .000
16.919 .839 .444 20.157 .000
(Constant)Subiect - Numarani scoala
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Aproximativ câte cãrþi (în afara manualelor ºcolare) aveþi îngospodãrie?
a.
Model Summary
.444a .197 .197 124.384Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Subiect - Numar ani scoalaa.
Este un test de seminificaţie pornind de la raţiuni inferenţiale: tabelul ne indică în ce măsură modelul poate fi generalizat la întreaga populaţie.Sig. <=0.05, prin urmare modelul este generaliyabil
Principala statistică oferită de tabel este cea care evaluează puterea modelului: ce procent din varianţa variabilei dependente este explicată de modelul de regresie. R2=0.197, adică 19,7% din varianţă.
Tabelul ne oferă informaţiile necesare pentru a construi dreapta de regresie.
Y* = -76.700+16.919XSau standardizat
Y* = .444*X
Cum se obţine un model de regresie simplă? Statistici: interpretare
Interpretare R Intensitatea medie a legăturii dintre educaţia subiectului şi numărul de cărţi în gopsodărie este de
0,444 (pe o scală de la -1 la 1, unde zero indică lispa unei legături).
Interpretare R2
Dacă utilizăm ecuaţia lineară de predicţie Book = -76,700 + 16,919*Educaţie pentru a estima numărul mediul de cărţi a gospodăriei comitem cu 19,7% mai puţine erori decât dacă am estima numărul de cărţi pe baza mediei acestei variabile.
Interpretarea coeficientului b Numărul de căriţi în gospodăriei creşte în medie cu 16,919 exemplare cu fiecare an în plus de
şcoală (admiţând că între cele două variabile există o dependenţă lineară).
Interpretarea coeficientului a cineva care nu are nici un an de şcoală are în medie în gospodăriei -76,700 exemplare (admiţând
că între cele două variabile există o dependenţă lineară) [ceea ce este absurd!!]
Interpretarea coeficientului β La o creştere cu o abatere standard a variabilei Educaţie îi corespunde o creştere de ,444 abateri
standard a variabilei Book (admiţând că între cele două variabile există o dependenţă lineară)
Model Summary
.473a .223 .222 122.366Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Tata -Numar ani scoala,Subiect - Numar ani scoala
a.
ANOVAb
7126021 2 3563010.445 237.955 .000a
24781118 1655 14973.48531907138 1657
RegressionResidualTotal
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Tata -Numar ani scoala, Subiect - Numar ani scoalaa.
Dependent Variable: Aproximativ câte cãrþi (în afara manualelor ºcolare) aveþi îngospodãrie?
b.
Coefficientsa
-76.432 8.805 -8.681 .000
12.906 .984 .339 13.112 .000
6.176 .825 .193 7.488 .000
(Constant)Subiect - Numar aniscoalaTata -Numar ani scoala
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Aproximativ câte cãrþi (în afara manualelor ºcolare) aveþi în gospodãrie?a.
Model de regresie multiplă: Educatie + EducTata -> Book
Modelul este generalizabil de la eşantion la populaţie
Prin introducerea unei noi variabile: EducatieTata procentul variaţiei explicate este 22,3%, adică o creştere de la 19,7% din varianţă din modelul anterior.
Dreapta de regresie nestand. Y* = -76.700+12.906X1+ 6,176X2
Sau standardizatY* = .339*X1+193X2
Observaţie: R2 a crescut, iar coeficientul b şi β asociat educaţiei a scăzut
Cum se obţine un model de regresie simplă? Statistici: interpretare
Interpretare R Intensitatea medie a legăturii dintre educaţia subiectului, educaţia tatălui şi numărul de cărţi în
gopsodărie este de 0,473 (pe o scală de la -1 la 1, unde zero indică lispa unei legături).
Interpretare R2
Dacă utilizăm ecuaţia lineară de predicţie Book = -76,700 + 12.906*Educaţie + 6,176*EducTata pentru a estima numărul mediul de cărţi a gospodăriei comitem cu 22,3% mai puţine erori decât dacă am estima numărul de cărţi pe baza mediei.
Interpretarea coeficientului b Numărul de căriţi în gospodăriei creşte în medie cu 12,906 exemplare cu fiecare an în plus de
şcoală pentru subieţii a căror tată au acelşi număr de ani de şcoală (admiţând că între cele două variabile există o dependeţă lineară).
Interpretarea coeficientului a cineva care nu are nici un an de şcoală şi nici tatăl subiecului nu are nici un an de şcoală atunci
are în medie în gospodăriei -76,700 exemplare (admiţând că între cele două variabile există o dependeţă lineară) [ceea ce este absurd!!]
Interpretarea coeficientului β La o creştere cu o abatere standard a variabilei Educaţie, pentru subiecţii a căror tată au acelaşi
număr de ani de şcoală, îi corespunde o creştere de ,444 abateri standard a variabilei Book (admiţând că între cele două variabile există o dependenţă lineară)
Cum se obţine un model de regresie simplă? Metoda celor mai mici pătrate (distanţă faţă de un plan
Efectul acestui tip de estimare a dreptei de regresie este acela că fiecare variabilă va aduce în model numai efectul său unic, şi nu si cel mediat. Prin urmare:-Va creşte varianţa totală explicată-Va scădea mărimea coeficientului b