+ All Categories
Home > Documents > Tema 3_ Modele de Regresie Simplă

Tema 3_ Modele de Regresie Simplă

Date post: 09-Mar-2016
Category:
Upload: alina-podgornii
View: 52 times
Download: 0 times
Share this document with a friend
Description:
Regresia simpla

of 48

Transcript
  • Conf.univ., dr. RUSU Viorica

  • Specificarea unui model de regresie simpl

    Definirea modelului de regresie simpl

    Identificarea modelului de regresie simpl

    Estimarea parametrilor unui model de regresie simpl

    Verificarea ipotezelor

    Ipoteze asupra unui model econometric (ipoteze stohastice)

    Verificarea semnificaiei estimatorilor parametrilor unuimodel econometric

    Verificarea semnificaiei modelului econometric

    Cuprins

  • Regresia liniar simpl este un caz particular al

    analizei de regresie ntr-un astfel de model variabiladependent ar fi explicat numai de o singurvariabil independent, iar factorii neeseniali suntexprimai sintetic prin variabila reziduu.

    Specificarea unui model de regresie simpl

  • Specificarea modelului de regresie pornete de la concepteleteoriei economice care definesc cadrul de analiz a fenomenelorluate n studiu.

    Spre exemplu n practica analizei economice modelul liniar deregresie are urmtoarele aplicaii: funcia de consum din modelul lui Keynes:

    =a+b*

    unde: consumul pentru un an

    venitul pentru aceeai perioad

    a,b parametrii modelului de regresie

    Specificarea unui model de regresie simpl

  • Relaia liniar ntre pregtirea profesional i venitul

    obinut;

    Legea cererii C=f(P) + cererea (C) a unui produs crete sau descrete sub influena preului (P);

    Legea ofertei O = f(P) + oferta (O) a unui produs crete sau descrete sub influena preului (P).

    Specificarea unui model de regresie simpl

  • Forma modelului de regresie liniar simpl este:

    Unde:

    Y variabila endogen;

    X variabila exogen;

    - variabila rezidual.

    Definirea modelului de regresie simpl

    Y = + +

  • Parametrii modelului de regresie simpl liniar, numii i coeficieni de regresie, sunt:

    - ordonata la origine - arat valoarea medie a variabilei Y cnd mrimea variabilei X este 0 ;

    - panta dreptei - arat variaia medie a variabilei dependente, Y, la o variaie absolut cu o unitate a variabilei X, adic variaia variabilei Y este proporional cu variaia variabilei X.

    Definirea modelului de regresie simpl

  • Const n alegerea unei funcii matematice care ardescrie cel mai bine valorile variabilei endogene y nfuncie de variaia variabilei exogene x.

    Funciile matematice sunt:

    Liniare

    Non-liniare

    Identificarea modelului de regresie simpl

  • Cel mai simplu procedeu de stabilire a funcieimatematice: procedeul grafic.

    Procedeul grafic const n construirea corelogrameidintre cele dou variabile. Axa OX va fi destinatvariabilei exogene, axa OY variabilei endogene.

    n funcie de forma graficului punctelor empirice sealege funcia matematic al crei grafic aproximeazcel mai bine graficul punctelor empirice.

    Identificarea modelului de regresie simpl

  • Spre exemplu:

  • De menionat, formele non-liniare (putere) se vor supune liniarizrii prin logaritmare!

  • Proprieti ale modelului de regresie liniar:

    simplitate

    capacitatea de aplicare direct pentru verificarea existenei unei relaii ntre variabile

    estimarea direct a parametrilor de regresie

  • Metoda celor mai mici ptrate (MCMMP):

    Dac forma general a modelului este definit de relaia: = + x +

    Estimarea parametrilor modelului de regresie se bazeaz pecriteriul minimizrii sumei ptratelor abaterilor ntre valorileobservate, yi , i valorile teoretice, :

    F(, ) = ( )2

    Condiia de minim a acestei funcii rezult din:

    Estimarea parametrilor unui model de regresie simpl

  • n cazul dreptei de regresie, = + , construit pe baza unui eantion observat, estimaiile i ale parametrilor i se pot calcula dup relaiile:

    =

    Estimarea parametrilor unui model de regresie simpl

  • b coeficient de regresie care prezint cu ct se

    modific caracteristica rezultativ dac caracteristicafactorial se modific cu o unitate.

    dac:

    b=0 , ntre x i y nu exist legtur;

    b>0, ntre x i y legtur direct proporional;

    b

  • Estimarea parametrilor prin interval de ncredere -

    se bazeaz pe distribuiile de selecie ale estimatorilor

    i ai parametrilor a i b.

    Pentru modelul liniar simplu, estimatorii parametrilor urmeaz o lege de distribuie normal i sunt nedeplasai:

    ) cu ) = a; )= ; =

    ~(, 2) cu () = b; ()=

    2; 2=

    1

    () 2

    2

    Estimarea parametrilor unui model de regresie simpl

  • Estimaii:

    pentru variana erorilor 2:

    - pentru variana estimatorului a i b variana estimatorului :

    = i =

    Estimarea parametrilor unui model de regresie simpl

  • Intervalul de ncredere

    Intervalul de ncredere pentru:

    coeficientul de regresie a este definit de relaia:

    = ( 2)

    coeficientul de regresie b este definit de relaia:

    = ( 2 )

    Estimarea parametrilor unui model de regresie simpl

  • Estimatorii obinui prin MCMMP sunt estimatori de maximverosimilitate dac pot fi acceptate urmtoarele ipoteze:

    Variabilele observate nu sunt afectate de erori de msurare;

    Liniaritatea modelului. Relaia ntre Y i X este liniar. Aceast ipotez este necesar pentru estimarea parametrilor modelului;

    Normalitatea erorilor. Variabila rezidual este distribuit normal: (0,

    2);

    Homoscedasticitatea. Varianele V() sunt constante, oricare ar fi valorile variabilei X, adic, = 2 ;

    Necorelarea erorilor. Erorile sunt necorelate ntre ele:

    , = 0;

    Independena erorilor de valorile variabilei X. Valorile variabilei sunt independente de valorile variabilei explicative X, adic , = 0.

    Ipoteze asupra unui model econometric (ipoteze stohastice)

  • se poate verifica regula celor trei sigma care const n verificarea urmtoarelor relaii:

    (+3 )

    (+3 )

    Variabilele observate nu sunt afectate de erori de

    msur dac:

  • Verificarea liniaritii se poate efectua grafic, folosind:diagrama reziduurilor din regresie.

    Diagrama reziduurilor din regresie se construiete lund peordonat variabila reziduu i pe abscis variabiladependent.

    Dac reziduurile apar dispersate aleator, de o parte i de altaa valorii zero, atunci relaia poate fi modelat cu ajutorulregresiei liniare. Dac reziduurile apar dispersate n blocurideasupra sau sub valoarea zero, atunci relaia dintrevariabilele considerate nu poate fi modelat cu ajutorulregresiei liniare.

    Testarea liniaritii modelului

  • Exemplu:

    Testarea liniaritii modelului

    Reziduu

    Variabila dependent

    Reziduu

    Variabila dependent

    ..................(a)........................................................................(b)Distribuia reziduurilor n cazul relaiei de tip liniar (a) i a relaiei de tip neliniar (b)

  • Ipoteza de normalitate a erorilor presupune c variabila

    urmeaz o lege normal de medie 0 i varian 2: ~(0,

    2);

    Importana: dac ~(0, 2 ), atunci estimatorii

    parametrilor modelului de regresie urmeaz, deasemenea, o lege normal: ~(,

    2) , ~(, 2) .

    Dac ipoteza de normalitate este nclcat, proprietileestimatorilor construii pe baza metodei celor mai miciptrate au doar proprieti asimptotice, adic necesiteantioane sau seturi mari de date!

    Testarea ipotezei de normalitate a erorilor

  • Testarea ipotezei de normalitate a erorilor se poate realiza cu ajutorul procedeelor grafice (histograma, diagrama reziduurilor) sau a procedeelor numerice (testul Jarque - Bera ).

    Testarea ipotezei de normalitate a erorilor

  • Histograma residurilor

    Testarea ipotezei de normalitate a erorilor

    0

    2

    4

    6

    8

    10

    12

    14

    16

    -80 -60 -40 -20 0 20 40 60 80

    Series: ResidualsSample 1960Q2 1999Q4Observations 159

    Mean 2.58e-13Median 1.151906Maximum 77.17157Minimum -85.90365Std. Dev. 28.59811Skewness -0.218962Kurtosis 3.470773

    Jarque-Bera 2.738806Probability 0.254259

  • Se tie c dac erorile urmeaz legea normal de medie zero i de abatere medie ptratic

    2 atunci are loc relaia:

    = 1

    ce va fi folosit pentru acceptarea ipotezei cercetate la nivelul de semnificaie .

    Testarea ipotezei de normalitate a erorilor

  • Testul Jarque-Bera

    Testul Jarque - Bera se calculeaz dup relaia:

    unde:

    , reprezint asimetria (skewness).

    S = 0 pentru o repartiie normal,

    S > 0 pentru o repartiie asimetric la dreapta,

    S < 0 pentru o repartiie asimetric la stnga;

    Testarea ipotezei de normalitate a erorilor

    22

    2 ~4

    )3(6

    KS

    nJB

    3

    2

    3

    S

  • reprezint boltirea, (kurtosis).

    K = 3 pentru o repartiie normal,

    K 3 pentru o repartiie afectat de boltire.

    Testarea ipotezei de normalitate a erorilor

    2

    2

    4

    K

  • Estimatorii pentru cei doi parametri sunt:

    respectiv

    unde

    Testarea ipotezei de normalitate a erorilor

    i

    i

    i

    i

    n

    nK

    2

    2

    4

    )2

    (

    2

    i

    i

    i

    i

    n

    nS

    3

    2

    2

    3

    )2

    (

    )2

    (

    iii yye

  • Din tabela chi-ptrat, se citete valoarea teoretic

    .

    Dac valoarea calculat a testului este mai mic dectvaloarea teoretic, se ia decizia de a accepta ipotezanul (de normalitate a erorilor), cu o probabilitate de0,95, i invers.

    Testarea ipotezei de normalitate a erorilor

    99,52 2;05,0

  • Asimetrie moderat i pozitiv SQRT(X)Asimetrie substanial i pozitiv LOG10(X)

    --------- atunci cnd scara include zero LOG10(X+C)

    Asimetrie sever i pozitiv 1/X

    --------- atunci cnd scara include un zero 1/(X+C)

    Asimetrie moderat i negativ SQRT(K-X)

    Asimetrie substanial i negativ LOG10(K-X)

    Asimetrie sever i negativ LOG10(K-X)

    C = constant adugat astfel nct scorul cel mai mic este 1

    K = constant din care este retras scorul astfel nct scorul cel mai mic este 1; n general egal cu scorul cel mai mare +1

    Tipuri de asimetrie i transformri ale variabilei pentru normalizarea distribuiei

  • Ipoteza de homoscedasticitate presupune c

    varianele sunt constante, oricare ar fi valorilevariabilei X, adic, .

    Pentru testarea ipotezei se utilizeaz :

    procedeul grafic;

    procedeul analitic.

    Testarea ipotezei de homoscedasticitate

    2)( V

  • Procedeul grafic - const n construirea corelogrameiprivind valorile variabilei factoriale x i ale variabileireziduale .

    Dac graficul punctelor empirice prezint o distribuie oscilant,se poate accepta ipoteza c cele dou variabile sunt independente i nu corelate.

    Testarea ipotezei de homoscedasticitate

  • Procedee analitice:

    Testul Goldfeld-Quandt

    Se aplic cnd se dispune de serii lungi de date.

    Paii:

    1. ordonarea cresctoare a observaiilor n funcie de variabilaexogen x;

    2. eliminarea a c observaii centrale, c fiind specificat a priori(se consider c c trebuie s reprezinte o treime sau un sfertdin numrul total de observaii);

    3. efectuarea de regresii aplicnd M.C.M.M.P. asupra celor dousubeantioane de dimensiune (n-c)/2 i calcularea sumeiptratelor erorilor pentru fiecare subeantion n parte;

    Testarea ipotezei de homoscedasticitate

  • 4. calcularea raportului dintre sumele ptratelor

    erorilor sau dispersiilor acestora, corespunztoarecelor dou subeantioane (suma ptratelor eroriloravnd valoarea cea mai mare fiind plasat lanumrtor):

    unde: u variabila rezidual pentru sub-modele definite;k numrul variabilelor exogene.

    Testarea ipotezei de homoscedasticitate

  • Presupunnd c erorile sunt normal distribuite,

    atunci raportul F* urmeaz o distribuie F cu

    1= 2=()

    2- + 1 grade de libertate.

    dac > ;

    2 +1 ;;

    2 +1

    , ipoteza de

    homoscedasticitate este infirmat, erorile suntheteroscedastice;

    dac < ;

    2 +1 ;;

    2 +1

    , ipoteza de

    homoscedasticitate este acceptat.

    Testarea ipotezei de homoscedasticitate

  • Ipoteza de necorelare a erorilor:

    presupune lipsa unei corelaii ntre termenii variabilei eroare din modelul de (eroarea asociat unei valori a variabilei dependente nu este influenat de eroarea asociat altei valori a variabilei dependente).

    Pentru testarea acestei ipoteze se pot utiliza: testul Durbin Watson.

    Testarea ipotezei de autocorelare a erorilor

    0),cov( ji

  • Testul Durbin Watson (DW)

    H0: = 0 (nu exist autocorelare a erorilor);

    H1: 0 (ipoteza este nclcat, exist o legtur ntre erori).

    n cazul existenei fenomenului de autocorelare a erorilor se presupune c ntre erori exist o relaie de tipul: ,

    cu

    Statistica test:

    Testarea ipotezei de autocorelare a erorilor

    iii u 1

    ),0(~ 2ui Nu

    n

    i

    i

    n

    i

    ii

    e

    ee

    DW

    1

    2

    2

    2

    1 )(

  • Valoarea calculat a testului DW se compar cu dL(limita inferioar) i dU (limita superioar), citite dintabelul Durbin Watson la pragului de semnificaie i volumul eantionului n.

    Testarea ipotezei de autocorelare a erorilor

  • Decizia se ia n funcie de urmtoarele regiuni:

    - regiune de respingere:

    >0 erorile nregistreaz o autocorelare pozitiv;

  • Testul Durbin-Watson se recomand pentru eantioanede volum mare n15 i este folosit n mod curentpentru analiza seriilor de timp.

    Testarea ipotezei de autocorelare a erorilor

  • Testarea parametrilor unui model de regresie se realizeaz cuajutorul testului t Student.

    Formularea ipotezelor:

    Estimatorii sunt semnificativ diferii de zero, cu un prag de semnificaie , dac se verific urmtoarele relaii:

    =

    > , =

    > ,

    = 2 (. ),

    Testarea semnificaiei estimatorilor parametrilor modelului de regresie

    0:

    0:

    1

    0

    aH

    aH

    0:

    0:

    1

    0

    bH

    bH

    05,0

  • Cnd modelarea econometric este realizat cusuportul softurilor specializate ) decizia poate fi luat in baza valorii Sig., astfel:

    Sig. > : se accept ipoteza H0,

    Sig. < : se respinge ipoteza H0, cu o probabilitate de95%.

    Testarea semnificaiei estimatorilor parametrilor modelului de regresie

  • Evaluarea global a modelului de regresie se realizeaz n bazaraportului de corelaie i presupune folosirea statisticii test FFisher.Statistica test F:

    urmeaz o lege de distribuie Fisher,unde:

    - reprezint estimaia varianei explicat prin model;

    reprezint estimaia varianei neexplicat, variana rezidual:

    este raportul de determinare, iar reprezint raportul de nedeterminare.

    Verificarea semnificaiei modelului econometric

    111 2

    2

    2

    2

    k

    kn

    R

    R

    k

    kn

    V

    V

    S

    SF

    R

    E

    rez

    reg

    2

    regS

    2

    rezS

    2R21 R

  • Elementele de calcul i valoarea raportului F se potobine facil cu ajutorul programelor statistice,rezultatele fiind prezentate n Tabelul ANOVA, ianume:

    estimaiile celor dou componente ale variaiei,

    gradele de libertate corespunztoare,

    estimaiile varianelor, explicat i rezidual,

    valoarea calculat a raportului Fisher i

    semnificaia testului, Sig.

    Verificarea semnificaiei modelului econometric

  • Valoarea teoretic a testului F se citete din tabelul Fisher, i

    anume ,1,2 ,

    unde 1=k 1 i 2=n k grade de libertate i un nivel de semnificaie .

    Decizia. Dac F ,1,2, se respinge 0 i se trage concluzia cntre variabilele cercetate exist o legtur semnificativ, deci modeluleste corect specificat (valid), cu un risc acceptat de 5%.

    Sau n baza nivelului Sig. :

    dac valoarea Sig. corespunztoare statisticii F este mic (maimic dect 0,01), atunci variabila independent explic variaiavariabilei dependente i invers, deci relaia liniar dintre cele douvariabile considerate este semnificativ .

    Verificarea semnificaiei modelului econometric


Recommended