+ All Categories
Home > Documents > Curs+Econometrie Sumar+

Curs+Econometrie Sumar+

Date post: 15-Feb-2015
Category:
Upload: oana-stefy
View: 106 times
Download: 6 times
Share this document with a friend
35
Cuprins ELEMENTE DE ANALIZĂ DISPERSIONALĂ (ANOVA) ANALIZA DISPERSIONALĂ (ANOVA) Metoda analizei dispersionale (ANOVA) (“analiză de varianţă”) Analiza dispersională unifactorială Medii condiţionate Media generală Varianţa dintre grupe Varianţa din interiorul grupelor (varianţă reziduală) Varianţa totală dispersii corectate: Dispersia corectată factorială (sistematică) Dispersia corectată reziduală Testul F (Fisher) Modelul de analiză dispersională bifactorială REGRESIA LINIARĂ UNIFACTORIALĂ: INFERENŢA STATISTICĂ 1.Testarea semnificaţiei parametrilor modelului unifactorial liniar Testarea semnificaţiei parametrului “β” (panta dreptei) Testarea semnificaţiei lui β Testarea semnificaţiei lui α 2. Coeficientul de corelaţie: calcul, testarea semnificaţiei 3. Estimarea valorilor variabilei dependente 4. Exemplu – rezolvare în EXCEL MODELUL CLASIC DE REGRESIE MODELUL UNIFACTORIAL – definiţie, specificare, identificare MODELUL UNIFACTORIAL LINIAR din colectivitatea generală şi din eşantion Estimarea parametrilor modelului unifactorial liniar Ipotezele modelului unifactorial de regresie liniară Verificarea validităţii modelului unifactorial liniar Abaterea medie pătratică a erorilor în eşantion este: Caracterizarea econometrică a seriilor cronologice cu componentă sezonieră 1. Trendul (componenta de lunga durata) (ytT); 15 2. Componenta sezoniera (ytS); Componentele termenilor unei serii cronologice 3. Componenta ciclica (ytC) – este mai dificil de determinat; 4. Componenta reziduala, aleatoare (ytR). Modelul aditiv Modelul multiplicativ Indicii de sezonalitate Metoda mediilor mobile Determinarea componentei sezoniere în modelul aditiv 1
Transcript
Page 1: Curs+Econometrie Sumar+

CuprinsELEMENTE DE ANALIZĂ DISPERSIONALĂ (ANOVA)ANALIZA DISPERSIONALĂ (ANOVA)Metoda analizei dispersionale (ANOVA) (“analiză de varianţă”)Analiza dispersională unifactorialăMedii condiţionateMedia generalăVarianţa dintre grupeVarianţa din interiorul grupelor (varianţă reziduală)Varianţa totalădispersii corectate:Dispersia corectată factorială (sistematică)Dispersia corectată rezidualăTestul F (Fisher)Modelul de analiză dispersională bifactorială

REGRESIA LINIARĂ UNIFACTORIALĂ: INFERENŢA STATISTICĂ1.Testarea semnificaţiei parametrilor modelului unifactorial liniarTestarea semnificaţiei parametrului “β” (panta dreptei)Testarea semnificaţiei lui βTestarea semnificaţiei lui α2. Coeficientul de corelaţie: calcul, testarea semnificaţiei3. Estimarea valorilor variabilei dependente 4. Exemplu – rezolvare în EXCEL

MODELUL CLASIC DE REGRESIEMODELUL UNIFACTORIAL – definiţie, specificare, identificareMODELUL UNIFACTORIAL LINIAR din colectivitatea generală şi din eşantionEstimarea parametrilor modelului unifactorial liniarIpotezele modelului unifactorial de regresie liniarăVerificarea validităţii modelului unifactorial liniarAbaterea medie pătratică a erorilor în eşantion este:

Caracterizarea econometrică a seriilor cronologice cu componentă sezonieră1. Trendul (componenta de lunga durata) (ytT); 152. Componenta sezoniera (ytS);Componentele termenilor unei serii cronologice3. Componenta ciclica (ytC) – este mai dificil de determinat;4. Componenta reziduala, aleatoare (ytR).Modelul aditivModelul multiplicativIndicii de sezonalitateMetoda mediilor mobileDeterminarea componentei sezoniere în modelul aditiv

De aprofundat pg 17-21

1

Page 2: Curs+Econometrie Sumar+

ELEMENTE DE ANALIZĂ DISPERSIONALĂ (ANOVA)ANALIZA DISPERSIONALĂ (ANOVA)Metoda analizei dispersionale (ANOVA) (“analiză de varianţă”), este utilizată pentru a verifica gradul în care valorile reale, empirice ale unei caracteristici se abat de la valorile teoretice, determinate în general cu ajutorul mediilor sau al ecuaţiilor de regresie. Ea studiază efectul variabilei/variabilelor independente asupra celei dependente, altfel spus, măsura în care variaţia caracteristicii rezultative este dependentă sau nu de factorul (factorii) de grupare.

are la bază metoda grupării, prin ea separându-se influenţa factorilor esenţiali (determinanţi) de influenţa factorilor consideraţi întâmplători (aleatori) asupra caracteristicii “efect”.

în funcţie de numărul factorilor înregistraţi ce-şi exercită influenţa asupra caracteristicii rezultative (unul, doi sau mai mulţi), analiza dispersională se poate efectua după un model unifactorial, bifactorial sau multifactorial.

Pentru fiecare variantă/interval de variaţie a caracteristicii cauzale X, se înregistrează o distribuţie de valori ale variabilei efect Y, distribuţie pe care o putem caracteriza, de regulă, prin nivelul mediu. Dacă aceste medii ale variabilei Y, pe grupe după X sunt egale sau foarte puţin diferite, atunci se concluzionează că variabila independentă X nu influenţează variaţia variabilei dependente Y (vezi a)

Cu cât mediile lui Y pe grupe după X diferă mai mult unele de altele, cu atât X influenţează mai mult pe Y.Analiza dispersională unifactorialăIpoteza nulă susţine egalitatea între mediile grupelor din colectivitatea generală, alcătuite după variabila X:

Ipoteza alternativă susţine că cel puţin două medii ale grupelor nu sunt egale:

Se testează, deci, dacă diferentele intre mediile de grupă nu sunt prea mari pentru a fi puse doar pe seama întâmplării (a factorilor aleatori), iar dacă există cel puţin două medii semnificativ diferite, înseamnă că factorul de grupare X are o influenţă semnificativă asupra variabilei Y.Mediile grupelor din colectivitatea generală sunt aproximate prin mediile grupelor din eşantion ( , ),

Medii condiţionate (medii parţiale):

Media generală a eşantionului:

Varianţa dintre grupe (varianţă factorială, sistematică) arată influenţa factorului cauzal asupra variaţiei lui Y:

Varianţa din interiorul grupelor (varianţă reziduală) exprimă influenţa factorilor aleatori asupra lui Y:

2

Page 3: Curs+Econometrie Sumar+

Varianţa totală reflectă influenţa tuturor factorilor (sistematici – X şi reziduali) asupra lui Y:

Pentru a asigura comparabilitatea varianţelor, ele sunt raportate la numărul gradelor de libertate, obţinându-se Dispersii corectate:Dispersia corectată factorială (sistematică):Dispersia corectată reziduală:

Testul F (Fisher) este raportul între dispersia corectată sistematică şi cea reziduală:Presupuneri pentru aplicarea testului F:

cele “r” grupe din eşantion sunt extrase aleator din cele “r” grupe ale colectivităţii totale; Fiecare grupă din colectivitatea generală are o distribuţie normală, iar abaterile medii pătratice ale

acestora sunt egale:

Valoarea calculată a testului F se compară cu valoarea critică, corespunzătoare nivelului de semnificaţie α şi gradelor de libertate (r-1) şi (n-r): F α; r-1; n-r.Regula de decizie este:

Dacă Fcalc≤ F α; r-1; n-r , atunci se acceptă H0, deci mediile de grupă nu diferă semnificativ unele de altele, iar eventualele diferenţe ce pot apare pot fi puse pe seama întâmplării. În acest caz, variabila Y este independentă de factorul de grupare X şi analiza dispersională este punctul final al analizei.

Dacă Fcalc> F α; r-1; n-r , atunci se acceptă H1, deci între mediile de grupă există o diferenţă semnificativă, care nu poate fi pusă pe seama acţiunii factorilor aleatori. În acest caz, variabila Y depinde semnificativ de factorul de grupare X şi trebuie aplicate în continuare metodele de analiză a legăturilor dintre variabile.

3

Page 4: Curs+Econometrie Sumar+

Aplicaţie:Un producător de sucuri de mere a realizat un nou produs: concentrat lichid. Acest produs are câteva avantaje faţă de vechiul produs, printre care:

Este mai practic (uşor) de utilizat; Are o calitate cel puţin la fel de bună ca şi a vechiului produs; Preţul noului produs este semnificativ mai mic decât al vechiului produs.

Pentru a decide care este cea mai bună strategie de marketing, directorul acestui departament a dispus realizarea unui studiu în 3 oraşe:

În oraşul A, campania de publicitate s-a axat pe uşurinţa folosirii noului produs; În oraşul B, campania de publicitate s-a axat pe calitatea net superioară a noului produs; În oraşul C, campania de publicitate s-a axat pe preţul inferior al noului produs.

În toate cele 3 oraşe, s-au înregistrat vânzările săptămânale, în mai multe săptămâni consecutive.Directorul de marketing ar dori să ştie dacă există diferenţe semnificative între vânzările medii săptămânale din cele 3 oraşe (nivel de semnif. 5%)Aplicaţie:

Volumul mediu al vânzărilor pe fiecare strategie:

Volumul mediu al vânzărilor pe total:

Varianţele:

Dispersiile corectate:

Statistica F:

Cum rezultă că se respinge H0, se acceptă H1, deci cel puţin două medii diferă semnificativ. Aşadar, pentru o probabilitate de 95%, se poate afirma că tactica de marketing aleasă pentru promovare produsului a influenţat vânzările.

4

Page 5: Curs+Econometrie Sumar+

Analiza dispersională unifactorială

Formulele devin:

Modelul de analiză dispersională bifactorială se identifică doi factori de influenţă, iar variabilitatea caracteristicii rezultative poate să fie pusă:

pe seama influenţei primului factor; pe seama influenţei celui de-al doilea factor; pe seama interacţiunii celor doi factori; pe seama întâmplării (factorului rezidual).

Concluzii modelele de analiză dispersională nu explică relaţia dintre variabile verifică doar măsura în care valorile reale ale unei caracteristici se abat de la valorile teoretice,

precum şi măsura în care aceste variaţii sunt sau nu dependente de factorul/factorii de grupare. metoda analizei dispersionale poate fi utilizată atât înaintea, cât şi după aplicarea metodelor

corelaţiei şi regresiei statistice. Testul F se poate utiliza şi pentru testarea validităţii modelului de regresie. în general, în analiza dispersională, nivelurile x1, x2, ..., xr sunt niveluri ale unei variabile

categoriale (numite şi tratamente), dar, cum ceea ce este valabil pentru o scală inferioară (nominală) este valabil şi pentru orice altă scală superioară (ordinală, de intervale, de rapoarte), analiza se poate extinde.

5

Page 6: Curs+Econometrie Sumar+

REGRESIA LINIARĂ UNIFACTORIALĂ: INFERENŢA STATISTICĂ1. Testarea semnificaţiei şi estimarea pe interval de încredere a parametrilor a şi b.2. Calculul şi testarea semnificaţiei coeficientului de corelaţie. 3. Estimarea valorilor variabilei dependente.4. Exemplu – rezolvare şi interpretare în EXCEL.

1.Testarea semnificaţiei parametrilor modelului unifactorial liniarEstimatorii “a” şi “b” ai coeficienţilor din ecuaţia de regresie în colectivitatea generală au distribuţii de eşantionare, cu următoarele proprietăţi:

“a” şi “b” sunt estimatori nedeplasaţi ai parametrilor “α” şi “β”, adică: Distribuţiile de eşantionare ale estimatorilor “a” şi “b” sunt normal distribuite, cu mediile “α” şi “β” şi dispersiile: şi

Testarea semnificaţiei parametrului “β” (panta dreptei)Ipotezele statistice pestru testul bilateral:

H0: β = 0H1: β ≠ 0

Dacă eşantionul este de volum mare:Testul z:

Regiunea critică: dacă sau se respinge H0. Dacă eşantionul este de volum mic:

Testul t:

Reg. Critică: dacă sau se respinge H0.

Teste unilaterale:Test unilateral dreapta:

H0: β = 0H1: β > 0

Test unilateral stânga:H0: β = 0H1: β < 0

Regiunea critică:Pt. test unilat. dreapta:Pt. test unilat. stânga:

Intervalul de încredere pentru “β”:

Testarea semnificaţiei parametrului “α”Ipotezele statistice pestru testul bilateral:

H0: α = 0H1: α ≠ 0

Testul t:

Reg. Critică: dacă sau se respinge H0, deci α este semnificativ statistic.

Intervalul de incredere pentru parametrul α este:

6

Page 7: Curs+Econometrie Sumar+

Exemplu:Pentru exemplul anterior (nr. spoturi publicitare şi profit din vânzări), să se testeze semnificaţia parametrilor modelului de regresie liniară şi să se determine intervalele de încredere pentru aceştia.Rezultate obţinute anterior:

7

Page 8: Curs+Econometrie Sumar+

2. Coeficientul de corelaţie: calcul, testarea semnificaţieir poate fi folosit pentru a oferi o estimaţie pe interval de încredere a parametrului , coeficientul de corelaţie din colectivitatea generală.

sau, prin transformări elementare:

“b” se mai poate scrie:

Numărătorul lui “b” este:

Numitorul lui “b” este:

Deci “b” se mai poate scrie:

Din expresia coeficientului de corelaţie:

Rezultă deci că:

cu condiţia ca cele două variabile să aibă o distribuţie bivariată normală. Media estimatoare r este şi abaterea medie pătratică esteSemnificaţia coeficientului de corelaţie (r) poate fi testată utilizând testul t.

H0 : ρ = 0, cu ipoteza alternativă: H1 : ρ ¹ 0 în cazul testului bilateral şi ρ > 0 sau ρ < 0 în cazul testului unilateral dreapta, respectiv testul unilateral stânga.

Statistica t este:

Se observă că statistica t pentru testarea ipotezei H0 : ρ = 0 este identică, de fapt, cu testul t pentru testarea ipotezei H0 : b = 0, pornind de la relaţia: Ipoteza nulă se respinge dacă valoarea calculată tn2 ta/2,n2 pentru testul bilateral şi tcalc. >ta,n2 sau tcalc. < -ta,n2 pentru testul unilateral dreapta, respectiv, stânga.

8

Page 9: Curs+Econometrie Sumar+

Exemplu:H0: ρ = 0H1: ρ ≠ 0

3. Estimarea valorilor variabilei dependente Dacă presupunem că la unit. statistica i variabila independentă ia valoarea specificată Xn+1,i şi legătura liniară se menţine, atunci valoarea corespunzătoare a variabilei dependente la acea unitate (Yn+1,i) este:

Yn+1,i = a + bXn+1,i + en+1,i cu val. ajustata: Daca m (Xn+1,i) = Xn+1, atunci media tuturor valorilor Yn+1,i va fi:

m (Yn+1,i/X = Xn+1) = a + bXn+1.Ecuaţiile de mai sus sunt utilizate pentru estimarea mediei de răspuns şi pentru estimarea unui răspuns individual. Pentru amândouă estimaţiile putem obţine estimaţii punctuale sau pe intervale de încredere. Pentru a obţine estimaţii punctuale, folosim ecuaţia de regresie liniară în eşantion:

yi = a + bxi + ei ; şi atunci, înlocuind pe xi cu valoarea dată Xn+1, obţinem:

= a + b×xn+1.

Construirea intervalului de încredere pentru previzionare necesită cunoaşterea distribuţiei, mediei şi dispersiei pentru . Variabila urmează o distribuţie t cu (n – 2) grade de libertate. Dispersia asociată variabilei poate fi identificată în trei cazuri şi anume:

determinarea intervalului de încredere pentru media de răspuns, când xn+1 = Ştim că: dar

dacă xn+1 = , atunci iar estimatorul dispersiei pentru este:

Intervalul de încredere este, în acest caz:

determinarea intervalului de încredere pentru media de răspuns, când xn+1 ¹ . În acest caz:

iar estimatorul dispersiei pentru este:

9

Page 10: Curs+Econometrie Sumar+

Intervalul de încredere pentru media de răspuns este:

determinarea intervalului de încredere pentru un răspuns individual. În acest caz trebuie să determinăm dispersia diferenţei adică dispersia erorii de previzionare. Dispersia în eşantion este:

Intervalul de încredere este:

ExempluProprietarul unui minihotel dezvoltă o analiză statistică pentru determinarea cheltuielilor cu materialele de curăţenie (y) în funcţie de numărul camerelor ocupate (x). El determină ecuaţia de regresie pentru cheltuielile zilnice (pentru detergent, clor etc.) (zeci mii lei), pe baza datelor înregistrate pentru n=14 zile:

a) Proprietarul doreşte să estimeze cheltuielile pentru o zi în care are 6 camere ocupate;b) Proprietarul doreşte să estimeze cheltuielile medii pentru zilele în care are 6 camere ocupate.Dacă numărul camerelor ocupate este , atunci:

t0,025;12 = 2,179

a) Intervalul de încredere pentru cheltuielile unei zile în care sunt 6 camere ocupate este:

adică (22,89;43,11) garantat cu o probabilitate de 95%;b) Intervalul de încredere pentru media cheltuielilor zilnice în cazul în care au 6 camere ocupate este:

adică (26,87;39,13), garantat cu o probabilitate de 95%.4. Exemplu – rezolvare în EXCEL

Exemplu – rezolvare în EXCEL10

Page 11: Curs+Econometrie Sumar+

Rezolvare folosind EXCEL:Introduceţi datele pe două coloane. În celula A1 se scrie „Nr. spoturi“ iar în B1 „Profit“.Apăsaţi TOOLS/DATA ANALYSIS şi apoi REGRESSIONLa Input Y Range selectaţi B1:B8La Input X Range selectaţi A1:A8Daca doriti sa calculati valorile reziduale selectati Residuals.Apăsaţi OK

MODELUL CLASIC DE REGRESIEMODELUL UNIFACTORIAL – definiţie, specificare, identificareDefiniţie: o relaţie matematică construită pe baza teoriei economice, care presupune că fenomenul economic Y (fenomenul efect) este rezultatul acţiunii a două categorii de factori:

prima, constituită dintr-un singur factor principal, esenţial, determinant – X, a doua - formată din toţi ceilalţi factori – consideraţi neesenţiali, cu acţiune întâmplătoare (specificaţi prin

variabila reziduală “ε”) sau constantă, invariabilă, asupra lui Y (şi deci nu au sens a fi specificaţi în model).

Specificarea modelului unifactorial constă în precizarea variabilei endogene Y şi a celei exogene X, pe baza teoriei economice; ca orice ipoteză teoretică, ea poate fi adevărată sau falsă.

y = f(x) + ε

11

Page 12: Curs+Econometrie Sumar+

Identificarea modelului constă în alegerea unei funcţii (sau a unui grup de funcţii) matematice, cu ajutorul căreia se urmăreşte să se descrie valorile variabilei endogene, doar în funcţie de variaţia variabilei exogene X. Identificarea modelului se poate face prin: • procedeul grafic; • procedeul conservării ariilor; • procedeul calculelor algebrice.

Keynes: C=f(x)Suma cheltuită pentru consum depinde de:

mărimea venitului pe de o parte alte obiective în funcţie de circumstanţe (de exemplu investiţiile) alte nevoi subiective

Legea psihologică fundamentală: „o persoană este dispusă de regulă şi în medie să îşi crească consumul pe măsura creşterii venitului dar nu în aceeaşi măsură”Presupunerea cea mai simplă: C=a+bX, 0<b<1 este o relaţie deterministă neadecvată.În model trebuie inclus şi factorul aleator:

C=f(X,e)Modelul cel mai simplu:

C=a+bX+ey=a+bxy=a+bz, z=exy=a+br, r=1/xy=a+bq, q=ln(x)

Sau y=αxb Þ ln(y)=a+bln(x)

Forma generală: f(yi)= a+bg(xi)+ei

Contra exemplu: nu poate fi transformat în model liniar.MODELUL UNIFACTORIAL LINIAR din colectivitatea generală şi din eşantionModelul probabilistic la nivelul colectivităţii generale:

unde (xi,yi) reprezintă valorile numerice ale variabilelor cauză şi efect înregistrate la nivelul unităţii statistice „i”;α, β = parametri constanţiα = punctul de intersecţie al dreptei de regresie cu axa Oy;β = panta dreptei, se mai numeşte şi „coeficient de regresie” şi arată cu câte unităţi de măsură se modifică Y dacă X se modifică cu o unitate de măsură;εi = componenta reziduală (eroare aleatoare) pentru unitatea statistică „i”.

Valoarea reală yi a caracteristicii Y din modelul probabilistic cuprinde:- componenta teoretică, deterministă ( ), adică partea din valoarea reală yi care se poate determina pe baza modelului pentru o anumită valoare xi:

- componenta aleatoare (reziduală), numită şi eroarea aleatoare, (εi), reprezentând acea parte din valoarea reală a lui Y care nu se poate cuantifica.

Dacă datele disponibile provin dintr-un eşantion, avem n perechi de observaţii reale: (x1,y1), (x2, y2), ... , (xn, yn), pe baza cărora se vor estima parametrii ecuaţiei, α şi β.Modelul de regresie în eşantion va fi:

unde: a = estimatorul parametrului α din colectiv. generală;b = estimatorul parametrului β din colectiv. generală;ei = valoarea reziduală pt. unitatea “i” în eşantion.

12

Page 13: Curs+Econometrie Sumar+

Estimarea parametrilor modelului unifactorial liniarEstimarea parametrilor modelului se poate face prin următoarele metode:

Metoda punctelor empirice Metoda punctelor medii Metoda celor mai mici pătrate Metoda celor mai mici pătrate generalizată Metoda verosimilităţii maxime cu informaţie limitată sau completă

Metoda celor mai mici pătrate presupune maximizarea similitudinii, a gradului de asemănare a valorilor teoretice cu valorile reale, deci minimizarea erorilor. Cum erorile se pot produce intr-un sens sau în altul faţă de valorile reale, ea presupune minimizarea sumei pătratelor reziduurilor:

Condiţiile de ordin 1 de minimizare a funcţiei sunt:

Aplicând metoda determinanţilor, se obţine:

Rămâne de verificat dacă este verificată condiţia de ordin 2, adică soluţia găsită este un punct de minim. Matricea derivatelor parţiale de ordin doi trebuie să fie pozitiv definită:

Deci matricea este pozitiv definita.“b” se mai poate scrie:

Numărătorul lui “b” este:

Numitorul lui “b” este:

Deci “b” se mai poate scrie:

13

Page 14: Curs+Econometrie Sumar+

Din expresia coeficientului de corelaţie:

Rezultă deci că:

Sistemul de ecuaţii normale are următoarele proprietăţi:

Variabila aleatoare are media 0

Principiul conservării informaţiilor

Dreapta de regresie trece prin punctul

Pentru obţinerea unor estimatori de calitate, se formulează următoarele presupuneri (ipoteze):

1. Valorile xi (fixate sau aleatoare) sunt statistic independente de variabila aleatoare εi .Dacă se acceptă că variabilele ε şi x sunt independente.

2. Variabilele aleatoare εi sunt statistic independente una de alta, adică (non-autocorelarea reziduurilor).

Dacă cov(εi, εj) ≠ 0, i ≠ j spunem că erorile sunt autocorelate.Ipotezele modelului unifactorial de regresie liniară

3. Valorile variabilei reziduale εi urmează o distribuţie normală, de medie zero ( ) şi dispersie constantă şi nenulă, pentru toate valorile Xi:

(homoscedasticitatea erorilor). Cu alte cuvinte, întrucât distribuţia variabilei reziduu este independentă de valorile variabilelor explicative, nici dispersia perturbaţiei nu diferă semnificativ în raport cu valorile Xi, ceea ce indică o stabilitate relativă a legăturii dintre variabila rezultativă şi variabilele factoriale.Verificarea validităţii modelului unifactorial liniar

Se poate realiza cu ajutorul analizei dispersionale (ANOVA) şi a testului Fisher (F).

Unde: este abaterea totală este abaterea neexplicată de model este abaterea explicată de model

În care:este varianţa totală a lui Y

este varianţa sistematică (explicată de model)

este varianţa reziduală (neexplicată de model)

14

Page 15: Curs+Econometrie Sumar+

Dispersia corectată totală:

Dispersia corectată sistematică:

Dispersia corectată reziduală:

Abaterea medie pătratică a erorilor în eşantion este:

unde k este numărul variabilelor independente (k=1).unde este un estimator nedeplasat al dispersiei reziduurilorse este util în compararea modelelor. Dacă avem la dispoziţie câteva modele dintre care trebuie să alegem, cel mai potrivit a fi utilizat este cel pentru care se este mai scăzut. se este un indicator important în determinarea intervalului de încredere pentru coeficientul de regresie β şi pentru intercepţia α.

Caracterizarea econometrică a seriilor cronologice cu componentă sezonierăComponentele termenilor unei serii cronologice sunt:

Trendul (componenta de lunga durata) (ytT); Componenta sezoniera (ytS); Componenta ciclica (ytC) – este mai dificil de determinat; Componenta reziduala, aleatoare (ytR).

1. TRENDUL reprezintă tendinţa generală, ce corespunde unei evoluţii sistematice, generale, fundamentale,

sesizabile pe perioade lungi de timp, generate de acţiunea unor factori de lungă durată. Este componenta principală a termenilor unei serii cronologice

2. COMPONENTA SEZONIERĂ Oscilaţiile sezoniere sunt fluctuaţii regulate, cu periodicitate constantă, care se repetă în cadrul

unei perioade complete de până la un anComponentele termenilor unei serii cronologiceSunt sesizabile când termenii seriei se referă la perioade mai mici decât anul (date trimestriale, lunare, zilnice, orare etc.)Apar sunt influenţa a două categorii de factori:

- factori naturali, climatici (prod. agricolă, vânzări de băuturi răcoritoare, de articole de îmbrăcăminte etc.)- factori sociali – tradiţii, obiceiuri, concedii (vânzările de rechizite şcolare, de ouă, de pomi de iarnă etc.)

3. COMPONENTA CICLICĂE formată din fluctuaţii regulate, manifestate pe termen mai lung, care devin complete pe parcursul câtorva ani.Sunt cauzate de două categorii de factori:

- naturali (oscilaţiile producţiei agricole, datorate ciclurilor meteo)- economico-sociali (ciclurile de afaceri, datorate modernizării aparatului de producţie, aprovizionarea cu

materii prime etc.)4. COMPONENTA ALEATOARE (REZIDUALĂ)Fluctuaţiile aleatoare apar sub forma unor abateri accidentale ale termenilor seriei de la linia de trend, sub influenţa unor factori imprevizibili, accidentali (greve, conflicte de muncă spontane, calamităţi naturale, războaie etc.)

uneori nu se identifică toate cele patru componente, atunci când analizăm o serie cronologică: Cel mai adesea, componenta ciclică nu se poate determina La unele serii, poate lipsi chiar trendul (serii staţionare)

15

Page 16: Curs+Econometrie Sumar+

Pentru a reconstitui termenii unei serii cronologice, cele 4 componente se pot combina după două modele:MODELUL ADITIV:

Se presupune că abaterile aleatoare se compensează reciproc, deci suma lor e zero, iar media componentei sezoniere este nulă.Modelul este recomandat a se folosi atunci când amplitudinea oscilaţiilor faţă de linia de trend este aproximativ constantă.Efectul sezonier se măsoară, în acest model, sub forma devierilor (abaterilor) sezoniere.Devierile sezoniere arata cu câte unitati de masura se abate, în medie, în fiecare sezon, nivelul variabilei analizate faţă de trend; iau valori pozitive şi negative, astfel încât suma devierilor sezoniere, pentru toate sezoanele, este egală cu zero.Componentele termenilor unei serii cronologiceMODELUL MULTIPLICATIV:În acest model, doar componenta de trend şi termenii reali au valori absolute, concrete, în timp ce componenta sezonieră şi cea aleatoare au valori relative (sunt rezultatele unor rapoarte).Media componentei aleatoare are valoarea neutră 1.Modelul este recomandat a se folosi atunci când amplitudinea oscilaţiilor faţă de linia de trend este crescătoare sau descrescătoare (oscilaţii amplificate sau atenuate).Efectul sezonier se măsoară, în acest model, sub forma indicilor de sezonalitate.Indicii de sezonalitate măsoară, în medie, de câte ori se abate nivelul variabilei, în fiecare sezon, de la trend; iau valori supraunitare sau subunitare, astfel încât produsul lor este egal cu 1Caracterizarea econometrică a seriilor cronologice cu componentă sezonierăDeterminarea componentei sezoniere se face prin eliminarea, din nivelul real al termenilor seriei, a celorlalte componente ale acesteia (trendul şi componenta aleatoare)Deci, înainte, trebuie identificat trendul, cu o metodă analitică sau, dintre metodele mecanice, cu metoda mediilor mobile.Metoda mediilor mobileEste utilizată cu deosebire atunci când seria cronologică prezintă fluctuaţii regulate (sezoniere sau ciclice), pentru a netezi evoluţia. Tendinţa pe termen lung se determină sub formă unor medii, calculate din atâţia termeni succesivi (m), la câţi se manifestă o oscilaţie completă. Mediile se numesc mobile, glisante, deoarece, în permanenţă, în calculul unei astfel de medii, se lasă în afară primul termen al mediei anterioare şi se introduce următorul termen.Dacă mediile mobile sunt calculate, spre exemplu, din cinci termeni, fiecare valoare ajustată va cuprinde termenul din perioada respectivă, cei doi termeni anteriori şi cei doi termeni următori.

În general, dacă mediile sunt calculate din m termeni (m, număr impar) se vor pierde, prin calculul mediilor mobile, (m-1) termeni; fiecare valoare ajustată va fi situată în dreptul unei valori înregistrate, deci mediile mobile astfel calculate vor constitui chiar valorile ajustate (de trend).Dacă, însă, mediile mobile se calculează din m termeni (m număr par), atunci valorile medii se situează între termenii reali şi vom centra nivelurile, astfel ajustate, prin calculul unor medii de medii. Spre exemplu, dacă o oscilaţie completă are loc la 6 termeni, atunci calculăm medii mobile centrate:

În acest caz se vor pierde, prin calculul mediilor centrate, m termeni.Avantaje ale metodei:

- Este flexibila, uşor de aplicat- Nu necesită îndeplinirea prealabilă a unor condiţii;

Dezavantaje ale metodei:- Se pierde informaţie (cu cât nr. de termeni din care se calculează media mobilă este mai mare, cu atât se

pierde mai multă informaţie)- Nu permite previzionarea fenomenului pe o perioadă viitoare

16

Page 17: Curs+Econometrie Sumar+

Exemplu:Numărul biletelor de odihnă într-o staţiune montană, vândute de o agenţie de voiaj, a cunoscut în perioada 2004-2006 următoarea evoluţie: Tabelul 1Anul Numar de bilete vandute in

trimestrul:I II III IV

2004 32 48 64 582005 40 52 74 662006 44 60 82 74

Se cere:a) Să se reprezinte grafic seria cronologică prezentat?b) Să se determine abaterile sezoniere şi coeficienţii sezonieri.c) Să se previzioneze vanzarile trimestriale de bilete pentru anul 2007.

Determinarea componentei sezoniere în modelul aditivPentru determinarea devierilor sezoniere se parcurg următorii paşi:

1. Se înlătură din valorile seriei cronologice (yt) componenta de trend (ytT). 2. Pentru fiecare sezon în parte, calculăm media diferenţelor obţinute la pasul 1.

17

Page 18: Curs+Econometrie Sumar+

În felul acesta (prin calculul mediei) se înlătură cea mai mare parte din variaţiile reziduale (deşi foarte rar le putem înlătura în întregime). Aceste medii ale diferenţelor, calculate pentru m sezoane, măsoară abaterile fenomenului, faţă de linia de tendinţă, date de componenta sezonieră (devieri sezoniere brute).

3. Se determina media devierilor sezoniere obtinute la pasul 2.4. Se corecteaza (prin scadere) devierile sezoniere brute cu media lor, obtinandu-se devierile sezoniere

corectate ( a caror suma este egală cu zero).

Intepretare: In trimestrul I, factorul sezonier a determinat o scadere medie a numarului de bilete vandute cu 16

bucati, fata de linia de trend; In trimestrul II, factorul sezonier a determinat o scadere medie a numarului de bilete vandute cu 4

bucati, fata de linia de trend; In trimestrul III, factorul sezonier a determinat o crestere medie a numarului de bilete vandute cu 14

bucati, fata de linia de trend; In trimestrul IV, factorul sezonier a determinat o crestere medie a numarului de bilete vandute cu 6

bucati, fata de linia de trend;Previzionarea fenomenelor afectate de sezonalitate – model aditivSe desezonalizeaza seria cronologică scazand din termenii reali ai seriei devierile sezoniere (yt – ytS). Rezultatele astfel obţinute vor conţine doar componenta de trend (ytT) şi componenta reziduală (ytR).

yt – ytS = ytT + ytR Pentru seria desezonalizata se determina trendul aplicând o metodă mecanică ori analitică. Se prelungeste trendul, determinandu-se valoarea previzionata a trendului pentru perioada viitoare ( )

Se adună valorile previzionate ale trendului pe sezoane cu devierile sezoniere (ytS) pentru a obţine previziunea finală:

18

Page 19: Curs+Econometrie Sumar+

Tabelul nr. 4Previzionarea vanzarilor trimestriale de bilete

Anul Trimestrul p ytS Previziune

0 1 2 3 4 52007

IIIIIIIV

1234

67,8+1,8=69,669,6+1,8=71,471,4+1,8=73,273,2+1,8=75,0

-16-4146

69,6-16=53,671,4-4=67,473,2+14=87,275,0+6=81,0

19

Page 20: Curs+Econometrie Sumar+

5./pg 224 O firmă ce organizează licitaţii pentru vânzarea unor antichităţi doreşte să determine relaţia dintre preţul obţinut pentru articolele licitate (u.m.) şi numărul de persoane ce participă la licitaţie. în ipoteza unui model de regresie liniară, rezultatele prelucrării în EXCEL sunt:

a) Să se interpreteze rezultatele din tabele.b) Determinaţi şi interpretaţi intervalele de încredere pentru parametrii modelului (tcritic = 2,896)

1/pg 221 In scopul evaluării impactului pe care variaţia preţului unui produs îl are asupra variaţiei cantităţilor vândute din acel produs a fost selectat un eşantion reprezentativ de 10 de magazine, în care s-au urmărit valorile următoarelor variabile:

- Q - cantitatea vândută din produsul respectiv (kg);- P - preţul produsului (RON).

A fost folosit pentru estimarea parametrilor următorul model, ale cărui rezultate sunt prezentate mai jos:Q = a + P - P + e .

a. Testaţi validitatea modelului de regresie, pentru un nivel de semnificaţie de5% (Ffr,„(.= 5.32).b. Testaţi, interpretaţi şi determinaţi intervalele de încredere pentru coeficienţii modelului (tcritic = 2,896)

Regression Statistics Pr 1/pg 221R Multiple R 0.860271 0.913173052R2 R Square 0.740066 0.833885023

Adjusted R Square 0.707575 0.813120651Se Standard Error 177.7908 10.73509502n Observations 10 10

ANOVA

Nr. gr. de libertate

Suma abaterilor

< 0,05

df SS MS F Significance F

Regression K 1

719973.5

719973.522.77708 0.0014

04

Residual n-K-1 8 252876.5 31609.56

Total n-1 9 972850

Coefficients Standard Error t Stat P-valueIntercept a 1086.691 Sa 174.4825 6.228079 0.000252

0.000252x100=0.0252100-0.0252=99.974

Mărimea audientei b 9.329102 Sb 1.954748 4.772534 0.0014040.001404x100=0.1404100-0.1404=99.859

df SS MS FRegression K 1 4628.0619 4628.0619 40.15Residual n-K-1 8 921.93 115.24Total n-1 9 5550 616.66

Coefficients Standard ErrorIntercept a -29.32363674 Sa 20.687667Preţ vânzare (mii $) b 0.068972606 Sb 0.0108839

20

Page 21: Curs+Econometrie Sumar+

Problemele vor fi:din testari de ipoteze, regresie (care include si un tabel in ANOVA), si serii cronologice (medii mobile, sezonalitate)

21


Recommended