+ All Categories

Download - Statistic A

Transcript
Page 1: Statistic A

Gheorghe SĂVOIU

STATISTICĂ ECONOMICĂ

CURS PENTRU STUDENŢII PROGRAMULUI FRECVENŢĂ REDUSĂ

Editura Universităţii din Piteşti 2011

Page 2: Statistic A

Cursul de Statistică economică este destinat studenţilor Facultăţii de ştiinţe economice din Piteşti, forma de învăţământ frecvenţă redusă (FR)

Specializarea

Numărul de credite -7 puncte credit Numărul de ore de studiu individual-50 Forma de finalizare - examen Numărul de ore de pregătire tutorială-42

Ponderea notei la examen 50 Structura notei Ponderea notei la - teme de control

teste tematice 30 20

Obiectivele cursului Statistica economică reprezintă pentru învăţământul economic un mod de gândire aplicat în economie, axat pe metode specifice, instrumente distincte şi indicatori fundamentali în înţelegerea fenomenului economic, de regulă atipic şi indeterminist prin metode cauzale simple. Gândirea statistică aplicată prin metode specifice, în demersul complet de cercetare şi cunoaştere finală a fenomenelor din economia de piaţă, de la observare la prelucrare, analiză şi interpretare permit studentului să înţeleagă diversitatea legăturilor multicauzale ce o caracterizează.Statistica economică oferă competenţe consistente studenţilor în a sistematiza datele din activitatea economică, în vederea obţinerii, prezentării şi reprezentării informaţiilor sub denumirea de indicatori statistici, fiind înrudită cu contabilitatea şi ajută împreună la formarea studenţilor în domeniul economic. Disciplina de statistică economică urmăreşte dobândirea unei culturi şi a unei educaţii statistice, care să permită viitorului economist să fundamenteze deciziile sale contabile şi financiare pe metode statistice simple, evaluări, analize şi interpretări ale indicatorilor statistici specifici, dar şi să formeze şi dezvolte deprinderi de a interpreta diversificarea, concentrarea, conjunctura, ciclicitatea şi sezonalitatea în economia de piaţă, alături de alte instrumente şi metode de cercetare selectivă a pieţelor şi de evaluare a dinamicilor specifice.

Referent ştiinţific: - Prof. univ. dr. Mihai Korka

Descrierea CIP a Bibliotecii Naţionale a României

SĂVOIU, GHEORGHE Statistică economică: curs pentru studenţii programului frecvenţă redusă / Gheorghe Săvoiu. - Piteşti: Editura Universităţii din Piteşti, 2011

Bibliogr. Index ISBN 978-606-560-228-1

Page 3: Statistic A

I

CUPRINS

Pagina

INTRODUCERE III CAPITOL 1 STATISTICA – INSTRUMENT DE FUNDAMENTARE A DECIZIEI ECONOMICE 1.1 Definire şi accepţiuni ale statisticii contemporane 1 1.2 Rol, obiect de studiu şi scurt istoric al statisticii ca ştiin ţă 3 1.3 Unele concepte sau noţiuni specifice ale limbajului statistic 4 1.4 Modul de gândire statistic în demersul cercetării economice 7 1.5 Test de autoevaluare şi aplicaţii 9 1.6 Rezumat 11 CAPITOL 2 OBSERVAREA ŞI SISTEMATIZAREA DATELOR 2.1 Program, modalităţi, tehnici şi erori specifice observării statistice 13 2.2 Etape în sistematizarea datelor statistice 19 2.3 Indicatori relativi şi locul lor în universul indicatorilor statistici 21 2.4 Test de autoevaluare şi aplicaţii 25 2.5 Rezumat 28 CAPITOL 3 INDICATORII TENDIN ŢEI CENTRALE, VARIA ŢIEI, ASIMETRIEI ŞI BOLTIRII 3.1Indicatorii statistici ai tendinţei centrale 29 3.2Indicatorii statistici pentru caracterizarea frecvenţelor 35 3.3 Indicatorii statistici ai variaţiei 36 3.4 Regula de adunare a dispersiilor 38 3.5 Indicatorii asimetriei şi boltirii 39 3.6 Test de autoevaluare şi aplicaţii 40 3.7 Rezumat 50 CAPITOL 4 SONDAJE STATISTICE APLICATE ÎN ECONOMIE 4.1 Aspecte şi noţiuni teoretice privind sondajul statistic 52 4.2 Procedee şi tehnici de eşantionare 56 4.3 Erori specifice cercetărilor selective 59 4.4 Sondajul simplu aleator repetat şi nerepetat şi alte tipuri de sondaje 64 4.5 Test de autoevaluare şi aplicaţii 68 4.6 Rezumat 74

Page 4: Statistic A

II

Pagina CAPITOL 5 METODA INDICILOR ŞI MĂSURAREA INFLA ŢIEI ÎN ECONOMIE 5.1 Concepte, funcţii, utilitate şi clasificări în universul indicilor 75 5.2 Scurtă istorie a metodei indicilor şi evoluţia indicelui interpret 81 5.3 Sisteme concrete de indici şi probleme practice de construcţie 84 5.4 Descompunerea variaţiei unui fenomen complex prin metoda indicilor 86 5.5 Infla ţia şi indicii interpret 89 5.6 Test de autoevaluare şi aplicaţii 91 5.7 Rezumat 97

CAPITOL 6 REGRESIE ŞI CORELA ŢIE STATISTIC Ă 6.1 Legătura statistică – noţiuni şi clasificare 99 6.2 Regresie statistică 101 6.3 Corelaţie statistică 106 6.4 Test de autoevaluare şi aplicaţii 112 6.5 Rezumat 115 CAPITOL 7 ANALIZA CRONOLOGIC Ă ŞI TERITORIAL Ă A SERIILOR DE DATE 7.1 Particularităţi şi tipologie în seriile cronologice şi teritoriale 116 7.2 Sisteme de indicatori statistici ai seriilor cronologice şi teritoriale 118 7.3 Determinarea trendului şi sezonalităţii în evoluţia fenomenelor 124 7.4 Previziune şi ierarhizare statistică 130 7.5 Test de autoevaluare şi aplicaţii 132 7.6 Rezumat 139 CAPITOL 8 INDICATORI STATISTICI ECONOMICI 8.1 Metode şi instrumente statistice aplicate în macro şi microeconomie 140 7.5 Test de autoevaluare şi proiect statistic 155 7.6 Rezumat 159 BIBLIOGRAFIE 160 ANEXE 161

Page 5: Statistic A

III

INTRODUCERE

Variabilitatea cursurilor de statistică în sine este un inedit prilej de analiză

statistică aplicată. Gândirea statistică, atrasă perpetuu de variabilitate şi diversitate, reuşeşte să identifice similitudini în ceea ce priveşte structurarea internă în aproape toate cărţile de statistică. De asemenea, un grad ridicat de omogenitate globală tematică se poate regăsi în metodele prezentate. Nu pot lipsi metoda grupării, a indicatorilor relativi şi a indicatorilor tendinţei centrale, metodele de determinare a variaţiei, simetriei şi excesului sau excentricităţii în seriile de date unidimensionale, precum şi metoda analizei dispersionale în seriile bidimensionale, cu accent pe regula adunării dispersiilor, determinaţie şi nedeterminaţie factorială, în ipotezele de cunoaştere şi explicare a lumii economice şi sociale înconjurătoare. Metoda cercetării selective şi metoda regresiei sau corelaţiei statistice se vor îmbina cu metoda indicilor pentru a realiza construcţiile instrumentale practice contemporane ale economiei de piaţă, pentru a facilita înţelegerea legăturilor multidimensionale ale fenomenelor atipice şi aparent indeterministe inflaţioniste sau de tipul creşterii economice ori al comercializării externe, echilibrării pieţelor de capital sau ocupării relative a forţei de muncă etc. Studiul seriilor cronologice şi teritoriale va contribui la formarea unor capacităţi necesare de a prognoza sau estima şi de a ierarhiza spaţial.

O carte de statistică destinată învăţământului economic va trebui să contribuie la însuşirea unui limbaj statistic, matematic şi economic, iar cu ajutorul metodelor şi instrumentelor specifice să formeze atitudini constante şi reacţii metodologic riguroase în cuantificare şi cunoaşterea calitativă a activităţilor economice.Cartea de faţă este structurată într-un număr de numai opt teme majore redefinind tot atâtea capitole, pentru care s-au stabilit de la bun început, nu numai cuprinsul, dar şi obiectivele, durata parcurgerii, o bibliografie restrânsă, teste de autoevaluare, aplicaţii soluţionate şi aplicaţii propuse spre rezolvare. Opţiunea alternativă a duratei alocate tematic oscilează între un timp minim de studiu de 28 de ore şi un timp maxim de 42 de ore. Acest curs sintetic este destinat segmentului celor ce deţin secretele studiului individual aprofundat, structurarea lui pe teme şi valorificarea unor teste de autoevaluare per capitol uşurând studiul pentru persoanele autodidacte ori cu posibilitatea reală de a învăţa exclusiv într-un regim redus al frecvenţei şi, mai ales, celor ce doresc să nu iasă din procesul de cunoaştere continuă, de acum devenit cerinţă europeană şi naţională, sub denumirea de long life learning.

Măsura în care această carte va avea un grad mai mare sau mai mic de utilitate practică depinde majoritar de sugestiile viitorilor cititori, colegi şi prieteni, cărora le mulţumesc cu anticipaţie pentru semnalarea oricăror aspecte, inclusiv a unor posibile erori, pe adresa [email protected].

Page 6: Statistic A

IV

Page 7: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

1

Tema 1 STATISTICA-INSTRUMENT DE FUNDAMENTARE A DECI ZIEI ECONOMICE CUPRINS: Pag. 1.1 Definire şi accepţiuni ale statisticii contemporane 1 1.2 Rol, obiect de studiu şi scurt istoric al statisticii ca ştiin ţă 3 1.3 Unele concepte sau noţiuni specifice ale limbajului statistic 4 1.4 Modul de gândire statistic în demersul cercetării economice 7 1.5 Test de autoevaluare şi aplicaţii 9 1.6 Rezumat 11 Obiective: Principalul obiectiv al statisticii este acela de a pune în aplicare un mod specific de gândire, axat pe un ansamblu de metode. O primă ţintă este aceea de a găsi răspunsuri la câteva întrebări legate de teoria şi istoria definirii acestei ştiinţe, ca instrument util practic în plan decizional, de semnificaţiile variate ale statisticii de la serie de date, la instituţie sau activitate. Un alt obiectiv important este şi cunoaşterea limbajului specific utilizat în demersul cercetării statistice, de la măsurare sau scalare, la înregistrare şi prelucrare, de la analiză, la interpretare. Cunoaşterea modalităţii de organizare a activităţii statistice şi dobândirea unei educaţii statistice contribuie la formarea contemporană a tinerilor studenţi, pentru a-i transforma în economişti reali şi cercetători competenţi ai economiei de piaţă. Timpul alocat temei: minim 1 oră - maxim 2 ore. Bibliografie T., Andrei, S., Stancu, Statistică, Ed. ALL, Bucureşti 1995. M., Bădiţă,T.Baron, M.Korka, Statistică pentru afaceri,Ed.Eficient, Bucureşti, 1998. M.,Biji,E.M.Biji,E.Lilea,C.Anghelache,Tratat de statisticǎ, Ed.Economicǎ,Bucureşti, 2002. A.Francis, Statistică şi matematică pentru managementul afacerilor, Ed.Tehnică ,Bucureşti, 2005. N.,Georgescu-Roegen, Metoda statistică,Ed. Expert, Bucureşti,1998. M.,Korka, L.-S., Begu, E.Tusa, Bazele statisticii pentru economişti, Ed. Tribuna Economică, 2002. C.,Moineagu, I.Negură,V.Urseanu, Statistica,Ed. ştiinţifică şi enciclopedică, Bucureşti,1976. G.,Săvoiu, Statistică generală. Argumente în favoarea formării gândirii statistice, Ed. Independenţa Economicǎ, Piteşti, 2003. G., Săvoiu (coord.), Statistică generală.Elemente teoretice, teste tip grilă, aplicaţii şi studii de caz, Ed. Independenţa Economicǎ, Piteşti, 2004. G., Săvoiu, Statistica.Un mod ştiinţific de gândire, Ed.Universitară,Bucureşti,2007. G., Săvoiu, Statistica.Mod de gândire şi metode, Ed.Universitară, Bucureşti, 2009. G.,Secară,G.,Săvoiu,C.,Necşulescu,Statistică economică, manual IFR,Ed. Universităţii din Piteşti, 2010. M., Solomon, Moduri de gândire, Ed. Ştiinţifică şi enciclopedică, Bucureşti, 1987. V.,Trebici, Mica enciclopedie de statistică, Ed. ştiinţifică şi enciclopedică, Bucureşti, 1985. M.,Ţarcă, Tratat de statistică aplicată, Ed didactică şi pedagogică R.A.Bucureşti, 1998. G.U.Yule, M.G.Kendall, Introducere în teoria statisticǎ, Ed. ştiinţifică, Bucureşti, 1969. Webografie *** http://www. insse.ro şi *** http://epp.eurostat.ec.europa.eu/

Page 8: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

2

1.1 Definire şi accepţiuni ale statisticii contemporane Definiţia şi demonstraţia rămân operaţiile pe care se întemeiază arta de a

convinge pe interlocutor de adevărul unei teze şi metoda ideală de organizare a informaţiei într-o ştiinţă particulară, cum este statistica. “Definiţiile, afirma Ştefan Odobleja, nu sunt numai mijloace de pricepere sau înţelegere a lucrurilor şi fenomenelor, ci şi puncte de plecare pentru noi creaţii. De multe ori unele dintre cele mai mari invenţii şi descoperiri nu sunt altceva decât rezultatele unor asemănări banale neaşteptate.”Definiţia ştiinţifică privită ca un ansamblu, reuneşte într-o singură propoziţie un subiect sau definitul (definiendum) şi un predicat sau definitorul (definiens), care descriu aceeaşi clasă de obiecte, iar ca rezultat direct al teoriei definiţiei este menită să faciliteze cunoaşterea şi să precizeze înţelesul termenilor pe care îi utilizăm, deşi ea însăşi oferă accepţiuni diferite.Definiţia a devenit astăzi o ecuaţie rezolvată, în care membrul stâng sau definitul (Dfd) coincide cu necunoscuta ecuaţiei, iar definitorul Dfn) corespunde părţii din dreapta a ecuaţiei rezolvate, unde nu intervin necunoscute: (Dfd) ≡ (Dfn). Ca exemplu sintetic extrem de definire a unei ştiinţe, logica a fost considerată gândirea care gândeşte gândirea. O problemă esenţială a termenilor limbajului cotidian a devenit şi aceea a imposibilităţii definirii unice a conceptelor majore, în cadrul atât de variatelor limbaje ştiinţifice specializate. Pentru exemplificare iată câteva definiţii ale termenului statistică, extrase din dicţionare enciclopedice de tip: a) statistic: ştiinţa ce descrie şi analizează numeric fenomenele de masă, dezvăluind particularităţi de volum, structură, dinamică, conexiune, precum şi legile ce le guvernează; b) economic: ştiinţa care are ca obiect aplicarea metodelor statistice în vederea măsurării, prezentării şi interpretării realităţii economice; c) matematic: teorie care se ocupă cu formularea şi interpretarea legilor de comportare ale fenomenelor de masă (inaccesibile metodelor deterministe) sau ale fenomenelor aleatoare, pe baza studiului unor date rezultate din observaţii asupra acestor fenomene; d) fizic: teorie care se ocupă cu studiul sistemelor constituite dintr-un număr foarte mare de particule, utilizând metode de calcul al probabilităţilor; e) biologic şi medical: manipulare şi prelucrare raţională şi sistematică a unui ansamblu de date, iniţial referitoare la populaţia umană sau stat; f) explicativ: ştiinţa care culege, sintetizează, descrie şi interpretează date ale fenomenelor de masă etc.

Principalele definiţii ale statisticii, indiferent de metoda din care sunt iniţiate, respectiv fie că pornesc de la demersul inductiv fie de la cel deductiv, sau chiar şi atunci când o consideră o expunere sistematică de concepte, principii şi metode, nu uită să amintească de măsurare ca principal obiectiv al ştiinţei statistice. Măsurarea cu rezultatul ei cantitativ a devenit treptat statistică. Cea mai naturală definiţie inductivă a statisticii actuale pare să fie aceea de a gândi cu ajutorul datelor, iar la nivelul unei exprimări generale, statistica devine ştiinţa prin care înveţi să gândeşti cu ajutorul cifrelor. Definirea inductivă a statisticii, drept mod de gândire cu ajutorul datelor, detaliază trei trenduri relativ emergente:

-creşterea nevoii oamenilor de a gândi prin date în economie şi educaţie, în viaţa zilnică ; -expansiunea tehnologiilor capabile să ofere suport oamenilor pentru a gândi prin date; -creşterea interesului ştiinţific pentru înţelegerea gândirii prin date specific statisticii.

Page 9: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

3

Pornind de la formularea de tipul terţului exclus, statistica se poate defini clasic deductiv astfel: statistica este cantitate (rezultat al cantităţii), cantitatea este măsurare (rezultat al măsurării) şi, în final, statistica este măsurare (rezultat al măsurării). Pentru diversele state ale lumii, guvernele şi locuitorii acestora, statistica este o siglă, un acronim sau o instituţie. În Uniunea Europeană, această instituţie comună şi relativ tânără, se numeşte EUROSTAT, reunind 27 de institute sau comisii naţionale, inclusiv Institutul Naţional de Statistică al României. Statisticianul sau acela care desfăşoară activităţi într-o astfel de instituţie, se identifică cu una din profesiunile umane cele mai vechi din istoria lumii, fiind un personaj prezent, sub denumirea de „statist”, în piesele de teatru ale lui William Shakespeare. Semnificaţia banală sau comună a statisticii, conform mass-media, este aceea de serie de date sau informaţii, indiferent de faptul că seria în sine vizează lumea politică, economică, sportivă, religioasă, culturală. Activitatea generatoare de serii de date valorifică studiul numerelor, prezentarea lor în tabele, reprezentarea sintetică în grafice, evaluarea erorilor, testarea validităţii unei ipoteze etc. În concluzie, statistica este azi atât activitate, ştiinţă, metodă sau colecţie de metode, instituţie şi profesie, serie de date sau informaţii, cât mai ales un mod de gândire, la fel de “necesar ca şi scrisul sau cititul“ (Herbert George Wells).

1.2 Rol, obiect de studiu şi scurt istoric al statisticii ca ştiin ţă

De la rolul de măsurare, de la nevoia practică de orientare prin număr şi de la descrierea statelor prin intermediul cifrelor semnificative, statistica s-a transformat treptat, prefigurată de noi concepte, metode, instrumente şi legităţi într-o abordare selectivă, eficientă şi raţională, ce oferă date şi informaţii, cu costuri tot mai mici, dar cu o promptitudine tot mai mare. Rolul contemporan al statisticii a devenit acela de a furniza metode, instrumente şi, în final, informaţii solicitate de procesul de decizie la toate nivelurile sale formale de tip micro, mezo şi macro, privind majoritatea fenomenelor şi proceselor politice, economice şi sociale, precum şi în toate abordările temporale specifice, de la decizia bazată pe termen scurt, la decizia pe termen mediu sau lung. Procesul decizional, analizat fie la stadiul micului întreprinzător sau antreprenor, fie la cel al societăţii transnaţionale, parcurge toate etapele sale însoţit de metode, instrumente şi informaţii statistice:

Omniprezenţa statisticii în etapele deciziei manageriale Denumirea etapei (prezenţa statisticii) Cunoaşterea situaţiei problematice apărute (informaţie statistică) Elaborarea de variante decizionale distincte (analiză statistică) Alegerea variantei decizionale optime (ierarhizare şi selectare statistică) Executarea şi monitorizarea deciziei (control prin indicatori statistici) Evaluarea impactului deciziei asupra situaţiei iniţiale (informaţie statistică)

Obiectul de studiu al statisticii se constituie din acele fenomene şi procese, în marea lor majoritate global omogene şi intern structurate, care se produc sub forma unui număr mare de manifestări individuale, cazuri, elemente aparent întâmplătoare, dar care, la nivel de ansamblu, prezintă o esenţă comună, o regularitate sau o legitate de manifestare. În cadrul obiectului statisticii se

Page 10: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

4

conturează tot mai mult evaluarea erorilor cercetării ştiinţifice, identificarea gradului de certitudine al legităţilor ştiinţifice şi delimitarea pragului de credibilitate sau verosimilitate maxim admis. Fenomenele şi procesele de masă, stohastice, indeterministe sau atipice descrise relevă legităţi statistice ce se manifestă în condiţii concrete bine delimitate în timp, spaţiu sau din punct de vedere organizatoric.Delimitarea concretă creează o întreagă tipologie a statisticilor contemporane, respectiv statistica matematică, beneficiind de un grad maxim de abstractizare, statistica generală sau teoretică reunind principalele concepte, principii şi metode, statistica economică, oferind instrumente de măsură esenţiale în planul evoluţiei fenomenelor economice, statistica descriptivă sau tradiţională relevând aspectele cantitative ale descrierii statului, statistica actuarială sau a asigurărilor de persoane, statistica socială sau a evaluării indicatorilor sociali capabili să descrie dezvoltarea umană durabilă, calitatea vieţii şi coeziunea socială, statistica informaţională sau a evaluării simetriei informaţionale, statistica demografică sau statistică populaţiilor umane etc. Statistica se întrepătrunde în prezent cu aproape toate „metriile“ (econometria, demometria etc.), cu economia, psihologia, sociologia, geografia ş.a. Populaţiile, fenomenele şi procesele ştiinţei statistice sunt finite, metodele şi instrumentele ei simple şi uşor accesibile, erorile recunoscute dar şi estimate, iar soluţiile sale finale testate şi acceptate.

Un scurt istoric al ştiinţei statistice impune o trecere succintă prin următoarele etape: statistica veche sau “prestatistica” atestată încă de acum 5000 de ani şi care a rezistat aproape 4 milenii ca instrument de orientare practică a conducătorilor, statistica descriptivă sau descrierea statului, o primă manifestare ca ştiinţă, dezvoltată de şcoala germană, aritmeticienii politici englezi sau etapa abordării analitice printr-un instrumentar matematic de o simplitate fără precedent şi mai ales prin identificarea primei legităţi de către primul statistician ca om de ştiinţă (John Graunt), clasicismul statistic sau statistica inductivă determinată mai ales de apariţia şi dezvoltarea teoriei probabilităţilor, statistica modernă, cristalizată în jurul şcolii anglo–saxone de statistică matematică, iar temporal pe naşterea în 1924 a teoriei sondajului şi recunoaşterea oficială a avantajelor cercetării selective din 1934, de către Societatea regală engleză de statistică. Accentul contemporan al ştiinţei statistice se modifică prin înnoirea metodelor, instrumentelor şi cade, astfel, pe informaţie şi simetrie informaţională.

1.3 Unele concepte sau noţiuni specifice ale limbajului statistic Dialogul statistic nu poate fi realizat în afara limbajului specific sau, mai

precis, a cunoaşterii conceptelor sau noţiunilor statistice fundamentale, dintre care s-au selectat câteva cu impact major în planul demersului statistic. Populaţia sau colectivitatea statistică reprezintă o mulţime bine delimitată în timp, spaţiu şi organizatoric de manifestări, cazuri, elemente de aceeaşi natură, respectiv care au cel puţin o trăsătură comună. Dacă se iau în calcul toate manifestările, cazurile, elementele, atunci populaţia statistică se numeşte generală sau exhaustivă, iar dacă se extrage numai o parte, cu scop de extindere ulterioară a rezultatelor, atunci se defineşte o populaţia parţială sau selectată. Unitatea statistică reprezintă purtătorul

Page 11: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

5

originar de informaţie, subiectul logic al informaţiei statistice, o manifestare, un caz sau un element din mulţimea bine delimitată, numită populaţie, ce defineşte fenomenul cercetat. Unităţile statistice se clasifică în funcţie de nivelul de înregistrare a performanţelor în simple (se înregistrează manifestarea, elementul, cazul cu performanţele individuale) şi în complexe, (se înregistrează o sumă de unităţi simple cu performanţele întregii colectivităţi).Caracteristica statistică constituie trăsătura, însuşirea sau proprietatea cantitativă sau calitativă comună tuturor elementelor din colectivitate. Abordată la nivelul elementelor, caracteristica statistică observată prezintă fie un anumit nivel, fie o anumită stare particulară, care diferenţiază o unitate statistică de alta. Nivelul, respectiv starea particulară specifică capătă denumirea de variantă a caracteristicii. Privită la nivelul unei populaţii statistice, mulţimea de variante a caracteristici devine variabil ă statistică. Calitatea unităţilor statistice de a-şi modifica nivelul de dezvoltare al unei caracteristici într-un interval de valori, în condiţii date de timp şi spaţiu este cunoscută ca variaţie (variabilitate). Tipologia variabilelor este diversă. Astfel, criteriul utilitate le împarte în teoretice şi empirice, iar criteriul conţinut în variabile de timp, de spaţiu şi atributive. Variabilele atributive se subclasifică şi ele în: a) variabile atributive numerice (cantitative) a1) variabile de tip discret (discontinuu), care pot lua numai anumite valori pe scara de variaţie firească (de regulă întregi) a2) variabile de tip continuu, care pot lua orice valori într-un interval dat (pentru vârstă, de regulǎ 0-100 ani, pentru înălţime 50-250 cm etc.) b) variabile atributive nenumerice (calitative sau de stare) b1) variabile alternative (dihotomice sau binare, de tip alb – negru sau prezent – absent) b2) variabile nealternative (admit mai multe stări, ex:căsătorit, necăsătorit, văduv, divorţat) Variabila aleatoare desemnează variabila ale cărei valori, apriori necunoscute apar în împrejurări datorate întâmplării, cu probabilităţi determinate (în teoria probabilităţilor). În statistica matematică ea exprimă fie un ansamblu de valori posibile (xi), fie o funcţie finită indicând, în raport cu rezultatul unui experiment, probabilitatea fiecăreia dintre valorile posibile (pi). Variabila aleatoare este fie de

tip discret X=

i

i

p

x , unde:1≤ i ≤ n şi ∑=

n

1iip =1, fie de tip continuu: F (x) =P(X<x ),

unde: F(-∞) = 0, F (+∞) = 1, F (x) = monoton crescătoare şi P [ ]{ }b,ax∈ ═ ∫b

a

)x(d)x(f .

Frecvenţa exprimă atât numărul de înregistrări ale aceleiaşi variante într-o populaţie statistică (ni sau fi), cât şi ponderea, greutatea specifică sau cota parte a

unei variante într-o populaţie statistică (n*i sau f*i ).În primul caz este definită

frecvenţa absolută (notată cu „ni” sau „fi”, unde i = k1 , iar k = numărul variantelor distincte într-o populaţie statistică). În al doilea caz este precizată frecvenţa

relativă, notată cu n*i =∑ i

i

n

n x 100 sau f*i =∑ i

i

f

f x 100 sau gi = ∑ ii

ii

fx

fx x 100

Page 12: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

6

Dată fiind o variabilă statistică x care ia valorile x1, x2, …, xn, cu frecvenţele f1, f2, …, fn, atunci mulţimea ale cărei elemente sunt perechile ordonate ( xi, fi) constituie reparti ţia variabilei statistice X sau distribuţia statistică de frecvenţe (discretă):

X :

n21

n,21

f,...f,f

x...x,x sau X :

i

i

f

x , unde i= n1 .

Valoarea reprezentativă dedusă dintr-o operaţie numerică, definită fără ambiguitate şi aplicată la o repartiţie statistică este cunoscută sub numele de parametru statistic. Parametrul este rezultatul celei mai mari condensări posibile desprinse dintr-o mulţime (masă) de observaţii. Parametrii statistici cei mai des utilizaţi sunt cei de nivel (ex: media, mediana, modul) de împrăştiere sau dispersie (ex:varianţa, abaterea medie pătratică, coeficientul de variaţie) de asimetrie şi boltire (ex: coeficienţii Pearson sau Fisher). Succesiunea variabilă, repartiţie, parametru nu poate fi concepută în afara măsurării, adică acordării de nivele sau stări fiecărei unităţi statistice pentru caracteristica studiată. În limbajul statisticianului această problemă înseamnă a scala sau a stabili scala de măsurare. Tipologia scalelor identifică patru categorii: nominală (neparametrică), ordinală (ierarhică), cardinală (de interval) şi proporţională (de raport). Primele două caracterizează variabilele calitative iar ultimele două variabilele cantitative. Scala nominală sau neparametrică este o simplă enumerare de variante, cu precădere stări şi permite doar clasificarea unităţilor studiate. Scala ordinală sau ierarhică introduce relaţia de ordine şi prezintă ca logică esenţială: “superioritatea fiecărei poziţii sau stări nou apărute în raport cu precedenta“. Scala cardinală sau de interval permite alături de relaţia de ordine atât efectuarea operaţiilor elementare de adunare şi scădere. Pe o scală cardinală, punctul “zero“ este fixat arbitrar sau relativ. Scala proporţională sau de raport permite şi operaţii de raportare, pornind de la poziţia naturală a valorii “zero“. Datele statistice sunt structurate în trei componente distincte: partea numerică sau cantitativă care a fost identificată (indicatorul propriu-zis), componenta de delimitare în timp, spaţiu şi organizatoric (incluzând şi precizarea unităţii de măsură, precum şi asigurarea comparabilităţii) şi componenta noţională (include metodologia de calcul a indicatorului). Orice dată statistică este purtătoarea unui conţinut nou, mesaj inedit sau chiar a unei semnificaţii neuzitate. Decriptarea mesajului, receptarea noutăţii de conţinut şi semnificaţiei generează o informaţie statistică. Informa ţia statistică este originalitatea deţinută de mesajul reflectat al datei statistice, un semnal cât mai identic emis, transmis şi receptat, referitor la cunoaşterea individuală sau universală, o formă a energiei conţinută de date statistice, având utilitate deosebită, dar şi costuri foarte ridicate.Expresie cantitativă sau numerică a unei anumite determinări sau trăsături calitative constante printre manifestările, cazurile, elementele unei populaţii statistice bine delimitate în timp, spaţiu şi organizatoric, indicatorul statistic prezintă o tipologie diversă.Indicatorii primari de m ăsurare sunt valori absolute rezultate din măsurarea caracteristicii la nivel de element, caz, manifestare, respectiv unitate statistică, iar indicatorii primari sintetici adaugă la valorile absolute măsurate şi operaţia de cumulare sau agregare. Indicatorii

Page 13: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

7

derivaţi prin comparare sunt rezultatul celor mai simple operaţii aritmetice: scăderea(soldul balanţei comerciale= Export–Import sau X-M) şi împărţirea (numeroasa familie a indicatorilor relativi de structură, de coordonare, de dinamică, de intensitate şi ai programului sau planului). Indicatorii deriva ţi de estimare sunt rezultatul unor calcule deosebite, abstractizări şi generalizări. Abordaţi ca ansamblu sistemul de indicatori statistici reprezintă o componentă a bazei de date şi ea inclusă alături de sistemul de gestiune şi mijloacele de culegere, prelucrare, transmitere, stocare, regăsire, în banca de date (parte definitorie în subsistemul informaţional statistic reunind beneficiarii şi furnizorii de informaţii statistice). Eroarea sau „cunoştinţa care nu reflectă adecvat, corect, veridic realitatea obiectivă” este o componentă a adevărului relativ. Ea are o semnificaţie primordial statistică. Eroarea statistică este diferenţa: între o dată statistică (indicator statistic) şi valoarea reală corespunzătoare sau înregistrarea altei valori x în locul celei reale x0 şi se determină practic fie în valoare absolută e = x0 -x, fie în valoare

relativǎ є =0

0

x

xx − =

0x

e , precum şi între înregistrarea valorii determinate statistic

(calculate) şi notate xs în locul celei reale x0 şi se determină analog, fie în valoare

absolută es = x0 – xs, fie în valoare relativǎ єs = 0

s0

x

xx −=

0

s

x

e.

1.4 Modul de gândire statistic în demersul cercetării economică Cunoaşterea şi cercetarea economică modernă au devenit de natură

preponderent statistico – matematică, fiind procese logic integrate ce trebuie să beneficieze de simplitate metodologică. Acest fapt implică statistica în corpul economiei contemporane cu precădere ca metodă sau set de metode, deşi ştiinţa statistică rămâne în mod esenţial un mod aparte de gândire. Observarea şi prelucrarea datelor conduc la formularea de ipoteze, analiza şi interpretarea rezultatelor obligă la predicţia bazată pe deducţii logice iar validarea sau invalidarea închid şi redeschid continuu modul de gândire de natură statistică. O analiză succintă a organizării instituţionale a activităţii de statistică relevă constanţa în timp a două criterii: a) criteriul adaptabilităţii sau adecvarea organizatorică şi funcţională a statisticii oficiale la structurile economice şi sociale şi b) criteriul unicităţii deciziei şi gestiunii metodologice sau existenţa unui centru naţional de decizie şi gestiune a metodologiei. Statistica nu poate fi utilă decât dacă îndeplineşte două condiţiuni esenţiale: teoria statistică trebuie să fie atât de avansată încât să permită o interpretare ştiinţifică a rezultatelor, să poată identifica reguli şi legi de valabilitate generală şi să stabilească corelaţii între cauză şi efect, iar organizarea statistică trebuie să fie întemeiată pe o înregistrare exactă de fapte statistice şi pe generalizarea înregistrării, astfel încât materialul supus unei examinări să poată fi interpretat în mod valabil prin metode ştiinţifice. Dacă se produce un decalaj între teorie şi practică ambele rămân sterile şi documentarea statistică va fi fără utilitate. Un demers complet statistic desfăşurat pentru

Page 14: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

8

cunoaştere şi cercetare economică se distinge fie ca o cercetare de tip clasic, restrânsă la observarea, prelucrarea, analiza şi interpretarea statistică a datelor, fie ca o cercetare de tip modern, respectiv la cele trei etape clasice, adăugând prin utilizarea teoriei sondajului, inferenţa şi decizia statistică.În cadrul uneia dintre cele mai recente şi rezonante abordări, conţinutul demersului complet al cercetării statistice, include patru cicluri sau dimensiuni suprapuse temporal şi distinct etapizate, aşa cum au fost formulate de către profesorii Maxine Pfannkuch şi Chris Wild de la universitatea Auckland, Noua Zeelandă, pornind de la structura modului de gândire ce caracterizează statistica în prezent, ca ştiinţă: a) ciclul investigaţional (definire problemă→program investigaţie→date rezultate→analiză şi interpretare →concluzii); b) ciclul interogativ (generare de variante alternative sau soluţii →căutare şi selectare de alternative sau soluţii optimizate→ interpretare şi ierarhizare variante sau soluţii→ comentare variante sau soluţii→ varianta sau soluţia pentru care s-a optat în decizia finală); c) ciclul tipologiei modalităţilor de gândire consideră că statistica reuneşte moduri adecvate de gândire umană şi cuprinde alături de tipurile generale de gândire strategică, cercetarea explicaţiilor, gândirea modelatoare şi aplicativ tehnică, alte cinci tipuri exclusiv statistice de gândire: recunoaşterea nevoii de date, transnumeraţia sau transformarea din nenumeric în numeric, identificarea şi analiza variaţiei, apelul la capacitatea de a raţiona prin intermediul modelelor statistice ca expresii ale agregării, reciprocitatea contextual-statistic, altfel spus gândirea statistică asupra variaţiei obţinută cu ajutorul datelor modelate îşi va „relata propria poveste” despre real/contextual, argumentată matematic; d) ciclul părţilor psihologice ale investigaţiilor prin conceptul de dispoziţii personale (originalitatea gândirii statistice fiind dată şi de psihologia sau dispoziţia personală a statisticianului).

Activitatea institu ţională de statistică se desfăşoară în România de peste un secol şi jumătate şi este organizată la nivelul Institutului Naţional de Statistică. Ca instituţie naţională I.N.S. colaborează cu alte instituţii similare din diverse ţări dar şi cu asociaţii ale acestora (EUROSTAT, ONU etc.).

Educaţia statistică este un factor important de optimizare a economiilor de piaţă. Principiul lui Heraclit, formulat prin „educaţia este al doilea soare pentru cei care o au“, completat cu definiţia dată educaţiei de către Herbert Spencer, drept „pregătirea pentru o viaţă completă”, caracterizează şi informaţia statistică. Asigurarea educaţiei statistice se extinde de la studenţi, la agenţi economici, de la organizaţii şi instituţii, la asociaţii şi chiar la nivelul familiei sau gospodăriei, ca o lumină intens focalizată pe înţelegerea fenomenelor economice şi sociale. Cunoaşterea publicaţiilor statistice devine în economia de piaţă contemporană o condiţie de bază a concurenţei echilibrate, a asigurării unei simetrii informaţionale. 1.5 Test de autoevaluare şi aplicaţii A) Test de autoevaluare

A1) Întrebări clasice recapitulative

(Completaţi spaţiile goale)

A2) Întrebări tip gril ă

(Încercuiţi litera răspunsului corect)

Page 15: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

9

1.Cum definiţi statistica modernă ?

2.Care sunt principalele accepţiuni sau semnificaţii ale statisticii?

3.Prin ce se particularizează rolul şi obiectul de studiu al ştiinţei statisticii ?

4.Care sunt principalele noţiuni şi concepte specifice limbajului statistic?

5. Care este rolul contemporan al educaţiei statistice ?

6.După conţinut, variabilele statistice sunt: a)de timp, de spaţiu şi atributive;b) discrete şi continue; c) alternative şi nealternative; d) teoretice şi empirice. 7. Frecvenţa absolută este definită prin: a) modalitatea concretă de manifestare a variabilelor statistice; b) numărul unităţilor statistice care prezintă aceeaşi valoare, stare sau variantă; c) numărul variabilelor utili-zate în cercetarea unui fenomen economic; d) suma tuturor unităţilor statistice ce alcătuiesc populaţia cercetată. 8. Etapele cercetării statistice clasice sunt: a) interpretarea, prelucrarea şi observarea statistică; b) observarea, prelucrarea, analiza şi interpretarea statistică a datelor; c) anali-za, interpretarea şi prelucrarea datelor; 9.Etapele cercetării statistice moderne sunt: a) interpretarea, prelucrarea şi observarea statistică; b) observarea, prelucrarea, analiza şi interpretarea statistică a datelor;c) obser-varea, prelucrarea, analiza şi interpretarea datelor, inferenţa şi decizia statistică.

B) Aplicaţii rezolvate

1. Ordonaţi corect noţiunile din primele trei coloane, conform titlurilor: Tabel 1

Varianta (a1) Variabila (a2) Variaţia (a3) Lista notelor Media obţinută la examen Nota 9 Tabel al PIB-ului real Creştere PIB real de 2 % Creştere economică Dinamica salarială Salariul Nouă sute lei Statut profesional Tipologia schimbărilor de statut Patron

Rezolvare: Ordinea corectă este prezentată în tabelul 2, conform semnificaţiei paradigmei variaţiei, prin analiza noţiunilor de variantă, variabilă şi variaţie: Tabel 2

Varianta (a1) Variabila (a2) Variaţia (a3) Lista notelor Media obţinută la examen Nota 9 a1= Nota 9 a2 = Media obţinută la examen a3 = Lista notelor Tabel al PIB-ului real Creştere PIB real de 2 % Creştere economică a1=creştere PIB real de 2% a2 = Creştere economică a3 = Tabel al PIB-ului real Dinamica salarială Salariul Nouă sute lei a1= Nouă sute lei a2 = Salariul a3= Dinamica salarială Statut profesional Tipologia schimbărilor de statut Patron a1 = Patron a2 = Statut profesional a3 = Statut profesional

Page 16: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

10

2. Determinaţi frecvenţa absolută maximă şi frecvenţa relativă minimă în situaţiile de mai jos. Comentaţi rezultatele obţinute. a) Notele obţinute de 20 studenţi ai grupei 1, prezenţi la examen au fost următoarele: 8, 5, 8, 9, 7, 6, 4, 7, 6, 9, 8, 7, 7, 10, 7, 8, 6, 5, 4, 6.

Rezolvare: Distribuţia de frecvenţe este X : i

i

x

f

sau X :4 5 6 7 8 9 10

2 2 4 5 4 2 1

,

unde xi = reprezintă nota iar fi numărul studenţilor care au obţinut nota xi.

I. frecvenţa absolută maximă ( )maxif = 5 şi corespunde studenţilor ce au nota 7;

II. frecvenţa relativă minimă ( )*

minif =∑ fi

f maxi x 100 = 1

20 x 100 = 5% şi corespunde

studentului care a obţinut nota 10. b) Trei produse A, B şi C s-au vândut la preţuri identice de 250 lei, dar în cantităţi diferite, respectiv de 100, 400 şi 500 de bucăţi.

Rezolvare: Distribuţia de frecvenţe este Y : 100 400 500

A B C

I. frecvenţa absolută minimă sau ( )minif =100 şi corespunde produselor A;

II. frecvenţa relativă maximă sau ( )max*if =

∑ i

maxi

f

f x100=1000

500x100=50% şi

corespunde produselor de tip C . c) Aceleaşi trei produse A, B, C deţin un volum diferenţiat al vânzărilor, preţurile la care s-au realizat pe piaţă fiind 500 lei (A), 400 lei (B) şi 250 lei (C), cantităţile fiind aceleaşi ca în exemplul anterior .

Rezolvare: Distribuţia de frecvenţe a volumului vânzărilor este Z:

i

i

f

z, unde zi

este tipul produsului (A,B şi C) iar fi = pi qi sau vânzările produselor:

500 100 400 400 250 500

A B C

× × ×

= 50000 160000 125000

A B C

I.frecvenţa absolută minimă sau ( )minif = ( )minii qp =50000 lei şi corespunde

produselor de tip A vândute cu preţul maximal II.frecvenţa relativă maximă este echivalentǎ cu greutatea specifică maximă a

vânzǎrilor:gi= i i

i i

p q

p q∑x100=160000

100 47,8%335000

=× şi reprezintă greutatea specifică a

vânzărilor produselor de tip B în total vânzări cumulate A,B şi C. 3. Calculaţi eroarea absolută şi relativă în cazurile descrise mai jos: a) Testarea la recepţie a unui eşantion de 100 de becuri dintr-un lot de 10000, a scos în evidenţă 6 rebuturi. Depăşind limita prevăzută în contract (5%), lotul a fost verificat bec de bec, numărul final al rebuturilor fiind 606.

Page 17: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

11

Rezolvare:La nivelul eşantionului în raport cu populaţia totală

e = x0 – x = 6,06 – 6 = 0,06 ε =0

0

x

xx − =0x

e=

06,6

06,0 = 0,0099 (% = 0,99).

b)Într-un chestionar al unei anchete realizate cu scopul de a evalua cheltuielile ocazionate de căsătorie s-au obţinut drept vârste medii declarate ale mirilor 24 de ani la femei şi 30 de ani la bărbaţi. Datele statistice din ultimul anuar prezintă valorile: 27 de ani la femei şi 29,5 la bărbaţi.

Rezolvare: e femeis =x0 - xs= 27-24=3 ani ε s =

0

s0

x

xx −=

0x

es =27

3 =0,111 (%=11,1),

ebarbatis =x0-xs=29,5-30=-0,5 ani ε s =

0

s0

x

xx −=

0x

es =5,29

5,0−= -0,01695 (%= - 1,7).

C) Aplicaţii propuse spre rezolvare 1.Determinaţi frecvenţa absolută maximă şi frecvenţa relativă minimă în ceea ce priveşte notele obţinute de cei 20 studenţi, prezenţi la examenul de statistică au fost următoarele: 4,5,6,9,7,6,3,7,6,9,8,7,8,10,7,8,6,5,4,10. 2.Patru produse A, B, C şi D s-au vândut la preţuri identice de 70 lei, dar în cantităţi diferite, respectiv de 100, 200, 300 şi 400 de bucăţi. Identificaţi frecvenţa absolută şi frecvenţa relativă maximă şi minimă. 3.Determinaţi frecvenţele absolute şi frecvenţele relative dacă aceleaşi patru produse A, B, C şi D deţin un volum diferenţiat al vânzărilor, preţurile la care s-au realizat pe piaţă fiind 200 lei (A), 300 lei (B), 500 lei (C) şi 350 lei (D), cantităţile fiind aceleaşi ca în exemplul anterior. 4.Calculaţi eroarea absolută şi cea relativă în cazurile descrise mai jos: a) Testarea la recepţie a unui eşantion de 200 de becuri dintr-un lot de 20000, a scos în evidenţă 7 rebuturi. Depăşind limita din contract de 4%, lotul a fost verificat bec de bec, numărul total al rebuturilor fiind de 1206. b) Într-un chestionar al unei anchete realizate cu scopul de a evalua cheltuielile ocazionate de divorţ s-au obţinut drept vârste medii declarate 30 de ani la femei şi 36 de ani la bărbaţi.Datele statistice din ultimul breviar local prezintă următoarele valori: 32 de ani la femei şi 35,5 la bărbaţi.

1.6 Rezumat Definiţia ştiinţifică inductivă a statisticii actuale este aceea de ştiinţă prin care înveţi să gândeşti cu ajutorul datelor şi informaţiilor. Definiţia deductivă a statisticii este axată pe cantitate, iar cantitatea fiind expresia măsurării, statistica devine şi ea măsurare sau rezultat al măsurării. Statistica modernă este atât activitate, ştiinţă, metodă sau colecţie de metode, instituţie şi profesie, serie de date sau informaţii, cât mai ales un mod de gândire, la fel de “necesar ca şi scrisul sau cititul“. Rolul contemporan al statisticii a devenit acela de a furniza metode, instrumente şi, în final, informaţii solicitate de procesul de decizie la toate nivelurile sale formale de tip micro, mezo şi macroeconomic, iar obiectul de studiu al statisticii se constituie din acele fenomene şi procese, global omogene şi intern structurate, care prezintă o esenţă comună, o regularitate sau legitate de manifestare (fenomene de

Page 18: Statistic A

Statistica – instrument de fundamentare a deciziei economice Capitolul 1

12

masă, stohastice, indeterministe, atipice). Un scurt istoric al ştiinţei statistice relevă următoarele etape: statistica veche sau “prestatistica” ,statistica descriptivă sau descrierea statului, aritmeticienii politici englezi (formarea ca ştiinţă modernă şi apariţia primului statistician în persoana lui John Graunt), clasicismul statistic sau statistica inductivă, statistica modernă şi contemporană. Conceptele (noţiunile) statistice caracteristice limbajului ei ştiinţific sunt: a) populaţia (colectivitatea) statistică defineşte o mulţime bine delimitată în timp, spaţiu şi organizatoric de manifestări, cazuri, elemente de aceeaşi natură, având cel puţin o trăsătură comună (exhaustivă şi selectivă); b) unitatea statistică reprezintă purtătorul originar de informaţie, subiectul logic al informaţiei, o manifestare, un caz sau un element din mulţimea bine delimitată, numită populaţie, ce defineşte fenomenul cercetat (simplă şi complexă), c) caracteristica statistică constituie trăsătura, însuşirea, proprietatea cantitativă sau calitativă comună tuturor elementelor din colectivitate; d) nivelul, respectiv starea particulară specifică capătă denumirea de variantă a caracteristicii, e) privită la nivelul unei populaţii statistice, mulţimea de variante ale aceleiaşi caracteristici devine variabilă statistică, f) calitatea unităţilor statistice de a-şi modifica nivelul de dezvoltare al unei caracteristici într-un interval de valori, în condiţii date de timp şi spaţiu este cunoscută ca variaţie sau variabilitate; g)variabila aleatoare desemnează variabila ale cărei valori,apriori necunoscute apar în împrejurări datorate întâmplării, cu probabilităţi determinate, h) frecvenţa exprimă numărul de înregistrări ale unei variante într-o populaţie statistică (ni sau fi), dar şi ponderea, greutatea specifică sau cota parte a unei variante într-o

populaţie (n*i sau f*i ); i) valoarea reprezentativă dedusă dintr-o operaţie numerică, definită

fără ambiguitate şi aplicată la o repartiţie statistică este cunoscută sub numele de parametru statistic; j) succesiunea variabilă, repartiţie, parametru nu poate fi concepută în afara măsurării, adică acordării de niveluri sau stări fiecărei unităţi statistice pentru caracteristica studiată, iar în limbajul statisticianului această problemă înseamnă a scala sau a stabili scala de măsurare; k) datele statistice sunt structurate în trei componente distincte: partea numerică sau cantitativă care a fost identificată (indicatorul propriu-zis), componenta de delimitare în timp, spaţiu şi organizatoric (incluzând şi precizarea unităţii de măsură, asigurarea comparabilităţii) şi componenta noţională (include metodologia de calcul); l) informaţia statistică este originalitatea deţinută de mesajul reflectat al datei statistice, un semnal cât mai identic emis, transmis şi receptat, referitor la cunoaşterea individuală sau universală, o formă a energiei conţinută de date statistice, având utilitate deosebită, dar şi costuri foarte ridicate; m) indicatorul statistic reprezintă expresia cantitativă sau numerică a unei anumite determinări sau trăsături calitative constatate printre manifestările, cazurile, elementele unei populaţii statistice; n)eroarea sau cunoştinţa care nu reflectă adecvat, corect, veridic realitatea obiectivă şi are o semnificaţie primordial statistică. reprezentând o diferenţa între o dată statistică şi valoarea reală. Un demers complet statistic se distinge fie ca o cercetare de tip clasic, restrânsă la observarea, prelucrarea, analiza şi interpretarea statistică a datelor, fie ca o cercetare de tip modern, respectiv la cele trei etape clasice, adăugând prin utilizarea teoriei sondajului, inferenţa şi decizia statistică. Educaţia statistică devine astăzi un factor important de optimizare a economiilor de piaţă.

Page 19: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

13

Tema 2 OBSERVAREA ŞI SISTEMATIZAREA DATELOR CUPRINS: Pag. 2.1 Program, modalităţi, tehnici şi erori specifice observării statistice 13 2.2 Etape în sistematizarea datelor statistice 19 2.3 Indicatori relativi şi locul lor în universul indicatorilor statistici 21 2.4 Test de autoevaluare şi aplicaţii 25 2.5 Rezumat 28 Obiective: Principalele obiective ale cercetărilor statistice sunt observarea datelor obţinerea prin prelucrare a indicatorilor şi prezentarea sau reprezentarea lor conform demersului complet de observare, prelucrare, analiză şi interpretare (inferenţă şi decizie statistică). O primă ţintă constă în însuşirea conţinutului observării, programului ei specific, modalităţilor teoretice şi tehnicilor practice de măsurare şi scalare, generatoare de indicatori prin prelucrarea datelor, dar şi identificării de soluţii prompte de prevenire, control şi înlăturare a erorilor. A doua ţintă vizează prezentarea şi reprezentarea indicatorilor în general, precum şi valorificarea practică a indicatorilor relativi. Timpul alocat temei: minim 2 ore - maxim 4 ore. Bibliografie M.,Bădiţă,T.Baron,M.Korka,Statistică pentru afaceri, Ed.Eficient,Bucureşti,1998. M.Biji,E.M.Biji, E.Lilea,C.Anghelache,Tratat de statisticǎ,Ed.Economicǎ,Bucureşti, 2002. A., Isaic-Maniu, Dicţionar de statistică generală, Ed. Economică, Bucureşti, 2003. M.Korka,L.Begu,E.Tusa,Bazele statisticii pentru economişti, Ed.Tribuna Economică, 2002. G., Săvoiu, Statistică generală. Argumente în favoarea formării gândirii statistice, Ed. Independenţa Economicǎ, Piteşti, 2003. G., Săvoiu (coord.), Statistică generală. Elemente teoretice, teste tip grilă, aplicaţii şi studii de caz, Ed. Independenţa Economicǎ,Piteşti, 2004. G., Săvoiu, Statistica.Un mod ştiinţific de gândire, Ed.Universitară,Bucureşti,2007. G., Săvoiu, Statistica.Mod de gândire şi metode, Ed.Universitară,Bucureşti, 2009. V., Trebici, Mica enciclopedie de statistică, Ed. ştiinţifică şi enciclopedică, Bucureşti,1985. V.,Trebici,Mică enciclopedie de demografie, Ed.ştiinţifică şi enciclopedică,Bucureşti, 1975. M.,Ţarcă, Tratat de statistică aplicată,Ed. didactică şi pedagogică R.A.Bucureşti,1998. Webografie *** http://www. insse.ro şi *** http://epp.eurostat.ec.europa.eu/

2.1 Program, modalităţi, tehnici şi erori specifice observării statistice

Indiferent dacă este considerată etapa unei cercetări statistice clasice descriptive (restrânsă la observare, prelucrare, analiză şi interpretare) sau a unei cercetări moderne selective (extinsă cu etapa inferenţei şi deciziei statistice), observarea statistică este o acţiune de culegere şi înregistrare de date sau informaţii referitoare la anumite caracteristici ale unităţilor statistice, după criterii unitare şi riguros definite. În orice observare domină două întrebări îndreptăţite. Prima se referă la „ce anume se observă” şi a doua la „în ce mod se realizează observarea”. Răspunsurile practice devin esenţa observării, respectiv se observă numai acele

Page 20: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

14

trăsături, însuşiri sau caracteristici ale unităţilor statistice, care corespund scopului declarat al cercetării statistice sau sunt bănuite a fi cauze, factori explicativi pentru fenomenele şi procesele studiate şi oricât ar fi de limitată sau de extinsă observarea, datele se culeg şi se înregistrează conform unui program sau plan de observare. Programul unei observări statistice reprezintă o combinaţie optimă de decizii referitoare la probleme metodologice şi organizatorice, un veritabil itinerar ce conduce la atingerea obiectivelor observării.

Elemente ale componentei metodologice în programul de observare Caseta nr. 2.1 Scopul observării constă în a oferi date şi informaţii statistice în vederea elaborării de variante de decizie sau de validare / invalidare ulterioară a impactului decizional. Delimitarea populaţiei statistice impune identificarea spaţială, temporală şi organizatorică (administrativă) a mulţimii unităţilor statistice ce o compun. (inclusiv eşantioane prelevate din populaţia totală în cazul observărilor parţiale cu scop de testare, de probă sau pilot). Definirea unităţii statistice presupune precizarea succintă, simplă şi lipsită de ambiguitate a elementelor, manifestărilor, cazurilor, indivizilor unei populaţii statistice. Precizarea timpului observării, fie ca moment t, generând o imagine de stoc a fenomenului, fie ca perioadă sau interval între două momente t şi t+1, oferind o imagine de flux ca însumare a manifestărilor, cazurilor, apariţiilor din perioada cercetată poate conduce la perioade identice sau diferite în raport cu timpul de referinţă al observării efective. Precizarea locului observării identifică detaliat adresa (locaţia) unităţii statistice sau un anumit itinerariu cu sau fără salt de la o adresă la alta. Precizarea caracteristicilor (variabilelor) supuse observării trebuie să cuprindă elemente privind măsurarea, scala de măsurare şi comparabilitatea unităţilor de măsură diferite. Determinarea riguroasă a metodelor, tehnicilor, procedeelor de recoltare a datelor este dominată de principiul optimizării raportului cost-eficienţă (efort minim şi rezultat maxim). Anticiparea apariţiei unor erori, a surselor acestora, inclusiv a ratei de nonrăspuns facilitează prelucrarea şi analiza finală a datelor culese şi înregistrate. În observarea statistică trei deficienţe sunt recunoscute ca „delicte”grave: alegerea unui timp inadecvat, a unei populaţii nereprezentative şi a unui personal nepregătit.

Elemente ale componentei organizatorice în programul de observare Caseta nr. 2.2 Selectarea şi pregătirea personalului se realizează în funcţie de caracterul permanent (temporar), dar şi de periodicitatea observării, iar verificarea onestităţii, eficienţei şi adecvării pregătirii la cerinţele majore ale fiind nu lipsesc din nici un program practic. Documentele observării reunesc chestionare şi fi şe specifice agenţilor economici sau respondenţilor individuali, cu liste comune sau formulare ale raportărilor instituţionale, cu ghiduri de interviuri sociale şi cu formulare virtuale postate pe web-site-uri etc. Toate pot genera erori sistematice, prin tehnoredactarea lor incorectă sau instrucţiuni incomplete. Informarea şi mobilizarea opiniei publice în investigaţiile statistice majore se realizează după obţinerea unui aviz favorabil din partea autorităţilor publice. Programul se încheie cu un calendar de predare a bazelor de date şi de informaţii culese şi înregistrate, în vederea prelucrării şi sistematizării lor pentru determinarea indicatorilor. Programul unei observări statistice se particularizează relativ şi în raport cu modalităţile teoretice sau cu tehnicile practice specifice de culegere şi înregistrare.

Page 21: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

15

Tipologia modalităţilor de observare Tabel nr. 2.1

Criterii de clasificare Modalităţi de observare I.Accesul la unitatea statistică

•••• directă sau prin contact nemijlocit cu unitatea statistică (măsurarea, cântărirea, intervievarea etc.) •••• indirectă sau documentară (extragerea cu discernământ a datelor din înregistrări sau cercetări anterioare)

II. Populaţia observată •••• totală (exhaustivă) sau înregistrarea tuturor unităţilor, constituind populaţia finită, supusă cercetării

•••• parţială (selectivă) sau în eşantionul prelevat III.Periodicitatea observării •••• curentă (continuă)

•••• periodică (la limită chiar unică) Principalele tehnici de observare sunt recensământul sau inventarul, eşantionul extras aleator (repetat şi nerepetat), panelul sau eşantionul constant în cote (dirijat sau subiectiv), observarea părţii principale sau a masivului de date, ancheta, monografia şi observarea prin intermediul rapoartelor sau formularelor statistice.

Principalele tehnici de observare statistică – descriere succintă Caseta nr. 2.3 Recensământul este o tehnică bazată pe modalitatea de observare directă, exhaustivă, periodică şi realizată după criterii unitare, nediscriminatorii şi riguros stabilite.Tipurile cele mai cunoscute sunt recensământul populaţiei şi al locuinţelor, alături de recensământul agricol (suprafeţe de teren, numărul de pomi, animale, valoarea şi numărul pieselor de inventar agricol). Recensământul populaţiei este cel mai vechi şi cel mai frecvent practicat, romanii fiind aceia care l-au consacrat şi i-au conferit un limbaj specific (census, lustrum, tabularium etc.). Introduse în Roma de către Servius Tullius (578 – 534 î.Hr.) „census“–urile romane se succedau la o perioadă (lustrum) de numai cinci ani. În vremurile lui Augustus, în Roma devenită capitala unui imperiu extins în „mai multe continente”, periodicitatea s-a mărit, la zece ani, ca în timpurile lui Diocleţian să crească la 15 ani, cauza fiind diminuarea resurselor imperiale, mai ales financiare.“Census populi“ sau operaţiunea recenzării se realiza iniţial pe câmpul lui Marte, conducerea ei era încredinţată „censorilor”, în timp ce declaraţiile date de cetăţeni cu prilejul recensământului erau depozitate la “tabularium“ sau arhiva publică. Cel mai apropiat recensământ de anul “0”, a fost realizat la moartea împăratului August, în anul 14 d.Hr., şi a înregistrat circa 54 de milioane de locuitori, respectiv populaţia cunoscută de romani în imperiul acestora (în acelaşi secol, China era estimată la circa 71 de milioane de locuitori, Egiptului la 9 milioane, iar o estimare populaţiei omenirii pare să fi fost cuprinsă undeva între 200 şi 300 de milioane de locuitori, în timp ce astăzi depăşeşte 6,8 miliarde de locuitori,iar în 2050 va atinge 9,2 miliarde). Primele recensăminte cu caracter ştiinţific real s-au realizat la finalul celei de-a doua jumătăţi a secolului al XVIII-lea (începând cu 1749 în Suedia, 1790 în SUA, 1800 în Anglia şi 1801 în Franţa), iar cel dintâi recensământ unitar metodologic şi comparabil cu cele de astăzi rămâne cel realizat în Belgia, sub conducerea statisticianului Adolphe Quetelet, în 1846. Demografia actuală defineşte recensământul populaţiei ca o observare statistică, exhaustivă, având drept obiectiv înregistrarea populaţiei la un moment dat, împreună cu o serie de caracteristici demografice şi socio-economice: domiciliul, vârsta, sexul, starea civilă, cetăţenia, nivelul de instruire, locul de muncă, categoria socială etc., organizată în vederea determinării numărului, structurii şi repartizării teritoriale a populaţiei. Recensământul contemporan valorifică şi două tipuri de anchete specifice:a)

Page 22: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

16

ancheta de probă sau test (pilot), anterioară, cu scop de verificare, printr-o simulare restrânsă spaţial; b) ancheta de control, ulterioară, cu rol de estimare prin sondaj, a calităţii înregistrărilor(nivel de precizie al recensământului, erori de înregistrare). Potrivit metodologiei ONU, proiectarea unui recensământ are în vedere existenţa unui temei legal care să conţină dispoziţii privind lansarea, programul de observare, personalul implicat, costurile, precizarea momentului critic („ora zero”, ziua, luna), obiectivele propuse şi eşalonarea operaţiilor, organizarea şi administrarea activităţii specifice, lucrările pregătitoare în teren (sectorizare, întocmire hărţi etc.), pregătirea chestionarului, stabilirea programului de prelucrare, planul de înregistrare, programul de prelucrare şi valorificare a datelor, programul de publicaţii, ancheta de probă, test sau pilot (recensământul experimental), publicitatea, recrutarea şi formarea personalului, studierea sectoarelor de recensământ de către recenzori, difuzarea chestionarelor şi instrucţiunilor, înregistrarea propriu-zisă a datelor, după primirea şi verificarea formularelor, însoţită de controlul pe teren după înregistrare, ancheta de control, gruparea şi prelucrarea datelor, elaborarea unor studii diverse. În privinţa metodei de înregistrare sunt argumente care pledează pentru autoînregistrare şi recensământ prin internet, în cazul populaţiilor cu venit ridicat, alfabetizate, instruite completă, cu dezavantajul interpretării neunitare a noţiunilor, dar şi pentru interogarea orală şi înregistrarea directă ca fiind superioare şi unitare, dacă sunt puse în practică de către recenzori instruiţi metodic. Definirea unităţilor statistice (persoana, gospodăria, locuinţa, clădirea) şi stabilirea caracteristicilor se asigură prin nomenclatoare statistico-demografice, unde se identifică variantele variabilelor personale de la domiciliul şi reşedinţa, la locul naşterii, locul de muncă, sexul, vârsta, starea civilă, vârsta la căsătorie, numărul de copii născuţi-vii, copiii în viaţă, cetăţenia, etnia, limba, religia, nivelul de instruire, tipul activităţii, ocuparea, mediul de rezidenţă, compoziţia gospodăriei, compoziţia familiei, statutul social-economic, venitul, suprafaţa şi dotarea locuinţei sau clădirii. În privinţa recensămintelor România beneficiază de o bogată tradiţie, primul recensământ modern fiind cel realizat după Unirea Principatelor (în perioada decembrie 1859–martie 1860) şi care a cuprins locuitorii din Moldova şi Ţara Românească, întrunind majoritatea cerinţelor impuse recensămintelor în epocă, de la universalitate,la înregistrarea prin dialog cu subiectul, la caracterul individual al înregistrării, la iniţierea şi efectuarea acţiunii de către stat. În secolul XX s-au mai efectuat nouă recensăminte, în momentele critice sau zero (conform principiului simultaneităţii sau al reperului temporal unitar definit ca ziua recensământului, socotită la ora zero): 1 decembrie 1899, 19 decembrie 1912, 29 decembrie 1930, 29 decembrie 1930, 6 aprilie 1941, 25 ianuarie 1948, 21 februarie 1956, 15 martie 1966, 5 ianuarie 1977, 7 ianuarie 1992. În noul mileniu, România a realizat cu finanţarea Uniunii Europene recensămintele din 18 martie 2002 şi 22 Octombrie 2011. Inventarul este o observare totală, directă şi periodică a populaţilor statistice specifice activităţii firmelor şi instituţiilor publice cu referire la numărul, mărimea, tipologia activelor imobilizate, obiectelor de inventar, stocului de mărfuri, materialelor sau materiilor prime. Datorita unui raport cost-eficienţă cu mult mai bun, categoria cea mai larg utilizată a observărilor statistice este aceea a tehnicilor parţiale sau selective. Dacă tehnica practică este aceea a eşantionului extras aleator (repetat şi nerepetat), atunci are loc o extindere sau inferenţiere riguroasă a rezultatelor obţinute prin observare în eşantion (populaţie selectată), la întreg (populaţie totală), cu precizarea erorii limită admise. Costul mai redus şi timpul mai scurt al acestei observări sunt principalele avantaje, alături de precizarea prealabilă a erorii (maxim 5% în economie). O altă tehnică practică este şi aceea a panelului, care a debutat ca un eşantion selectat dirijat sau subiectiv, constant sau stabil în cote pentru mai multe observări succesive. Apărute în sectorul produselor de larg consum, la nivel de

Page 23: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

17

magazin şi apoi de consumatori), panelurile s-au dezvoltat ca urmare a cererii de informaţii în economiile de piaţă. Primul panel a fost creat în anul 1929, în S.U.A. de către Arthur Charles Nielsen ca panel de distribuitori, iar in Europa apare şi se extinde progresiv, începând cu anul 1950. Panelul de distribuitori a rămas axat pe un eşantion statistic permanent de puncte de vânzări cu amănuntul, panelul de consumatori este constituit din gospodării, ambele fiind reprezentative la un anumit moment pentru populaţiile cercetate. Observarea părţii principale sau a masivului de date este o tehnică practică de observare, motivată mai ales de lipsa acută de resurse (personal, timp şi bani). Această tehnică este bazată pe culegerea şi înregistrarea datelor de la un număr restrâns de unităţi considerate principale, furnizând proporţia majoritară şi semnificativă (masivul de date). Această observare este justificată şi de principiul „20/80” al lui Vilfredo Pareto (20% din cauze, factori sau unităţi ale populaţiei oferă explicaţii pentru aproximativ 80% din efecte). Ancheta statistică reprezintă o tehnică de observare în plină extindere, acoperind majoritar observarea fenomenelor economice şi sociale. Ancheta este tehnica de observare a unei părţi oarecare din populaţia statistică, mai rar extrasă aleatoriu, fără şanse de a putea evalua matematic erorile şi nerestricţionată de o structură complet asemănătoare populaţiei totale, ca în cazul panelului şi nici limitată prin variabile şi unităţi ca observarea masivului de date. Ştiinţele sociologice definesc şi ele numeroase tehnici specifice, dar accentuează importanţa anchetei şi interviului. Principalele diferenţe între anchetă şi de interviu sunt: a) o anchetă este standardizată integral, în timp ce interviul, foarte rar şi atunci numai general tematic; b) ancheta se bazează pe chestionar (şi pe un manual de anchetă), iar interviul, exclusiv pe ghidul interviului; c) ancheta se utilizează extensiv, interviul intensiv; d)populaţia observată este mult mai numeroasă în anchetă, decât în interviu. După cum inventarul are un conţinut majoritar contabil şi parţial statistic, tot astfel monografia este o observare predominant sociologică sau contabilă şi doar în secundar are şi caracter statistic. Definită ca observare intensivă a unui anumit domeniu ştiinţific, a unui anumit teritoriu cu toate metodele şi instrumentele unei ştiinţe, cu referire specială la domeniul contabilităţii, sociologiei sau statisticii, monografia rămâne totuşi limitată, aparţinând mai ales perioadei descriptive a ştiinţei statistice. Tradiţiile şcolii monografice şi sociologice româneşti, dar şi caracterul complex al campaniilor monografice au fost unele de excepţie. În România interbelică, după ce idealul naţional al unirii a fost realizat, generaţiile de absolvenţi ai universităţilor româneşti s-au aflat într-o efervescenţă creativă şi o comunicare culturală excepţională. Şcoala sociologică sau monografică, Serviciul social, Institutul Social Român, Criterion, Fundaţiile Regale cu editurile şi revistele lor au constituit o legătură vitală şi durabilă între toţi cei pe care i-au adus în contact şi al căror act fundamental de credinţă a devenit: ”a-ţi cunoaşte ţara pentru a o servi”. Serviciul social, care a funcţionat în 1938 şi 1939, a instituit chiar obligativitatea pentru fiecare student de a participa în campanii sociologice, la realizarea unei monografii a unui sat românesc, în vacanţa de vară. Monografia interbelică a rămas un curent cultural, esenţa originalităţii sale fiind dată de pluridisciplinaritatea monografiştilor. Observarea prin intermediul rapoartelor sau formularelor statistice solicitate de instituţia naţională specializată este un sistem practic de observare reunind toate tehnicile descrise anterior în cadrul programului cercetărilor statistice. Se poate exemplifica prin domeniul demografic unde se confruntă observarea totală, periodică şi directă a recensământului, cu cea de tip documentar, curentă cu ajutorul sistemului buletinelor statistice demografice şi a registrelor de populaţie. Utilizarea combinată de tehnici de observare, de la interviul telefonic la raportul statistic, de la preluarea de baze de date prin internet sau intranet, la simpla confruntare de fişiere transmise în reţele, subliniază diversitatea practică a observării statistice contemporane.

Page 24: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

18

Procesul de observare nu se poate realiza fără măsurarea statistică definită ca scalare şi reunind prezenţa variabilei, etalonului de măsură şi unor reguli precise de atribuire a valorilor numerice sau atributelor nenumerice (ordinea prin numerale, clasificările prin simboluri etc.). Etalonul de măsură este o mărime definită, cu care urmează a fi comparate variantele ce descriu nivelul de dezvoltare a caracteristicii numerice studiate sau starea atributivă a unei trăsături. Etalonul natural defineşte o mărime naturală absolută, cu semnificaţie de unitate de măsură şi exprimare numerică certă şi precisă (metru, kilogram etc.), în timp ce etalonul conceptual defineşte o mărime relativă printr-un set de criterii sau standarde cu sensul de unitate convenţională de măsură. Pentru unele variabile atributive statistica utilizează şi ea etaloane conceptuale prin scalele calitative în mod special. „Asocierea variabilei unei caracteristici” sau scalarea calitativă în expresia sa clasică este legată de parcurgerea următoarelor etape: mai întâi se identifică un „câmp maxim de amplitudine sau un spaţiu de variaţie” (ca rezultat al observării), care va avea conţinutul unei mulţimi de valori ce vor fi ulterior asociate cu variantele caracteristicii, apoi se definesc regulile de asociere şi simbolurile pentru situaţiile concrete ale variantelor reale şi, la final, se trece la asocierea practică, pentru caracteristica de tip calitativ studiată, fiecărui individ îi va corespunde o singură valoare din câmpul maxim de amplitudine sau spaţiul specific de variaţie. Prima formă de măsurare statistică este scala nominală (neparametrică). A nominaliza statistic nu înseamnă a realiza operaţii, ci a identifica şi clasa. Debutul operaţional în măsurare aparţine scalei ordinale (ierarhice) care introduce relaţia de ordine sau ierarhice (orice stare nou definită este superioară celei anterioare (exemplul nivelului şcolii absolvite este edificator prin stările succesive analfabet, absolvent de ciclu primar, gimnazial, liceal, universitar, postuniversitar etc). Când numărul operaţiilor creşte apar scala cardinală (de interval), unde adunarea şi scăderea sunt utilizate fără riscuri, dar nu se recomandă înmulţirea şi împărţirea, precum şi scala proporţională (de raport), permisivă în raport cu toate operaţiile.

În general, nu există observare care să nu fie influenţată de erori specifice, clasificate în sistematice (care provin din acţiunea continuă şi constantă a unui factor, care produce o distorsiune sau deplasare a variantelor, întotdeauna în acelaşi sens, ele fiind cauzate de om sau aparat în procesele de numărare, măsurare, interogare, calcul sau de nerespectarea principiilor de chestionare şi înregistrare) şi întâmplătoare sau accidentale (care rezultă din acţiunea unor factori aleatori ce produc devieri, deplasări ale variantelor continuu în ambele sensuri, astfel încât cu cât populaţia statistică observată va fi mai numeroasă, cu atât erorile de un anumit sens le vor compensa pe cele de sens contrar şi conform legii numerelor mari, data sau informaţia finală vor fi practic foarte puţin sau aproape deloc afectate de acest tip de eroare). Ordinul de mărime al erorilor generează valorile extreme sau „aberante”, ce se revăd sau elimină chiar de la apariţia lor. Sensul unic agregativ sau compensator al unei erori este evidenţiat de calculul erorii nete (En), respectiv En =|Σei|=|Σ(x0-xi)|,unde 1≤i≤n şi xi= valoarea eronată.Dacă erorile individuale (ei) reprezintă semne diferite şi relativ alternante pentru câteva situaţii luate în calcul (ex:ei =+3,-6,+5,-4,+2,+1,-3,-1), atunci se

Page 25: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

19

identifică o eroare întâmplătoare. În măsura în care se realizează un număr mai mare de verificări, eroarea netă scade sau tinde spre valoarea zero (En↓), de unde şi noţiunea de eroare potenţial compensatoare.Dacă erorile individuale(ei) prezintă exclusiv acelaşi semn (fie numai +, fie numai -), eroarea rezultată este de natură sistematică. În măsura în care, pentru un număr tot mai mare de verificări, eroare netă creşte (En↑), apare şi noţiunea de distorsiune (deplasare a valorii). Prevenirea apariţiei erorilor începe cu identificarea lor prealabilă prin observări test, pilot sau de probă şi continuă cu elaborarea de formulare şi chestionare clare, complete, cu redactarea de întrebări simple, precise şi a unor instrucţiuni uşor de înţeles. Câteva soluţii prompte de prevenire, control şi, eventual, înlăturare a erorilor Caseta nr. 2.4 Controlul cantitativ/calitativ al erorilor de observare se face atât în timpul cât şi imediat după realizarea observării. Controlul cantitativ are ca obiective asigurarea completitudinii şi autenticităţii culegerii şi înregistrării de date (în volum complet şi de la toate unităţile statistice din programul observării, autentificate nominal, prin coduri, semnături, ştampile, adrese poştale, telefon, fax, e-mail etc). Controlul calitativ se referă la realizarea efectivă de verificări logice, de la verificarea respectării unor corelaţii, conexiuni, legături logice între variabile, pânǎ la realizarea de verificări aritmetice sau de utilizare a unor „chei de control” conţinând operaţii aritmetice simple bazate pe respectarea unor relaţii balanţiere (nivel iniţial + intrări = nivel final + ieşiri). Cheile de control existǎ, parţial, în instrucţiuni de observare şi, complet, în erorile descrise prin programele informatice adecvate introducerii datelor în calculatoare şi formării bazelor de date. Ca urmare a extinderii prelucrărilor automate apare cu o frecvenţă tot mai mare un tip de control mixt, simultan calitativ şi cantitativ, bazat pe valori limitative înscrise pe rapoarte sau formulare de observare, care se stabilesc apelând şi la o valoare reziduală maximală, acordând un prag de 5% sub şi peste nivelul rezultat din calcule, pornind de la cerinţa de asigurare a unei informaţii statistice în procesul deciziei economice şi sociale cu o probabilitate de apariţie suficientă de 0,95 sau valabilă în 95% din cazuri). Înlăturarea parţială a erorilor constatate sau, dacă este posibilă, eliminarea erorilor de observare se realizează în funcţie de proporţia unităţilor la care s-au identificat valori eronate. O primă soluţie ar fi refacerea întregii observări a populaţiei dacă numărul erorilor depăşeşte un prag limită prestabilit (situaţie gravă, cu consecinţe în costuri, determinată superficialitatea observărilor test, pilot sau de probă). Dacă numărul de erori de observare este mai mic sau sub prag, apar trei soluţii de ameliorare în funcţie de tehnica de observare: a)soluţia corectării erorilor la unităţile statistice la care au fost constatate (valabilă în observarea totală şi implică o nouă culegere şi înregistrare la acele unităţi statistice la care s-au identificat erorile); b) soluţia înlăturării unităţilor ce au prezentat erori şi înlocuirea lor cu unităţi statistice noi, la care se va realiza practic vechea culegere şi înregistrare de date (valabilă în observarea parţială); c) soluţia înlăturării unităţilor statistice generatoare de erori la n elemente şi extinderea informaţiei obţinute de la populaţia statistică ce nu a furnizat erori în cercetare (N-n) elemente, la populaţia totală iniţială de N elemente. În cazul primei soluţii existǎ riscul repetării erorii din dorinţa sursei de a fi constantǎ în afirmaţii, în cazul celei de-a doua soluţii poate apare imposibilitatea identificării de unităţi statistice „similare” pentru înlocuire, iar în cazul celei de-a treia soluţii, aceasta poate fi insuficientă (nereprezentativă) pentru cunoaşterea întregii populaţii de N elemente, pe baza a numai (N-n) elemente.

Page 26: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

20

2.2 Etape în sistematizarea datelor statistice Sistematizarea datelor statistice reprezintă un complex de operaţii de

prelucrare(colectare, aranjare, ordonare, grupare, clasificare, centralizare, agregare, prezentare şi reprezentare), în vederea expunerii cât mai clare şi într-o formă cât mai uşor accesibilă a informaţiilor finale ale observării.

Principalele etape ale procesului de sistematizare Caseta nr. 2.5 I.Colectarea şi centralizarea datelor brute sunt punţi între observare şi sistematizare, constând în aducerea datelor la un loc sau la un centru unic de prelucrare, urmată de centralizarea matriceală (tabelară) uniformă a datelor brute, denumită centralizare simplă. II.Calculul caracteristicilor secundare (derivate) se realizează prin modele simple de tip aditiv (bazate pe adunare, inclusiv pe substituirea a două variante prin diferenţa sau soldul lor) sau multiplicativ (axate pe înmulţire şi împărţire, inclusiv pe substituirea a două variante prin raportul lor) şi impun anterior măsurarea statistică, a cărei ecuaţie simplă este: k = (Valoare măsurată) : (Unitate de măsură standard), unde k rezultă din măsurare. II.Gruparea şi clasificarea datelor individuale constituie etapa esenţială a sistematizării statistice.În timp ce gruparea statistică presupune dezmembrarea, descompunerea, scindarea sau partiţionarea unei populaţii statistice în componente omogene numite grupe, ale căror unităţi sunt de acelaşi fel sau tip calitativ (diferă una de alta, în mică măsură), clasificarea statistică sau nomenclatorul definesc o grupare stabilă, care s-a validat, respectiv a rezistat în timp sau a fost oficializată printr-un act normativ. Considerată una dintre cele mai vechi metode statistice, gruparea constrânge pe utilizatorul ei la parcurgerea următorilor paşi: A. identificarea, selectarea şi folosirea caracteristicilor de grupare; B. Calculul sau alegerea numărului optim de grupe (r) şi stabilirea înălţimii intervalului de grupare (h) conform relaţiei lui H.A. Sturges, valabilă în cazul grupării pe intervale egale: h = (Ax) : (r) = (xmax - xmin): (1+3,322 lg n ), unde: Ax = amplitudinea sau câmpul maxim de împrăştiere al variabilei xi şi n = numărul unităţilor statistice, iar r = numărul de grupe (intervale), limitat de statistica clasică diferit: rmax <5 lg n sau 6≤ rmediu≤ 16 sau rmax ≈ 25; C.determinarea centrului intervalului de grupare [x i = ½ (xsup+xinf)] pornind de la limitele de interval şi evaluarea erorii (absolute sau relative) introduse în calcule prin grupare; D.selectarea formei optime de prezentare şi reprezentare a rezultatului grupării cu precizarea alternativelor la problemele soluţionate prin metoda grupării . Tipologia grupării este variată, în raport cu numărul caracteristicilor de grupare se disting gruparea simplă şi combinată, cu natura variabilei gruparea cronologică, teritorială şi atributivă, dar şi repartiţia (distribuţia) de frecvenţe, iar în raport cu complexitatea procesului gruparea pe variante distincte, pe intervale de variaţie (egale sau neegale). Gruparea pe intervale neegale este cunoscută şi sub denumirea de grupare tipologică. Gruparea pe intervale de variaţie se realizează cu respectarea principiilor omogenităţii, completitudinii, unicităţii şi scindării respectiv recompunerii succesive a grupelor sau intervalelor. Pornind de la exemplul comun al notelor obţinute la examen de către un grup de 50 de studenţi grupate iniţial pe variante distincte: yi : 3 4 5 6 7 8 9 10 ni : 1 4 5 6 16 8 6 4

unde yi = nota obţinută, iar ni = numărul (frecvenţa absolută) celor ce deţin nota yi.

Amplitudinea fiind Ax = xmax - xmin =10-3 =7 puncte, iar pentru un număr comandat de grupe (intervale), de exemplu r = 4, înălţimea h ≈ 2. există multiple soluţii de grupare simplă a numărului de studenţi (ni) conform notei (xi) prin precizarea concretă a: A – variantelor limit ǎ de B – apartenenţei limitei C – apartenenţei limitei

Page 27: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

21

interval inferioare a intervalului superioare a intervalului Tabel nr 2.1 Tabel nr.2.2 Tabel nr. 2.3

xi ni xi ni xi ni 3-4 5 2-4 5 2-4 5 5-6 11 4-6 11 4-6 11 7-8 24 6-8 24 6-8 24

9-10 10 8-10 10 8-10 10 Total 50

Total 50

Total 50 Observaţie: variabila xi este discretă şi are limi-te discontinui [xinf-xsup].

Observaţie: limita inferioa-ară nu este inclusă în interval sau (xinf-xsup]

Observaţie: limita supe- rioară este inclusă în interval sau (xinf-xsup]

sau prin grupare pe intervale neegale de variaţie (studenţi nepromovaţi, medii şi buni) xi [2-4] [5-7] [8-10] Total ni 5 27 18 50

Între r şi h există o relaţie indirectă, produsul lor fiind egal cu amplitudinea. În populaţiile grupate pe intervale pentru calcule se valorifică centrul de interval [xi = ½ (xsup+xinf)]. Rezultatele grupării sunt seria (modalitate de prezentare a datelor sub forma a două şiruri paralele, în care primul şir se referă la caracteristica de grupare, iar cel de al doilea înfăţişează rezultatul centralizării frecvenţelor sau valorile unei alte caracteristici, aflate într-o relaţie de interdependenţă cu caracteristică de grupare), tabelul (imagine de ansamblu sistematică şi neechivocă a unor judecăţi asupra fenomenului cercetat, beneficiind de o formalizare succintă, expusă prin cuvinte, expresii şi ordine de mărime cât mai simple şi uşor de înţeles, eliminând omisiunile, confuziile şi redundanţa informaţională) şi graficul (suportul vizual decizional al gândirii logice). III. Centralizarea complexă şi agregarea datelor prezintă aceeaşi semnificaţie de însumare sau agregare directă, cu evidenţierea unor structuri prin totaluri parţiale, dar se poate identifica o diferenţă semantică semnificativă între cei doi termeni. Agregarea este o centralizare cu aport calitativ, rezultatul însumării directe realizate după o metodologie specifică de calcul, putând deveni o informaţie de referinţă şi fiind uşor de corectat direct cu anumite elemente ce apar pe o treaptă superioară de analiză. IV. Determinarea indicatorilor statistici constituie obiectivul principal al sistematizării şi oferă suport prezentării şi reprezentării lor finale. Indicatorul statistic rezultat din sistematizarea datelor în calitate de expresie cantitativă (numerică) a unei determinări calitative constatate pe elementele unei populaţii bine delimitate în timp, spaţiu sau organizatoric, deţine funcţii de măsurare, comparare (confruntare), analiză şi interpretare, sinteză, estimare, prognoză, verificare a ipotezelor statistice şi testare .

2.3 Indicatori relativi şi locul lor în universul indicatorilor statistici Indicatorii statistici se clasifică în absoluţi (ca rezultat direct al măsurării şi

eventual al centralizării sau agregării) şi derivaţi (rezultaţi dintr-o prelucrare ulterioară observării şi măsurării fie simplă, fie cu un caracter complex de abstractizare sau generalizare). La rândul lor, indicatorii absoluţi sunt structuraţi în categoria celor de măsurare şi a celor sintetici (implică suplimentar prezenţa agregării ca însumare cu aport calitativ), iar cei derivaţi sunt rezultaţi din comparare sau confruntare (sub formă de diferenţă sau de raport) şi din estimare (determinaţi pe baza unui algoritm standard). Din categoria indicatorilor derivaţi prin comparare sub formă de raport fac parte indicatorii relativi (de structură, de

Page 28: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

22

coordonare, de dinamică, de intensitate şi ai programului), iar dintre cei derivaţi prin estimare se pot enumera indicatorii medii, sintetici de variaţie, de asimetrie, de boltire etc. Indicatorul relativ exprimă caracteristici calitative prin compararea sub formă de raport a altor doi indicatori (absoluţi, relativi sau medii) şi este rezultatul împărţirii indicatorului raportat, la cel denumit bază de raportare (comparaţie) fiind un număr pur (adimensional) în cele mai multe situaţii (fac excepţie indicatorii relativi de intensitate, care deţin două unităţi de măsură). Clasificarea acestui indicator relevă cinci categorii speciale: indicatori relativi de structură, de coordonare, de dinamică, de intensitate şi ai programului (planului).

Indicatori relativi, proceduri de determinare şi grafice specifice Caseta nr. 2.6 Indicatorii relativi de structur ă arată în ce raport se află fiecare variantă statistică, grupă sau interval de variaţie cu întreaga populaţie şi apar sub denumirea de pondere sau cotă

parte (xi: ∑=

m

1i ix ), frecvenţă relativă (ni: ∑=

m

1i in ) şi greutate specifică (xini: ∑=

m

1i inix ), cu i = m1 ,

iar 100% sau 1 devin valorile maxime procentuală, respectiv în exprimată prin coeficienţi. Graficul specific rămâne diagrama de structură. Indicatorii relativi de coordonare descriu numeric raportul dintre doi indicatori de acelaşi fel ce caracterizează grupe diferite sau intervale de variaţie distincte, dar aparţinând aceleiaşi populaţii statistice sau prezintă cantitativ raportul dintre nivelurile atinse de un indicator în teritorii diferite (xi:xj), unde i şi j = m1 . Cunoscuţi mai ales ca indici teritoriali, pot lua orice valori (mai mari dar şi mai mici ca 100%, respectiv ca 1) iar graficul specific este cartograma sau cartodiagrama. Indicatorii relativi de dinamic ă redau evoluţia unui fenomen în timp şi reflectă variaţiei indicatorului specific de la o perioadă bază de comparaţie sau anterioară (x0 sau xt-1) la o perioadă curentă (xt). Rezultatul comparării sau confruntării celor două niveluri ale

fenomenului este un indice statistic cronologic cu bază fixă (i xt 0/ ) sau cu bază în lanţ sau

mobilă (i xtt 1/ − ) calculaţi astfel:ix

t 0/ =(xt): (x0)×100 şi i xtt 1/ − =(xt): (xt-1)×100. Pot lua orice

valori, de regulă procentuale (mai mari dar şi mai mici ca 100%) iar graficul specific este cronograma cu timpul redat pe abscisa Ox (rareori diagrama prin benzi sau coloane). Indicatori relativi de intensitate reprezintă un raport între doi indicatori diferiţi ce caracterizează două fenomene ce se află într-o relaţie de interdependenţă, beneficiind de o dublă unitate de măsură. Se calculează la nivel de unităţi simple (xi:yi) sau la nivel agregat

( ∑=

m

1i ix : ∑=

m

1i iy , cu i= m1 ). Nu există restricţii valorice, iar diagramele prin figuri geometrice,

benzi şi coloane domină reprezentarea lor grafică. Indicatorii relativi ai programului (planului)se determină fie ca raport al nivelului curent realizat (xt) şi nivelului programat (xpr), denumiţi indici ai gradului de îndeplinire ai programului [(xt: xpr) ×100], fie ca raport între nivelul noului program şi nivelul perioadei trecute (xt-1), denumiţi şi indici ai sarcinii de program sau plan [xpr:xt-1) ×100], realitatea nelimitându-le valoarea în raport cu 100% şi nici forma de reprezentare statistică la un anumit fel de diagramă (domină totuşi diagramele comparative prin benzi sau coloane).

Prezentarea datelor grupate şi a indicatorilor rezulta ţi se realizează sub formă de serii şi tabele statistice iar reprezentarea sub formă de grafice. Seria

Page 29: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

23

statistică este rezultatul direct al grupării statistice, fiind alcătuită din două şiruri de date paralele, primul şir se referă la caracteristica de grupare, iar cel de al doilea înfăţişează rezultatul centralizării frecvenţelor sau valorile altei caracteristici aflate într-o relaţie de interdependenţă cu caracteristica de grupare (variantă sau stare, timp sau spaţiu), ceea ce face ca această exprimare a unei variabile în raport cu variaţia alteia să fie denumită când serie de repartiţie de frecvenţe, când serie cronologică sau teritorială. Tabelele statistice reprezintă imagini de ansamblu ale unor judecăţi postgrupare sau postsistematizare, beneficiind de o formalizare succintă, sistematică şi neechivocă asupra fenomenului studiat, expuse într-un spaţiu redus, prin cuvinte, expresii şi ordine de mărime, cât mai simple şi uşor de înţeles, eliminând sau diminuând omisiunile şi confuziile, dar mai ales redundanţa informaţională (repetarea informaţiilor). Indiferent de scopul pentru care au fost create, tabelele trebuie să respecte, atât elementele de fond (subiectul şi predicatul specific), cât şi elementele de natură formală (titlul, reţeaua şi sursa de date).

Titlul general al tabelului statistic

Tabel nr. 2.4 - U.M. - Predicatul tabelului

Titluri interioare -A- -B- -1- -2- … … … -n-

R e ţ e a u a t a b e l u l u i

st a t i stic

S

ubie

ctul

ta

belu

lui

T

itlur

i in

terio

are

Total*

Sursa: detaliată prin autor, lucrare, editură, localitate, anul apariţiei, pagina. Graficele statistice sau diagramele sunt forme de reprezentare a indicatorilor rezultaţi din sistematizarea datelor, ce valorifică maximal calitatea celui mai bine structurat şi capacitat organ de simţ uman care este ochiul, în a aprecia sintetic forma, direcţiile, lungimile, suprafeţe şi mai ales raportul dintre toate acestea. Definit succint de André Piatier ca „suport vizual al gândirii logice”, orice grafic statistic obligă atât la cunoaşterea elementelor sale constructive (titlul, reţeaua, scara de reprezentare, legenda şi notele explicative, sursele de date), cât şi la respectarea principiilor şi regulilor referitoare la proporţii, la linii, culori şi haşuri, la corespondenţa cu fenomenul primar şi la adecvarea prin indicatori optimi a fenomenelor studiate. Principalele semnale practice de ambiguitate şi neîncredere în reprezentarea grafică sunt generate de nerespectarea regulii de aur a lui ¾ (abscisa Ox fiind întotdeauna egală cu ¾ din ordonata Oy), falsificarea principiului proporţionalităţii şi echidistanţei, necunoaşterea adecvării scalei de reprezentare la conţinutul fenomenului, alegerea inadecvată a indicatorului statistic în raport cu obiectivul cercetării şi utilizării fără discernământ a graficelor color, ca şi a celor bazate pe figuri geometrice.

Câteva noţiuni fundamentale privind grafice uzuale şi diagrame statistice

Page 30: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

24

Caseta nr. 2.7 Reţea polară

2π =an, π = semestru etc.

unde: Ox este axa şi „O” polul axei, coordonatele devenind ρ = OP (raza vectoare exprimată într-o lungime oarecare şi α = unghiul polar (xOP), ex-primat în radiani.

Reţea rectangulară

unde:Ox (xi = abscisa) şi Oy (yi = ordonata) sunt coordonate perpen diculare P(x1,y1) iar scala poate fi aritmetică, logaritmică etc.

Reţeaua grafică poate fi a) vizibilă sau b) invizibilă

a) b)

Diagrame diverse (prin coloane, linii, histogramă, cronogramă, densitate de

frecvenţe, structurală)

0

1

2

3

4

5

6

7

1 2 3 4 5 6 7 8 9 100

1

2

3

4

5

6

7

1 2 3 4 5 6 7 8 9 10

0

1

2

3

4

5

6

7

0.5 1.0 1.5 2.0 2.5 3.0

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

5 10 15 20 25 30

Page 31: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

25

.0

.1

.2

.3

.4

.5

.6

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

65%

20%

15%

Alfa Beta Gama

Familia diagramelor, cum sunt denumite generic graficele statistice este mult mai numeroasă decât în exemplificarea anterioară şi cuprinde tipuri de grafice bine individualizate, de la diagrame prin benzi sau coloane, prin figuri geometrice de suprafaţă sau de volum, diagrame polare (radiale) şi cronograme (historiograme), diagrame teritoriale (cartograme sau cartodiagrame), diagrame aferente seriilor de repartiţie de frecvenţe unidimensionale (histograma, poligonul frecvenţelor, diagrama frecvenţelor cumulate) şi bidimensionale (corelograma) la multe alte diagrame diverse şi originale (pictograme cu figuri naturale şi convenţionale), aflându-se într-un proces continuu de multiplicare prin pachete de programe statistice cu grafice personalizate (Excel, SPSS, EViews, SAS etc.). Dacă secolul al XIX-lea a fost un secol al analfabetismului clasic, secolul al XX-lea a devenit acela al analfabetismului grafic (J.P.Simeray), iar secolul în al cărui al doilea deceniu am păşit deja se caracterizează prin analfabetism funcţional (S.P.Kapiţa).

2.4 Test de autoevaluare şi aplicaţii A) Test de autoevaluare

A1) Întrebări clasice recapitulative

(Completaţi spaţiile goale) 1. Elementele componentei metodologice în programul de observare sunt?

2.Ce tip de observare este recensământul?

3. Enumeraţi patru soluţii de prevenire, control şi, eventual, înlăturare a erorilor?

A2) Întrebări tip gril ă

(Încercuiţi litera răspunsului corect) 6. Definiţia incorectă a seriei de date este: a) rezultatul direct al grupării statistice; b) o dublă înşiruire de date, logic corelate; c) un cod (alfa) numeric de comunicare statistică; d) exprimarea unei variabile în raport cu variaţia alteia. 7. Gruparea salariaţilor după venit este: Grupe după venitul orar – lei / oră –

3,0-4,5

4,5- 6,0

6,0-7,5

7,5-9,0

9,0-10,5

Număr de salariaţi 6 23 14 5 2 Ponderea salariaţilor,în %, cu venit orar mai mic de 7,5 lei este: a)58;b) 86; c)96; d)106. 8. Comparaţia indicatorilor derivaţi se face: a) prin diferenţă; b) prin raport; c) prin

Page 32: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

26

4.Cum se calculează înălţimea intervalului de grupare?

5.Care sunt principalele categorii de indicatori relativi?

diferenţă şi prin raport; d) prin adunare. 9. Indicatorii relativi de structură presupun: a) raportarea a două valori aparţinând aceleiaşi populaţii; b) compararea nivelului din perioada curentă cu cel din perioada de bază (anterioară); c) raportarea a două valori cu unităţi de măsură diferite; d) compararea nivelului din perioada de bază cu cel curent.

B) Aplicaţii rezolvate 1.Ratele medii ale dobânzii la credite practicate de 10 bănci au fost în procente de: 9,1;10,4;11,3;10,2;12,3;12,9;10,6;11,8;11,5;11,1. Grupaţi băncile după dobândă, pe 4 intervale egale şi reprezentaţi grafic gruparea printr-o histogramă. Rezolvare: Valoarea r fiind dată (4), se calculează valorile A şi h necesare grupării Amplitudinea variaţiei dobânzilor A = (xmax -xmin) = 12,9-9,1=3,8 şi înălţimea unui interval h = A: r = 3,8:4 ≈ 1

Gruparea băncilor după dobânda

practicată Tabel nr. 2.5 Rata-xi 9-10 10-11 11-12 12-13 Total Bănci-ni 1 3 4 2 10 Obs.limita superioară este inclusă în interval

Histograma

0

0,5

1

1,5

2

2,5

3

3,5

4

9,0-10,0 10,0-11,0 11,0-12,0 12,0-13,0

1.Utilizând exemplul notelor la examen ale celor 50 de studenţi din caseta 2.5 să se determine centrele de interval şi erorile introduse prin grupare, în cazul B descris în tabelul 2.2, comparând cu rezultatele din gruparea A, tabelul 2.1, iar în final, să se opteze pentru gruparea A sau B prin analiza erorii relative. Rezolvare: Se calculează mediile pe interval şi media finală conform notelor reale Note reale obţinute - xi 3 – 4 5 – 6 7 – 8 9 – 10 Numărul studenţilor-ni 1 +4=5 5 +6= 11 16+8=24 6+4=10 Media aritmetică parţială reală (pentru fiecare interval în parte)

8,35

19 = )45(,511

61 = )3(,724

176 = 4,910

94 =

Nota medie a întregii populaţii este 1

nxi

ixi n

== =3 16 25 36 112 64 54 40

50

+ + + + + + +=7 puncte

Calculul erorilor dintre mediile reale şi centrele de interval ale grupării B este descris în continuare:

Grupe de studenţi după

notă (xi)

Număr de studenţi ( ni )

Centrul de interval ( Xi )

Media reală de interval

Eroarea absolutǎ

(e )

Eroarea relativǎ

( Є în % ) 2– 4 5 3 3,8 -0,8 -26,(6) 4– 6 11 5 5,(45) -0,(45) -8,(3) 6– 8 24 7 7,(3) -0,(3) -4,(54)

8– 10 10 9 9,4 -0,4 -4,255

Page 33: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

27

Total

nn = 50i

i = 1∑

sup infx +xx =i 2

nx

ii = 1x =

i n

ie = x - X Є =

e

xi

×100

Media aritmetică estimată prin gruparea B a notelor celor 50 de studenţi la examen este de 6,56 puncte, pe baza valorilor centrelor de interval calculate:

15 + 55 + 168 + 90 328x = = = 6,56estimată

50 50, eroarea absolută e = 7 - 6,56 = 0,44

şi eroarea relativă Є=e 0 , 4 4

× 1 0 0 = × 1 0 0 = 6 , 3 %x 7 , 0

În gruparea A media

aritmetică a centrelor de interval este afectată de o eroare relativă mult mai mică prin gruparea în varianta A (sub 1 %), ceea ce nu va distorsiona semnificativ nici o decizie ulterioară, bazată pe aceste calcule.

17,5 + 60,5 + 180 + 95 353x = = = 7, 06estimată

50 50, iar e = - 0,6 şi Є= - 0,9%.

Varianta A valorifică variaţia specifică de tip discret a notei (notele sunt numere naturale) şi deţine o eroare relativă mai mică, fiind, în final, gruparea adecvată. C) Aplicaţii propuse spre rezolvare 1.Grupaţi cei 20 de salariaţi ai firmei conform datelor alăturate după x, y şi z conform relaţiei lui H. A. Sturges, apoi pe 4 intervale egale şi centralizaţi datele după y şi z. Reprezentaţi grafic grupările cu ajutorul diagramei de structură, a histogramei şi a poligonului frecvenţelor. Notă: * Date centralizate utile F=12 (60%) şi M=8 (40%)

Σyi=200 şi Σ iy y− =96

Σzi=32000 şi Σ iz z− =3200

Tabel nr. 2.6

Nr.

crt

.

Sex

(F

/M)

V

ech

ime

(an

i) C

âştig

net

(R

on

)

Nr.

crt

.

Sex

(F

/M)

V

ech

ime

(an

i) C

âştig

net

(R

on

)

0 x y z 0 x y z 1 F 2 1300 11 M 3 1300 2 M 7 1600 12 F 15 1800 3 F 6 1500 13 F 12 1500 4 F 4 1400 14 M 20 1880 5 M 13 1800 15 F 18 1730 6 F 7 1700 16 M 21 1820 7 M 15 1850 17 F 5 1500 8 F 8 1500 18 M 14 1720 9 F 4 1400 19 F 8 1700 10 F 9 1500 20 M 9 1500

2.Rezultatele înregistrate la examen în grupa 2, de către cei 20 de studenţi prezenţi sunt:9,3,8,6,5,4,6,9,10,6,7,5,4,8,7,6,5,7,7,4. Sistematizaţi notele obţinute printr-o grupare simplă pe variante, pe 4 intervale egale şi reprezentaţi grafic rezultatele utilizând histograma şi poligonul frecvenţelor. Apelând la variabila alternativă de tip promovat/nepromovat, grupaţi notele şi valorificaţi o diagramă de structură.

xi (nota ) : 3 5 7 9 ni (număr studenţi): 5 11 24 10 Total puncte la nivel de grupă xi × ni 15 55 168 90

xi (nota ) : 3,5 5,5 7,5 9,5 ni (număr studenţi): 5 11 24 10 xi × ni 17,5 60,5 180,5 95,0

Page 34: Statistic A

Observarea şi sistematizarea datelor Capitolul 2

28

3.În luna curentă, producţia firmei ALFA a atins 8890 zeci de mii de RON, iar numărul salariaţilor a fost de 254 angajaţi.Productivitatea muncii a crescut de 1,12 ori faţă de luna precedentă. Nivelul productivităţii muncii în luna precedentă exprimat în zeci de mii RON/salariat a fost: a)10,8; b)18,35; c)25,13; d)31,25. 4.În care din lunile următoare cele două produse beneficiază de aceeaşi evoluţie: - cu bază fixă ianuarie - a) februarie; b) martie; c) aprilie; d) mai. - cu bază mobilă sau în lanţ - a) februarie; b) martie; c) aprilie; d) mai. Tabel nr. 2.7

Preţul practicat pe piaţă, în RON, în luna: Produsul U.M. Ianuarie Februarie Martie Aprilie Mai

A kg 100 136 180 216 230 B l. 90 80 70 84 207

5 Pornind de la producţia anterioară de 120 de tone, firma Alfa doreşte să îşi menţină creşterea de producţie de 10 %. Care va fi noul program? Dacă la final a realizat numai 125 tone care este indicatorul gradului de realizare a programului? 2.5 Rezumat Observarea statistică este o acţiune de culegere şi înregistrare de date (informaţii)referitoare la anumite caracteristici ale unităţilor statistice, după criterii unitare şi riguros definite. Programul unei observări statistice reprezintă o combinaţie optimă de decizii referitoare la probleme metodologice şi organizatorice. Tipologia modalităţilor de observare este variată în raport cu accesul la unitatea statistică, tipul de populaţie şi periodicitatea observării. Principalele tehnici de observare sunt recensământul sau inventarul, eşantionul extras aleator (repetat şi nerepetat), panelul sau eşantionul constant în cote (dirijat sau subiectiv), observarea părţii principale sau a masivului de date, ancheta, monografia şi observarea prin intermediul rapoartelor sau formularelor statistice. Prevenirea apariţiei erorilor sistematice începe cu identificarea lor prealabilă prin observări test, pilot sau de probă şi continuă cu elaborarea de formulare şi chestionare clare, complete, cu redactarea de întrebări simple, precise şi a unor instrucţiuni uşor de înţeles. Sistematizarea datelor statistice reprezintă un complex de operaţii de prelucrare (colectare, aranjare, ordonare, grupare, clasificare, centralizare, agregare, prezentare şi reprezentare), în vederea expunerii cât mai clare şi în forma cea mai uşor accesibilă a informaţiilor finale. Gruparea pe variante distincte, pe intervale egale de variaţie (determinând în etape amplitudinea numărul de intervale şi înălţimea intervalului), pe intervale neegale de variaţie sau tipologice, pe stări (pentru variabile atributive nenumerice) constituie una dintre cele mai vechi metode statistice. Indicatorii se clasifică în primari (de măsurare şi sintetici)şi derivaţi (prin comparare şi estimare). Indicatorul relativ exprimă caracteristici calitative prin compararea sub formă de raport a altor doi indicatori) şi este rezultatul împărţirii indicatorului raportat, la cel denumit bază de raportare. Clasificarea acestui indicator relevă cinci categorii speciale: de structură, de coordonare, de dinamică, de intensitate şi ai programului (planului). Principalele rezultate ale sistematizării datelor sunt seriile (două şiruri de date paralele, dintre care primul se referă la caracteristica de grupare, iar cel de al doilea înfăţişează rezultatul centralizării frecvenţelor sau valorile altei caracteristici asociate), tabelele (imagini de ansamblu, beneficiind de o formalizare succintă, sistematică şi neechivocă asupra fenomenului studiat) şi graficele (diagramele sau suporturile vizuale ale gândirii logice).

Page 35: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

29

Tema 3 INDICATORII TENDIN ŢEI CENTRALE, VARIA ŢIEI, ASIMETRIEI ŞI BOLTIRII CUPRINS: pag. 3.1Indicatorii statistici ai tendinţei centrale 29 3.2Indicatorii statistici pentru caracterizarea frecvenţelor 35 3.3 Indicatorii statistici ai variaţiei 36 3.4 Regula de adunare a dispersiilor 38 3.5 Indicatorii asimetriei şi boltirii 39 3.6 Test de autoevaluare şi aplicaţii 40 3.7 Rezumat 50 Obiective: Un deziderat major al statisticii este acela de a identifica printr-o unică valoare ordinul de mărime al tuturor datelor ce alcătuiesc o serie de date. Problema apărută simultan cu calculul acestor indicatori medii sau ai tendinţei centrale este legată de posibilitatea ca studentul în loc să simplifice, nu cumva să complice realitatea, prin ceea ce creează ca valoarea substitutivă a seriei (esenţializată, tipică, centrală şi reprezentativă).Opţiunea localizării completează alternativa gândirii cantitative sau algoritmice. Istoria statisticii oscilează câteva secole în jurul valorii optime a indicatorului mediu, dar şi a condiţiilor ce trebuie îndeplinite în planul variaţiei, asimetriei şi boltirii pentru a utiliza o valoare centrală fără riscuri în calcule viitoare. Câţiva indicatori capătă o valoare de termometru pentru validarea temperaturii populaţiei, fiind cei care validează sau nu o ipoteză de normalitate a seriilor de date şi poartă numele de coeficienţi de variaţie, asimetrie şi boltire. Competenţele dobândite prin însuşirea algoritmilor de calcul, localizare şi validare a indicatorilor tendinţei centrale constituie esenţa formării statistice a studenţilor. Timpul alocat temei: minim 4 ore - maxim 6 ore. Bibliografie T., Andrei, S., Stancu, Statistică, Editura ALL, Bucureşti, 1995. N.,Georgescu-Roegen, Metoda statistică, reed. Editura Expert, Bucureşti, 1998. M.Korka,L.,Begu,E.,Tusa,Bazele statisticii pentru economişti,Ed.Tribuna Economică,2002. G.,Săvoiu, Statistică generală. Argumente în favoarea formării gândirii statistice, Ed. Independenţa Economicǎ, Piteşti, 2003. G.,Săvoiu (coord.),Statistică generală. Elemente teoretice, teste tip grilă, aplicaţii şi studii de caz, Ed. Independenţa Economicǎ, Piteşti, 2004. G.,Săvoiu, Statistica.Un mod ştiinţific de gândire, Ed. Universitară, Bucureşti, 2007. G.,Săvoiu, Statistica.Mod de gândire şi metode, Ed.Universitară, Bucureşti, 2009. V.,Trebici, Mica enciclopedie de statistică, Ed. ştiinţifică şi enciclopedică, Bucureşti, 1985. M.,Ţarcă,Tratat de statistică aplicată, Ed. didactică şi pedagogică R.A. Bucureşti, 1998. G.U.Yule, M.G.Kendall, Introducere în teoria statisticǎ, Ed. ştiinţifică, Bucureşti, 1969. Webografie *** http://www. insse.ro

Page 36: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

30

3.1 Indicatorii statistici ai tendinţei centrale Indicatorii medii într-o serie de date, în calitatea lor de indicatori evoluaţi,

constituie expresii numerice sintetice, rezultate din maxima concentrare (condensare) de date individuale în cadrul fenomenelor economice şi evidenţiază ceea ce este esenţial, tipic, central, comun şi reprezentativ în populaţia statistică prin prisma caracteristicii studiate. Indicatorii medii sunt expresii numerice susceptibile de a rezuma ansamblul valorilor observate ale unei variabile statistice sub acţiunea puternică şi permanentă a factorilor esenţiali. Principala clasificare a indicatorilor medii este legată de procedura de determinare, după care se disting: indicatori medii de nivel, calculaţi printr-un algoritm de substituire bazat pe o proprietate specifică ansamblului de unităţi statistice şi indicatori medii poziţionali, rezultaţi în principal din localizare. Din prima categorie fac parte media aritmetică, armonică, geometrică şi pătratică alături de media cronologică, anarmonică, cubică media variabilei alternative şi alte valori medii specifice, iar din cea de-a doua categorie modul, mediana, mediala şi valoarea potenţială. Condiţiile sau cerinţele ce trebuie îndeplinite de către un indicator mediu au fost formulate de G.U.Yule şi în conformitate cu ele o mărime medie: a) se defineşte în mod precis (obiectiv şi independent); b) este expresia tuturor observaţiilor(valorilor înregistrate); c) deţine proprietăţi simple şi evidente, o semnificaţie uşor de înţeles şi nu posedă un caracter matematic prea abstract; d) se calculează cu uşurinţă şi rapiditate; e) este afectată cât mai puţin cu putinţă de fluctuaţiile de selecţie; f) se studiază rapid cu ajutorul calculului algebric (se pretează cu uşurinţă la calcule algebrice ulterioare).Indicatorul mediu rezultat dintr-un algoritm de substituire bazat pe o proprietate se defineşte mai ales ca valoare substitut, respectiv cu care dacă s-ar înlocui toate valorile individuale ale unui şir de unităţi statistice sau variantele unei repartiţii de frecvenţe, nu se va modifica suma, suma „inverselor”, produsul sau suma „pătratelor” tuturor acestor valori (variante).

Media aritmetică este valoarea substitut ce menţine constantă suma valorilor unui şir de unităţi statistice sau ale variantelor unei repartiţii de frecvenţe.

Algoritmul de calcul al mediei aritmetice A. simple B. ponderate C. a frecvenţelor relative exprimate D. a variabilei

alternative prin coeficienţi în procente

x = 1

nxii

n

∑= x = 1

1

mx ni ii

mnii

∑=

∑=

x =

*

1

mx ni ii

∑= x =

1 *

1100

mx fi ii

∑×=

x = N

M = p

Proprietăţile mediei aritmetice (x ) exprimate succint sunt următoarele:

1. Dacă orice x i = c , atunci x = c unde c = constantă

2. x este o valoare unică

3. x este o valoare internă ⇒ x min < x < xmax

4. Într-o repartiţie de frecvenţe x oscilează în jurul variantei (xi) cu frecvenţa maximǎ (ni max )

Page 37: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

31

5. Dacă orice 'ix = xi ± a , unde a ≠ 0, atunci 'x x a= ± .

6. Dacă orice 'ix = xi × k , unde k ≠ 0, atunci 'x x k×= .

Dacă orice 'ix = xi ×

1

k, unde k ≠ 0, atunci ' 1

x xk

×= .

7. Dacă orice 'i in n k= × , unde k ≠ 0, atunci 'x x= .

Dacă orice ' 1i in n

k= × , unde k ≠ 0, atunci 'x x= .

8. Dacă orice ni = m, atunci x = 1

1

mx ni ii

mnii

∑=

∑=

= 1

mxii

m

∑= , unde m ≠ 0.

9. yx + = x + y

10. x× y = x × y

11. ( )1

nx xii

−∑=

= 0 sau ( )1

mx x ni ii

−∑=

= 0

12. 2( )1

nx xii

−∑=

= minim sau ( )1

mx x ni ii

−∑=

= minim

Formula de calcul simplificat a mediei aritmetice simple sau ponderate este consecinţa proprietăţilor cu numărul 5 şi 6:

x= 1

n x aii k k a

n

−∑= + sau x= 1

1

m x ai nii k k amnii

−∑= +

∑=

, unde a ≠ 0 şi k ≠ 0

Din punct de vedere grafic media aritmetică este centrul de greutate al curbei frecvenţelor. Principalele avantaje ale mediei aritmetice sunt: a)este unica valoare medie care îndeplineşte toate condiţiile lui G.U.Yule; b)se poate determina în toate situaţiile, chiar şi atunci când se cunosc volumul totalizat (cumulat) şi numărul unităţilor statistice; c)permite calculul mediei generale a populaţiei totale (reunite din populaţii parţiale) ca medie aritmetică a mediilor parţiale ponderate cu volumul subpopulaţiilor respective; d) permite calculul mediilor procentelor prin ponderarea fiecărui procent proporţional cu baza sa; e)este recomandată atunci când fenomenul prezintă, prin variantele specifice de manifestare,modificări de forma unei progresii aritmetice. Dezavantajul major al mediei aritmetice este dat de sensibilitatea ei deosebită la valorile extreme. În concluzie media aritmetică este valoarea esenţială, covârşitor majoritară ca utilizare.

Media armonică este valoarea substitut ce menţine constantă suma valorilor inverse ale unui şir de unităţi statistice sau ale variantelor inverse ale unei repartiţii de frecvenţe.

Page 38: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

32

Algoritmul de calcul al mediei armonice A. simple B. ponderate C. frecvenţelor relative exprimate

prin coeficienţi în procente

x h = 1

1

nn

i xi∑=

x h = 11

1

mnii

mnii xi

∑=

×∑=

x h = 1

1 *

1

mnii xi

×∑=

x h = 100

1 *

1

mfii xi

×∑=

Proprietatea fundamentală a mediei armonice, alături de cele cu numărul 1,2,3,4,7

ale mediei aritmetice, este următoarea: 1 1

01

n

i x xhi− =∑

=

sau

1 10

1

mnii x xhi

− =∑=

Principalul avantaj al mediei armonice este acela al utilizării ei în cazul variabilelor de forma inversă (1/xi) cum sunt normele de timp, preţurile exprimate ca număr de produse la o unitate monetară (euro, dolar etc). Dezavantajele acestei valori medii sunt cauzate de sensibilitatea deosebită la valorile unice (xi=1) şi de nedeterminarea ei în situaţia concretă a existenţei unei valori nule (xi =0).

Media geometrică este valoarea substitut ce menţine constant produsul valorilor unui şir de unităţi statistice sau ale variantelor unei repartiţii de frecvenţe.

Algoritmul de calcul al mediei geometrice Pur teoretic Pragmatic

A. simplă B. ponderată A. simplă B. ponderată

xg1

nn xii

= ∏=

1g1

xm

nii

m nixii

∑= ∏

==

lg1x lgg

nxiianti

n

∑==

lg1x lgg

1

mn xi iianti m

nii

∑==∑=

Proprietăţile mediei geometrice reprezintă reunirea aceloraşi proprietăţi 1,2,3,4,7 ale mediei aritmetice cu următoarele, lapidar exprimate:

1. 11

n xii xg

=∏=

sau ( )lg lg 01

nx xgii

− =∑=

2. 1 2 ...1 2

x x x xgnny y y yn g

× × × = sau 1 2

11 2

1 2

1 2

...

mm

ii

m

nn nn gm

nn nm g

xx x x

y y y y=∑ × × × =

3. 1

nn x y x yg gi ii

= ×∏=

sau 1

1

m

ii ii

mnn n

gi i gi

x y x y=

=

∑ = ×∏

Principalul avantaj al mediei geometrice este considerat caracterul ei exact şi deosebit de precis, care o recomandă în cazul indicatorilor relativi (indici de preţ mai ales). Preferatǎ pentru sensibilitatea redusă la valorile extreme şi în situaţiile în

Page 39: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

33

care fenomenul prezintă modificări de forma unei progresii geometrice, această valoare medie este denumită şi medie de ritm. Dezavantajul major este cauzat de dificultatea calculului, iar dacă cel puţin o valoare (variantă) este nulă sau negativă se renunţă la determinarea ei practică. Media pătratic ă este valoarea substitut ce menţine constantă suma pătratelor valorilor unui şir de unităţi statistice sau ale variantelor unei repartiţii de frecvenţe.

Algoritmul de calcul al mediei pătratice A. simple B. ponderate

2

1xp

nxii

n

∑==

( )21xp

1

mx ni iim

nii

×∑==

∑=

Proprietatea ei definitorie este prezentată mai jos şi se adaugă celor comune tuturor

celorlalte valori medii prezentate:n 22

pii=1

(x - x ) = 0∑ sau n 22

pi ii=1

(x - x )n = 0∑ .

Avantajul utilizării mediei pătratice în statistică compensează parţial sensibilitatea sa „ieşită din comun” la valorile extreme. Deşi aparent poate fi calculată din orice valori sau variante, ea are sens economic pentru cele pozitive. Generalizarea noţiunii de indicator mediu apare sub în formula de calcul a mediei de ordin „k”:

1

1 1

1 1

m m kk ki i i i

i ik k m m

i ii i

x n x nx

n n

= =

= =

= =

∑ ∑

∑ ∑

, unde pentru:

k = -1 ⇒ k hx x= , k ↓ 0 ⇒ k gx x=

k = 1 ⇒ kx x= şi k = 2 ⇒ kx x= p

Această relaţie de calcul relevă inegalitatea mediilor, facilitând memorarea ei

logică printr-o transcriere standard: 1 0 1 2 h g px x x x x x x x− ≤ ≤ ≤ ⇔ ≤ ≤ ≤ . Media anarmonică, cronologică, cubică constituie alte valori medii utile, una de largă utilitate (media cronologică), celelalte însă ceva mai rar folosite în economie.

Indicatorii medii pozi ţionali sunt rezultaţi, în principal, prin localizare şi mai puţin ca urmare a unor calcule (considerate sumare şi convenţionale). Modul sau valoarea dominantă specifică repartiţiilor de frecvenţe reprezintă acea variantă (xi) care se întâlneşte cel mai des sau posedă frecvenţa de apariţie maximă (ni maxim). Prin opoziţie valoarea antimodală este cea mai rar întâlnită şi este specifică acelor ”curbe grafice în formă de U sau J”. Determinarea valorii modale pentru un şir de valori se realizează în două etape: a) se identifică frecvenţa maximă (ni maxim); b) se citeşte varianta corespunzătoare frecvenţei maxime (Mo=xi aferent lui ni maxim) sau în trei etape în cazul unei repartiţii de frecvenţe unimodală pe intervale de variaţie: a) se identifică frecvenţa maximă (nimaxim); b) se localizează

Page 40: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

34

intervalul modal sau cel căruia îi aparţine dominanta; c) se estimează valoarea

modală printr-o formulă de interpolare: inf 1Mo Mo

1 2

Mo x + h∆=

∆ + ∆.

Grafic, modul este valoarea coborâtă de sub vârful curbei pe axa absciselor. Repartiţiile de frecvenţe pot fi uni, bi, plurimodale sau chiar antimodale. Valoarea modală validează numai proprietăţile mediei aritmetice cu numărul 1, 3, 5, 6, 7. Avantajele şi utilizările modului ca valoare tipică, prin definiţie sunt determinarea sa rapidă în studii speciale. Când nu există date pentru mediile „calculate”, lipsa oricăror influenţe din partea valorilor extreme sau a intervalelor deschise, interesul special pentru mod. În cercetările vizând determinarea preferinţelor în domenii economice, sociale, electorale, etc. Valoarea dominantă pierde caracterul de valoare centrala şi reparaţiile bi sau plurimodale. Modul este un indicator util atunci când este bazat pe un număr suficient de unităţi statistice ce îl posedă ca valoare a caracteristicii (prezentând o densificare definită prin ni sau ni*).

Mediana, în calitatea ei de indicator central „sui-generis” sau de valoare „mijlocie”, se defineşte ca valoarea ce se localizează la mijlocul şirului de valori sau repartiţiei de frecvenţe, ordonate în prealabil crescător sau descrescător. În raport cu valoare mediană, variantele ce sunt mai mari sau mai mici ca ea, apar cu frecvenţe cumulate egale. Determinarea medianei sau a valorii „echiprobabile” se realizează în etape: a) se ordonează şirul de valori crescător sau descrescător; b) se

stabileşte locul valorii mediane: loc Me = 1

2

n+

sau

11

2

rnii

∑ +=

; c) dacă valoarea

locului este pară se „citeşte” valoarea medianei sau, dacă este impară se determină convenţional valoarea mediană, ca medie aritmetică simplă a valorii unităţilor statistice

2

nx şi 1

2

nx+

. În cazul seriilor de intervale, lucrurile sunt similare, pornind

de la ordonarea şirului sau repartiţiei, continuând cu „localizarea” dar diferă prin estimarea valorii mediane printr-o formulă de interpolare specifică:

Me =

( )1

1

inf 1

1

2

Me

r

rii

ii

Me MeMe

nn

x hn

=

=

+−

+

∑∑

unde loc Me = 1

1

2

r

ii

n=

+∑.

Grafic mediana este delimitată pe abscisă de către perpendiculara descinsă din chiar intersecţia poligoanelor de frecvenţă cumulate crescător şi descrescător şi împarte curba repartiţiei de frecvenţe în două regiuni sau areale egale.Proprietatea fundamentală a valorii mediane se adaugă celor validate în mod obişnuit de o

valoare medie (1,2,3,4,7):1

n

ii

x Me=

− =∑ 0.Avantajele medianei sunt substanţiale în

raport cu toate celelalte valori medii, mai puţin însă comparativ cu cele ale

Page 41: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

35

medianei aritmetice. Există totuşi câteva situaţii practice în care mediana este preferata mediei aritmetice fie datorită formei concrete şi naturale de exprimare a acestui indicator mediu, fie prin influenţa nesemnificativă exercitată asupra sa de către valorile extreme şi intervalele deschise, fie prin dependenţa sa evidentă de numărul variantelor şi nu de valorile unităţilor statistice. Principalul dezavantaj al medianei este imposibilitatea studierii prin calcule algebrice. Mediala (Me) este o mediană specială, de rangul doi, a unei agregări superioare, segmentând în două părţi egale suma produselor „varianta şi frecvenţă” sau suma valorilor xi, tot aşa cum şi valoarea potenţială (Mo

potenţial) sau „valore poziore” a şcolii italiene de statistică este o valoare dominantă deosebită, tot de rangul doi a aceleiaşi agregări superioare, respectiv a produsului „varianta şi frecvenţă”. Principalii indicatori ai tendinţei centrale sau medii rămân media aritmetică ca valoare esenţială, mai simplu intitulată media, covârşitor majoritară ca utilizare, modul sau valoarea tipică prin definiţie şi mediana sau valoarea centrală „sui-generis”.Cu cât concentrarea, condensarea sau densificarea valorilor sau variantelor va fi mai mare cu atât repartiţia va fi mai aproape de simetria perfectă, evidenţiată prin

relaţia: x = M e = M o .În cazul repartiţiei moderat asimetrice, G.U.Yule şi M.G.Kendall au exprimat o relaţie empirică existentă între cele trei valori medii:

Mo= x -3(x - Me).

3.2 Indicatorii statistici pentru caracterizarea frecvenţelor Sistemul de indicatori statistici pentru caracterizarea frecvenţelor într-o

serie de repartiţie (distribuţie) este alcătuit din frecvenţe absolute (ni), frecvenţe relative (n* i), frecvenţe cumulate crescător (ni↑ sau n* i↑) sau descrescător (ni↓ sau n*

i↓), densităţi de repartiţie a frecvenţelor (ni/hi sau ni*/hi). Frecvenţele cumulate

crescător (descrescător) permit identificarea cuantilelor (Cv) din a căror familie fac parte mediana (Me), quartilele (Q1, Q2, Q3), decilele (D1,…,D9) şi centilele (C1,…,C99), care împart populaţia în două, patru, zece şi o sută de părţi egale. Etapele specifice ale determinării unei cuantile sunt: a) ordonarea frecvenţelor şi

cumularea lor;b) identificarea locului cuantilelor[( 1)

1 ]

ms ni iilocCvs si s

∑ +== , unde is

este rangul iar S tipul cuantilei (ex. decila cu numărul 4 devine 410

Cv Cvsi s⇒ ); c)

determinarea intervalului în care se afla cuantila pentru repartiţiile de frecvenţă rezultate din gruparea pe intervale; d) calculul bazat pe o relaţie generală de

interpolare a oricărei cuantile:

( 1)

( 1)1 1

Cv sms ii n ni ii isCv X hs Cvi ns Cvsi s

−∑ ∑+ −= =

= + ,

unde: CvX ,h şi Cv is sn reprezintă limita inferioară, înălţimea şi frecvenţa intervalului

Page 42: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

36

cuantilic şi( 1)

1

Cv sinii

−∑=

semnifică frecvenţa intervalelor cumulată până la cel

cuantilic. Sistemul de indicatori ai gradului de concentrare/diversificare (depărtare sau apropiere) a unei repartiţii de frecvenţe în raport cu repartiţia egalitară sau cu echirepartiţia este alcătuit din: 1. coeficientul abaterii medială (Ml)-mediană (Me), notat CMl-Me:

100 100max min

Ml Me Ml MeCMl Me A x xx

− −= × = ×− −

0 00 00 100CMl Me≤ ≤−

2. coeficientul abaterii medii Gini, notat GdmC unde 0 1

GdmC≤ ≤ :

( )

2

diferenta medie Gini dmGCdm xG= , cu

42 1

1

ndm x Me rang rangxi MeG iin

= − −∑=

sau 2 *{( )[ ( )]}2 1

rhdm n n ni iG ini

= −∑=

� � , unde h=înălţimea intervalului de grupare

3.coeficientul Gini: 2

1

nC giG i

∑==

,cu valori în intervalul 1 ,1n şi gi=

1

nim

nii∑=

4.coeficientul Gini-Struck:CG-S=2

11

1

nn gii

n

∑ −=

−, unde 0 1G SC −≤ ≤

Densităţile de repartiţie a frecvenţelor (ni/hi, *i in h sau *

i if h ) permit

aprecierea normalităţii şi simetriei repartiţiilor empirice de frecvenţe.

3.3 Indicatorii statistici ai variaţiei Sistemul de indicatori statistici ai variaţiei într-o serie de repartiţie de

frecvenţe unidimensională se referă la mărimea şi intensitatea împrăştierii valorilor individuale în jurul tendinţei centrale de grupare.Categoria indicatorilor simpli ai variaţiei sau evaluării mărimii împrăştierii apelează în afara mediei la una sau două unităţi statistice (variante) şi cuprinde:

1.amplitudinea absolută (Ax) şi relativă (Ax%)

Ax = x max – x min Ax(%) = max min100 100x xAx

x x

−× = ×

2.abaterile individuale absolute (di) şi relative (di%)

di = xi – x di (%) = 100 100d x xi i

x x

−× = ×

Page 43: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

37

3.abaterile intercuartilică ( 3 12

Q QdQ

−= ) şi interdecilică ( 9 1

2

D DdD

−= )

Calculul acestor indicatori simpli ai variaţiei oferă primele trei semnale sau tendinţe de normalitate şi omogenitate pentru seria studiată:

I.A x(%)≤100,0%, II. max maxd d+ −= şi III. 1 3 3 1Qd x Q Q Me Q x Me Q≈ − ≈ − ≈ − ≈ −

Categoria indicatorilor sintetici ai variaţiei valorifică informaţiile referitoare la toate unităţile statistice ale populaţiei cercetate şi include:

1.abaterea medie liniară şi absolută (d )

1

ndiid

n

∑== sau 1

1

md ni iid mnii

∑==∑=

,unde : di = xi - x sau di= xi - Me

2.dispersia, varianţa sau fluctuaţia ( 2σ )

( )22 1

ndii

∑== sau

( )22 1

1

md ni ii

mnii

σ∑==∑=

,unde: di = xi - x sau di = xi - Me

sau în varianta de calcul simplificat bazată pe împrăştierea faţă de medie

( )2

22 1

nxii x

∑== − ; ( )

222 1

1

mx ni ii xmnii

σ∑== −∑=

sau ( ) ( ) ( )( )2 22

p p px x x x x xσ = − = − +

iar în cazul unei serii de repartiţie de frecvenţe grupate pe intervale egale, dispersia calculată pe baza centrelor de interval (xi) este egală cu:

2σ = ( )

2

21 2

1

m x ai nii hh x am

nii

−∑=

− −∑=

sau 2σ =

( ) ( )2'

221

1

mx ni ii h x am

nii

∑= − −

∑=

unde a = origina unde 'ix = ix a

h

h = înălţimea intervalului de variaţie 3.abaterea medie pătratică, standard sau tip (σ )

( )2

1

ndii

∑== sau

( )21

1

md ni iim

nii

σ∑==

∑=

sau 2σ σ=

4.coeficientul de variaţie sau omogenitate: Co= 100d

x× şi Co= 100

x

σ× ,unde

Page 44: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

38

Co [ ]0%,100%∈ , iar interpretarea este corelată cu valorile efective obţinute:

Caseta nr. 3.1 a) dacă Co = 0%, valorile sunt egale între ele şi cu media lor, lipsa variaţiei fiind evidentă;

b) dacă Co ( ]0%,17%∈ seria este strict omogenă şi media strict reprezentativă;

c) dacă Co ( ]17%,35%∈ seria este moderat omogenă şi media moderat reprezentativă;

d) dacă Co ( ]35%,50%∈ seria este relativ eterogenă şi media relativ nereprezentativă;

e)dacă Co ( ]50%,100%∈ seria este eterogenă şi media nereprezentativă;

Calcului indicatorilor sintetici ai variaţiei oferă alte două semnale sau tendinţe de normalitate şi omogenitate pentru seria studiată.

IV. 4 5d σ= sau 0,7979d σ=

2 3Qd σ= sau 0,6745Qd σ=

V. O anumită proporţie din unităţile statistice este constantă în intervalele

statistice definite prin medie şi abaterea standard de tipul [x kσ± ]:

• 68,26% dintre variante aparţin intervalului [ x σ± ]

• 95,44% dintre variante aparţin intervalului [ 2x σ± ]

• 99,74% dintre variante aparţin intervalului [ 3x σ± ]

3.4 Regula de adunare a dispersiilor Regula de adunare a dispersiilor sintetizează specificitatea sistemului de

indicatori statistici ai variaţiei într-o serie de repartiţie de frecvenţe bidimensională: 2oσ = 2σ + 2σ ,respectiv dispersia populaţiei statistice totale ( 2

oσ ) este egală cu

dispersia explicată de factorul de grupare (2σ ) la care se adaugă dispersia

reziduală sau neexplicată de acelaşi factor ( 2σ ).

( )2012

1

my y nj jj

o mn jj

σ−∑

==

∑=

, ( )2

02 1

1

ry y ni ii

rn ii

σ∑ −==

∑=

� �

, ( )2

2 1

1

rni ii

rn ii

σσ

∑==∑=

� �

.

(dispersia totală)=(dispersia mediilor de grupă)+(media dispersiilor de grupă)

Relaţia anterioară împărţită la 2oσ conduce la calculul coeficientului de

determinaţie (R2) şi nedeterminaţie (K2):2 2

2 21

o o

σ σσ σ

+ = sau R2 + K2 = 1.

Page 45: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

39

Coeficientul de determinaţie se exprimă, de regulă, procentual şi identifică ponderea factorului principal de grupare (variabila xi) în variaţia totală a

caracteristicii: R2 = 2

2100

o

σσ

⋅ = 100% - K2

3.5 Indicatorii asimetriei şi boltirii

Sistemul de indicatori statistici ai asimetriei şi ai boltirii (excentricităţii) într-o serie de repartiţie de frecvenţe unidimensională necesită definirea asimetriei ca măsură în care seria este mai mult (pronunţat) sau mai puţin (uşor) oblică în raport cu distribuţia normală (Gauss-Laplace) şi definirea excentricităţii ca măsură în care repartiţia este mai rarefiată sau mai densă (condensată) în jurul tendinţei centrale decât în cazul aceleiaşi distribuţii normale (Gauss-Laplace).

A.Principalii indicatori ai asimetriei sau oblicit ăţii sunt:

1.asimetria absolută : ∆ = x -M0 ∆ > 0 asimetrie pozitivă ∆ = 0 simetrie perfectă ∆ < 0 asimetrie negativă

2.densităţile de frecvenţe, calculate ca raport între frecvenţe şi înălţimea intervalului într-o serie rezultată dintr-o grupare pe intervale neegale (ni/hi sau

*i in h sau *

i if h )

3.coeficienţi de asimetrie propuşi de Karl Pearson (Cas1 şiCas2), Ronald Fisher(Cas3), Yule şi Kendall (Cas4), Arthur Bowley (Cas5)

Cas1 = SK1 = ox M

σ− [ ]1,1∈ − Cas2 = SK2 =

( )3 x Me

σ−

[ ]3,3∈ −

Seriile moderat asimetrice deţin valori cuprinse între

Cas1 ∈ [- 0,3; 0)∪ (0; 0,3] Cas2∈ [- 1; 0)∪ (0; 1]

Cas3 = SK3 =23

1 22

µβµ

= sau Cas3 = SK3 =( ) ( )

23321 :1

1

mx x ni iim

nii

β σ−∑

==∑=

SK4 = 42 2

2

µβµ

= sau SK4 =( ) ( )

4221 :2

1

mx x ni iim

nii

β σ−∑

==∑=

Page 46: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

40

Cas4 =( ) ( )3 1

5 3 1

Q Me Me QSK Q Q

− − −= =

−1 2

1 2

q q

q q

−+

,unde: q1= Q3–Me şi q2=Me–Q1.

Cas5 = 6

' '1 2' '1 2

K

q qS

q q

−=+

, unde: '1q = Me – D1 şi

'2q = D9 – Me .

B. Principalii indicatori ai boltirii, excentricit ăţii sau excesului sunt: 1.coeficientul pearsonian 2.coeficientul lui Ronald Fisher

( ) ( )4

2214 :4 2 22

1

mx x ni iiS mK

nii

µβ σ

µ

−∑== = =

∑=

2 2 3γ β= −

Sistemul de indicatori statistici ai seriilor atributive calitative cuprinde indicatori privind caracterizarea frecvenţelor (absolute, relative, cumulate crescător sau descrescător), indicatori relativi de coordonare, indicatori poziţionali (Me sau Mo) şi indicatori de concentrare/diversificare (Gini-Struck). 3.6 Test de autoevaluare şi aplicaţii A) Test de autoevaluare

A1) Întrebări clasice recapitulative

(Completaţi spaţiile goale) 1. Cum definiţi generic un indicator mediu determinat pe baza unui algoritm de calcul?

2.Cum se calculează media armonică şi ce proprietăţi, avantaje şi dezavantaje deţine?

3. Cum se calculează şi interpretează un coeficient de omogenitate şi de asimetrie?

4.În ce constă structura unui sistem de indicatori pentru a caracteriza frecvenţele?

5.Care sunt principalii indicatori ai tendinţei centrale?

A2) Întrebări tip gril ă

(Încercuiţi litera răspunsului corect) 6. Atunci când termenii unui şir au valori negative sau nule se recomandă media: a) armonică; b) geometrică; c) pătratică; d) aritmetică. 7. Unul dintre indicatorii de mai jos este inutil în evaluarea omogenitǎţii: a) dispersia; b) amplitudinea absolută; c) abaterea medie liniarǎ; d) media. 8. Într-o serie de date, unde media este 16m, σ2 =25 şi Mo=3,2m, coeficientul de variaţie (omogenitate) este: a) 125,07%; b)31,25 %; c) 21,33 %; d) 6,44 %. 9.Identificaţi valorile corecte pentru seria de date:

Media aritmetică: a) 6; b) 7; c) 8; d) 9. Abaterea medie liniară:a)0,9; b)1,22; c)1,39; d)1,44. Abaterea medie pătratică: a)1,15; b)1,32; c)1,48; d)1,63. Coeficientul de variaţie în %, în funcţie de abaterea medie

xi (to) 5 6 7 8 9 10 ni 1 9 24 30 27 9 Σni =100

Page 47: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

41

- liniară: a)9,50; b)10,75; c)11,25; d) 14,44. - pătratică:a)11,90;b)12,35;c)14,38;d) 16,50.

B) Aplicaţii rezolvate 1.Producţia de avioane(xi) a firmei BETA în ultimele 10 luni a fost de:15,17,29,14, 12,9,19,27,13,16. Determinaţi indicatorii medii bazaţi pe algoritm de calcul. Rezolvare: Se apelează la un sistem tabelar de calcul al acestor indicatori: Tabel nr. 3.1 Variabila Şirul valorilor distincte ale variabilei Agregări

(xi)

15

17

29

14

12

9

19

27

13

16 1

nxii

∑=

=171

(1/xi)

0,067

0,059

0,034

0,071

0,083

0,111

0,053

0,037

0,077

0,063

1

1

n

i xi

∑=

=0,655

(lg xi)

1,176

1,23

1,462

1,146

1,079

0,954

1,279

1,431

1,114

1,204 lg

1

nxii

∑=

=12,075

(xi

2)

225

289

841

196

144

81

361

729

169

256 2

1

nxii

∑=

=3291

1

nx x nii

∑==

=17,1≅ 17 1

1

nx nh

i xi

∑==

=15,3 ≅15 ( )lg lg1

nx anti x ng ii

∑==

=16,1 ≅ 16

2

1

nx x np ii

∑==

=18,1 ≅ 18 (tipul discret al variabilei cere rotunjirea valorilor).

2. Notele obţinute de 50 de studenţi la examen au generat distribuţia de mai jos: 3 4 5 6 7 8 9 10

:1 4 5 6 16 8 6 4

iX

, unde 1

50m

i

i

n=

=∑ .Calculaţi mediile uzuale.

Rezolvare:Se apelează la un sistem tabelar de calcul al celor patru indicatori medii. Tabel nr. 3.2

(xi) (ni) (xini)

(1/xi) ni (nilg xi) (xi2ni)

3 1 3 0,333 0,477 9 4 4 16 1 2,408 64 5 5 25 1 3,495 125 6 6 36 1 4,669 216 7 16 112 2,286 13,522 784 8 8 64 1 7,225 512 9 6 54 0,667 5,725 486 10 4 40 0,4 4 400

Total 1

mnii

∑=

=50 1

mx ni ii

∑=

=350 1

1

mnii xi

∑=

=7,686 lg1

mn xi ii

∑=

=41,521 2

1

mx ni ii

∑=

=2596

m mx = ( x n ) : ( n ) 7i i ii=1 i=1

∑ ∑ =

Page 48: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

42

mni

i=1x = 6, 51h m 1

nixi=1 i

=∑

mn lgxi i

i=1x = antilg 6, 77g mni

i=1

∑ =

m 2x niii=1x = 7, 21p mni

i=1

∑=

3. Calculaţi valorile medii pentru notele obţinute de către cei 50 de studenţi grupate pe 4 intervale egale de variaţie discontinuu (ca medii ponderate) Rezolvare:Pentru seria de date grupate se vor utiliza centre de interval, care conduc la estimarea şi nu la calculul precis al indicatorilor medii dar nu introduc o eroare mare (aici sub 1%). Estimarea mediilor ponderate este prezentată mai jos: Tabel nr. 3.3

Grupe conform notă (xi)

Număr studenţi

(ni)

Centrul de inter- val (Xi)

xini

(1/xi)ni

(ni

.× lgxi)

(xi)2ni

3-4 5 3,5 17,5 1,4286 5·0,544068=2,72034 61,25 5-6 11 5,5 60,5 2 11·0,740363=8,143993 332,75 7-8 24 7.5 180 3,2 24·0,8750613=21,00147 1350,00

9-10 10 9,5 95,0 1,0526 10·0,9777236=9,777236 902,50 Total 50 - 353 7,6812 41,63039 2646,5

1

nixhnixi

∑= =∑

6,509;x ni ixni

∑= =

∑7,06; lg0,7946 6,23x antig = = ;

2x ni ixpni

∑= =

∑ 7,275.

4. Calculaţi media aritmetică şi valoarea modală a salariului mediu brut într-o regiune în construcţii, apoi evaluaţi asimetria prin coeficientul Pearson şi precizaţi valoarea ei şi în ce condiţii puteţi calcula mediana după relaţia lui Yule. Dintre indicatorii tendinţei centrale decideţi care ar fi mai adecvat pentru identificarea salariului cel mai des plătit şi estimarea rapidă a fondului de salarii regional? Care sunt valorile indicatorilor sintetici ai variaţiei salariilor în jurul mediei lunare? Este media reprezentativă şi poate înlocui fără riscuri populaţia studiată? Tabel nr. 3.4

Salariul brut lunar (mii lei/salariat) -xi- Xi Număr salariaţi (mii salariaţi) -ni- 2,5 – 3,5 3 5 3,5 – 4,5 4 20 4,5 – 5,5 5 70 5,5 – 6,5 6 130 6,5 – 7,5 7 40 7,5 – 8,5 8 20 8,5 – 9,5 9 15 TOTAL - 300

Observaţie: limita superioară nu este inclusă în interval.

Rezolvare: Media aritmetică: 1800

6300

x ni ixni

∑= = =

∑ mii lei / salariat

Page 49: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

43

Valoarea modală: niMAX =130 şi locMoЄ[55-65), de unde 1

1 2MoMo x h

∆= +∆ + ∆

adică Mo=55+10×[60/(60+90)]=5,9 mii lei/salariat. Determinarea coeficientului de asimetrie Pearson impune anterior calculul abaterii

medii pătratice:( )2 4502 1,50

300

x x ni i

niσ

−∑= = =

∑, de unde 2 1,225σσ == mii lei.

(Seria rezultată din grupare este omogenă, media reprezentativă şi utilizabilă)

x -Mo = 6 - 5,9 = 0,1 asimetrie pozitivă 6, 0 5, 9 0,1

0, 08161, 225 1, 225

x MoCAS σ

− −= = = =

CAS >0 şi CASЄ (0 - 0,35)⇒ seria rezultată din grupare este uşor asimetrică. Evaluarea valorii mediane pornind de la relaţia existentă într-o serie de repartiţie

unidimensională uşor sau moderat asimetrică x -Mo = 3(x –Me ). 0,1 = 3( 6 – Me ) sau 3Me = 18 - 0,1 =17,9 , de unde: Me = 5,97 mii lei. Estimarea valorii mediane pe baza formulei de interpolare obişnuite în cazul unei serii de repartiţie de frecvenţe conduce la un rezultat destul de apropiat. Loc Me=150,5 de unde (x150 - Me - x151)

( )1

1 150,5 955,5 10 5,93

130

1/ 2 1Men

i ii

M

Me

e

n n

Me x hn

= −+ =

+ −= + =

∑ ∑mii lei.

Între cele două valori apare o diferenţă foarte mică (sub 1,0 %).

x=6,0 mii lei serie de distribuţie de frecvenţe absolute. Me=5,93 mii lei seria este uşor asimetrică (ponderat). Mo=5,9 mii lei asimetria este pozitivă. Decizia privind indicatorul adecvat selectează modul pentru salariul cel mai frecvent plătit şi media pentru fondul de salarii.Indicatorii sintetici ai variaţiei sunt:

- abaterea medie liniară d =∑i ix x n− /∑ni =250 /300 =0,833 mii lei.

- dispersia ( )2 4502 1,50

300

x x ni i

niσ

−∑= = =

∑mii lei

- abaterea medie pătratică 2 1, 225σσ == mii lei - coeficientul de variaţie (omogenitate)

1001, 225

100 20,4%6

VCx

σ= × = × = ⇒CV <35-40 %

Seria rezultată din grupare este omogenă, media poate fi utilizată fără riscuri. 5.Societatea de asigurări ASIRTOTAL deţine un număr de 70 de agenţii teritoriale. Agenţiile sunt grupate după volumul operaţiilor decadale. O explicaţie a variaţiei volumului acestor operaţii ar putea fi dimensiunea diferită a agenţiilor, stabilită în

Page 50: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

44

funcţie de numărul de salariaţi care lucrează în cadrul acestora. Tabelul de mai jos grupează agenţiile în funcţie de cele două caracteristici observate: Tabel nr. 3.5

Mărimea agenţiilor după numărul salariaţilor Volum operaţii decadale (mii RON)

Microagenţii 5-10

Agenţii mici 10-15

Agenţii mijlocii 15-20

Total

4,5 - 5,2 2 6 - 8 5,2 - 5,9 12 6 - 18 5,9 - 6,6 4 20 - 24 6,6 - 7,3 2 4 2 8 7,3 - 8,0 - 4 2 6 8,0 - 8,7 - - 4 4 8,7 - 9,4 - - 2 2 TOTAL 20 40 10 70

Observaţie: limita superioară nu este inclusă în interval. Să se caracterizeze statistic distribuţia agenţiilor în funcţie de volumul operaţiilor decadale efectuate, determinând indicatorii tendinţei centrale, ai variaţiei şi asimetriei comentând rezultatele obţinute.Considerând că volumul operaţiilor decadale depinde de numărul de salariaţi din fiecare agenţie, să se determine mediile şi dispersiile de grupă, să se verifice regula de adunare a dispersiilor şi să se calculeze şi comenteze coeficientul de determinaţie rezultat. Rezolvare: După ce se stabileşte valoarea fiecărui centru de interval se determină tabelar indicatorii tendinţei centrale: Tabel nr. 3.6

Grupe de agenţii după volumul

activităţii (mii RON)

Numărul agenţiilor

(ni)

Centrul de interval

( xi )

xini

(1/xi)ni

(xi)

2ni ni×lgxi

4,5-5,2 8 4,85 38,8 1,649 188,180 5,486 5,2-5,9 18 5,55 99,9 3,243 554,445 13,397 5,9-6,6 24 6,25 150,0 3,840 937,500 19,101

6,6-7,3 8 6,95 55,6 1,151 386,420 6,736 7,3-8,0 6 7,65 45,9 0,784 351,135 5,302 8,0-8,7 4 8,35 33,4 0,479 278,890 3,687 8,7-9,4 2 9,05 18,1 0,221 163,805 1,913 TOTAL 70 - 441,7 11,367 2860,375 55,622

Observaţie: limita superioară nu este inclusă în interval.

În continuare sunt prezentate valorile mediilor clasice calculate( , , ,h p gx x x x ):

441, 76, 31

70

x ni ixni

∑= = =

∑ mii RON;

706,16

1 11, 367

nixhni

xi

∑= = =

mii RON;

22860,375

6,3970

x ni ixpni

∑= = =

∑miiRON;lg lg

n ni ix xg i∑

∏= <=> 1

lg lgx n xg i ini

∑=∑

Page 51: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

45

lg gxlg 55, 622

0, 794670

n xi i

ni

∑= = =

∑ şi lg 0,7946 6, 23g antix = = mii RON.

Notă: Pentru simplitatea şi rapiditatea calculelor, în calitate de indicator mediu esenţial se recomandă utilizarea cu precădere a mediei aritmetice. Mediile poziţionale cele mai importante rămân mediana (Me) şi modul (Mo), iar mediala, valoare potenţială, precum şi cuantilele (cuartilele Q1-3 , decilele D1-9, centilele C1-99) constituie indicatori cu utilizări speciale.Determinarea acestor doi indicatori medii poziţionali se realizează estimativ, parcurgând etapele cunoscute:

• determinarea locului medianei:locM e =1 71 35 35, 5

362 2

XniX

∑ += = → ;

• identificarea intervalului median : Me ∈ [5,9 - 6,6 ); • estimarea valorii mediane prin intermediul formulei de interpolare:

( ) 11 / 2 1

1

nMen ni iiMe x hMe nMe

−+ −∑ ∑

== + sau ( )1 / 2 1n ni VMeMe x hMe nMe

+ −∑ ∑= +

1

1

nMen nvi Mei

−=∑ ∑

== 26 şi reprezintă suma rezultată din frecvenţele cumulate

crescător ale tuturor intervalelor până la intervalul median, iar x Me=5,9; h=0,7 şi

nMe =24. 35,5 26

5,9 0, 724

Me−

+= =5,9+0,7×0,396=6,1772 ≈ 6,18 mii RON.

Determinarea valorii modale se realizează parcurgând aceleaşi etape: • determinarea locului valorii modale: locMo ⇒ ni max (ni max =24); • identificarea intervalului modal: Mo Є [5,9 - 6,6 ); • estimarea valorii modale prin intermediul unei formule de interpolare:

1

1 2MoMo x h

∆= +∆ + ∆

, unde: ∆1=24-18=6 şi ∆2=24-8=16 .

65,9 0,7 6,091 6,09

6 16Mo + = ≅

+= mii RON.

Cei trei indicatori esenţiali ai tendinţei centrale sunt situaţi în acelaşi interval de variaţie, respectiv [5,9 - 6,6), dar nu sunt identici, seria nefiind una simetrică. Există diferenţe, însă acestea sunt destul de mici (modul = 6,09 mii RON, mediana = 6,18 mii RON şi media = 6,31 mii RON).Ca imagine generală intervalul median şi modal este totodată şi al mediilor,reunind 34,3% din numărul agenţiilor, iar între 5,2 şi 7,3 mii RON se află 71,4% din populaţia agenţiilor. Se emite ipoteza unei medii reprezentative, datorită concentrării în acelaşi interval a ¾ din populaţie.Amplitudinea (absolută sau relativă), ca indicator simplu al variaţiei nu poate fi determinată,necunoscând clar valorile extreme,dar se pot afla abaterile individuale:

Page 52: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

46

1.abaterile individuale absolute:i id x x= − şi relative: (%) 100x xidi

x

−= ×

Figura nr.1 absolute 2,74 Pozitive relative 43,4 %

Abaterile maxime absolute -1,46

Negative relative -23,1 %

Notă: max maxim imd d+ −= constituie un semnal de simetrie a distribuţiei.

Tabel nr. 3.7 Centrul

de interval

Număr de

agenţii

di =x xi − di(%) = 100x xi

x

−×

i ix - x n

( )2x x ni i−

4,85 5,55 6,25 6,95 7,65 8,35 9,05

8 18 24 8 6 4 2

-1,46 -0,76 -0,06 0,64 1,34 2,04 2,74

-23,1 -12,0 -1,0 10,1 21,2 32,3 43,4

11,68 13,68 1,44 5,12 8,04 8,16 5,48

17,0528 10,3968 0,0864 3,2768 10,7736 16,6464 15,0152

/ 1

nnii

∑=

=70 /

/ 1

nx x ni ii

−∑=

=53,6 ( )273, 248

1

nx x ni ii

∑ − ==

Indicatorii sintetici ai variaţiei exprimă intensitatea împrăştierii

1.Abaterea medie liniară sau absolută:53,6

0,765770

x x ni id

ni

−∑= = =

∑mii RON.

Interpretare: Abaterea medie liniară d exprimă cu câte unităţi concrete de măsură se abat în medie variantele (xi) de la media colectivităţii (în situaţia dată se abat concret cu 0,7657 mii RON).Se poate calcula şi în funcţie de mediană, dar se reţine

că întotdeauna x

d >Me

d .Se apreciază că acest indicator nu corespunde integral

cerinţei de evidenţiere a intensităţii împrăştierii, o măsură mai bună a intensităţii variaţiei fiind oferită de abaterea medie pătratică (mai întâi se determină dispersia). 2.Dispersia (media aritmetică a pătratelor abaterii valorilor individuale de la medie sau diferenţa dintre pătratul mediei pătratice şi cel al mediei aritmetice)

( )2

2 73, 2481, 0464

70

x x ni i

niσ

−∑= = =

∑ sau

2 222 2860,375 441, 7

70 70

x n x ni i i in ni i

σ∑ ∑

= − = −∑ ∑

=1,0464

Dispersia este o mărime adimensională ce nu se valorifică direct în analiza variaţiei. 3.Abaterea medie pătratică sau abaterea standard (devierea standard) - σ

Page 53: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

47

2 1,023σσ = = mii RON Interpretare: Fiecare din cele 70 de agenţii are un volum decadal de operaţii, în medie cu 1,023 mii RON mai mare sau mai mic decât media (6,31 mii RON). Tabel nr. 3.8

Grupe de agenţii după volumul de

activitate (mii RON)

xi

*

f i

xi

* f i

(xi*- x )2

(xi*- x )2ni

(xi

*)2f i

4,5-5,2 5,2-5,9 5,9-6,6 6,6-7,3 7,3-8,0 8,0-8,7 8,7-9,4

-2 -1 0 1 2 3 4

8 18 24 8 6 4 2

-16 -18 0 8 12 12 8

2,1316 0,5776 0,0036 0,4096 1,7956 4,1616 7,5076

17,0528 10,3968 0,0864 3,2768 10,7736 16,6464 15,0152

32 18 0 8 24 36 32

TOTAL

-

70

*(xi1

)n

iif∑

=× = 6

-

* 2x(x )i1

nnii

∑ − ×=

= 73,248

* 2(xi1

)n

ifi×∑

=

= 150

4.Coeficientul de variaţie 100OCx

d= × sau 100OC

x

σ= × şi

1, 023100 16, 2%

6, 31OC = × = .

Populaţia celor 70 de agenţii este strict omogenă, media strict reprezentativă şi utilizabilă fără riscuri sau rezerve. Indicatorii statistici ai asimetriei (asimetria absolută, densităţi de frecvenţă şi coeficientul de asimetrie propus de Pearson) se determină în paralel cu sistemul celor ce caracterizează frecvenţele (frecvenţe absolute şi relative, cumulate crescător sau descrescător, coeficientul de concentrare–diversificare Gini–Struck, densităţi de frecvenţă).

1.Asimetria absolută: x -Mo (în situaţia descrisă 6,31x = iar Mo = 6,09 şi x -Mo = 0,22, traducând astfel o asimetrie absolută pozitivă) 2.Coeficientul de asimetrie Pearson, pentru repartiţia de frecvenţe unimodală: CAS

sau SK 1 = (x -Mo):σ = 0,22:1,023 = 0,215 (conform valorii mai mici decât 0,3 seria este moderat asimetrică, media reuşind să substituie cu succes populaţia statistică). 3.Densitatea absolută a frecvenţelor (ni/h) sau relativă (ni

*%) /h, este determinată aici forţat, din motive didactice, nefiind specifică distribuţiilor pe intervale egale: Tabel nr. 3.9

Frecvenţe cumulate xi

ni

ni

*= gi

gi2 ni↑ ni*↑(%)

ni/hi

(ni*%)/hi

4,85 8 0,1143 0,01306 8 11,43 11,43 16,33 5,55 18 0,2571 0,06610 26 37,14 25,71 36,73 6,25 24 0,3429 0,11758 50 71,43 34,29 48,99 6,95 8 0,1143 0,01306 58 82,86 11,43 16,33 7,65 6 0,0857 0,01229 64 91,43 8,57 12,24 8,35 4 0,0571 0,00326 68 97,14 5,71 8,16 9,05 2 0,0286 0,00082 70 100,00 2,86 4,09 / 70 1,0000 0,22617 / / / /

Page 54: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

48

Densităţile de repartiţie a frecvenţelor (ni/hi, şi *i in h ) permit aprecierea asimetriei

în cazul repartiţiilor reale sau empirice de frecvenţe.Aceste instrumente se folosesc cu precădere în cazul seriilor rezultate din grupările statistice pe intervale neegale. În măsura în care seria reală tinde spre o repartiţie normală, respectiv valorile frecvenţelor (absolute/relative) se diminuează către capetele distribuţiei se poate aprecia că seria tinde spre simetrie sau o asimetrie uşoară (moderată).Densităţile de frecvenţe sunt instrumente de comparare a repartiţiilor empirice cu cele teoretice. Majoritatea fenomenelor economice analizate prin intermediul distribuţiilor de frecvenţe tind să se apropie de repartiţia simetrică (normală). Pentru că sunt date disponibile în tabelul nr.3.9 se poate determina cu uşurinţă:

4.Coeficientul Gini-Struck:

2 11

1

i

nn giCG S n

−∑==− −

, unde: 0 1G SC −≤ ≤ .

7 0, 22617 1 0,583190,311766

7 1 6G SC −

× −= =

−= (uşor diversificată).

Dacă valoarea acestui coeficient tinde către „1”, atunci are loc un proces de concentrare (specializare sau repartizare neuniformă) iar dacă tinde către „0” atunci are loc un proces de diversificare (relativ uniform). Pentru a demonstra existenţa unui factor cauzal esenţial al variaţiei lui „x”, (ipoteza iniţială) se sistematizează dispersiile şi mediile grupelor într-un tabel unic: Tabel nr. 3.10

Grupe de agenţii

nJ

Media

grupei ( jx )

Dispersia

grupei ( 2

jσ ) ( )2

0j jx nx − 2

jnσ

MICRO [5-10)

20

115,2/20=5,76 mii RON

5,978:20 =0,2989

6,05 5,978

MICI [10-15)

40

245,8/40=6,145 mii RON

24,059:40 =0,601475

1,089

24,059

MIJLOCII [15-20)

10 80,7/10=8,07 mii RON

5,096:10 =0,5096

30,976 5,096

Total 70

ox =441,7:70 =6,31

(σ0)

2=73,248:70 =1,0464

38,115

( )2

01

j

nx x njj

−∑=

35,133

2

1

nnjj

σ∑=

Factorul de grupare dimensiunea agenţiei exprimată prin numărul de salariaţi este cel mai important dintre factorii explicativi ai variaţiei volumului operaţiilor (D=52 % şi R2 > K2) Se determină mai întâi dispersia explicată de factorul de grupare

„numărul de salariaţi din fiecare agenţie”: ( )2

2 38,11500,5445

70

x x nj j

n jδ

−∑= = =

Page 55: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

49

(dispersia mediilor de grupă). Apoi se calculează şi dispersia reziduală sau cauzată

de factori necunoscuţi: 2

2 35,1330, 5019

70

n j

n j

σσ

∑= = =

∑ (media dispersiilor de grupă)

Regula de adunare a dispersiilor se verifică pe baza rezultatelor: 2 2 20σ δ σ= + =

= 0,5445+0,5019=1,0464 (dispersia colectivităţii generale- 20σ este egală cu suma

dintre dispersia mediilor de grupă 2δ şi media dispersiilor de grupă 2σ ). Coeficientul de determinaţie D sau gradul de determinaţie (R2) subliniază contribuţia factorului de grupare în variaţia fenomenului analizat, în timp ce gradul de nedeterminaţie (K2) identifică acelaşi lucru pentru factorii necunoscuţi. Relaţia dintre aceştia este:R2+K2=1. Dacă R2 > K2 există un factor atât important cât şi majoritar explicativ, ceea ce corespunde ipotezei acestei aplicaţii:

2

2

0

0,5445100 100 52, 0%

1, 0464D

δσ

× ×= = = .

Coeficientul de determinaţie D sau gradul de determinaţie R2 arată că 52,0 % din variaţia totală a variabilei dependente sau rezultative volumul operaţiilor (mii lei) este explicată de variabila cauzală sau independente numărul de salariaţi din fiecare agenţie. În acelaşi timp K2 arată că 48,0% din variaţia totală a variabilei dependente sau rezultative volumul operaţiilor (mii lei) este explicată de influenţa unor factori necunoscuţi şi neînregistraţi.Interpretare:Din variaţia totală a volumului operaţiilor o valoare procentuală de 52,0% se explică prin numărul diferit de salariaţi ce lucrează în cele 70 de agenţii. Întrucât R2 > K2 se poate afirma că variabila număr de salariaţi din fiecare agenţie reprezintă factorul major pentru volumul operaţiilor. C) Aplicaţii propuse spre rezolvare 1. Profitul celor 20 de sucursale ale firmei SIGMA, pe variante distincte sunt: Profit (milioane lei) -xi - 4 5 6 7 8 9 10 Număr filiale -ni - 2 4 5 4 2 2 1 a)Determinaţi nivelul profitului mediu pentru cele 20 de filiale. b)Identificaţi profitul ca valoare mediană. c)Calculaţi abaterea medie liniară în funcţie de media aritmetică de la punctul „a” şi de valoarea mediană de la punctul „b”. 2.Calculaţi numărul mediu de salariaţi şi coeficientul de variaţie pentru seria de repartiţie de frecvenţe unidimensională şi comentaţi omogenitatea repartiţiei: Tabel nr. 3.11

Observaţie : limita superioară este inclusă în interval.

Puncte de lucru grupate după numărul salariaţilor -xi- Număr de agenţii -ni- 30– 40 40– 50 50– 60 60– 70

10 20 50 20

TOTAL 100

Page 56: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

50

3.În sesiunea de refacere a unei probe de verificare, din cei 120 de studenţi nepromovaţi s-au prezentat la examen numai 94. Să se calculeze media şi dispersia caracteristicii alternative prezent – absent. 4. Pentru o firmă ce desfăşoară o activitate industrială se cunosc următoarele date referitoare la vechimea în specialitate a celor 300 de salariaţi: Grupe de salariaţi după vechime (ani)

Sub 5 5-10 10-15 15-20 20-25 25-30 30-35 35 şi peste

Număr salariaţi (n) 10 40 60 80 50 30 20 10 I. Să se precizeze valoarea vechimii medii în specialitate exprimată în ani prin utilizarea mediei aritmetice a frecvenţelor absolute, relative şi printr-o modalitate de calcul simplificat, specificând ce proprietăţi ale mediei aritmetice stau la baza determinării mediei aritmetice prin intermediul frecvenţei relative şi prin calcul simplificat;II. Să se determine valorile indicatorilor medii de poziţie. 3.7 Rezumat Indicatorii medii, în calitate de indicatori evoluaţi sunt expresia numerică sintetică, rezultată din maxima condensare de date individuale ale unui fenomen, expresii care evidenţiază ceea ce este esenţial, tipic, central, comun şi reprezentativ într-o populaţie din punct de vedere al variabilei studiate. Se disting indicatori medii de nivel, rezultaţi dintr-un algoritm de substituţie bazat pe o proprietate specifică ansamblului şi indicatori medii poziţionali, rezultaţi prin localizare. Din prima categorie fac parte media aritmetică, armonică, geometrică şi pătratică alături de media cronologică, anarmonică, cubică şi media variabilei alternative iar din cea de-a doua categorie modul, mediana, mediala şi valoarea potenţială. Indicatorii medii poziţionali sunt rezultaţi, în principal, prin localizare şi mai puţin ca urmare a unor calcule (considerate sumare şi „convenţionale”) şi includ modul, mediana, mediala şi valoarea potenţială. În sinteză, indicatorii tendinţei centrale se restrâng la media aritmetică sau valoarea esenţială, covârşitor majoritară ca utilizare, modul sau valoarea tipică prin definiţie şi mediana sau valoarea centrală „sui-generis”. Cu cât concentrarea, condensarea sau densificarea valorilor sau variantelor va fi mai mare cu atât repartiţia va fi

mai aproape de simetria perfectă, evidenţiată prin relaţia: x = Me = Mo .În cazul repartiţiei moderat asimetrice, G.U.Yule şi M.G.Kendall au exprimat următoarea relaţie empirică

existentă între cele trei valori medii semnificative: Mo = x -3( x - Me). Sistemul de indicatori statistici pentru caracterizarea frecvenţelor într-o serie de repartiţie sau distribuţie este alcătuit din următoarele componente: frecvenţe absolute (ni), frecvenţe relative (n* i), frecvenţe cumulate crescător (ni↑ sau n* i↑ ) sau descrescător (ni↓ sau n* i↓ ), densităţi de

repartiţie a frecvenţelor ( /i in h sau * /i in h ). Frecvenţele cumulate crescător sau

descrescător permit identificarea cuantilelor (Cv) din a căror numeroasă familie fac parte: mediana (Me), quartilele (Q1, Q2, Q3), decilele (D1, …, D9) şi centilele (C1, …, C99), care împart populaţia statistică în două, în patru, în zece şi într-o sută de părţi egale.Sistemul de indicatori statistici ai variaţiei într-o serie de repartiţie de frecvenţe unidimensională se referă la mărimea şi intensitatea împrăştierii valorilor individuale în jurul tendinţei centrale de grupare. Categoria indicatorilor simpli ai variaţiei sau evaluării mărimii împrăştierii apelează în afara mediei la una sau două unităţi statistice (variante,) şi cuprinde: amplitudinea absolută (Ax) şi relativă (Ax%), precum şi abaterile individuale absolute (di) şi relative (di%), abaterile intercuartilică, interdecilică etc. Indicatorii sintetici ai variaţiei

Page 57: Statistic A

Indicatorii tendinţei centrale, variaţiei, asimetriei şi boltirii Capitolul3

51

valorifică informaţiile referitoare la toate unităţile populaţiei şi includ abaterea medie liniară şi absolută, dispersia, varianţa sau fluctuaţia, abaterea medie pătratică şi coeficientul de omogenitate (variaţie). Utilizarea unei valori medii este strict legată de interpretarea

coeficientului de omogenitate: Co = 100d

x× şi Co= 100

x

σ× ,unde Co [ ]0%,100%∈ :

a) dacă Co = 0%, valorile sunt egale între ele şi cu media lor, lipsa variaţiei fiind evidentă;

b) dacă Co ( ]0%,17%∈ seria este strict omogenă şi media strict reprezentativă;

c)dacă Co ( ]17%,35%∈ seria este moderat omogenă şi media moderat reprezentativă;

d)dacă Co ( ]35%,50%∈ seria este relativ eterogenă şi media relativ nereprezentativă;

e) dacă Cv sau Co ( ]50%,100%∈ seria este eterogenă şi media nereprezentativă;

Regula de adunare a dispersiilor sintetizează specificitatea sistemului de indicatori statistici

ai variaţiei într-o serie de repartiţie de frecvenţe bidimensională : 2oσ = 2σ + 2σ ,respectiv

dispersia populaţiei statistice totale ( 2oσ ) este egală cu dispersia explicată de factorul de

grupare ( 2σ ) la care se adaugă dispersia reziduală sau neexplicată de acelaşi factor

( 2σ ).( )2

012

1

my y nj jj

o mn jj

σ∑ −=

=∑=

, ( )2

012

1

ry y ni ii

rn ii

σ∑ −=

=∑=

� �

, ( )2

2 1

1

rni ii

rn ii

σσ

∑==

∑=

� �

.

(dispersia totală) = (dispersia mediilor de grupă) + (media dispersiilor de grupă)

Relaţia anterioară împărţită la 2oσ conduce la calculul coeficientului de determinaţie (R2) şi

nedeterminaţie (K2): 2 2

2 21

o o

σ σσ σ

+ = sau R2 +K2=1. Coeficientul de determinaţie se exprimă,

de regulă, procentual şi identifică ponderea factorului principal de grupare (variabila xi) în

variaţia totală a caracteristicii: 2

22 100o

Rσσ

= × = 100% - K2. Sistemul de indicatori statistici

ai asimetriei şi ai excentricităţii într-o serie de repartiţie de frecvenţe unidimensională necesită definirea asimetriei ca măsură în care seria este mai mult (pronunţat) sau mai puţin (uşor) oblică în raport cu distribuţia normală sau funcţia Gauss-Laplace şi definirea excentricităţii ca măsură în care repartiţia este mai “rarefiată” sau mai “densă” (condensată) în jurul tendinţei centrale decât în cazul aceleiaşi distribuţii normale sau funcţiei Gauss-

Laplace. Principalii indicatori ai asimetriei sau oblicităţii sunt: simetria absolută (∆ = x -M0), densităţile de frecvenţe, coeficienţi de asimetrie propuşi de Karl Pearson, Ronald Fisher, Yule şi Kendall, Arthur Bowley etc. Indicatorii excentricităţii sau ai excesului şi boltirii sunt: coeficientul pearsonian şi coeficientul lui Ronald Fisher. Sistemul de indicatori statistici ai seriilor homograde sau de atribute cuprinde indicatori privind caracterizarea frecvenţelor (absolute, relative, cumulate crescător sau descrescător), indicatori relativi de coordonare, indicatori de tip poziţional ai tendinţei centrale (Me sau Mo) şi chiar indicatorul de concentrare/diversificare Gini-Struck.

Page 58: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

52

Tema 4 SONDAJE STATISTICE APLICATE ÎN ECONOMIE CUPRINS: pag. 4.1 Aspecte şi noţiuni teoretice privind sondajul statistic 52 4.2 Procedee şi tehnici de eşantionare 56 4.3 Erori specifice cercetărilor selective 59 4.4 Sondajul simplu aleator repetat şi nerepetat şi alte tipuri de sondaje 64 4.5 Test de autoevaluare şi aplicaţii 68 4.6 Rezumat 74 Obiective: O cerinţă omniprezentă în gândirea statistică este eficienţa cercetării prin îmbunătăţirea continuă a raportului dintre cheltuieli şi rezultate, evidenţiată de preferinţa pentru sondaje (cercetări selective), în detrimentul celei pentru cercetări totale. Problema ce apare în acest tip de abordare a realităţii economice este legată de reprezentativitatea rezultatelor,iar costurile mult mai mici pot justifica informaţii statistice cu o eroare de reprezentativitate redusă ca impact decizional. Formarea statistică a studenţilor se întregeşte astfel prin cunoaşterea şi aplicarea în economie a metodei sondajelor. Timpul alocat temei: minim 3 ore - maxim 4 ore Bibliografie T., Andrei, S., Stancu, Statistică, Editura ALL, Bucureşti, 1995. M.Korka,L.,Begu,E.,Tusa,Bazele statisticii pentru economişti,Ed.Tribuna Economică,2002. C.A., Moser, Metode de anchetă în investigarea fenomenelor sociale, Ed., Ştiinţifică, Bucureşti, 1967. G.,Săvoiu, Statistică generală. Argumente în favoarea formării gândirii statistice, Ed. Independenţa Economicǎ, Piteşti, 2003. G.,Săvoiu (coord.),Statistică generală. Elemente teoretice, teste tip grilă, aplicaţii şi studii de caz, Ed. Independenţa Economicǎ, Piteşti, 2004. G.,Săvoiu, Statistica.Un mod ştiinţific de gândire, Ed. Universitară, Bucureşti, 2007. G.,Săvoiu, Statistica.Mod de gândire şi metode, Ed.Universitară, Bucureşti, 2009. V.,Trebici, Mica enciclopedie de statistică, Ed. ştiinţifică şi enciclopedică, Bucureşti, 1985. M.,Ţarcă,Tratat de statistică aplicată, Ed. didactică şi pedagogică R.A. Bucureşti, 1998. Webografie *** http://www. insse.ro

4.1 Aspecte şi noţiuni teoretice privind sondajul statistic

Sondajul sau cercetarea selectivă reprezintă un rezultat practic al soluţionării corecte a unor aspecte esenţiale ale procesului de cercetare statistică legate de lipsa resurselor materiale şi a timpului afectate firesc unei cercetări statistice totale sau exhaustive, imposibilitatea accesării practice a tuturor unităţilor ce compun populaţia statistică, iraţionalitatea controlului distructiv total în asigurarea calităţii, sau caracterul aparent infinit al unor populaţii (veritabile universuri statistice). Evoluţia teoriei probabilităţilor se află la baza teoriei sondajului, iar împreună au marcat profund ultimele trei secole de dezvoltare a gândirii statistice. De la 1713, când Jacob Bernoulli, în lucrarea Ars conjectandi, formula pentru prima dată legea

Page 59: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

53

numerelor mari, trecând apoi prin ezitările, neîncrederea şi disputele pe tema reprezentativităţii eşantioanelor, relativ limpezite la Congresul internaţional de statistică din 1925, la Roma şi culminând cu expozeul lui Jerzy Neyman, susţinut în faţa membrilor Societăţii Regale de Statistică a Marii Britanii, în apărarea teoriei moderne a sondajelor din 1934, drumul parcurs de sondajul statistic este unul dificil, dar ascendent ca impact. La finele secolului al XX-lea, teoria sondajului îşi ocupa locul binemeritat în demersul general al cunoaşterii ştiinţifice, oferindu-i aproape o treime din metodele şi limbajul lui actual.Conceptele fundamentale şi noţiunile perechi specifice sondajului îşi au originea în dualitatea subpopulaţie - populaţie totală, în dialectica relaţiei dintre eşantion şi populaţia originară.

Noţiuni teoretice esenţiale în teoria sondajului statistic Caseta nr. 4.1 Populaţia totală (originară) reprezintă mulţimea tuturor manifestărilor, cazurilor, unităţilor, elementelor sale componente, care au cel puţin o trăsătură comună, fiind bine delimitată în timp, în spaţiu şi organizatoric (structural). Eşantionul (selecţia, mostra, proba), definit ca o populaţie parţială, selectată aleator, dirijat sau mixt din populaţia originară este rezultatul identificării, extragerii şi alăturării unităţilor sau prelevării sale din populaţia totală. Reprezentativitatea eşantionului descrie capacitatea măsurabilă a acestuia de a reproduce „ în mic” şi cât mai fidel cu putinţă, structura şi trăsăturile esenţiale ale populaţiei originare. Eşantionul extras aleator este unicul a cărui reprezentativitate poate fi riguros precizată. Reprezentativitatea eşantionului depinde în mod semnificativ de caracteristicile populaţiei originare, mărimea eşantionului, procedura de eşantionare sau tehnica de selecţie, calitatea bazei de sondaj, nonrăspunsurile finale. Erorile de reprezentativitate măsoară diferenţa efectivă sau probabilă dintre cei mai stabili indicatori ai populaţiei originare şi ai eşantiontului, distingând aici, mai ales, eroarea medie şi eroarea limită de reprezentativitate. Baza (cadrul) de sondaj constituie o sistematizare a unităţilor unei populaţii (liste, hărţi, fişiere) realizată astfel încât să permită atât identificarea lor cu uşurinţă, cât şi extragerea rapidă a tuturor acelora ce vor intra în eşantion, fiind de regulă completă, nerepetitivă sau cu duble înregistrări, disponibilă într-un singur centru şi periodic actualizată. Nonrăspunsul se defineşte ca refuzul sau imposibilitatea obţinerii datelor, manifestat în final prin absenţa unui volum de date utile. O rată mare a nonrăspunsurilor deformează (distorsionează) rezultatele sondajului. Remediul practic pentru nonrăspunsuri o constituie sporirea volumului eşantionului cu numărul acestora (nonrăspunsuri anticipate ca valoare a absolută sau ca procent preluat din sondaje similare). Estimatorii reprezintă valorile caracteristice variabilei atributive numerice sau alternative (media x sau w şi dispersia 2σ sau 2σw),

calculate pornind de la seria de repartiţie a variabilei xi, obţinută prin prelucrarea datelor

observate în eşantion. Parametrii sunt valori specifice populaţiei originare (media0x sau p

şi dispersia 2

0σ sau 2

pσ ) ce se inferenţiază pe baza estimatorilor. Nivelul de încredere rămâne

problema cardinală a sondajului, delimitând credibilitatea sa, prin precizarea probabilităţii în estimarea parametrilor şi a mărimii erorilor caracteristice. Dacă nu este posibil ca fiecărei unităţi din populaţia originară să i se determine o probabilitate de selecţie calculabilă şi nenulă, atunci teoria sondajului nu se poate aplica şi nu se pot preciza erorile.

Principalele obiective ale sondajului, urmărind obţinerea cu un efort minim a unui volum maxim de informaţii, rămân observarea unei părţi cât mai reduse, dar suficiente, din numărul total de unităţi statistice, sistematizarea volumului de date

Page 60: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

54

înregistrate şi extinderea finală a rezultatelor asupra populaţiei totale pe baza capacităţii părţii de a reproduce la scară redusă structura şi trăsăturile esenţiale ale întregului, respectiv a reprezentativităţii eşantionului. Etapele sondajului sunt: a) eşantionarea (prelevarea) de eşantioane; b)observarea unităţilor statistice selectate şi sistematizarea datelor înregistrate; c)calculul estimatorilor ce caracterizează eşantionul; d)inferenţa statistică (estimarea cu precizie determinată a parametrilor); e) analiza şi interpretarea finală.

Eşantionarea sau prelevarea eşantionului se defineşte ca extragere şi alăturare succesivă, metodică şi programată a unităţilor statistice ce alcătuiesc selecţia, mostra etc. În teoria statistică se recunoaşte existenţa unor avantaje certe ale valorificării sondajului, descrise concret prin faptul că sondajul: a) se impune ori de câte ori cercetarea totală nu este posibilă sau nu este recomandabilă (geologie, astronomie, control distructiv de calitate etc.); b) este mult mai eficient(operativ şi economic); c) oferă un plus de cunoaştere, volumul eşantionului fiind mult redus permite un program de observare mai amănunţit; d) este cel mai indicat, atât în cazul cercetărilor de tip preliminar (pilot, test), cât şi ulterior (control validare). În paralel apar limitări şi dificultăţi, ce se pot transforma în situaţii de neglijare totală în dezavantaje: a) apariţia unui nou tip de eroare foarte importantă prin consecinţe, denumită eroare de reprezentativitate; b) realizarea unui nivel mediu mai ridicat al cheltuielilor pe unitatea de informaţie (legate de asigurarea tehnicilor de prelevare a eşantioanelor, de actualizarea bazei de sondaj şi de culegerea datelor cu o mai mare precizie); c) dificultatea sau chiar imposibilitatea de a surprinde, în perioade foarte scurte de timp, schimbările petrecute în evoluţia fenomenului economic.

Noţiunile pereche sau indicatorii statistici pereche constituie rezultatul abordării lor la nivelul populaţiei totale (prin notaţii cu majuscule), precum şi la nivelul subpopulaţiei extrase (prin minuscule) şi se referă la volum (N,R,M în cuplu cu n, r, m), la medie (0x , p în cuplu cu x , w) şi la dispersia caracteristicii analizate

( 220 , pσσ , în cuplu cu 22 , wσσ ). Prin intermediul notaţiilor diferenţiate după tipul

caracteristicii (alternative/nealternative) şi a tipului unităţii (simple/complexe) aceste noţiuni sunt sintetizate în tabelul următor:

Notaţi şi noţiuni pereche în teoria sondajului Tabel nr. 4. 1

Notaţia şi modalitatea de calcul în: Noţiunea/indicatorul de tip statistic populaţia totală (originară) subpopulaţia extrasă (eşantion)

A.Caracteristică nealternativă şi unităţi statistice simple Volumul total

N = 1

N

ini=

∑ n = 1

n

ini=

Nivelul mediu (media) 1

0

Nx ni iiX

N

∑== 1

nx ni iixn

∑==

Dispersia (împrăştierea în jurul mediei) 1

202

0

( )N

ix x ni i

Nσ =

−∑=

2

2 1( )

n

ix x ni i

nσ =

−∑=

B.Caracteristică nealternativă şi unităţi statistice complexe

Page 61: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

55

Volumul total

R = 1

R

ini=

∑ r = 1

r

ini=

Nivelul mediu (media) 1

0X i

Rx ni i

R=∑

= 1

rx ni iixr

∑==

Dispersia (împrăştierea în jurul mediei)

2

20

0( )1

Rx x ni ii

−∑==

2

2( )

1

rx x ni ii

−∑==

C.Caracteristică alternativă Volumul total

N = 1

N

ini=

∑ n = 1

n

ini=

Nivelul mediu (media) P=M : N w = m : n

Dispersia (împrăştierea în jurul mediei)

)1(2 ppp −=σ

)1(2 www −=σ

Parametri Estimatori Programul oricărui sondaj rămâne o combinaţie de decizii tehnice şi

organizatorice, iar domeniile lui de aplicabilitate sunt în continuă expansiune. Caseta nr. 4.2 Programul sondajului este un lanţ de acţiuni şi lucrări complexe de la descrierea populaţiei originare şi eşantionului, la precizarea erorilor de sondaj, de la tehnica de eşantionare adecvată, la volumul eşantionului. Conţinutul etapizat este următorul: pasul I stabileşte obiective şi resurse necesare sondajului (detalierea scopurilor, metodelor şi a unei schiţe de buget aferente); pasul II precizează modul de utilizare a rezultatelor cercetării selective şi nivelul de încredere al estimării parametrilor; pasul III delimitează populaţia totală în timp (definirea temporală a unităţii statistice: anul de înfiinţare al firmei sau gospodăriei), în spaţiu (arealul geografic al mulţimii unităţilor: judeţ sau localitate), organizatoric (delimitarea funcţională: clasa firmelor, tipul gospodăriilor) şi chiar structural (delimitarea internă a submulţimilor: bazine hidrografice, străzi), pasul IV obligă la verificarea omogenităţii populaţiei totale, care induce şi primele efecte tehnice, populaţia omogenă impunând un sondaj simplu aleator, iar populaţia eterogenă oferind două alternative, un sondaj stratificat sub constrângerea unităţilor simple(locuitori) sau un sondaj de serii pretins de unităţile complexe(firme sau gospodării);pasul V selectează, stabileşte şi actualizează continuu baza de sondaj (eşantionare) şi anticipează nonrăspunsurile în valori absolute sau relative; pasul VI identifică mărimea eşantionului, tehnicile de eşantionare (extracţie) şi procedurile de calcul ale estimatorilor, extragerea şi alăturarea eşantionului (prelevarea lui); pasul VII stabileşte precis variabilele, planul observării, metodele de obţinere a datelor (directe prin operator de interviu şi anchetator sau indirecte prin telefon şi prin poştă) şi a periodicităţii sondajului (ex: panelul sau sondajul pe cote de tip „continuu”sau „în valuri”); pasul VIII presupune cunoaşterea cu anticipaţie a temei, reacţiei respondenţilor, a necesităţii ameliorării chestionarului (interviului) prin intermediul anchetei pilot, testului preliminar sau interviului de probă; pasul IX coincide cu definitivarea elaborării formularelor şi tipărirea lor; pasul X reuneşte colectarea datelor culese şi înregistrate din eşantion cu calculul estimatorilor la nivelul subpopulaţiei extrase;pasul XI alege procedeele de verificare a semnificaţiei estimatorilor şi inferenţă (extindere) a rezultatelor eşantionului la nivelul populaţiei totale cu precizie determinată (estimarea parametrilor); pasul XII analizează, interpretează date şi formulează concluzii. În domeniul statisticii economice şi sociale, în ultimele două decenii, cercetările statistice au devenit selective şi în România,

Page 62: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

56

armonizându-se cu statistica europeană. Cercetări exhaustive se mai menţin în demografie, în statistica învăţământului şi în domeniul cultural şi în foarte puţine alte activităţi, în paralel cu extinderea sondajelor în industrie, transporturi, construcţii, comerţ, servicii, în evaluarea veniturilor şi cheltuielilor populaţiei, în evaluarea ocupării resurselor de muncă, în folosirea timpului liber, în determinarea condiţiilor de viaţă, în domeniul măsurării inflaţiei etc. Omniprezenţa cercetării selective este evidentă şi în biologie, fizică, meteorologie, astronomie, controlul şi asigurarea calităţii, presa scrisă şi audio-vizuală etc.

4.2 Procedee şi tehnici de eşantionare Procedeele şi tehnicile de eşantionare minimizează distorsiunea sau diferenţa

dintre valoarea scontată şi valoarea reală a parametrului şi maximizează precizia, pentru o cheltuială relativ constantă sau limitată de resurse. Reprezentativitatea ca identitate a trăsăturilor şi fidelitatea structurală (a întregului şi a părţii extrase) depinde de trei aspecte majore la nivelul eşantionului: a) omogenitatea populaţiei originare, analizată după caracteristicile cercetate;b)mărimea eşantionului, mărime care o dată ce creşte peste valori de 600-700 de unităţi statistice aduce un spor de precizie tot mai mic, conform curbei Stoetzel şi Girard (teoretic un eşantion de 1000 de persoane are în final cam aceeaşi reprezentativitate atât pentru populaţia Chinei de peste 1,4 miliarde de locuitori la 1 iulie 2007, cât şi pentru un oraş de o sută de mii de locuitori);c)procedeul de eşantionare (reprezentativitatea se poate determina numai pentru eşantioanele strict aleatoare sau probabilistice). Condiţiile concrete de reprezentativitate ale unui eşantion extras aleator (probabilistic) sunt: a) asigurarea de probabilităţi de extracţie determinabile anticipat şi nenule pentru fiecare unitate statistică a populaţiei originare; b) prelevarea unui eşantion suficient de mare pentru a reda şi structura şi trăsăturile populaţiei originare (cu un grad mare de stabilitate a indicatorilor); c) extragerea în mod obiectiv a unei unităţi statistice,după legile hazardului şi independent de alte unităţi (evenimentele de extracţie ale fiecărei unităţi în parte trebuie să fie independente); d) acceptarea unui procedeu teoretic şi a unei tehnici practice de eşantionare care să manifeste o evidentă autonomie în raport cu caracteristicile sau variabilele populaţiei originare.

Procedeele teoretice clasice de eşantionare se divid în două clase: aleatoare sau probabilistice (sondajul aleator, quasialeator şi parţial aleator), nealeatoare sau neprobabilistice(sondajul realizat prin eşantionarea dirijată sau subiectivă) şi mixte.

Procedee şi tehnici de eşantionare aleatoare, nealeatoare şi mixte Caseta nr. 4.3 A. Sondajul aleator se concretizează în tehnicile loteriei (varianta bilei revenite şi bilei nerevenite), a tabelului cu numere întâmplătoare şi a pasului mecanic de numărare. A1.Tehnica loteriei sau tragerii la sorţi defineşte sondajul aleator de notorietate şi constă în confecţionarea de bile, bilete, jetoane identice, care coincid ca număr cu volumul populaţiei originare şi reprezintă fiecare câte o unitate statistică. Se disting două variante de extragere din urnă varianta sondajului simplu repetat sau a bilei revenite şi sondajului nerepetat sau a bilei nerevenite în urnă. În varianta sondajului simplu repetat fiecare bilă beneficiază de şansa de a reintra în eşantion, iar principalele caracteristici sunt:a) şansa egală şi constantă a fiecărei unităţi, pe întreg parcursul extragerilor, de a fi prelevată în eşantion, transpuse în nivel identic al probabilităţilor de selecţie p=(1/N), unde N este numărul unităţilor din

Page 63: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

57

populaţia originară; b) prin extrageri repetate se pot obţine maxim Nn eşantioane distincte, unde n este volumul eşantionului; c) la finalul eşantionării sau prelevării, în urnă rămân (N-1) unităţi statistice. În cea de-a doua variantă a sondajului simplu nerepetat, bila odată extrasă nu se mai reintroduce în urnă, iar principalele caracteristici sunt:a) şansa egală pentru fiecare unitate de a fi inclusă în eşantion înaintea fiecărei extrageri, dar în permanentă creştere de la o extragere la alta, conform evoluţiei nivelului probabilităţilor:

])1n(N

1np[...)

2N

13p()

1N

12p()

N

11p(

−−<<

−<

−< ==== ; b) prin extrageri repetate se

obţin nNC eşantioane distincte sau N!/(N-n)!n!; c) la final, în urnă rămân (N-n) unităţi.

O limită practică de utilizare a tehnicii loteriei este generată de volumul populaţiei N. Asigurarea de bile identice pentru întreaga populaţie a României, ce se introduc apoi în urnă presupune un număr foarte mare de bile, iar extragerea cu şanse egale este imposibilă. A2. Tehnica tabelului cu numere întâmplătoare presupune o selectare a celor n unităţi statistice ale eşantionului din populaţia originară, unde au fost numerotate în prealabil de la 1 la N, selectare bazată pe tabelele elaborate de Kendall, Babbington-Smith, Rand, Tippet, Fisher, Yates, inclusiv pe unele programe elementare contemporane generatoare de numere aleatoare. Tabelele clasice cu numere întâmplătoare se întocmeau cu ajutorul unui dispozitiv de „randomizare” sau amestecare aleatoare a numerelor. Tehnica a apărut ca soluţie în cazul eşantioanelor mari, iar practica recentă valorifică programe ce generează numere aleatoare pe calculator şi răspunde oricărei cerinţe de volum a eşantionului. A3. Tehnica pasului mecanic de numărare sau selecţia mecanică este un procedeu quasialeator, deoarece extragerea unei unităţi a eşantionului depinde de selecţia celei anterioare în timp ce, în celelalte tehnici prezentate anterior, toate rămân independente. În ce anume constă această dependenţă, se poate deduce din calculul pasului mecanic de numărare (k), care rezultă din raportarea volumului populaţiei originare, la volumul eşantionului: k = (N/n). Eşantionul se constituie printr-o selecţie aleatoare a primei unităţi statistice (de obicei printr-o tragere la sorţi dintr-o urnă ce conţine un număr k de unităţi statistice) urmată de selecţia tuturor celorlalte (n-1) unităţi rămase, identificate şi extrase prin adăugarea repetată a valorii pasului mecanic obţinut la numărul de ordine al primei unităţi extrase (N1): a) prima unitate (n1) extrasă aleator este situată în poziţia N1; b) a II-a unitate (n2) este situată în poziţia N1+k; c) a III-a unitate (n3) este situată în poziţia (N1+k)+k=N1+2k; d) a m-a unitate (nm) este situată în poziţia [N1+(m-1)k]. B.Sondajul nealeator este cunoscut ca sondaj dirijat şi se aplică în cercetări de marketing sau sociologice, ca de exemplu în determinarea atitudinilor şi opiniilor cumpărătorilor. B1. Sondajul dirijat în varianta eşantionării pe cote, presupune o cunoaştere specială a populaţiei originare, a factorilor principali de grupare şi a omogenităţii grupelor formate în interiorul acestei populaţii. Eşantionarea pe cote este mai puţin riguroasă teoretic deoarece nu asigură fiecărei unităţi statistice o şansă calculabilă şi nenulă de a fi cuprinsă în subpopulaţia finală, dar relativitatea rezultatelor poate fi compensată prin utilizarea unui bun cunoscător (expert) al populaţiei originare, prin includerea conştientă în eşantion de unităţi considerate de acesta ca fiind reprezentative. Elementul aleatoriu, probabilistic este înlocuit cu cel subiectiv, intenţional, urmat de fixarea unor reguli ferme de alegere a unităţilor reale din eşantion de către operatorii cercetării. Concret sondajul pe cote conţine trei etape esenţiale: a) stabilirea factorilor de grupare în populaţia originară ce devin apoi criterii pentru stabilirea cotelor în eşantion (denumite criterii de control şi exemplificate prin sex, grupă de vârstă, statut social, nivel de venit etc.); b) descompunerea după cote a eşantionului, conform structurii populaţiei originare prin intermediul criteriilor de control

Page 64: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

58

(de regulă independente); c) alegerea unităţilor statistice reale se bazează pe reguli a căror aplicare este lăsată în seama investigatorilor anchetei sau operatorilor de interviu. Cele mai cunoscute eşantioane pe cote sunt panelurile (de consumatori, magazine, distribuitori etc.). Alături de eşantionarea pe cote, în practică se mai aplică şi alte metode de selecţie dirijată: a) metoda voluntariatului, bazată pe voluntarii extraşi prin intermediul unui chestionar dintr-o populaţie specială (cititorii unui anumit ziar, aderenţii la o organizaţie caracteristică etc.) beneficiind de rezultate cel mult interesante, dar nu şi inferenţiabile; b) metoda eşantionării la faţa locului, ce se realizează pe cei selectaţi prin pas mecanic(a n-a persoană ce „vizitează” un spaţiu special şi de interes în cercetarea selectivă - muzeu, aeroport, magazin etc.) şi ale cărei rezultate nu se extrapolează; c) metoda itinerariilor axată pe o eşantionare pe cote combinată cu interesul realizării unui anumit traseu şi cu respectarea anumitor puncte de oprire care încearcă să evite nonrăspunsul, prin trecerea la punctul următor sau la unitatea statistică următoare; metoda rămâne nereprezentativă în rezultate, fiind numai orientativă; d) metoda unităţilor tip, determinată de definirea unităţii tip, prin corelarea anumitor variabile şi gruparea populaţiei originare în subansambluri omogene, fără pretenţii de extindere riguroasă a indicatorilor final obţinut sau rezultat din eşantion. C.Sondajul mixt (parţial aleator) este o combinaţie de eşantionare aleatoare şi dirijată, pornind de la ideea de a maximiza avantajele şi minimiza dezavantajele sondajului statistic. C1. Sondajul stratificat (tipic) se aplică populaţiilor eterogene de unităţi simple, care se pot segmenta în straturi omogene, pentru care se prelevează distinct subeşantioane, formarea eşantionului ca reuniune a subeşantioanelor apelând la tehnici aleatoare la nivelul fiecărui strat sau fiecărei grupe în parte. Motivaţiile stratificării sunt generate de existenţa unei legături consistente între variabila corelată şi criteriul de clasificare (cu cât este mai mare proporţia variaţiei totale într-o populaţie originară cauzată de variaţia între straturi, cu atât este mai mare avantajul stratificării) şi de nevoia practică de segmentare pe criterii geografice (regiuni, judeţe, oraşe, comune).Apar astfel trei probleme majore ale stratificării: a) determinarea straturilor (identificarea corectă a variabilei generatoare sau fondatoare de straturi) şi a criteriilor de alcătuire ale acestora (calitative, ca şi cele geografice sau teritoriale şi cantitative, ca şi cifra de afaceri pentru agenţi economici sau populaţia pentru localităţi); b) optimizarea numărului de straturi (cu cât creşte precizia la nivel de strat cresc şi cheltuielile totale ale cercetării ); c) repartizarea concretă a eşantionului pe straturi (fie neproporţional, proporţional sau optim, fie cu stratificare anterioară sau ulterioară selecţiei). C2. Sondajul de serii este utilizat atunci când populaţia este tot neomogenă dar alcătuită din unităţi statistice complexe, ca în cazurile controlului de loturi (pachete, lăzi, containere), al transporturilor aeriene (serii de zboruri) etc. Aceste unităţi statistice complexe denumite curent serii prezintă grade diferite de omogenitate, o serie extrasă în eşantion fiind în mod obligatoriu cercetată integral. Aplicarea practică a selecţiei de serii se impune atunci când populaţia originară este natural grupată în serii. Deoarece eşantionul se formează din aceste serii sau subansamble formal similare, adesea o bază de sondaj incompletă (indisponibilă) poate fi remediată prin acest tip de sondaj. C3. Sondajul multistadial (în trepte) este o selecţie de serii cercetatǎ sau studiatǎ parţial, selecţie repetată în mai multe stadii sau trepte. Primul stadiu sau prima treaptă are o contribuţie majoră în precizia cercetării. În practică nu se recomandă prea multe stadii sau trepte (în mod obişnuit apar două sau trei). Realizarea efectivă a unui sondaj „bi sau tristadial” presupune existenţa unei grupări a populaţiei cât mai naturale (de tipul teritorial-administrativ, ca în cazul judeţelor, localităţilor). Un sondaj multistadial sau în trepte poate fi exemplificat astfel la nivel regional: a) stadiul I-localitatea; b) stadiul II-gospodăria; c) stadiul III-gospodăria; d) stadiul IV- individul. Se preferă ca în primul stadiu grupele să fie

Page 65: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

59

mai omogene. Avantajul acestei selecţii îl constituie concentrarea cercetării în teren şi dezavantajul major, creşterea erorii de reprezentativitate, în funcţie de numărul stadiilor. C4. Sondajul multifazic utilizează mai multe eşantioane succesiv. În prima fază eşantionul este de dimensiuni mai mari, iar numărul variabilelor studiate, limitat.În fazele următoare se diminuează semnificativ volumul noului eşantion, dar se extinde profunzimea programului de observare (numărul caracteristicilor acestuia creşte).Principalul avantaj al acestei tehnici este generat de posibilitatea utilizării eşantionului iniţial (al primei faze) pentru selectarea eşantioanelor din fazele următoare (tematic specializate).Tehnica este folosită cu succes pentru completarea recensămintelor cu cercetări tematice aprofundate. C5. Sondajul secvenţial verifică practic unele calităţi importante şi mai ales apartenenţa la un spectru de valori bine delimitat prin diverse testări.Domeniul major de aplicare al acestui sondaj este cel al controlului calităţii producţiei, asigurând la timp corecţiile necesare. Practica extinde tipologia sondajelor şi eşantioanelor. Se mai utilizează eşantioane întrepătrunse sau replicate, rezultate din divizarea în subpopulaţii a eşantionului iniţial, eşantioane pe zone sau pe areale, a căror bază de eşantionare este o hartă, eşantioane de bază sau dominante, din care se extrag periodic subeşantioane,cele dominante simplificând şi accelerând procedura de selecţie, cu condiţia să fie întreţinute şi actualizate periodic.

4.3 Erori specifice cercetărilor selective În cadrul cercetării selective, pe lângă celelalte tipuri de erori sistematice sau

întâmplătoare, comune tuturor cercetărilor statistice, apare o categorie aparte denumită eroare de reprezentativitate, mai rar evaluată ca efectivă şi cel mai des ca probabilă. Eroarea de reprezentativitate sau măsura în care este afectată capacitatea eşantionului de a reproduce cât mai fidel, la o scară redusă, structura, trăsăturile şi valorile esenţiale şi stabile ale populaţiei originare, se regăseşte în diferenţa, abaterea sau ecartul dintre estimatori şi parametri.

Eroarea efectivă se calculează pentru acele caracteristici la care s-au cules şi înregistrat date, atât prin observare totală cât şi prin sondaj. În situaţia în care nu se dispune de o cercetare totală anterioară şi de valori ale parametrilor, dar sunt disponibile mai multe eşantioane şi valorile estimatorilor, un parametru se substituie cu media mediilor mai multor eşantioane (x ) iar relaţia de calcul

este: 1x

mi

ix

m=∑

= ,cu xi = media per eşantion i şi m = număr de eşantioane extrase

Eroarea efectivă de reprezentativitate se evaluează prin trei indicatori specifici:

a) eroarea absolută (mǎrimea abaterii absolute a reprezentativităţii (x

d ), ca

diferenţă absolută între media eşantionului ( esx ) şi a populaţiei originare ( 0x ):

xd = esx – 0x sau media mediilor eşantioanelor (x )şi a populaţiei:

xd = esx –x

b) eroarea relativă sau procentul abaterii reprezentativităţii (x

d %), ca valoare

relativă a abaterii mediei eşantionului ( esx ) de la media populaţiei originare ( 0x )

Page 66: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

60

sau de la media mediilor eşantioanelor (x ): x

d (%)= 0

0 0

100 100esd x xx

x x

−× = × sau

xd (%)= 100 100

esd x xx

x x×

−× =

c) eroarea structurală de reprezentativitate sau procentul abaterii de la structura programată, ca raport între suma abaterilor în modul (

1

m

id f

=∑ ) ale structurii

eşantionului (ni*es) de la structura programată a populaţiei originare (ni

*), respectiv:

kdf = 1 100

mdf

in

∑= × , unde df = (ni

*es) – (ni

*), n = volumul eşantionului iar m = numărul

de variante distincte sau intervale de variaţie.

Erorile probabile de reprezentativitate ale sondajului, respectiv eroarea medie şi eroarea limită (admisibilă), constituie soluţiile matematice oferite de teoria probabilităţilor şi statistica matematică pentru cazul practic în care nu se cunosc informaţii despre populaţia originară, dar s-a verificat că eşantionul este suficient de reprezentativ. Această verificare a reprezentativităţii se traduce fie într-o verificare paralelă a eşantionului bazată pe existenţa datelor despre o altă variabilă statistică atât în subpopulaţie, cât şi în populaţia originară (situaţie mai rar întâlnită), fie prin controlul respectării condiţiei ca extracţia eşantionului să fi fost aleatoare sau, altfel exprimat, pe baza unei scheme probabilistice, de prelevare (situaţie cu cea mai mare frecvenţă practică). Teoria sondajului subliniază că dacă volumul eşantionului este suficient de mare, media de selecţie va urma legea de repartiţie din populaţia originară, apropiindu-se tot mai mult de media populaţiei originare sau, pe scurt: o selecţie aleatoare suficient de mare va asigura apropierea până la identitate a valorii estimatorului de valoarea parametrului.Teoria sondajului, conform legii numerelor mari, susţine stabilitatea valorii tipice (mediei) pe măsura creşterii volumului subpopulaţiei studiate. Legea numerelor mari, formulată matematic de Jacob Bernoulli prin: 0,1)(lim * >∀→<−

∞→εε pentrupnP i

n

arată că probabilitatea ca diferenţa absolută între frecvenţa relativă şi probabilitatea de producere a unui eveniment (p) să fie mai mică decât un număr pozitiv şi arbitrar ales ε, va tinde spre 1, atunci când volumul eşantionului va tinde spre infinit (n→ ∞). Consecinţa teoremei lui Cebîşev afirmă că în timp ce variaţia caracteristicii aleatoare la nivel individual rămâne imprevizibilă, valoarea atinsă de media aritmetică se poate determina cu probabilitate mult mai mare pentru o subpopulaţie suficient de numeroasă. În practică, prin selecţii succesive se accentuează caracterul de variabilă aleatoare al mediei de selecţie. Pentru acelaşi volum de selecţie se pot obţine mai multe eşantioane extrase din aceeaşi colectivitate totală, rezultând astfel valori diferite ale mediei de selecţie. În acest proces de formare a mediilor de selecţie fiecare medie poate să apară o singură dată sau de mai multe ori determinând practic o serie specifică de repartiţie de frecvenţe. Se confirmă astfel că şi media de selecţie este tot o variabilă aleatoare

Page 67: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

61

căreia i se poate stabili legea de distribuţie.Pe cale empirică şi matematică se dovedeşte că eşantioanele de volum n extrase din populaţia originară de volum N, ce deţin o medie identică practic cu media populaţiei totale sunt întotdeauna cele mai frecvente sau mai des întâlnite.

Eroarea medie de reprezentativitate sau abaterea medie pătratică a tuturor mediilor de selecţie (

xσ ) se determină pornind de la relaţia existentă între dispersia

populaţiei originare( 20σ ),pătratul erorii medii de reprezentativitate (2

xσ )şi volumul

n al eşantionului, respectiv 20σ = n2

x×σ ,de unde :

nx

20σσ = .

Acceptând ipoteza că dispersia eşantionului poate fi considerată o măsură satisfăcătoare a dispersiei populaţiei totale, pentru un eşantion suficient de mare, se estimează eroarea medie de reprezentativitate în funcţie de dispersia eşantionului:

1

20

−=

nx

σσ sau nx

20σσ =

(cazul SSAR –sondaj simplu aleator repetat) n ≤ 120 n>120

1

)1(

−−=

n

wwwσ

sau n

www

)1( −=σ(cazul SSANR-sondaj simplu aleator nerepetat)

n<120 n>120

Aceste formule se rectifică, prin multiplicare cu corecţia finită a populaţiei (c.f.p.) egală cu radicalul raportului dintre numărul unităţilor statistice rămase în urnă după

o selecţie simplă aleatoare nerepetată (N-n) şi una repetată (N-1): c.f.p.= ,1−

−N

nN iar

dacă N este suficient de mare, atunci c.f.p. = 11

N n N n n

N N N

− −≈ ≈ −

−.

1

)1(

1

)1(

−−≈

−−=

n

ww

n

ppwσ

n

ww

n

ppw

)1()1( −≈−=σ

n ≤ 120 n>120 (cazul SSAR-sondajul simplu aleator repetat)

(1 ) (1 )1 1

1 1w

p p n w w n

n N n Nσ − −

= − ≈ −− −

(1 ) (1 )

1 1w

p p n w w n

n N n Nσ − −

= − ≈ −

n ≤ 120 n>120 (cazul SSANR -sondajul simplu aleator nerepetat) Eroarea limită de reprezentativitate sau maxim admisibilă este a doua eroare probabilă semnificativă derivată din eroarea medie de reprezentativitate. Se notează

Page 68: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

62

x∆ şi este egală cu produsul erorii medii de reprezentativitate şi argumentul

funcţiei Gauss–Laplace: x

∆ = z × x

σ , unde z este coeficientul funcţiei de

probabilitate cu care se garantează rezultatele sau argumentul funcţiei Gauss-Laplace. Revenind la teoria probabilităţilor teorema limită centrală a lui Leapunov

probabilitatea ca variabila aleatoare sau media de eşantionare ( 0x )să fie cuprinsă

între două limite fixate cu anticipaţie, se aproximează prin relaţia:

P[(x

zx σ− )< 0x <(x

zx σ+ )]= =∫+

−z

z

u

due 2

2

2

1

π

2

21

2

z z

ze d z

α

απ

−∫ =Øzα,

unde Øzα defineşte funcţia de probabilitate cu care se garantează rezultatele (un anumit nivel de încredere în rezultate), iar z este coeficientul acesteia (z fiind argumentul funcţiei Gauss-Laplace descrise mai sus). Distribuţia mediilor a m eşantioane de volum n, extrase dintr-o populaţie de volum N tinde spre distribuţia normală când n tinde spre infinit. Eroarea limită de reprezentativitate se determină ca o abatere între media unui eşantion şi media populaţiei originare, garantată cu suma probabilităţilor corespunzătoare limitelor intervalului sǎu de variaţie, luând valori în ambele sensuri. Teoria sondajului, pornind de la legea numerelor mari, demonstrează că în cazul unui eşantion aleator suficient de mare (pentru fenomenele monotipice cu n >40 de unităţi statistice) media de selecţie se distribuie după funcţia sau repartiţia normală Gauss-Laplace.Dacă mediile de sondaj se repartizează după distribuţia normală şi erorile de reprezentativitate se măsoară în

abateri normale normate, conform relaţiei zi=x

oesi xx

σ− , pe baza repartiţiei normale

cu ox =0 şix

σ =1, pentru un nivel de probabilitate (1-α) şi prag de semnificaţie (α)

se pot preciza limitele intervalului de încredere (estimarea parametrului): Nivel de siguranţă, prag de semnificaţie şi interval de încredere în distribuţia

normală Tabel nr. 4.2

Nivel de probabilitate (1-α sau Øz ) în %

Prag de semnificaţie (α) în %

Interval de încredere

68,26 31,74 x

0x

x σ<<σ−

95,00 5,00 x0x

96,1x96,1 σ<<σ−

95,44 4,56 x0x

00,2x00,2 σ<<σ−

99,00 1,00 x0x

58,2x58,2 σ<<σ−

99,73 0,27 x0x

00,3x00,3 σ<<σ−

99,90 0,10 x

0x

29,3x29,3 σ<<σ−

99,9938 0,0062 – 4,00x

σ <0x < 4,00

Page 69: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

63

În practică, z este tabelat, iar valorile sale şi ale lui Øz cele mai des folosite sunt cele generate de acceptarea ca prag minim economic al lui Øz = 0,95. Cu cât creşte Øz sau nivelul de probabilitate, cu atât creşte z argumentul funcţiei Gauss-Laplace, iar invers cu cât valoarea lui z creşte cu atât Øz se apropie de 1. Valori ale lui z (argumentul funcţiei Gauss-Laplace) pentru un nivel Øz uzual Tabel nr.4.3

Øz z Øz z Øz z 0,6827 0,7499 0,9011 0,9297 0,9426

1 1,15 1,65 1,81 1,90

0,9500 0,9545 0,9608 0,9707 0,9797

1,96 2,00 2,06 2,18 2,32

0,9901 0,9949 0,9995

0,999938 0,999999

2,58 2,80 3,29 4,00 5,00

Eroarea limită sau maxim admisibilă de reprezentativitate luând valori în ambele sensuri, pe cale de consecinţă şi parametrul (media populaţiei originare) va fi egal cu media sondajului plus sau minus eroarea limită garantată cu un anumit nivel de probabilitate Øz. Procesul de estimare a parametrului generează un interval centrat pe valoarea estimatorului şi delimitat cu plus şi minus de valoarea erorii limită de reprezentativitate sau maxim admisibile (indiferent de tipul variabilei).

0 xx x= ± ∆ ⇔ ( ) ( )0 ;x xx xx ∈ − ∆ + ∆ ⇔ (

xx ∆− )≤ 0x ≤ (

xx ∆+ )

p = w ± ∆w ⇔ p∈ [(w - ∆w);( w + ∆w) ] ⇔ (w - ∆w) ≤ p ≤ ( w + ∆w) În practica statistică, problema se mai poate pune şi altfel, respectiv cu ce nivel de probabilitate Øz trebuie garantate rezultatele sondajului pentru a obţine un anumit interval de încredere al mediei de selecţie pornind de la valoarea erorii medii de reprezentativitate? Din calculul erorii limită se determină coeficientul z sau argumentul funcţiei Gauss-Laplace:

x∆ = z

xσ ⇒ z =

x∆ /

xσ , iar repartiţia normală

fiind tabelată, se caută şi se identifică nivelul de probabilitate Øz corespunzător valorii lui z (z ⇒ Øz). În condiţiile unei caracteristici alternative, notaţiile celor două erori probabile se modifică prin utilizarea simbolului mediei şi dispersiei unei variabile alternative [∆w= z×σw şi ∆w = z×σw, cu media w şi dispersia w(1-w)].

În final, se poate afirma că eroarea medie şi cea limită pot fi calculate anticipat dacă se cunosc media şi dispersia variabilei în populaţia totală sau un estimator al acestora şi dacă s-au stabilit volumul eşantionului şi probabilităţile cu care se vor garanta rezultatele. Pentru acelaşi volum al eşantionului se vor obţine o singură eroare medie şi mai multe erori limită, în raport cu nivelul de probabilitate acceptat sau volumul eşantionului. Valoarea erorii limită depinde de volumul eşantionului şi de probabilitatea cu care se estimează abaterea dintre media eşantionului şi media populaţiei originare. În cadrul sondajului simplu aleator repetat (SSAR), pornind de la relaţia de calcul a erorii limită sau maxim admisibile se determină mai întâi volumul eşantionului (n):

Page 70: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

64

zx

=∆ ×n

zn

z22

0x

σ×≈σ

×=σ ⇒ (x

∆ )2 = z2×n

zn

22

20 σ×≈

σ ⇒ n=

2

22

2

20

2

)()(xx

zz

∆≈

∆σσ

Acelaşi raţionament conduce la aflarea volumului eşantionului în sondajul simplu

aleator nerepetat (SSANR): n = ≈+∆

N

z

z

x

20

22

20

2

)(σ

σ

N

z

z

x

222

22

)(σ

σ

+∆. Utilizarea variabilei

alternative modifică în formulele de calcul pex

∆ şi 2σ în ∆w respectiv w(1-w).

Debutul oricărui sondaj (aleator sau nealeator) este constituit de determinarea practică a volumului eşantionului ce urmează a fi prelevat pentru a se putea elabora rapid schiţă sumară de buget a sondajului, apoi se trece riguros la respectarea programului cercetării selective.

4.4 Sondajul simplu aleator repetat şi nerepetat şi alte tipuri de sondaje Sondajul simplu aleator, în variantele sale clasice repetat şi nerepetat (SSAR

sau SSANR) este utilizat în cazul populaţiilor originare care sunt: a) omogene (conform valorii coeficientului de omogenitate); b) restrânse sau puţin numeroase (după tehnica loteriei) şi eventual de volum mare şi foarte mare (după tehnica pasului mecanic de numărare şi a tabelului cu numere întâmplătoare); c)alcătuite din unităţi statistice simple; d) bine amestecate sau deţinând posibilităţi practice de amestecare a unităţilor statistice ce le compun. Fie că este vorba de solicitantul, realizatorul sau de cel ce interpretează rezultatele sondajului, etapele practice sunt ordonate prin program şi pornesc cu determinarea volumului eşantionului (n). Se emite ipoteza unui sondaj aleator simplu repetat (simple random sampling with replacement) ce deţine o eroare medie de reprezentativitate, descrisă prin relaţia:

nnx

220 σσσ ≈= şi o eroare limită

x∆ = z×

nz

nz

x

220 σσσ ≈= . Se deduce

apoi volumul necesar al eşantionului, în funcţie de valoarea 220 σσ sau disponibilă:

(x

∆ )2 = z2

nz

n

22

20 σσ

≈ ⇒ n=2

22

2

20

2

)()(xx

zz

∆≈

∆σσ

. Dispersia poate fi valorificată atât

pentru variabila cantitativă ( 2σ ) cât şi pentru variabila calitativă, respectiv w(1-w).

După determinarea practică a volumului eşantionului ce urmează a fi prelevat, pentru a se putea evalua costul sondajului, se precizează eroarea limită (maxim admisibilă) de reprezentativitate (

x∆ ), nivelul de probabilitate cu care se

intenţioneazǎ a fi obţinuţi indicatorii de sondaj (Øz), nivel căruia îi corespunde o anumită valoare tabelată a argumentului z. În locul dispersiei populaţiei originare, se poate valorifica o dispersie orientativă dintr-o cercetare exhaustivă sau selectivă anterioară a populaţiei cercetate. Dacă nu se deţine o astfel de informaţie se extrage un eşantion din populaţia originară pentru a se identifica un nivel aproximativ al

Page 71: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

65

dispersiei eşantionului. În cea mai dificilă dintre situaţiile practice se apelează la valorile maximă şi minimă ale populaţiei originare, obţinând o dispersie maximală:

( ) ( ) ( )22 2

max min2 1 12

n nd x xi i x xi i

n nσ

−∑ ∑ −= == = =

(pentru o variabilă alternativă sau binară ea va fi egală cu 0,25 ). În aceste condiţii se determină volumul eşantionului (n) şi nu se omite să se majoreze valoarea lui n, cunoscând nivelul relativ al nonrăspunsurilor din cercetări anterioare similare [R2(%)=(n2/n)×100, unde n2 = nonrăspunsuri totale]:

n ≈ )100/1()(

)100/1()( 22

22

22

20

2

Rz

Rz

xx

+∆

≈+∆

σσ sau n ≈ ).100/R1()(

)w1(wz22

w

2

+∆

În aceeaşi manieră succintă, se procedează şi în cazul unui sondaj simplu aleator nerepetat (simple random sampling without replacement), caracterizat de o eroare

medie de reprezentativitate, descrisă prin relaţia: 20

xσ N - n

=n N - 1

σ

2 2σ N - n σ n1 -

n N n N ≅ ≅

şi de o eroare limită: x∆ = z

2 2 2σ N n σ N - n σ n0z z z 1 -x n N 1 n N n N

− σ × ≅ × ≅ × − = .

Apelând la corecţia finită de populaţie se calculează volumul eşantionului,

soluţionând ecuaţia anterioară n = 2 2

2 2

2

x

z σ

(∆ ) + z σ / N. Pentru acele sondajele unde

variabila este calitativă alternativă, generată de întrebările de tipul (da sau nu), volumul eşantionului se va determina pe baza dispersiei variabilei binare w(1-w), respectiv: n = 2

2 2w

z w(1 w)

( ) z w(1 w) / N

−∆ + −

. Debutul sondajului aleator repetat este şi el

constituit tot de determinarea practică a volumului eşantionului ce urmează a fi prelevat, după precizarea erorii limită (maxim admisibilă) de reprezentativitate (

x∆ ), a nivelului de probabilitate cu care se intenţioneazǎ a se obţine indicatorii de

sondaj (Øz şi valoarea tabelată a lui z).Se determină volumul eşantionului (n) şi nu se omite să se majoreze valoarea lui n, cunoscând nivelul relativ al nonrăspunsurilor din cercetări de piaţă similare anterioare [R2(%)=(n2/n)×100], n ≈

2 2

2x

2 2z σ

z σ

(∆ ) + / N(1 R /100)2+× sau: n≈ 2

2 2w

z w(1 w)

( ) z w(1 w) / N

−∆ + −

(1 R / 100)2+× .

Principalele avantaje ale sondajului aleator sunt constituite de calitatea sa de soluţie ideală în cazul populaţiilor relativ omogene (pieţe dominate de veniturile unei clase medii majoritare, pieţe de produse şi servicii relativ omogene atât ca preţ

Page 72: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

66

cât şi din punct de vedere calitativ, populaţii şcolare omogene ca performanţă etc). Dacă se consideră a fi justificată practic alocarea unor probabilităţi diferite de extracţie pentru unele unităţi considerate ca nefiind echiprobabile (oraşe, magazine, şcoli etc) se apelează la varianta sondajului proporţional cu volumul unităţilor . O exemplificare se poate realiza prin construirea unui eşantion de volum mic (n=6), prin intermediul unui sondaj proporţional cu populaţia unor oraşe existente într-o anumită regiune geografică.Populaţia urbană a regiunii este de 3500000 de persoane ce locuiesc în 30 de oraşe grupate astfel: 1 oraş de o jumătate de milion de locuitori, 7 de două sute de mii, 10 de o sută de mii şi 12 de cincizeci de mii de locuitori, se pot determina probabilităţi diferite de incluziune în sondaj, pentru fiecare tip de oraş în parte după relaţia: pi = n ×yi: (Σyi), unde i =1,...,30 şi (Σyi) =3500000, obţinându-se patru valori ale acestora, a căror Σ p × k= 6:

a)p1 = 6 × 500000:3500000 = 0,857; b) p2 = 6×200000:3500000 = 0,343; c)p3 = 6 × 100000:3500000 = 0,171; d) p4 = 6 ×50000:3500000 = 0,086.

Evident şansele oraşului de 500 de mii de locuitori de a fi inclus în eşantion sunt cu mult mai mari comparativ cu oricare alt tip de oraş.

Principalele dezavantaje ale sondajului aleator sunt legate de limitările de volum ale urnei în utilizare acestei tehnici ca procedeu clasic de eşantionare aleatoare şi de asigurarea concretă de bile, jetoane etc. perfect identice. Soluţia este conferită de loturile înseriate şi de tehnica pasului mecanic de numărare sau a tabelelor cu numere întâmplătoare, generate de calculator. Sondajul aleator nu permite evaluări riguroase ale volumului eşantionului populaţiilor eterogene (polarizate, stratificate), unde se recomandă sondajul mixt stratificat sau alcătuite din unităţi complexe (gospodării, menaje) unde se valorifică sondajul mixt de serii.

Sondajul stratificat (stratified sampling) sau tipic impune soluţionarea a trei probleme majore ale stratificării: determinarea straturilor şi a criteriilor de alcătuire ale acestora (identificarea corectă a variabilei generatoare de straturi), optimizarea numărului de straturi (cu cât creşte precizia la nivel de strat cu atât cresc şi cheltuielile totale ale sondajului) şi repartizarea eşantionului pe straturi (fie neproporţional, proporţional sau optim, fie cu stratificare anterioară sau ulterioară). În practica eşantionării stratificate se identifică mai întâi şi apoi se delimitează straturile calitative din populaţia originară, apoi se realizează sondaje aleatoare la nivel de strat, simultan cu transferul structurii populaţiei originare în eşantion, printr-o selecţie dirijată. Împărţirea populaţiei pe straturi permite descompunerea în

funcţie de factorul de stratificare a dispersiei generale ( 20σ ), în dispersia mediilor

de strat ( 2δ ) şi media dispersiilor de strat de acelaşi factor ( 2σ ). Eroarea medie de reprezentativitate se va calcula după o formulă asemănătoare sondajului aleator

repetat sau nerepetat în care dispersia eşantionului disponibil ( 2σ ) este înlocuită cu

dispersia reziduală ( 2σ ) pentru o variabilă nealternativă şi alternativă [ )w1(w − ]. Variabilă cantitativă (SSAR) Variabilă cantitativă (SSANR)

Page 73: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

67

2

1x n

σσ =− sau

2

x n

σσ =

=

2

11

n

n N

σ−

− sau x

σ=

2

1n

n N

σ−

n ≤ 120 n >120 n ≤120 n > 120 Variabilă calitativă alternativă (SSAR)

wσ =

(1 )

1

w w

n

− sau

(1 )w

w w

nσ −

=

Variabilă calitativă alternativă (SSANR)

(1 )1

1w

w w n

n Nσ =

−−

− sau

(1 )1w

w w n

n Nσ −

= −

n ≤ 120 n >120 n ≤120 n > 120 Similar se determină eroarea limită de reprezentativitate şi volumul eşantionului

Variabilă cantitativă : x

∆ = z ×x

σ Variabilă calitativă alternativă: w∆ = z × wσ

n = 2

x

22

)(

z

∆σ

sau n =

N

z)(

z22

2

x

22

σ+∆

σ n=

2w

2

)(

)w1(wz

∆− sau n =

N

)w1(wz)(

)w1(wz2

2w

2

−+∆

Sondajul stratificat este valorificat în practică prin trei variante practice legate direct de procedura de alocare a unităţilor statistice ale eşantionului pe straturi: I. Stratificarea simplă

ni = n : r II.Stratificarea proporţională

ni = (Ni: N) × n unde n reprezintă volumul eşantionului, ni al stratului în eşantion, N al populaţiei şi Nj al stratului în populaţia totală.

III. Stratificarea optimă

nj = n

jN

Nr

1

2jj

2jj ×

∑ σ×

σ×

=

Principala caracteristică a sondajului de serii este capacitatea de a asigura o mai bună în populaţiile originare, împărţite în serii sau unităţi complexe, alcătuite la din unităţi simple eterogene (cazul gospodăriilor în cadrul populaţiilor umane) sau relativ omogene (exemplul loturilor de produse în vânzările generale). Sondajul de serii utilizează în calculul erorilor de reprezentativitate în locul dispersiei populaţiei

totale ( 20σ ), dispersia mediilor acestor serii (2δ ) sau dispersia explicată de

factorul de grupare. În cazul selecţiei de serii aleatoare nerepetate corecţia finită a populaţiei operează cu raportul de bază, R sau numărul seriilor fiind redus fără a se

renunţa practic la -1 de la numitorul fracţiei (c.f.p.= 1−

−R

rR ).

Cele două erori probabile, atât cea medie cât şi cea limită, deţin în varianta repetată şi nerepetată următoarele proceduri teoretice de calcul:

Variabilă cantitativă (SSAR)

pentru r ≤ 120 :1

2

−=

rx

x

δσ sau pentru r >120: rx

x

2δσ =

Variabilă cantitativă (SSANR)

pentru r ≤ 120 :2

1 1x

x

R r

r R

δσ −− − =

sau pentru r >120: 2

1x

x

R r

r R

δσ −−

=

Variabilă calitativă alternativă (SSAR)

Page 74: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

68

pentru r ≤ 120 :1

2

−=

rw

w

δσ sau pentru r >120:rw

w

2δσ =

Variabilă calitativă alternativă (SSANR)

pentru r ≤ 120 :2

1 1w

w

R r

r R

δσ −− − =

sau pentru r >120: 2

1w

w

R r

r R

δσ −−

=

Variabilă cantitativă : x

∆ = z ×x

σ Variabilă calitativă alternativă: w∆ = z × wσ

Avantajele utilizării sondajului de serii sunt dictate de natura înseriabilă a populaţiei originare şi de indisponibilitatea sau chiar lipsa bazei de sondaj. În practica statistică se constituie serii de mărimi relativ reduse şi pe cât posibil omogene. Dezavantajul său constă în utilizarea specifică şi nu generalizată şi în determinările laborioase prealabile axate pe dispersia explicată de factorul ipotetic de grupare sau înseriere, alături de estimarea specială a nonrăspunsurilor.

4.5 Test de autoevaluare şi aplicaţii A) Test de autoevaluare

A1) Întrebări clasice recapitulative

(Completaţi spaţiile goale) 1. Care sunt etapele sondajului modern?

2.Care sunt elementele noi în programul de observare al unui sondaj?

3. Care sunt relaţiile de calcul ale erorilor efective de reprezentativitate?

4.Cum se determină eroarea medie de reprezentativitate şi eroarea limită?

5.Care sunt indicatorii sondajului simplu aleator repetat şi nerepetat?

A2) Întrebări tip gril ă

(Încercuiţi litera răspunsului corect) 6. În raport cu volumul eşantionului, eroarea probabilă medie de reprezentativitate este: a) direct proporţională;b)invers proporţională; c) independentă. 7.Sondajul în care s-a exclus intervenţia subiectivă în eşantionare este: a) stratificat; b) aleator; c) dirijat; d) de serii. 8. Sondajul stratificat valorifică în calcul: a) dispersia generală; b) dispersia mediilor de strat; c) media dispersiilor de strat. 9.Corecţia finitǎ de populaţie este specifică variantei de prelevare nerepetată a unităţilor în eşantion,fiind egală cu:

a) N

n

; b) 11

N n n

N N

−≈ −

−; c) 1

1N −;

d) 1 1:

n N

.

B) Aplicaţii rezolvate 1. Din populaţia totală de studenţi a facultăţii (N=1490), care a fost supusă unui test la o disciplină definitorie pentru examenul de licenţă, s-a extras un eşantion

(SSAR şi SSANR), cu n = 50, ce a fost analizat atât prin intermediul notei (x=7,06

Page 75: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

69

puncte), cât şi prin prisma variabilei calitative alternative promovat-nepromovat (nu au promovat cinci studenţi, media fiind w=0,1). A.Să se asigure o estimare a notei ca parametru al caracteristicii cantitative şi stării promovat-nepromovat sau a caracteristicii calitative alternative cu un nivel de probabilitate Øz1 de 0,95 căruia îi corespunde un z1=1,96. B. Să se determine cât de mare ar trebui să fie un nou eşantion (SSAR şi SSANR) care să răspundă condiţiei de asigurare a unei estimări a parametrului cu un nivel de probabilitate Øz2 =0,9995 căruia să îi corespundă un z2=3,29 şi în limitele unui interval caracterizat de

x∆ =0,5 puncte sau de w∆ =0,1.

Rezolvare:A.Volumul noului eşantion se calculează în condiţiile unui sondaj simplu aleator repetat şi nerepetat, iar noţiunile pereche sunt expuse în tabel: Tabel nr. 4.4 Noţiunea statistică sau indicatorul statistic

Parametri Estimatori

Volumul total ∗∗ Nivelul mediu (media)

N=1490 studenţi

0X ∈ [ ? ] p∈ [ ? ]

n=50 studenţi x =7,06 puncte w=0,1

Dispersia sau împrăştierea valorilor în jurul mediei

20σ ≈ 2σ

(se admite prin ipoteză)

2σ =3,0864 2σ =w (1-w) = 0,09

Atât în cazul sondajului simplu aleator repetat (SSAR), cât şi al celui nerepetat (SSANR) se parcurg aceleaşi etape pentru estimarea parametrilor:

a) calculul şi interpretarea valorii erorii medii de reprezentativitate sau a abaterii medii pătratice a mediilor de selecţie sau sondaj (

xσ sau σw).

SSAR-variabilă Cantitativă (nota) Calitativă (alternativă:promovat – nepromovat)

1n

2

x −σ=σ =0,251 puncte

1n

)w1(ww −

−=σ =0,043 (4,3%)

SSANR-variabilă Cantitativă (nota) Calitativă (alternativă:promovat – nepromovat)

=

−−

σN

n1

1n

2=0,247 puncte

−−−=σ

N

n1

1n

)w1(ww

=0,042 (4,2%)

Interpretare: cu un nivel de probabilitate Øz =0,95 (z=1,96) distanţa maximă

(admisă) între x şi 0x , respectiv w şi p este x

∆ =0,49 puncte (SSAR) şi x

∆ =0,48

puncte (SSANR), respectiv ∆w = 8,4% (SSAR) şi ∆w = 8,3 % (SSANR) ceea ce

înseamnă că ]x[xx0 ∆±∈ , respectiv ]w[p w∆±∈ .

b) calculul şi interpretarea valorii erorii limită de reprezentativitate sau maxim admisibile (

x∆ sau ∆w).

SSAR-variabilă Cantitativă (nota) Calitativă (alternativă:promovat – nepromovat)

Page 76: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

70

x∆ = z ×

xσ =0,49 puncte 0x ∈ [6,57;7,55] ∆w = z × σw=0,084 (8,4%) p∈ [0,016;0,184]

SSANR-variabilă Cantitativă (nota) Calitativă (alternativă:promovat – nepromovat)

x∆ = z ×

xσ =0,48 puncte 0x ∈ [6,58;7,54] ∆w = z ×σw=0,083 (8,3%) p∈ [0,017;0,183]

Interpretare: cu un nivel de probabilitate Øz =0,95 (z =1,96), distanţa maximă

(admisă) între x şi 0x , respectiv w şi p estex

∆ = 0,49 puncte (S.S.A.R.) şi

x∆ =0,48 puncte (S.S.A.NR.), respectiv ∆w = 8,4 % (S.S.A.R.) şi ∆w = 8,3 %

(S.S.A.NR.) ceea ce înseamnă că ][0 xxx ∆±∈ , respectiv ][ wwp ∆±∈

Notă: Dacă cerinţa de calcul conform SSAR şi SSANR este aplicată aceleiaşi populaţii originare şi erorile se calculează după aceleaşi rezultate atunci se recomandă rectificarea valorilor erorilor probabile din SSAR cu corecţia finită a populaţiei pentru a se obţine rapid valorile erorilor în varianta SSANR. Valoarea corecţiei finite a populaţiei este de:

c.f.p.=50

1 1 0,9831490

n

N− = − =

I.Eroarea medie de reprezentativitate specifică SSAR pentru variabila nealternativă se corectează cu multiplicatorul 0,983 pentru a se obţine acelaşi indicator statistic în SSANR:

xσ =

2 2

0, 251 0, 9831 11 1

n n

n N n N

σ σ×

− = × − = − − = 0,247 puncte

Analog se procedează şi în cazul variabilei calitative alternative

( 1) (1 )1 1 0, 043 0, 0983

1 1w

w w n w w n

n N n Nσ − −

− = × − = ×− −

=

=0,042 (4,2%)

II.În cazul erorii limită (admise) de reprezentativitate se rectifică şi aici valorile

valorile specifice variabilei nealternative şi alternative în mod similar:

x∆ =z×

xσ =

2 21 1 0, 084 0,983 0, 083

1 1

nnz z

n N n N

σ σ×− = − = × =

− −

(8,3%)

Analog şi pentru o variabilă alternativă, dacă în condiţiile SSAR procentul mediu de nepromovaţi în populaţia originară, cu un nivel de probabilitate Øz =0,95 (z=1,96) este estimat în intervalul [1,6%;18,4%], în condiţiile SSANR, deci cu o eroare medie evident mai mică, intervalul de încredere se diminuează la [1,7%;18,3%] şi astfel creşte precizia sondajului. Utilizarea corecţiei finite a populaţiei impune câteva precizări şi delimitări: a) dacă N este o valoare foarte mare şi n foarte mică atunci (N-n) / (N-1) tinde spre 1;

b) dacă n / N < 5 %, atunci corecţia

−N

n1 se poate neglija;

Page 77: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

71

a. dacă N este destul de mic, atunci în locul lui

−N

n1 se aplică

1−−

N

nN ;

b. dacă n <30 de unităţi statistice (eşantion de volum redus) atunci nu se aplică c.f.p. B.Stabilirea volumului eşantionului este diferită în condiţiile unei selecţii simple aleatoare repetate în comparaţie cu sondajul nerepetată. Volumul n se deduce din formula specifică detaliată a erorii limită ridicată în prealabil la pătrat:

SSAR-variabilă SSANR-variabilă Cantitativă Alternativă Cantitativă Alternativă

2 2

2( )x

z σ∆

= 134 studenţi

2

2

(1 )

( )

z w w

w

−∆

= 98 studenţi

2 2

2 22

( )

z

zx N

σ

σ∆ +

= 123 studenţi

2

22

(1 )

(1 )( )

z w w

z w ww N

−−

∆ +

= 74 studenţi 2. O cercetare prin sondaj asupra unei pieţe a identificat 14900 firme a căror clasă de activitate comercială include produsele mărcii „X”. Pentru cele 14900 firme valorificând informaţiile rezultate din datele unui sondaj realizat pe un eşantion de 50 de firme extrase aleator să se calculeze volumul unui nou eşantion în condiţiile unui nivel de probabilitate Øz =0,95 (z =2) al unui nivel relativ al nonrăspunsurilor estimat R2=15% şi al unui nivel al erorii limită

x∆ =0,2

milioane lei, în cazul concret al unui SSAR : Tabel nr. 4.5

Tipuri de firme după dimensiunea rezultată din diversitatea gamei produselor vândute

Vânzările zilnice ale produselor de

interes (xi) milioane lei RON

Micro sau strict specializate

Mici sau relativ specializate

Medii sau nespecializate

TOTAL

2,5 – 4,5 1 4 - 5 4,5 – 6,5 1 8 2 11 6,5 – 8,5 13 4 7 24

8,5 – 10,5 9 - 1 10 TOTAL 24 16 10 50

Stratificarea pieţei cercetate este evidenţiată în continuare, de datele specifice: Tabel nr. 4.6

Numărul total de firme în: Strat sau tip de firme Populaţia totală I eşantion

Vânzarea medie în eşantion

Dispersia în eşantion

Firme micro N1=7150 n1=24 1x =8,0

21σ =2,083

Firme mici N2=4750 n2=16 2x =5,5

22σ =2,0

Firme medii N3=3000 n3=10 3x =7,3

23σ =1,16

TOTAL N=14 900 n = 50 0x =7,06

20σ =3,0864

Notă:Relaţia existentă între cele trei categorii de dispersii se validează pe baza datelor din tabel: Dispersia populaţiei totale

= ( 20σ =3,0864)

Dispersia mediilor de strat +

( 2δ =1,2144)

Media dispersiilor de strat

( 2σ =1,872)

Page 78: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

72

Rezolvare: Dispersia mediilor de strat (2δ ) sau dispersia explicată de factorul de stratificare dimensiunea firmei rezultată din diversitatea gamei produselor vândute reprezintă împrăştierea vânzărilor medii zilnice ale fiecărui strat faţă de media aceloraşi vânzări calculată în populaţia celor 50 de firme. Cu cât straturile sunt mai omogene, cu atât ele prezintă medii mai apropiate iar variaţia mediilor de sondaj va depinde majoritar de variaţia fiecărui strat din populaţia totală materializată în media dispersiilor de strat.Această dispersie, denumită neexplicată va înlocui dispersia populaţiei totale în calculul volumului eşantionului. Calculul se face cu includerea ratei nonrăspunsurilor, dar în funcţie de tipul sondajului şi variabilei:

SSAR SSANR

n = 2

22

)(x

z

∆σ (1 R /100)2+× sau n =

2 2

2 2 2

x

z

( ) z / N

σ∆ + σ

(1 R /100)2+×

Noul eşantion al SSAR va fi prelevat în trei variante într-un volum egal cu:

n =2

22

)(x

z

∆σ

x 2(1 R /100)+ = 216 firme (media dispersiilor de strat 2σ fiind 1,872)

A.Stratificarea simplă (r = 3) este indicată în condiţii de valori aproximativ egale

ale numărului de firme în straturile populaţiei originare: ni=n 216

72r 3

= = firme /

strat sau straturi perfect egale n1 = n2 = n3 = 72 firme. B.Stratificarea proporţională alocă fiecărui strat din eşantion un număr de unităţi statistice conform sau ponderii fiecărui strat în cadrul populaţiei originare.În ipoteza populaţiei totale ca sumă a

straturilor N=∑=

r

jjN

1

şi n =∑=

r

iin

1

, se utilizează: Nn ji =r rn Ni ji=1 j=1

∑ ∑

sau ni= N j

× nN

şi

rezultă subeşantioanele:n1=104, n2=69 şi n3=43. C.Stratificarea optimă are la bază ipoteza conform căreia intensitatea variaţiei în interiorul fiecărui strat este diferită de aceea a celorlalte straturi şi relaţia de calcul

se modifică şi devine: 2

j j

r r2

i j ji=1 j=1

ni N σ=

n N σ∑ ∑

, de unde ni = 2

j j

r2

j jj=1

nN σ

×N σ∑

, iar pentru

21σ =2,083, 2

2σ =2,0 şi 23σ =1,16 rezultă următoarele valori ale subeşantioanelor:

n1=7150×2,083

×216 =7150×2,083+4750×2,0+3000×1,16

115 firme,

n2=4750×2,0

×216 =7150×2,083+4750×2,0+3000×1,16

74 firme,

n3=3000×1,16

×216 =7150×2,083+4750×2,0+3000×1,16

27 firme.

Page 79: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

73

C) Aplicaţii propuse spre rezolvare 1.Din totalul de 1000 de hectare cultivate cu cereale, pe teritoriul agricol al S.C AGROEXP S.A, s-a extras un eşantion prin tehnica loteriei, varianta bilei revenite, de 100 de suprafeţe (areale). Eşantionul extras şi grupat este prezentat mai jos: Tabel nr. 4.7

Observaţie:limita superioară este inclusă in interval. a)Calculaţi media şi dispersia eşantionului. b)Calculaţi eroarea medie de reprezentativitate. c)Determinaţi eroarea limită sau maxim admisibilă în condiţii de Øz=0,99 (z=2,58). Interpretaţi şi comentaţi. d) Patronul societăţii doreşte o estimare a mediei producţiei (pentru cele 1000 de hectare) cu o probabilitate de 0,95 (economică), respectiv un Øz=0,95 sau z=1,96. e)Determinaţi cât de mare ar trebui să fie un nou eşantion în condiţii de limite de interval w∆ =0,5 kg şi cu o

probabilitate de 0,97 (Øz=0,97 sau z =2,18). 2.Cu scopul recepţionării (admiterii sau respingerii) unui lot de piese de schimb s-a extras un eşantion de 600 de piese. Numărul unităţilor statistice care posedă caracteristica de rebut este de 24. Volumul întregului lot este de 20 000 de unităţi iar eşantionul este de tip SSAR. a)Calculaţi media şi dispersia caracteristicii alternative. b)Determinaţi eroarea medie de reprezentativitate a caracteristicii alternative şi comentaţi rezultatul. c)Interpretaţi valoarea erorii limită obţinute în condiţii de Øz =0,95 (z =1,96). Interpretaţi rezultatul, în condiţii de w∆ =0,002,

Øz = 0,99 sau z =2,58. e) Considerând eşantionul anterior de tip SSANR să se rezolve toate cerinţele aplicaţiei. 3.Care este valoarea erorii medii de reprezentativitate a unui eşantion simplu, aleator repetat de volum n = 121, dacă dispersia este egală cu 36 ? 4 Pentru a putea lua o decizie investiţională corectă pe o piaţă în care preferinţa consumatorilor pentru un viitor robot casnic multifuncţional, este necesară mai întâi determinarea volumului unui eşantion simplu aleator repetat şi nerepetat ce se va extrage dintr-o populaţie regională de 3,15 milioane de locuitori. Adresându-se unui institut specializat în cercetări de piaţă, managerului firmei i s-au mai cerut date suplimentare privind nivelul de eroare maxim admisă (de 3% sau

w∆ =0,03) şi nivelul de probabilitate cu care să se garanteze rezultatele cercetării

prin sondaj (Øz=0,9995 şi valoarea tabelată a lui z = 3,29). Acceptând un nivel maxim al dispersiei de 0,25 şi un procent probabil de nonrăspunsuri din cercetări de piaţă similare anterioare R2= 20%, s-a determinat un volum foarte ridicat al viitorului eşantion aleator. În aceste condiţii decidentul a acceptat o eroare maxim admisă majorată la 5% sau w∆ =0,05 şi un nivel mai redus de probabilitate în

Grupe de suprafeţe după cantitatea recoltată (mii kg/ha) Numǎr de suprafeţe (ni) 2,5 - 3,5 3,5 - 4,5 4,5 - 5,5 5,5 - 6,5

24 36 25 15

Total 100

Page 80: Statistic A

Sondaje statistice aplicate în economie Capitolul 4

74

garantarea rezultatelor cercetării (Øz =0,95 şi z =1,96). Comparaţi valorile volumului eşantionului aleator în cele patru cazuri şi motivaţi opţiunea pentru una dintre situaţii.

4.6 Rezumat Sondajul este rezultatul practic al soluţionării eficiente a următoarelor aspecte: a) lipsa resurselor materiale şi timpului afectate unei cercetări statistice totale; b) iraţionalitatea controlului distructiv total; c) inaccesibilitatea tuturor unităţilor ce compun o populaţie statistică; d) caracterul aparent infinit al unor populaţii cercetate. Etapele sondajului sunt eşantionarea (prelevarea de eşantioane), observarea unităţilor statistice selectate şi sistematizarea datelor înregistrate, calculul estimatorilor (indicatorilor eşantionului) şi inferenţa statistică (estimarea cu precizie determinată a parametrilor), analiza şi interpretarea lor finală. Eşantionarea este o alăturare de unităţi statistice ce alcătuiesc partea sau părţile, extrase din întreaga populaţie. Eşantionul aleator (probabilistic) şi cel nealeator sunt sinonime cu populaţia parţială sau selectată, mostra, proba. Avantajele sondajului sunt: a) se impune ori de câte ori cercetarea totală nu este posibilă sau nu este recomandabilă (geologie, astronomie, control distructiv etc.); b) este mult mai eficient (operativ şi economic); c) oferă un plus de cunoaştere, volumul eşantionului fiind redus permite un program de observare amănunţit; d) este cel mai indicat, în cazul cercetărilor de tip preliminar (pilot, test), şi ulterior (control validare). În paralel sunt şi limitări sau dificultăţi: a)apariţia unei noi erori, denumită de reprezentativitate; b) realizarea unui nivel mediu mai ridicat al cheltuielilor pe unitatea de informaţie (prin asigurarea tehnicilor de prelevare, de actualizarea bazei de sondaj şi de culegere a datelor); c) dificultatea sau chiar imposibilitatea de a surprinde, în perioade foarte scurte de timp, schimbările petrecute în evoluţia fenomenului economic. Programul sondajului este un lanţ de lucrări complexe, de la descrierea populaţiei originare şi eşantionului, la precizarea erorilor de sondaj, de la tehnica de eşantionare, la volumul eşantionului, deţinând o etapizare foarte detaliată. Asigurarea practică a reprezentativităţii eşantionului impune cunoaşterea procedeelor sau tehnicilor aleatoare, de la tehnica loteriei (variantele bilă revenită şi nerevenită), la tabelul cu numere întâmplătoare şi la pasul mecanic de numărare, dar şi a celor nealeatoare (dirijate) sau mixte. Selecţia dirijată sau eşantionarea pe cote (panelul) substituie elementul obiectiv , probabilistic printr-unul subiectiv, intenţional, prin utilizarea unui bun cunoscător (expert) al populaţiei originare. Sondajul mixt este o combinaţie eşantionare aleatoare cu dirijată, cu scopul de a maximiza avantajele şi a minimiza dezavantajele şi cuprinde: sondajul stratificat (pentru populaţii eterogene de unităţi simple), de serii (pentru populaţii eterogene de unităţi complexe), multistadial sau în trepte, multifazic, secvenţial etc. Erorile specifice cercetării selective pe lângă celelalte tipuri obişnuite ale cercetării statistice, ce pot fi sistematice sau întâmplătoare, cuprind o categorie specifică denumită erori de reprezentativitate (efective şi probabile). Eroarea medie de

reprezentativitate sau abaterea medie pătratică a mediilor de sondaj (x

σ )este direct proporţională

cu dispersia populaţiei totale şi invers proporţională cu volumul eşantionului (n). Eroarea limită sau

maxim admisibilă de reprezentativitate(x

∆ ) reprezintă abaterea dintre media de sondaj

(estimator)şi media populaţiei totale (parametru), garantată cu suma probabilităţilor corespunzătoare limitelor intervalului sau de variaţie, luând valori în ambele sensuri ceea ce face ca parametrul populaţiei originare să fie egal cu estimatorul eşantionului plus sau minus această

abatere:x

xx ∆±=0 sau p = w ± ∆w. Principalele tipuri de sondaje valorificate în practică sunt

sondajul simplu aleator repetat şi nerepetat, sondajul stratificat şi sondajul de serii, ale căror procedee de inferenţiere sunt foarte importante în cercetarea statistică modernă.

Page 81: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

75

Tema 5 METODA INDICILOR ŞI MĂSURAREA INFLA ŢIEI ÎN EONOMIE CUPRINS: pag. 5.1 Concepte, funcţii, utilitate şi clasificări în universul indicilor 75 5.2 Scurtă istorie a metodei indicilor şi evoluţia indicelui interpret 81 5.3 Sisteme concrete de indici şi probleme practice de construcţie 84 5.4 Descompunerea variaţiei unui fenomen complex prin metoda indicilor 86 5.5 Infla ţia şi indicii interpret 89 5.6 Test de autoevaluare şi aplicaţii 91 5.7 Rezumat 97 Obiective: Realitatea contemporană impune prezenţa metodei indicilor, datorită calităţii de numere pure a acestora, specifică încă de la crearea lor, acum trei secole, de către episcopul anglican William Fleetwood. Obiectivul esenţial al temei este legat de însuşirea metodei, utilizată tot mai mult în descompunerea variaţiei fenomenelor complexe şi în cuantificarea influenţei modificărilor structurale ce apar în evoluţia populaţiilor omogene. Obiectivele investigaţiei indiciale includ cunoaşterea şi însuşirea semnificaţiei conceptului de indice, descrierea variatei tipologii a indicilor şi a principalelor sisteme de ponderare, cu scopuri practice de calcul şi construcţie a unor astfel de instrumente. Rolul indicilor de translator al vieţii economice şi sociale a devenit esenţial în statistică, justificând deplin importanţa indicilor interpret.Dobândirea de competenţe privind soluţionarea problemelor apărute în construcţia indicilor şi capacitatea în a descompune variaţia unui fenomen complex, exemplificabilă prin măsurarea inflaţiei cu ajutorul indicilor interpret încheie enumerarea principalelor beneficii practice ale metodei. Timpul alocat temei: minim 4 ore - maxim 6 ore Bibliografie W.Eichhorn, J.Voeller, Teoria indicilor de preţ, abordarea şi generalizarea testelor lui Fisher, Viena, 1976. A.,Francis, Statistică şi matematică pentru managementul afacerilor, Ed. Tehnică, Bucureşti, 2005. M.Korka,L.,Begu,E.Tusa,Bazele statisticii pentru economişti, Ed.Tribuna Economică, 2002 G.Săvoiu, Statistică generală. Argumente în favoarea formării gândirii statistice, Ed. Independenţa Economicǎ, Piteşti, 2003. G.Săvoiu, Statistică aplicată în domeniul economic şi social. Elemente teoretice, teste tip grilă, aplicaţii şi studii de caz, Ed. Independenţa Economicǎ, Piteşti, 2004. G.Săvoiu, Statistica.Un mod ştiinţific de gândire, Ed.Universitară, Bucureşti, 2007. G.Săvoiu, Statistica.Mod de gândire şi metode, Ed.Universitară, Bucureşti, 2009. G.Săvoiu, Gândirea statistică aplicată, Ed.Universitară, Bucureşti, 2010. G.Secară,G.,Săvoiu,C.,Necşulescu,Statistică economică, manual IFR, Ed. Universităţii din Piteşti, 2010. V.Trebici, Mica enciclopedie de statistică,Ed.ştiinţifică şi enciclopedică,Bucureşti, 1985. M.Ţarcă,Tratat de statistică aplicată, Ed. didactică şi pedagogică R.A. Bucureşti, 1998. Webografie ***http://www. insse.ro şi ***http://epp.eurostat.ec.europa.eu/ şi *** http://www. bnr.ro

Page 82: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

76

5.1 Concepte, funcţii, utilitate şi clasificări în universul indicilor Având originea etimologică în grecescul deixis, devenit în latinǎ index,

conceptul de indice are multiple semnificaţii de la arătător, indicator, titlu, listǎ până la inscripţie, sensuri îmbogăţite cu cele de indiciu, indicaţie, semn. Indicii statistici sunt acceptaţi ca metodǎ, sistem, raport (raportare), mărime sau indicator relativ, valoare medie ponderatǎ a unor mărimi relative (variaţie medie relativǎ), număr pur (expresie numericǎ adimensională), reprezentare simplificatǎ prin substituirea datelor, funcţie matematicǎ sau valoare a teoriei axiomatice a indicilor.

Conceptualizarea şi funcţiile indicilor statistici Caseta nr. 5.1 Metoda indicilor este o metodǎ de descompunere şi analizǎ factorială axatǎ pe identificarea şi înregistrarea factorilor, conform structurării interne a fenomenelor, şi pe clasificarea atentă şi sistematizarea riguroasǎ, cu scop de selecţie a celui mai potrivit instrument (indice). Fenomenul complex studiat prin metoda indicilor este descompus atât în factori calitativi şi cantitativi, cât şi în factori sistematici şi accidentali. Sistemul indicilor este forma cea mai uzualǎ de exprimare a existenţei complexe a indicilor. Indicele ca raportare identifică raportul logic între douǎ mărimi reale sau practic posibile, omogene (de acelaşi gen), exprimate în date absolute, comparate în timp sau în spaţiu. Între numărător şi numitor indicelui trebuie să existe o relaţie logică, naturală: a) cronologică sau temporală (perioada curentǎ, actuală sau care se raportează şi perioada trecutǎ, de bază sau la care se raportează); b) teritorialǎ, cu scop de delimitare a evoluţiei sau involuţiei de tip spaţial, cu scop de ierarhizare sau confruntare (ce face posibilă determinarea avansului sau decalajului teritorial); c) limitativă în raport cu un nivel de referinţă de tip program (plan). Cele două niveluri ale caracteristicii comparate trebuie să fie dintre cele obişnuite iar diferenţa dintre ele să corespundă modificării absolute a fenomenului studiat. Privit ca indicator relativ, indicele sintetizează nivelul relativ al caracteristicii unui element sau al unui ansamblu de elemente, care delimitează fenomenul şi reprezintă raportul dintre termenii unei serii şi o bază oarecare. Indicele urmăreşte dinamica sau teritorialitatea şi este adimensional, ceea ce îi conferă o mai mare uşurinţă în utilizarea sa în comparaţii şi ierarhizări. Cele mai condensate definiri sunt datorate lui G.U.Yule şi M.G.Kendall, unde indici sunt valori medii ponderate ale unor mărimi relative sau de variaţii medii relative ale acelor mǎrimi. În calitate de expresii numerice ale unor tendinţe centrale în cadrul unor serii de date, indicii sau cea mai mare parte a acelora utilizaţi în mod curent nu sunt altceva decât medii ponderate ale mărimilor relative care reprezintă elementele componente ale fenomenului studiat.Scopul indicelui este de a furniza o măsură a variaţiei medii relative a unui fenomen, fie că este vorba de o singură unitate de observare , de o grupă sau de un ansamblu.Definit ca număr-pur indicele este o formă particulară a purităţii numerice, a independenţei în raport cu unitatea de măsură a mărimilor comparate.Termenul de indice, aplicat iniţial la datele seriilor dinamice, este considerat un număr fără dimensiune, obţinut prin raportarea a două valori ale aceleiaşi variabile simple ce corespund la două perioade de timp sau spaţiu diferite sau a două mărimi ale unui indicator complex ale cărui mărimi simple nu pot fi însumate direct. Privit ca schemă a variaţiei unei singure sau mai multor mărimi (fenomene), indicele este o reprezentare simplificată prin substituirea datelor brute cu raportul lor şi vizând refacerea evoluţiei din punct de vedere temporal şi spaţial a mărimilor observate. Abordat în calitate de funcţie matematică, indicele a generat o întreagă teorie axiomatică ce îi poartă numele. Un indice economic este o măsură economică, o funcţie F:D�R, care proiectează pe de o parte un set D de obiective (informaţii şi date) de interes

Page 83: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

77

economic, într-un set R de numere reale şi care satisface, pe de altă parte, un sistem de condiţii economice relevante-spre exemplu proprietăţile de monotonie, de omogenitate sau de omoteticitate sau identitate relativă. În concluzie, dacă o variabilă îşi modifică nivelul în timp sau spaţiu, raportul temporal sau spaţial va naşte inevitabil un indice statistic. Indicele este definit fie ca raport sau raportare ce furnizează un număr caracteristic, fie ca mărime sintetică relativă sau indicator relativ în expresie numerică adimensională sau în calitate de număr pur, fie în varianta definitorie cea mai condensată, ca valoare medie ponderată a unor mărimi relative sau măsura variaţiei medii relative a unor variabile în diferite momente de timp, în diferite spaţii, ori în diferite categorii organizatorice şi, nu în ultimul rând, ca reprezentare matematică simplificată prin substituirea datelor brute cu raportul lor, prin intermediul unei funcţii cu acelaşi nume-funcţia indice, respectiv F:D�R, unde: F(z1,z2,…,zk)=z1/z2, iar z=variabila specifică, D fiind mulţimea obiectivelor, informaţiilor şi datelor de interes (economic) şi R mulţimea numerelor reale. Conceptul de indice este relevat de o metodă generală de descompunere şi analiză factorială şi utilizat în practică majoritar ca sistem.Funcţiile cognitive ale indicilor reflectă calităţile metodei indicilor în a simplifica cunoaşterea sistemică a populaţiilor, fenomenelor şi proceselor. Metoda indicilor oferă noi variante de înţelegere a acestora datorită faptului că indicii: a) reflectă nivelul

noului program faţă de cel efectiv anterior: ( ) ( )11 0 0100/ :xi x xprpr ef ef= × ; b)caracterizează

gradul de îndeplinire a unui program: ( ) ( )11 11100/ : pr

xi x xprpr pr = × ; c)măsoară variaţia în

timp şi spaţiu a fenomenelor: 100)X:X(i BAB/A ×= ; d)explică numeric influenţa

factorilor asupra unui fenomen complex: 100fx

fxI

00

10f0/1 ×=∑∑ şi 100

fx

fxI

10

11x0/1 ×=∑∑ ; e)

contribuie esenţial la omogenizarea unor populaţii eterogene şi în special la omogenizarea unor universuri statistice variate (preţuri, salarii etc.), indicii utilizaţi curent nefiind altceva decât medii ponderate ale mărimilor relative ale fenomenelor studiate; f)asigură comparabilitatea unor serii de date, ale căror valori caracteristice prin unităţile de măsură specifice sunt valori absolute de necomparat (legea lui Okun sublinia, prin intermediul indicilor, că o reducere a ratei şomajului cu 1% se asigura cu indicele PIB real de 105%). Utilitatea indicilor este astăzi indiscutabilă. Metoda indicilor este omniprezentă datorită calităţilor sale specifice: a) are o largă aplicabilitate în analiza statistică a variaţiei fenomenelor sociale şi economice complexe, în descompunerea lor pe factori de influenţă ai variaţiei dinamice, teritoriale, structurale sau organizatorice; b) oferă prin indice o modalitate dominantă sub care ajung informaţiile la utilizatori (indicele preţurilor bunurilor de consum pentru inflaţie, indicele producţiei industriale pentru activitatea industrială, indicele volumului fizic al PIB-ului, pentru creşterea economică); c)substanţializează analize comparative (confruntări) privind realizarea programelor, evoluţiile teritoriale etc. Forma concretă de exprimare a indicilor creează, chiar din definirea lor ca raport, trei probleme de veridicitate, ale căror soluţii pot fi exprimate succint astfel:a)valorile indicatorilor din numărătorul şi numitorul indicelui trebuie să fie mărimi reale sau practic posibile; b) diferenţa dintre valoarea numărătorului şi numitorului indicelui trebuie să corespundă modificării absolute a fenomenului cercetat; c) datele exprimate prin valorile indicatorilor din numărătorul şi numitorul indicelui vor avea ca sursă fie o

Page 84: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

78

cercetare exhaustivă, fie o cercetare selectivă cu reprezentativitate asiguratǎ.Forma de exprimare sau notaţia indicilor este un procedeu de identificare a conţinutului detaliat al lor, pornind de la o definiţie tipologică a indicilor, care îi consideră mărimi relative ce rezultă din compararea fenomenelor individuale sau compararea ansamblurilor de fenomene de acelaşi fel în timp, în spaţiu sau faţă de un program stabilit şi care îi divide în:a) indici individuali (elementari),ce apar când fenomenul

comparat are caracter individual şi se notează cu literǎ minusculǎ: 100x

xi

0

1x0/1 ×= şi

b) indici de grup (sintetici) ce rezultă din compararea unor ansambluri de fenomene

şi se notează cu literǎ majusculǎ: Ix1/0 = 100fx

fx

00

11 ×∑

∑ .

Exprimarea standard şi interpretarea elementară a indicilor Caseta nr. 5.2 Indicele statistic, număr pur, adimensional se exprimă prin: I =(Numărător:Numitor)×100K Modalitatea de evaluare efectivǎ se concretizează în coeficienţi (k=0), procente (k=2 ⇒%), promile (k=3 ⇒ 0/00), prodecimile (k = 4⇒0/000), procentimile (k=5⇒0/0000) etc. De regulă, factorul calitativ este simbolizat prin x şi cel cantitativ prin f, iar operatorului sumă nu i se

precizează limitele (∑ înlocuind pe ∑=

n

1i). Relaţia dintre numărător şi numitor este

esenţială nu numai în notaţia, ci şi în interpretarea elementară a unui indice statistic. Se disting trei situaţii în cea mai uzuală formă de exprimare, respectiv aceea de tip procentual: a)staţionaritate I = (Numărător:Numitor) ×100=100%,(fenomenul nu se modifică în timp sau spaţiu); b) proces de majorare sau creştere: I = (Numărător : Numitor) × 100 > 100 %, (nivelul fenomenului creşte în timp sau spaţiu); c) proces de diminuare sau reducere: I = (Numărător : Numitor) × 100 <100% (nivelul fenomenului scade în timp sau spaţiu).

În statistică, mărimilor direct observabile (xi) le corespund indici individuali

sau elementari (ix), iar mărimilor reprezentative ale unor fenomene vaste, complexe (yi) le corespund indicii sintetici sau de grup (Iy). Clasificările indicilor s-au multiplicat, la aceea în raport cu sfera de cuprindere, prezentată mai sus adăugându-se altele tot mai detaliate. În funcţie de natura comparaţiei (destinaţia şi scopul comparării), indicii statistici se clasifică în indici rezultaţi din compararea aceluiaşi indicator: a) în timp, ca indici de dinamică sau cronologici [(yt)/(y0)] sau [(yt)/(y t-1)]; b) în spaţiu, cunoscuţi drept indici teritoriali sau spaţiali [yA/yB], unde A şi B sunt unităţi teritoriale sau spaţiale; c) în raport cu programul (planul) ce se pot evalua în variantele: c1) noul nivel programat în raport cu nivelul efectiv anterior [(ypr1)/(yef 0)]; c2) nivelul efectiv realizat, în raport cu cel programat [(yef1)/(ypr1)].Se recunosc cu uşurinţă în această clasificare indicatori relativi de dinamică sau indicii în general, de coordonare şi ai programului.Prezentarea proprietăţilor indicilor individuali şi analiza simplificată a testelor lui Fisher, permite o înţelegere rapidă a unor cerinţe fundamentale, în construcţia indicilor sintetici specializaţi.

Page 85: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

79

Proprietăţile indicilor individuali Caseta nr. 5.3

A.Identitatea generează testul identităţii şi stă la baza transferabilităţii: 1/ ==t

txtt x

xi .

B.Simetria este comparabilă testului reversibilităţii în timp: 1i xt/0

x0/t =× sau

xt

xt

ii

/00/

1= .

C.Înlănţuirea sau circularitatea prezintă un echivalent în testul circularităţii:

1iii xt/t

xt/t

xt/t 133221

=×× sau 1ii..ii xt/t

xt/t

xt/t

xt/t n01nn1201

=××××−

.

D.Completitudinea coincide cu testul reversibilităţii factorilor care pornind de la modelul multiplicativ v = p×q sau y = x×f conduce la: iv= i p×i q sau i y= i x×i f. Asigurarea cât mai multor proprietăţi ale indicilor elementari în cazul celor sintetici îi apropie de indicele ideal. Dezvoltarea metodei indicilor a dus la apariţia unor subclasificări importante.O primă subclasificare a indicilor sintetici sau de grup (Iy), conform modului de calcul al acestora, este aceea în indici sintetici agregaţi, indici sintetici calculaţi sub formă de medie şi indici sintetici calculaţi ca raport de medii. Alegerea unui indice sintetic este o problemă practică, legată de informaţiile statistice disponibile. Subspecia indicilor sintetici agregaţi este utilizată atunci când populaţiile statistice studiate sunt eterogene, există date individualizate la nivelul factorului calitativ (x) şi al celui cantitativ (f), dar sumele ∑x şi ∑f sunt respinse de logica economicului. În acelaşi timp însǎ agregatul ∑xf are sens economic evident (vânzările ca ∑pq, fondul de salarii ca ∑ST etc.). Subspecia indicilor sintetici agregaţi operează atât la numitor, cât şi la numărător cu acelaşi agregat sau sumă a produselor de doi factori (indicatori) dintre care numai unul se modifică, având rolul de mărime indexată, iar celălalt rămâne constant, având rolul de pondere. În evoluţia istorică a indicilor, accentul s-a pus pe construirea sistemelor de ponderare, pe identificarea unor soluţii optime sau ideale de construcţie a indicilor sintetici agregaţi, detaliate în continuare, utilizând notaţii specifice ce reprezintă iniţiala numelui fiecărui autor.

Cele trei sisteme clasice de ponderare a indicilor agregaţi Caseta nr.5.4 A.Etienne Laspeyres a considerat ca semnificativă perioada de bază (zero) cu care marchează comăsurătorul.Conservator, conform calităţii de profesor, s-a axat pe stabilitatea agregatului şi pe date complete verificate din trecut:

∑∑=

00

010/1 fx

fxLx

şi

0 11/0

0 0

f x fL

x f= ∑∑

B.Hermann Paasche a accentuat importanţa perioadei curente (1 sau t) cu care identifică practic comăsurătorul. Perioada recentă şi promptitudinea agregatului au fost punctele de interes ale acestui autor, care a lucrat o parte din viaţă ca agent de bursă:

∑∑=

10

110/1 fx

fxPx

şi

1 11/0

1 0

f x fP

x f= ∑∑

Page 86: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

80

C.Irving Fisher a încercat un compromis între cele două sisteme de ponderare clasice, valorificând media lor geometrică, pe care a denumit-o indicele ideal.Rezultatul este de o

mare precizie, dar semnificaţia economică se diluează sau dispare: x0/1

x0/1

x0/1 PLF ×= şi

f0/1

f0/1

f0/1 PLF ×= . Conform proprietăţii de completitudine (testului de reversibilitate a

factorilor), produsul celor doi indici în cadrul sistemului va fi egal cu indicele fenomenului complex, modelat multiplicativ:∑y =∑x×f, acest lucru nefiind validat pentru Laspeyres sau

Paasche: f0/1

x0/1

f0/1

x0/1

y0/1 PPLLI ×≠×≠ ,dar fiind valabil numai la Fisher: x

0/1x

0/1y

0/1 FFI ×=

şi în situaţia încrucişării indicilor Laspeyres cu Paasche: x0/1

f0/1

f0/1

x0/1

y0/1 PLPLI ×=×=

Subspecia indicilor sintetici calculaţi sub formă de medie ponderată este rezultatul investigării unor populaţii eterogene şi neînsumabile. Construirea agregatelor ∑xf nu este posibilă, întrucât nu sunt disponibile informaţiile referitoare la x şi f (nu apar înregistrate în documentele primare). Apar două situaţii, când se cunosc:

a) indicii individuali yi 0/1 , xi 0/1 , fi 0/1 şi

nivelul iniţial y0, rezultând un indice sintetic de forma mediei aritmetice ponderate:

∑ ×

∑ ×

∑ ===0y

0yy0/1i

0y

0y0y1y

0y1yy

0/1I

a) indicii individuali yi 0/1 , xi 0/1 , fi 0/1 şi

nivelul final y1, rezultând un indice sintetic de forma mediei armonice ponderate:

∑ ×

∑ ×

∑ ===1yy

0/1i

11y

1y

0y

1y

11y

0y1yy

0/1I

Analog se obţin x0/1I şi f

0/1I , calculaţi tot sub formă de medii.Indicii cuantificaţi ca

medii ponderate apar în practică atunci când sunt îndeplinite următoarele condiţii: a) indicii individuali ai fenomenului complex deţin caracter de medie; b) când acest tip de indici sunt egali cu indicele agregat pe care îl substituie. Subspecia indicilor sintetici calculaţi ca raport de medii (structurali) constituie rezultatul practic al cercetării statistice a unor populaţii omogene şi însumabile, unde f este logic însumabil şi datele ce-l privesc sunt disponibile. În mod concret, deoarece existǎ ∑y şi ∑f, atunci se poate calcula uşor media factorului calitativ:

y x fx x g

f f

×= = = ×∑ ∑ ∑∑ ∑

(unde structura g =∑ f

f ) Media factorului calitativ

depinde de fiecare valoare (individuală) a lui xi,dar şi de structura populaţiei (gi). Indicele sintetic calculat ca raport de medii se mai numeşte şi indice cu structură

variabilă (ISV): x fx x f x gx 0 01 1 1 1 1I = = : = = ISV1/0 f f x gx0 1 0 0 0

∑∑ ∑

∑ ∑ ∑ şi exprimă modificarea medie

a caracteristicii, ca urmare a influenţei concomitente exercitate de x şi g. Acest tip de indice generează un sistem al indicilor structurali, ce conţine alături de indicele de structură variabilă (ISV) şi indicele cu structură fixă (ISF), ca rezultat al izolării modificării relative a factorului calitativ, exclusiv pe seama valorilor individuale ale lui x, precum şi indicele variaţiei structurale (IVS), ca rezultat al izolării modificării relative a factorului calitativ, exclusiv pe seama structurii (g):

Page 87: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

81

x fx x f x gx(x) 0 11 1 1 1 1I = = : = = ISF1/0 f f x gx 1 1 0 101

∑∑ ∑

∑ ∑ ∑

şi x x f x f x gx(g) 01 0 1 0 0 0 1I = = : = = IVS1/0 f f x gx 1 0 0 00

∑ ∑ ∑

∑ ∑ ∑

Cei trei indici rezultaţi formează un sistem propriu: ISV = ISF × IVS Pornind de la baza de raportare, subclasa indicilor cronologici se subdivide în: a) indici cu bază fixă

00/ y

yi tyt =

sau ∑∑=

00/ y

yI ty

t

b) indici cu bază mobilă (în lanţ):

11/

−− =

t

tytt y

yi

sau ∑∑

−− =

11/

t

tytt y

yI

Natura ponderilor conduce la apariţia a două tipuri de indici specifici: a) indici cu ponderi constante atât din perioada 0 cât şi din n

∑∑=

00

00/ fx

fxI ix

i

∑∑=

n

nixi fx

fxI

00/

b) indici cu ponderi variabile atât din perioada i cât şi din (i-1)

∑∑

−− =

ii

iixii fx

fxI

11/

∑∑

−−

−− =

11

11/

ii

iixii fx

fxI

Indicii cu ponderi constante mai pot apare şi cu bază mobilă (în lanţ), în timp ce indicii cu pondere variabilă se determină numai cu bază în lanţ.În conformitate cu natura fenomenului complex studiat, indicii statistici se clasifică în diverse sisteme de indici: a) sistemul indicilor interpret (indici ai preţurilor); b) sistemul indicilor productivităţii muncii; c)sistemul indicilor eficienţei utilizării activelor imobilizate; d) sistemul indicilor salariului (brut, net, real); e) sistemul indicilor stocurilor; f) sistemul indicilor bursieri; g) sistemul indicilor raportului de schimb; h) sistemul indicilor demografici etc.

5.2 Scurtă istorie a metodei indicilor şi evoluţia indicelui interpret Apărut ca şi statistica modernă din şcoala aritmeticienilor politici, indicele

are drept părinte pe episcopul anglican William Fleetwood. Data naşterii primului indice interpret este 1707 şi este consemnată de studiul evoluţiei preţurilor în Anglia, între 1440 şi 1707, cunoscut sub titlul Chronicon Preciosum. Valoarea acestui prim indice a fost de 30/5 sau 600,0% şi a fost construit pe baza mediei aritmetice simple a opt produse: grâu, ovăz, fasole, îmbrăcăminte, bere, carne de vită, carne de oaie şi şuncă.

Istoria succintă a cuantificării matematice a indicilor statistici Caseta nr. 5.5

Indicele Dutot descrie primul calcul matematic al unui indice:1 2 1

1 2

1

....

...

n

in i

nn

ii

pp p p =

=

+ + + =Ρ + Ρ + + Ρ Ρ

,

unde: pi = preţul perioadei curente, şi Pi = preţul perioadei de bază. Dacă se multiplică numărătorul şi numitorul indicelui cu (1/n),apare formula de calcul a indicelui Dutot (un

raport de medii), respectiv (1

npii

∑=

/n):(1

nii

∑ Ρ=

/n). Pentru a cuantifica efectul avut de afluxul

de metal preţios în Europa, între 1500 şi 1750, după descoperirea Americii, istoricul, astronomul şi economistul italian Gian Rinaldo Carli, în anul 1764, a folosit media aritmetică a trei produse, respectiv: grâu, vin şi ulei, în construcţia unui alt indice interpret.

Page 88: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

82

Indice Carli: 1 2

11 2

1 1...

nn i

in i

p pp p

n n =

+ + + = Ρ Ρ Ρ Ρ

∑ Dutot şi Carli sunt apreciaţi pentru generarea

problemei adimensionalităţii, a transformării în mărimi relative a unor mărimi absolute, în general incomparabile sau deloc reductibile. Cea mai importantă îmbunătăţire în construcţia indicelui aparţine lui Arthur Young, prin introducerea ponderării , a unor coeficienţi, pentru a sublinia importanţa relativă a diferitelor articole ce intră în componenţa indicelui. Young a folosit două formule de ponderare, plecând fie de la Dutot, indicele Young (1):

1 1 2 2 1

1 1 2 2

1

n ni i

....

Ρ K + Ρ K +...+Ρ K K

n

in

i

i in n

p kp k p k p k =

=

+ + + =Ρ

,unde ki = coeficient de importanţă per produs i, fie de

la Carli, indicele Young (2): 11 2

11 2

1 1

2i

ii i

nn

1 1C C ... C C

C C

nn

n ni

i i

ip ppp

=

= =

=

+ + + = × × Ρ Ρ Ρ Ρ ∑

∑ ∑

1

1

i

ii

C

C

n

ni

i

ip

=

=

×Ρ∑

∑,unde

1

i

i

C

Cn

i =

=∑

coeficient de ponderare (c.p.) şi 1

( . .)n

iic p

=∑ = 1.După soluţia

Young din 1812, noua problemă a proiectării indicilor avea să devină efectul variaţiei ponderilor. Sir George Shuckburgh Evelyn a introdus, în anul 1798, noţiunea de an de bază şi a anticipat astfel dilema selecţiei bazei şi construcţiei sistemului de ponderare. În anul 1863, prin indicele calculat ca medie geometrică a indicilor individuali, Stanley Jevons extinde problematica şi asupra formulei şi mai ales a mediei utilizate: Indice

Jevons:1

ni

n

i i

p

= Ρ∏ .Jevons nu va diferenţia indicii individuali,acordându-le acestora aceeaşi

importanţă.Doi indici impuşi de şcoala germană de statistică rămân şi astăzi, asemeni celor doi poli tereştri, limitele de construcţie pe axa sistemelor de ponderare. Primul este indicele lui Etienne Laspeyres, realizat în 1864, folosind ponderarea cu perioada de bază, iar cel de-al doilea este indicele lui Hermann Paasche, elaborat în 1874, utilizând perioada curentă drept criteriu de ponderare:

Indicii Laspeyres: i1 i0

i0 i0

p qp q

∑∑

sau i0 i1

i0 i0

p qp q

∑∑

şi Paasche: i1 i1

i0 i1

p qp q

∑∑

sau i1 i1

i1 i0

p qp q

∑∑

, unde:

pi0 şi pi1 = preţuri ale perioadei de bază (0) şi curente (1) qi0 şi qi1 = cantităţi ale perioadei de bază (0) şi curente (1).

Deşi aceşti indici verifică numai condiţia de identitate (1/1XI =X1/X1 =1), din toate testele lui

Fisher pentru indici elementari, totuşi sunt cei mai des folosiţi în practică, datorită conţinutului lor economic. În interiorul diferenţei dintre indicii Laspeyres şi Paasche, dar cu pierderea conţinutului economic specific şi în afara relaţiei lui Ladislaus von Bortkiewicz, s-au plasat mulţi indici teoretici. Aceştia pot fi numiţi fără nici o rezervă, indici de tip „mesonic”, pornind de la dorinţa autorilor lor de a se situa valorile în interiorul diferenţei (P – L), de a furniza o soluţie de echilibru între cele două valori limită din punctul de vedere al alegerii bazei. Dintre formulele indicilor de tip „mesonic” cele mai cunoscute sunt construcţiile ce utilizează medii statistice comune, obişnuite. Media aritmetică simplă a

Page 89: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

83

indicilor Laspeyres şi Paasche este indicele Sidgwik – Drobisch.: L + P2

.

Media aritmetică a cantităţilor din cele două perioade şi devenită astfel pondere genereazǎ

indicele Marshall - Edgeworth sau Bowley - Edgeworth (1885 - 1887): ( )( )

0 1i1 i i

0 1i0 i i

p q +q

p q +q∑

∑ .

Media geometrică a cantităţilor din cele două perioade transformată în pondere descrie

integral un indice Walsh (1901): ( )( )

1 0i1 i i

1 0i0 i i

p q q

p q q

×

×

∑. Media geometrică simplă a indicilor

Laspeyres şi Paasche nu este altul decât indicele Fisher (1922): ( )L P× Singurul test care

nu este satisfăcut de acest indice este testul de înlănţuire (circularitate). Avantajul datorat de

reversibilitatea indicelui Fisher :F0/1 = ( )( )1/0 1/0

1/01/0 1/0

1 1L P

FL P× = =

× este contrabalansat

prin dezavantajul pricinuit de lipsa de conţinut economic. O construcţie deosebit de practică este aceea a lui R.H.I. Palgrave (1886), care a propus un indice mediu aritmetic ponderat cu

valoarea bunurilor, aferentă perioadei curente (v1i=p1i×q1i): ( ) (v )11/0 1i i 1/0 1i

v1i1 i 1i

i p q ip q× ×

=∑ ∑∑ ∑

. Şirul

indicilor pur teoretici sau generalizaţi este imprevizibil şi plin de originalitate. Soluţia Cobb - Douglas (1928) este o generalizare a indicelui Jevons, utilizând ponderi inegale şi îndeplinind trei din testele Fisher (fără reversibilitatea factorilor): Indice Cobb - Douglas:

1

αi

i

ni

i

p

=

Ρ

∏ , unde αi > 0 şi 1

nαi

i =∑ = 1. Varianta lui Stuvel, un indice combinat între un

Laspeyres al factorului preţ (LP) şi un Laspeyres al factorului cantitate (Lq), realizat în

1957, satisface exclusiv condiţia de identitate: ( ) ( )

2p qp q p qL -P2

L -PI

4×+ + ,unde I(p×q)

= indicele variaţiei totale. O altă construcţie, inspirată de această dată din metoda proiectării „experimentale”, axată pe concepţia factorială, dar inoperantă economic, fiind lipsită de o astfel de semnificaţie este indicele lui R.S. Banerjee (1961), tot o combinaţie de indici

Laspeyres şi Paasche: ( )( )

P L + 1L + 11 P + 1+ 1P

= .Un adevărat punct limită al teoretizării clasice îl

constituie indicele autoregresiv: ( )( )

2i i

22

i i

i a

a

p P

P ×

∑, Prin ai se înţeleg cantităţi de produse sau

coeficienţi de ponderare (importanţă). Acesta verifică condiţia de identitate deşi este

construit condiţionat, 2p - P IAUTOREGRESIVi i

×∑ = minim. Indicii Torngvist (1936) şi Divisia

(1925) sunt rezultatul generalizărilor de tip matematic definindu-i următoarele relaţii:

ln (Indice Torngvist)=1

ln2

P Qp q pi i ip q P Q Pi i

i i

i i i

+ ×

∑∑ ∑

, unde:p qi i

p qi i∑ şi

P Q

P Qi i

i i∑ sunt ponderi

ale valorii tranzacţiilor specifice piqi şi PiQi .Forma obişnuită sub care se întâlneşte indicele

Page 90: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

84

Divisia este:P0t Q0t = it it

i0 i0

p qp q

∑∑

ca valoare medie dintr-o relaţie determinată a indicilor

individuali ai preţurilor, respectiv ( )...1 2P i i i ip p pn pi+ + + = . Procesele de multiplicare

contemporană a formulelor de calcul ale indicilor au două tendinţe, una deja vizibilă de axiomatizare şi matematizare extremă după modelele indicilor Torngvist şi Divisia, care a culminat cu şcoala indicilor axiomatici şi o a doua de reluare a filonului logic de semnificare economică a construcţiilor de indici, specifică ultimelor construcţii în plan internaţional de la sfârşitul secolului al XX-lea, respectiv variante de integrare a modelelor de construcţie aditive sau a modelelor mixte aditiv – multiplicative, apropiate de semnificaţia fenomenelor reale, ca în cazul indicelui avantajului comparativ relevat sau

indicele David Neven (1895):x mk kx mk k

− ×∑ ∑

100, unde x şi m sunt valori ale exportului

şi importului la nivelul industrie k.Indicele aparţine intervalului de valori (-100%; 100%), dar rareori atinge valori mai mari de 10% sau mai mici de – 10%.

Departe de a fi considerat definitiv încheiat procesul de construire a indicilor se află într-o continuă perfecţionare. Construcţia indicilor conduce la un fenomen de sintetizare şi încorporare a mai multor indici simpli sau reunire a unor indici simpli şi sintetici într-un singur indice agregat.

5.3 Sisteme concrete de indici şi probleme practice de construcţie Utilizarea cea mai des întâlnită a indicilor sintetici se realizează în varianta

lor de indici cronologici, iar pentru a simplifica în conformitate cu cazul cel mai frecvent, mai ales în ipostaza de indici cu bază fixă (It/0). Principalele sisteme concrete de indici sunt cele referitoare la vânzări, livrǎri, expedieri sau, prin generalizare, la valoarea exprimatǎ în raport cu preţul şi cantitatea efectivǎ (∑v=∑pq), la producţie în funcţie de productivitate şi personal (∑Q=∑WT), la producţie în funcţie de eficienţa fondurilor fixe şi valoarea fondurilor fixe (∑Q=∑EF) şi la fondul de salariu în raport cu salariul nominal şi numărul salariaţilor (∑FS=∑ST). Se utilizează indici sintetici agregaţi, informaţia fiind completă, detaliată şi evidenţele uşor accesibile.

I.Sistemul de indici ai valorii (v = pq) şi (∑v =∑ pq)

În mod concret, se disting douǎ tipuri de modificǎri ale valorii cu influenţe detaliate în raport cu preţul şi cantitatea specificǎ:

A. Modificarea relativă a valorii B. Modificarea absolută a valorii

-Indicele general al valorii ∑∑=

000/ qp

qpI ttv

t

-Modificarea absolută generalǎ

∑∑ −=∆ 000/ qpqp ttvt

-Indicele preţurilor (indicele valorii sub

influenţa preţurilor) : ∑∑=

t

ttpt qp

qpI

00/

-Modificarea absolută a valorii ca urmare a schimbării preţurilor

∑∑∑ ∆=−=∆ pqqpqp ttttpv

t 0)(

0/

-Indicele volumului fizic (indicele valorii -Modificarea absolută a valorii ca

Page 91: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

85

sub influenţa volumului fizic) : 0 t

/00 t

p q

p qq

tI

∑=∑

urmare a schimbării volumului fizic

( )/0 0 0 0 0

v qt tp q p q p q∆ = − = ∆∑ ∑ ∑

Ponderile utilizate generează următoarele relaţii de verificare a calculelor:

qt

pt

vt III 0/0/0/ ⋅=

şi )(

0/)(

0/0/qv

tpv

tvt ∆+∆=∆

De o manierǎ similară se determină şi celelalte sisteme concrete de indici, respectiv al producţiei în funcţie de productivitate şi număr de personal, de eficienţă şi valoarea activelor ori a fondului de salarii în funcţie de salariu şi numărul salariaţilor (Q = WT) şi (∑Q =∑WT), (Q = eF) şi (∑Q = ∑eF), (FS = ST) şi (∑FS =∑ST= ∑eF) etc.

Existǎ şi circumstanţe în care informaţia statistică deţinută este strict structurală

(apare ii

i

fg

f=∑

) şi se deţin , , ,p W E S modificările medii ale caracteristicilor

calitative. În această situaţie se apelează la modelul indicilor calculaţi ca raport de medii, cunoscuţi şi ca sistem de indici structurali. II. Sistemul de indici ai preţului mediu, în funcţie de evoluţia preţurilor individuale şi a structurii vânzărilor

pq qp p pg

q q= = =∑ ∑ ∑∑ ∑

A. Modificarea relativă a preţului mediu Indicele cu structură variabilă- arată modificarea preţului mediu ca urmare a influenţei concomitente exercitate şi de p şi de q:

0 0/ 0

0 0 00 0

:t t t tp t tt SV

t

p q p q p gp pI sau I

q q p gp p= = = =∑ ∑ ∑

∑ ∑ ∑

Indicele cu structură fixă ( )

/ 0p p

tI - arată variaţia lui p ca urmare a modificării lui p, iar q rămâne la nivel t

0( )/0

00 0

:t t t t tp p t tt SF

t t tt t

p q p q p gp pI sau I

q q p gp p= = = =∑ ∑ ∑

∑ ∑ ∑

Indicele variaţiei structurale ( )

/ 0p q

tI - arată variaţia lui p ca urmare a modificării lui q, iar p rămâne la nivel 0

0 0 0 0( ) 0 0/0

0 0 00 0

:t tp q t tt VS

t

p q p q p gp pI sau I

q q p gp p= = = =∑ ∑ ∑

∑ ∑ ∑ B. Modificarea absolută a preţului mediu

/ 0 0 0pt t tp g p g∆ = −∑ ∑

(a preţului mediu sub influenţa concomitentă exercitată de p şi q) ( )/0 0

p pt t t t tp g p g g p∆ = − = ∆∑ ∑ ∑

(a preţului mediu sub influenţa exercitată de p) ( )/0 0 0 0 0

p qt tp g p g p g∆ = − = ∆∑ ∑ ∑

Page 92: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

86

(a preţului mediu sub influenţa exercitată de q)

Relaţiile se verifica la final astfel: A. ( ) ( )

/ 0 / 0 / 0p p p p q

t t tI I I= ⋅ şi B.

( ) ( )/ 0 / 0 / 0

p p p p qt t t∆ = ∆ + ∆

Analog se procedează şi pentru productivitatea medie a muncii, pentru eficienţa medie a capitalului, pentru salariul mediu etc. În sinteză, în construcţia sistemelor concrete de indici se disting unele aspecte cu implicaţii practice deosebite. Într-un proces minimal de construcţie reală se recomandă parcurgerea următoarelor etape: a) identificarea corectă a unităţii de observare, a variaţiei temporale, spaţiale sau în raport cu orice altă situaţie (structură, organizare, limită, necesitate, impunere, estimare); b) identificarea factorilor calitativi (x) şi a celor calitativi (f); c) analiza şi evaluarea posibilităţilor de însumare în cazul factorilor cantitativ şi a imposibilităţii de agregare acolo unde aceasta apare; d) alegerea corespunzătoare a bazei de raportare ca nivel spaţial sau temporal, justificând desemnarea ca etalon în vederea unei adimensionalizări optime ulterioare; e)schimbarea bazei „îmbătrânite” sau a bazei care şi-a pierdut calitatea de a asigura tipul de comparabilitate pentru care a fost selectată; f) alegerea formulei de calcul a indicilor în funcţie de disponibilitatea, promptitudinea, completitudinea, precizia şi natura informaţiilor; g) selectarea tipului adecvat de indice sintetic sub formă de medie, de raport de medii sau de indice agregat; h) alegerea sistemului de ponderare în acord cu factorii care determină variaţia specifică urmărită, disponibilităţi, rapiditate şi costuri; i) racordarea periodică a construcţiilor de sisteme de indici pentru a putea asigura continuitatea informaţiilor, dar şi pentru a limita impactul fenomenului de îmbătrânire a ponderilor sau a coeficienţilor de ponderare.

5.4 Descompunerea variaţiei unui fenomen complex prin metoda indicilor

Metoda indicilor şi-a câştigat un loc important şi binemeritat în analiza, ca şi în descompunerea variaţiei unui fenomen complex, pornind de la factorii de influenţă ai acestuia, cu precădere datorită simplităţii sale. Dacă modelul analizat este unul de tip multiplicativ, descompunerea variaţiei prin metoda indicilor se regăseşte sub forme diferenţiate ca: metoda bifactorială (metoda substituirii în lanţ–MSL şi metoda restului nedescompus–MRN), metoda multifactorială.Metoda bifactorială de descompunere a variaţiei se numeşte astfel datorită modelului clasic de analiză multiplicativ specific:y = xf.Varianta denumită metoda substituirii în lanţ este justificată de o modificare cât mai mică a ponderii factorului cantitativ. Aceasta presupune două situaţii de schimbare succesivă a factorilor în timp:

A. M.S.L. 1 – cu debut cantitativ (mai întâi se modifică factorul cantitativ) Modificări relative Modificări absolute

/ 00 0 0

t t tyt

y x fI

y x f= =∑ ∑∑ ∑

/ 0 0 0yt t tx f x f∆ = −∑ ∑

Modificări relative Modificări absolute

0( )/ 0

0 0

ty ft

x fI

x f= ∑∑

( )/ 0 0 0 0 0

y ft tx f x f x f∆ = − = ∆∑ ∑ ∑

Page 93: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

87

Modificări relative Modificări absolute

( )/ 0

0

t ty xt

t

x fI

x f= ∑∑

( )/ 0 0

y xt t t t tx f x f f x∆ = − = ∆∑ ∑ ∑

Verificarea finalǎ ( ) ( )

/ 0 / 0 /0y y f y xt t tI I I= × ( ) ( )

/ 0 / 0 /0y y f y xt t t∆ = ∆ + ∆

B. M.S.L. 2 – cu debut calitativ (mai întâi se modifică factorul calitativ) Modificări relative Modificări absolute

/00 0 0

t t tyt

y x fI

y x f= =∑ ∑∑ ∑

/ 0 0 0yt t tx f x f∆ = −∑ ∑

Modificări relative Modificări absolute

0( )/ 0

0 0

ty xt

x fI

x f= ∑∑

( )/ 0 0 0 0 0

y xt tx f x f f x∆ = − = ∆∑ ∑ ∑

Modificări relative Modificări absolute

( )/ 0

0

t ty ft

t

x fI

x f= ∑∑

( )/ 0 0

y ft t t t tx f x f x f∆ = − = ∆∑ ∑ ∑

Verificarea finalǎ ( ) ( )/ 0 / 0 /0y y f y xt t tI I I= × ( ) ( )

/ 0 / 0 /0y y f y xt t t∆ = ∆ + ∆

Varianta restului nedescompus (influenţelor izolate) separă variaţia fenomenului complex, suma influenţelor izolate nefiind egală cu variaţia totală, restul nedescompus rezultând din interacţiunea celor doi factori. Modificări relative Modificări absolute

/ 00 0

t tyt

x fI

x f= ∑∑

/ 0 0 0yt t tx f x f∆ = −∑ ∑

Ambii factori se modifică izolat, dar pentru a întregi variaţia totală, se evaluează şi influenţa lor comună, generatoare a restului nedescompus (neputând detalia iniţial, în cadrul acestui rest, partea de influenţă a fiecărui factor în parte, în mod distinct).

0( )/ 0

0 0

ty ft

x fI

x f= ∑∑

( )/ 0 0 0 0 0

y ft tx f x f x f∆ = − = ∆∑ ∑ ∑

0( )/ 0

0 0

ty xt

x fI

x f= ∑∑

( )/ 0 0 0 0 0

y xt tx f x f f x∆ = − = ∆∑ ∑ ∑

( )/ 0y x f

tI I = 0

0

0 0

t t

t

t

x f

x f

x f

x f

∑∑∑∑

( )/ 0y x f

tI I = 0 0 0 0t t t tx f x f x f x f− − +∑ ∑ ∑ ∑ 0tx f x f= ∆ − ∆∑ ∑

Verificarea finală ( ) ( ) ( )/ 0 /0 /0 /0y y f y x y x ft t t tI I I I= × × I ( ) ( ) ( )

/ 0 /0 /0 /0y y f y x y x ft t t t∆ = ∆ + ∆ + ∆ I

Page 94: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

88

Apar trei situaţii practice de repartizare a restului nedescompus [( )/ 0

y x ft∆ I ]:

a) restul nedescompus se repartizează unui singur factor, ceea ce conduce la metoda substituirii în lanţ (MSL devine un caz particular al metodei MRN); b) restul nedescompus se poate diviza în părţi egale celor doi factori; c) restul nedescompus se repartizează în funcţie de ponderea influenţei izolate a fiecărui factor în suma celor două influenţe izolate; pentru realizarea acestei cerinţe efective mai întâi se calculează doi coeficienţi de repartizare specifici:

( )/0

( ) ( )/ 0 /0

y ft

f y f y xt t

k∆=

∆ + ∆ şi

( )/ 0

( ) ( )/ 0 / 0

y xt

x y f y xt t

k∆=

∆ + ∆

apoi se repartizează proporţional restul nedescompus pentru a se obţine:

� influenţa totală a factorului cantitativ ( )/ 0

y ftT∆

( ) ( ) ( )/ 0 / 0 /0

y f y f f y x ft t tT k∆ = ∆ + × ∆ I

� influenţa totală a factorului cantitativ ( )/ 0

y xtT∆

( ) ( ) ( )/ 0 / 0 /0

y x y x x y x ft t tT k∆ = ∆ + × ∆ I

Rezultatele caracteristice metodei restului nedescompus sunt mult mai exacte, comparativ cu metoda substituirii în lanţ, mai ales în condiţiile existenţei unei repartizări relativ distincte, semnificative sau proporţionale în realitatea imediată a influenţelor factorilor.Metoda multifactorială bazată pe un model multiplicativ cu mai mulţi factori este caracterizată de imposibilitatea de a mai face distincţia simplă între factorul calitativ şi cel cantitativ. Metoda se utilizează când un model bifactorial multiplicativ este detaliat. Astfel consumul de materii prime şi materiale (M) modelat elementar în funcţie de consumul specific (c) şi producţie (q), în urma detalierii producţiei în termeni valorici (pq) devine:M c p q= × × .

Metoda multifactorială se aplică practic cu respectarea a două reguli Regula 1:Se alcătuiesc un număr de indici egal cu numărul factorilor. Regula 2: Factorii sunt trataţi succesiv drept factori calitativi şi cantitativi (de manieră translativă sau glisantă de la stânga la dreapta).

Concret pe un model multifactorial y a b c d= × × × se remarcă următoarele: A. Modificări relative B. Modificări absolute

( )/ 0

0

t t t ty at

t t t

a b c dI

a b c d= ∑∑

( )/ 0 0 0( )y a

t t t t t t t t t t t ta b c d a b c d a a b c d∆ = − = −∑ ∑ ∑

0( )/ 0

0 0

t t ty bt

t t

a b c dI

a b c d= ∑∑

( )/ 0 0 0 0 0 0( )y b

t t t t t t t t ta b c d a b c d b b a c d∆ = − = −∑ ∑ ∑

0 0( )/ 0

0 0 0

t ty ct

t

a b c dI

a b c d= ∑∑

( )/ 0 0 0 0 0 0 0 0 0( )y c

t t t t t ta b c d a b c d c c a b d∆ = − = −∑ ∑ ∑

Page 95: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

89

0 0 0( )/ 0

0 0 0 0

ty dt

a b c dI

a b c d= ∑∑

( )/ 0 0 0 0 0 0 0 0 0 0 0 0( )y d

t t ta b c d a b c d d d a b c∆ = − = −∑ ∑ ∑

Verificarea finalǎ ( ) ( ) ( ) ( )

/0 /0 /0 /0 /0y y a y b y c y dt t t t tI I I I I= × × × ( ) ( ) ( ) ( )

/ 0 / 0 /0 /0 /0y y a y b y c y dt t t t t∆ = ∆ + ∆ + ∆ + ∆

Dacă modelul analizat este unul de tip aditiv clasic y = a + b (ca în exemplul: salariul brut = salariul net + taxe şi impozite) descompunerea este mult simplificată

prin modificări relative de forma: 1 1 1 1 1/0

0 0 0 0 0 0 0

yt

y a b a bi

y a b a b a b

+= = = ++ + +

şi modificări

absolute: /0 1 1 0 0 1 0 1 0 /0 /0( ) ( ) ( ) ( )y a bt t ta b a b a a b b∆ = + − + = − + − = ∆ +∆ . Descompunerea

practică a variaţiei unui fenomen complex pe factori de influenţă prin metoda indicilor operează cu promptitudine în condiţiile unui număr relativ limitat de indici (implicit factori explicativi).

5.5 Inflaţia şi indicii interpret

Definiţii distincte în diverse statistici naţionale, atribuite variatelor tipuri de indici de preţ, validează prin sintetizare afirmaţia că indicele interpret îşi are drept elemente constant identice următoarele caracteristici: a) instrument de măsură care furnizează o estimare a evoluţiei preţurilor (bunurilor de consum în IPC, industriale în IPPI etc.); b) înstrăinarea bunurilor şi prestarea serviciilor (respectiv preţuri şi tarife efectiv practicate); c) modificarea preţurilor între o perioadă fixă (perioadă de bază sau de referinţă) şi o perioadă variabilă (perioadă curentă).

Cei mai utilizaţi indici interpret sunt următorii: I. IPC –indicele preţurilor (bunurilor) de consum al populaţiei măsoară evoluţia de ansamblu a preţurilor mărfurilor cumpărate şi a tarifelor serviciilor utilizate, fiind considerat principalul instrument de evaluare a inflaţiei; descrierea instrumentală şi aplicativă a indicelui preţurilor bunurilor de consum are ca repere: definirea, avantajele şi dezavantajele utilizării, sfera de cuprindere, sursele de date, eşantioanele utilizate în construcţie, sistemul de ponderare, calculul efectiv, inflaţia calculată ca ritm al IPC, indicatori specifici ai inflaţiei, utilizări ale IPC şi indicele puterii de cumpărare a monedei naţionale.

IPC = ∑∑

)(

)(

00

00

qp

qpI p

, unde pCqp

qp =∑ )(

)(

00

00 iar Ip = indicele la nivel de post, grupă

sau general în luna t în raport cu anul t-2 şi Cp=coeficient de ponderare specific (sortimentului, postului, grupei) conform anchetei ABF. Indicele IPC este un indice sintetic calculat cu o medie aritmetică ponderată a indicilor pe diverse nivele inferioare de agregare (grupă, post, sortiment). Rata inflaţiei se determină ca ritm al IPC. Dacă IPC este un coeficient, rata inflaţiei devine: R =(IPC× 100)–100, iar când IPC este un procent, rata inflaţiei se determină astfel: R = IPC–100.Indicatorii inflaţiei, publicaţi în Buletinul statistic de preţuri, sunt descrişi în continuare.

I.Rata lunară a inflaţiei în luna t faţă de luna precedentă (t-1): 1001001ttIPC1ttR −×−=−

Page 96: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

90

II. Rata medie lunară a inflaţiei ca medie geometrică a creşterilor lunare pentru o anumită

perioadă de n luni: 100100)n IPC(R −×∏=

III. Rata inflaţiei la sfârşitul perioadei (anului) în luna t (decembrie) faţă de luna decembrie

a anului precedent: 100100decembrietIPCdecembrietR −×=

IV. Rata anuală a inflaţiei într-un an faţă de anul precedent, calculată ca un raport între indicele mediu al preţurilor dintr-un an şi cel al anului precedent, determinaţi amândoi ca medii aritmetice simple ale indicilor lunari din fiecare an, calculaţi faţă de aceeaşi bază (de

exemplu: octombrie 1990 = 100): 100100IPC

IPCR

)1t(AN

ANt)1t(ANANt −×=

−−

Utilizările IPC-ului sunt conjuncturale (IPC şi rata şomajului sunt indicatori esenţiali în analiza conjuncturală a ţărilor U.E, fostele criterii Maastricht) în analiza contabilităţii naţionale şi în analize sociale (comunitare), conducând la determinarea câştigului salarial real, Sr = (Sn/IPC)× 100, a pensiei reale, Pr = (Pn/IPC)× 100, la indexarea câştigurilor salariale şi a pensiilor, la determinarea consumului real etc. Indicele puterii de cumpărare a monedei naţionale (IPCMN) constituie inversul valorii IPC,

semnalând pierderea puterii de cumpărare a monedei naţionale: IPCMN = IPC

1

Pentru un indice al preţurilor de consum de 107,0%, IPCMN devine egal cu 93,5%, dezvăluind o pierdere a puterii de cumpărare estimată a monedei naţionale de 6,5%.

II. IPPI –indicele preţurilor producţiei industriale exprimă în mod sintetic evoluţia sau schimbările medii ale preţurilor produselor fabricate şi livrate de producătorii interni, practicate efectiv în primul stadiu al comercializării acestora, fiind utilizat atât la deflatarea producţiei industriale evaluată în preţuri curente, cât şi la determinarea inflaţiei în sfera „preţurilor producătorilor”. Acest indice este unul dintre puţini indicii înzestraţi cu putere de „premoniţie”, o veritabilă Cassandra în lumea atît de populată a instrumentelor de măsură a inflaţiei. Astfel IPPI anticipează evoluţia IPC. Din analiza ultimilor 17 ani, se constată o dinamică paralelă a evoluţiei celor două instrumente statistice de evaluare a inflaţiei, relevând capacitatea de predicţie a dinamicii IPC, pornind de la evoluţia IPPI; III. IVU –indicele valorii unitare a exportului/importului caracterizează dinamica preţurilor din contractele de export/import, extinderea variaţiei preţurilor mărfurilor considerate reprezentative asigurând în final o rată de acoperire maximală a produselor de 92%, ceea ce permite deflatarea prin intermediul său a indicatorilor ce caracterizează schimburile externe şi chiar calcularea raportului de schimb; IV . ICV –indicele de cost al vieţii arată care este costul la preţurile pieţei în perioada curentă, pentru menţinerea standardului de viaţă atins în perioada de bază, fiind calculat ca raport între acest cost ipotetic şi costul efectiv (de consum) al perioadei de bază, necesitatea acestui tip de indice interpret fiind evidentă mai ales în determinarea salariului real şi venitului real; între IPC şi ICV există o relaţie deosebită, caracterizată succint în continuare: V. IPAm–indicele preţurilor cu amănuntul stabileşte modificarea preţurilor la toate mărfurile vândute prin reţeaua comerţului cu amănuntul, importanţa lui ca instrument de măsură a inflaţiei în sfera preţurilor cu amănuntul, fiind evidentă;

Page 97: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

91

VI. ICC–indicele costului construcţiilor apreciază modificarea preţurilor în construcţiile de locuinţe, servind la indexarea chiriilor, indiferent de metoda de calcul aleasă el fiind folosit şi independent dar şi în cadrul IPC; VII. IPPA-A–indicele preţurilor produselor agro-alimentare măsoară evoluţia preţurilor pe piaţa ţărănească (piaţa producătorilor agricoli individuali sau asociaţi), furnizând informaţii importante despre inflaţia pe această piaţă specială; VIII. - indicele deflator al PIB sau deflatorul implicit al PIB–indicele preţurilor produsului intern brut care se calculează ca rezultat al raportului între PIB nominal sau în preţuri curente şi PIB exprimat în preţuri comparabile (după deflatarea separată a fiecărei componente a acestui indicator macroeconomic). Indicele implicit al preţurilor produsului intern brut sau deflatorul PIB–ului este un instrument statistic care măsoară evoluţia de ansamblu a preţurilor întregii sfere de producţie a unei economii naţionale, respectiv a preţurilor şi tarifelor produselor şi serviciilor finale, la nivelul unui teritoriu economic, într-o anumită perioadă de timp, de regulă un an sau un trimestru.Principalul avantaj al deflatorului PIB-ului este completitudinea sau sfera sa de cuprindere, mai extinsă în comparaţie cu toate celelalte instrumente statistice de măsurare a inflaţiei, iar dezavantajul major este lipsa promptitudinii sale sau tardivitatea specifică. PIB se calculează anual, iar din 2000 se estimează şi trimestrial. Evaluarea PIB este provizorie (la sfârşitul anului sau perioadei de referinţă), semidefinitivă (la 1-2 ani distanţă de anul de referinţă) şi definitivă (la 2-3 distanţă de anul de referinţă). Deflatorul PIB-ului este un indice Paasche, calculat prin raportarea indicelui PIB-ului nominal la indicele real:

Deflatorul PIB-ului = realPIB

nominalPIB

I

I =

∑∑

∑∑∑∑

=10

11

00

10

00

11

qp

qp

qp

qp

qp

qp

Indicele implicit al PIB–ului se calculează şi la nivelul componentelor: consum public şi privat, investiţii brute, modificări ale stocurilor, exportului şi importului.

Indici interpret sunt acele instrumente statistice absolut necesare în economiile de piaţă, care permit substituirea caracterizărilor de tip adjectival ale inflaţiei cu o scală ordinală. Cum variabila măsurată pe o scală ordinală este înzestrată cu relaţia de ordine aceasta permite ierarhizarea următoare: a ) nivelul de inflaţie subnormală (cuprinsă între 0 şi 3%); b) nivelul de inflaţie (infra)normală (model Friedman - inflaţie 3-5% anual); c) nivelul de inflaţie moderată (între 5 şi 10% anual); d) nivelul de inflaţie întreţinută (între 10 şi 20% anual); e) nivelul de inflaţie persistentă (între 20 şi 100% anual); g) nivelul de inflaţie forţată (între 100 şi 200% anual); h) nivelul de inflaţie accelerată (între 200 şi 300% anual); i) nivelul de inflaţie excesivă (între 300 şi 1300% anual) şi h) hiperinflaţia (şoc inflaţionist lunar de peste 50% şi peste 13000% anual).

5.6 Test de autoevaluare şi aplicaţii A) Test de autoevaluare

A1) Întrebări clasice recapitulative

(Completaţi spaţiile goale)

A2) Întrebări tip gril ă

(Încercuiţi litera răspunsului corect)

Page 98: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

92

1. Ce este un indice statistic şi care sunt funcţiile cognitive ale sale ?

2. Care sunt cele trei sisteme clasice de ponderare şi în ce constă originalitatea lor?

3. Care sunt problemele practice legate de construcţia sistemelor de indici interpret?

4.Cum se detaliază sistemul de indici ai preţului mediu?

5. Care sunt procedurile de determinare a IPC, IPPI şi deflatorul implicit al PIB-ului?

6. Identificaţi valoarea indicelui de preţ care asigură menţinerea volumului valoric al vânzărilor în condiţiile reducerii cu 15% a cantităţilor produse: a) 15,00; b) 17,65; c) 33,33 %; d) 117,65 %. 7. Alegeţi afirmaţia falsă privind indicii de preţ calculaţi în statistica românească: a)Deflatorul PIB este un indice Paasche; b)IPPI este un indice Laspeyres; c)IPC este un indice Fisher. 8. Identificaţi indicele puterii de cumpărare a monedei naţionale, în condiţiile în care inflaţia a fost de 9,0%: a)71,45%; b) 91,0%; c) 91,74% ; d) 109,03%. 9. Dacă cifra de afaceri nominală sau în preţuri curente prezintă lunar un indice de 120% şi rata inflaţiei este de 25%, atunci dinamica cifrei de afaceri reale este egală cu: a)95,0%; b) 96,0%;c)104,2%; d)105,0%

B) Aplicaţii rezolvate 1.Dacă vânzările la export, a două produse, în două luni succesive sunt cele din tabelul 5.1, atunci să se determine: a) indicii individuali ai vânzărilor, ai preţurilor şi ai volumului fizic; b) indicii sintetici agregaţi ai volumului fizic şi ai preţurilor Laspeyres, Paasche şi Fisher, iar în final indicele valoric al vânzărilor totale. Tabel nr. 5. 1

Preţ unitar (€) Cantitate (mii) Valoarea vânzărilor (mii € ) Produs p0 p1 q0 q1 p0q0 p0q1 p1q0 p1q1

A 100 120 10 9 1000 900 1200 1080 B 400 500 8 7 3200 2800 4000 3500

Total - - - - 4200 3700 5200 4580 Rezolvare: Indicii individuali iV, ip, iq semnifică dinamica la nivel de produs a vânzărilor:

1 1 11/ 0

0 0 0

100 100V v p qi

v p q= × = × , preţurilor 1

1/0

0

100p pi

p= × şi cantităţilor 1

1/ 0

0

100q qi

q= × .

Întotdeauna 1/0 1/0 1/0v p qi i i= × ,iar rezultatele sunt:

Produs vi 0/1 pi 0/1 qi 0/1

A 108,0 120,0 90,0 B 109,4 125,0 87,5

Indicii agregaţi Laspeyres (L) şi Paasche (P) sunt prezentaţi în paralel:

• Indicele volumului fizic: 0 1

1/ 0

0 0

3700100 100 88,095%

4200q p q

Lp q

= × = × =∑∑

,

Page 99: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

93

( 1/ 0 1/ 0

q qL şiP ) 1 1

1/ 0

1 0

4580100 100 88,077%

5200q p q

Pp q

= × = × =∑∑

.

• Indicele preţurilor : 1 0

1/ 0

0 0

5200100 100 123,809%

4200p p q

Lp q

= × = × =∑∑

,

( pp şiPL 0/10/1 ) 1 1

1/ 0

0 1

4580100 100 123,784%

3700p p q

Pp q

= × = × =∑∑

.

În final, indicele valorii vânzărilor totale este p q q pVI L P L P = 109,047 %= =

Sistemul de indici de preţ şi ai volumului fizic de tip Fisher (F) reprezintă mediile simple geometrice ale indicilor Laspeyres şi Paasche:

q q qF = L × P = 88,086%, p p pF = L × P = 123,796%şi IV=Fq·FP=109,047 %. 2.O firmă a vândut pe piaţă trei produse în luna ianuarie în valoare de 10 mii lei (5 mii de lei pentru articolul A, 3 mii pentru B şi 2 mii pentru C). Pentru februarie

calculaţi indicele Laspeyres ca medie aritmetică a indicilor individuali fAi =120,0

%, fBi = 80,0 % şi f

Ci = 150,0 %. Soluţie: Se determină indicele conform

formulei∑∑=

00

00

fx

fxiI

ff

L=114,0 % .

3. Datele privind exporturile celor două agenţii ale firmei A&B, privind două noi produse introduse pe piaţă timp de douǎ trimestre sunt următoarele: Tabel nr. 5.2

Preţ unitar (€) Structură vânzǎri(%) Preţuri medii (p= p gi i∑ ) Agenţia

p0 p1 g0 g1 p0g0 p0g1 p1g0 p1g1

A 5 4 0,4 0,2 2,0 1,0 1,6 0,8 B 8 10 0,6 0,8 4,8 6,4 6,0 8,0

TOTAL - - 1,0 1,0 6,8 7,4 7,6 8,8 a. Care sunt valorile pentru indicele preţului mediu sub influenţa concomitentǎ a preţurilor şi structurii, indicele preţului mediu sub influenţa preţurilor şi indicele preţului mediu sub influenţa structurii. b. Determinaţi influenţele absolute şi contribuţia procentuală a celor doi factori (preţul individual şi structura vânzărilor), în variaţia preţului mediu. Rezolvare:Preţul mediu este expresia raportării vânzărilor la cantităţile totale:

v pq qp = = = p = pg

q q q

∑ ∑ ∑ ∑∑ ∑ ∑

.Apoi se preia informaţia structurală g =∑q

q

exprimată prin intermediul coeficienţilor. Astfel, se deduc preţurile medii apelând la produsele preţ şi structură (pg), agregate (Σ pg):

• 0 0 0p = p q⋅∑ = 6,8 € (preţul mediu al perioadei de bază),

• =⋅=∑ 1001 qpp 7,4 € (preţul mediu al perioadei de bază cu structura

vânzărilor din perioada curentă),

Page 100: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

94

• =⋅=∑ 0110 qpp 7,6 € (preţul mediu al perioadei curente cu structura

vânzărilor din perioadei de bază), • =⋅=∑ 111 qpp 8,8 € (preţul mediu al perioadei curente).

Indicii preţului mediu sunt construiţi ca raporturi de medii. Indicele preţului mediu sub influenţa preţurilor şi structurii, cunoscut ca indice cu structură variabilă este:

1 1 0 0 1 1

1 0 0 0

1

0

( , )1/0

8,8: 100 100 100 129, 4%

6,8100p p g p q p q p g

q q p g

p

pI × = × = × ≈= × = ∑ ∑ ∑

∑ ∑ ∑

Indicii preţului mediu sub influenţă preţurilor şi a structurii sunt indicii cu structură fixă (ISF) şi ai variaţiei structurale (ISV).

1 1 0 1 1 11

1 1 0 101

( )1/0

8,8100 : 100 100 100 118,9%

7,4p p p q p q p gp

q q p gpI × = × = × = × ≈= ∑ ∑ ∑

∑ ∑ ∑=(ISF)

0 1 0 0 0 101

1 0 0 00

( )1/ 0

7, 4100 : 100 100 100 108,8%

6,8p g p q p q p gp

q q p gpI × = × = × = × ≈= ∑ ∑ ∑

∑ ∑ ∑=(IVS)

Întotdeauna: ( , ) ( ) ( )1/0 1/0 1/0p p g p p p gI I I= × sau ISV=ISF×IVS. Modificările absolute cauzate

de variaţia preţurilor individuale şi de variaţia structurii sunt prezentate detaliat. Modificarea concomitentă a celor doi factori este:

1 1

1 1 0 0

0 0

( ) ( , )1/0 8,8 6,8 2SV

p pg p p gp gI I p g p g

p g= = ⇒ ∆ = − = − =∑ ∑ ∑

∑€

Modificarea exclusivă a preţurilor reprezintă:

1 1

1 1 0 1

0 1

( ) ( )1/0 8,8 7,4 1,4SF

p p p pp gI I p g p g

p g= = ⇒ ∆ = − = − =∑ ∑ ∑

∑€

Modificarea exclusivă a structurii de vine egală cu:

0 1

0 1 0 0

0 0

( ) ( )1/0 7, 4 6,8 0,6VSp g p gp g

p g p gp g

I I ⇒ ∆ = − = − == = ∑ ∑ ∑∑

Întotdeauna: ( , ) ( ) ( )p p g p p p g∆ = ∆ + ∆ sau VSSFSV ∆+∆=∆ .Cum variaţia totală a

preţului mediu a fost ( , ) 2p p g∆ = € rezultă că variaţia preţurilor a contribuit cu ( )

( , )

1,4100 100 70 %

2,0

p p

p p g

∆× = × =

∆ şi variaţia structurii cu

( )

( , )

0,6100 100 30 %

2,0

p g

p p g

∆× = × =

∆.

4.S-au dat publicitǎţii urmǎtoarele date, pentru două regiuni: Tabel nr. 5.3

Anul 0 Anul 1 Venitul nominal minim lunar în sute de euro 5 6 Structura cheltuielilor de consum (coeficienţi de ponderare) -%- - mărfuri alimentare – cpA 55,0 60,0 - mărfuri nealimentare – cpN 30,0 26,0 - servicii – cpS 15,0 14,0

Page 101: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

95

Indicele preţurilor bunurilor de consum (IPC) -%- - mărfuri alimentare – iA - 150,0 - mărfuri nealimentare – iN - 120,0 - servicii – iS - 140,0 a) Determinaţi IPC, pornind de la indicii individuali şi structura consumurilor. b). Calculaţi şi comentaţi dinamica reală a venitului nominal minim lunar. c) Aflaţi diferenţa dintre IPC şi ICV. Rezolvare: Indicele preţurilor de consum în formula Laspeyres

pLI = 1 0

0 0

p q

p q

∑∑

=

1

0 0

0

0 0

pp q

p

p q

∑= 0 0

0 0

1/0pi p q

p q

∑∑

unde pi 0/1 sunt indicii iA , iN , iS,iar

0 0

0 0

p q

p q∑ reprezintă coeficienţii de ponderare ai cheltuielilor din perioada 0.

plI =

2

150 55

100

×+

2

120 30

100

×+

2

140 15

100

×=

2

13950

100=1,395 ( % =139,5)

Nivelul şi dinamica reală a venitului minim lunar

Nivelul real= Nivelul nominal

IPC=

6

139,5=4,3 sute euro.

Dinamica este conferită de indicele individual al celor două valori exprimate în

preţurile aceluiaşi an: 1/0veniti =

4,3

5x 100 = 86,0 %.Confruntat cu un IPC de 139,5

%,nivelul venitului minim lunar deşi prezenta o creştere aparentă de 20% (6/5x100=120,0%), în termeni reali sau comparabili, acelaşi venit minim s-a diminuat cu numai 14%. La acelaşi rezultat se ajunge şi prin raportarea celor doi indici, respectiv a indicelui dinamicii venitului minim lunar la IPC:

IVenit minim real = VENITNOMINALI 120, 0

=IPC 139,5

x100 = 86,0 %.

Aplicaţia permite şi calculul indicelui costului vieţii (în formula Paasche) astfel:

ppI =∑∑

10

11

qp

qp= 1 1

1 1

1 0

1

/

p q

p qp p

∑= 1

1

1/ 0

1p

v

vi

∑=ICV

Ïn formulă se înlocuiesc datele din aplicaţie, unde pi 0/1 sunt indicii iA , iN , iS , iar

structura curentă a cheltuielilor de consum este alcătuită din coeficienţii de ponderare obţinuţi la nivelul anului 1.

IPC =

1 1

1/0

11p p q

i∑x100=

1

1 1 1× 0, 6 + × 0, 26 + × 0,14

1, 5 1, 2 1, 4

×100=139,53 %

Page 102: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

96

Diferenţa dintre IPC şi ICV este egală cu 139,5 % - 139,53 %= - 0,03%. C) Aplicaţii propuse spre rezolvare 1.Completaţi informaţiile ce lipsesc despre evoluţia activităţii unui agenţii specializate în vânzările de autoturisme, pentru următorii cinci ani: Tabel nr. 5.4

Anul Cifra de afaceri ( sute de mii € )

Indicele volumului fizic

( qttI 1/ − ) -%-

Indicele preţurilor

( pttI 1/ − ) -%-

T 10,8 105,0 102,0 T+1 11,9 108,4 T+2 14,4 100,0 T+3 16,2 90,0 T+4 20,0 125,0

2.La nivelul firmei X se cunosc datele de mai jos privind vânzările în două semestre ale anului curent: Tabel nr.5.5

Valoarea vânzărilor (mii lei) Denumirea produsului Sem. I Sem. II

Indice de volum fizic (%)

Interfon „A” 500 550 114,0 Interfon „B” 1200 1800 120,0 Interfon „C” 1000 1000 156,0

a. Să se calculeze indicii individuali ai volumului valoric şi ai preţurilor.b.Să se determine indicii de grup sau sintetici ai volumului valoric,fizic şi ai preţurilor.c.Să se măsoare contribuţia factorului calitativ şi cantitativ în modificarea totală a vânzărilor. 3. Despre exporturile firmei Y s-au obţinut urmǎtoarele informaţii în douǎ trimestre succesive şi pentru cele trei agenţii deţinute. Datele sunt prezentate în continuare: Tabel nr. 5.6

Preţ unitar ( € / produs) Structura vânzărilor % Agenţia p0 p1 g0 g1

„A” 70 50 0,45 0,60 „B” 60 60 0,25 0,25 „C” 80 100 0,30 0,15

TOTAL - - 1,00 1,00 a. Să se determine preţul mediu în cele două trimestre. B. Să se determine indicele preţului mediu (ISV ), indicele preţului mediu sub influenţa preţurilor (ISF ) şi sub influenţa structurii (IVS,), influenţele absolute (∆ ) şi contribuţia procentualǎ a celor doi factori. 4. Exporturile pentru trei produse, în două luni succesive au fost următoarele: Tabel nr.5.7

Preţul unitar ( € ) Cantitatea (mii produse) Produs p0 p1 q0 q1

A 100 120 200 180 B 200 160 300 500 C 140 140 500 620

Determinaţi indicii individuali ai vânzărilor, preţurilor şi cantităţilor, cei sintetici agregaţi, conform Laspeyres, Paasche şi Fisher, dar şi indicele vânzărilor totale.

Page 103: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

97

5. În care din următoarele două regiuni dinamica prognozată a câştigului minim lunar este mai avantajoasă pentru locuitorii săi ? Tabel nr. 5.8

ANUL T T + 1

Reg X Reg Y Reg X Reg Y Câştigul salarial lunar – sute euro 6,0 5,8 6,6 6,38 Structura cheltuielilor de consum (coeficienţi de ponderare) -%- • mărfuri alimentare – cpA 43,0 46,0 40,0 45,0 • mărfuri nealimentare – cpN 35,0 30,0 32,0 33,0 • servicii – cpS 22,0 24,0 28,0 22,0 Indicele preţurilor bunurilor de consum (IPC) -%- • mărfuri alimentare – iA - - 130,0 120,0 • mărfuri nealimentare – iN - - 140,0 110,0

• servicii – iS - - 120,0 130,0

a.Să se afle diferenţa dintre indicele preţurilor în formula Laspeyres şi Paasche. b.Comentaţi dinamica reală a câştigului salarial,după cele două formule de calcul.

5.7 Rezumat Conceptul de indice este relevat de o metodă generală de descompunere şi analiză factorială şi utilizat în practică majoritar ca sistem. Funcţiile cognitive ale indicilor statistici reflectă calităţile metodei indicilor în a simplifica cunoaşterea unui fenomen economic: indică nivelul noului program în raport cu nivelul realizat anterior, caracterizează gradul de îndeplinire a unui program, măsoară variaţia fenomenelor în timp şi spaţiu, explică influenţa factorilor asupra unui fenomen complex, contribuie în mod esenţial la omogenizarea unor populaţii eterogene, asigură comparabilitatea unor serii de date, ale căror valori caracteristice prin unităţile de măsură specifice sunt valori absolute aparent de necomparat. Indicii prezintǎ cele mai variate criterii de clasificare, de la natura comparaţiei sau felul variaţiei, la sfera de cuprindere, de la baza de raportare, la natura ponderilor utilizate, de la natura fenomenului studiat, la sistemul de ponderare căruia îi aparţine. ponderilor utilizate, de la natura fenomenului studiat, la sistemul de ponderare căruia îi aparţine. Istoria indicilor se desfăşoară pe o perioadă de peste trei sute de ani. Doi indici impuşi de şcoala germană de statistică rămân şi astăzi limitele de construcţie ale sistemelor de ponderare: indicele lui Etienne Laspeyres (1864), folosind perioadei de bază ca pondere şi indicele lui Hermann Paasche (1874), utilizând perioada curentă drept pondere: Etienne Laspeyres Hermann Paasche

∑∑=

00

010/1 fx

fxLx şi 0 1

1/ 00 0

f x fL

x f= ∑∑

∑∑=

10

110/1 fx

fxPx şi 1 1

1/01 0

f x fP

x f= ∑∑

Media aritmetică simplă a indicilor Laspeyres şi Paasche este cunoscută drept indicele Sidgwik-Drobisch, iar media aritmetică a cantităţilor indicele Marshall -Edgeworth sau Bowley-Edgeworth. Media geometrică a cantităţilor din cele două perioade transformată în pondere devine indicele Walsh. Media geometrică simplă a indicilor Laspeyres şi Paasche

este cunoscută ca indice Fisher (1922): x0/1

x0/1

x0/1 PLF ×= şi f

0/1f

0/1f

0/1 PLF ×= .

Principalele sisteme concrete de indici sunt cele referitoare la vânzări la valoarea exprimatǎ

Page 104: Statistic A

Metoda indicilor şi măsurarea inflaţiei în economie Capitolul 5

98

în raport cu preţul şi cantitatea efectivǎ, la producţie în funcţie de productivitate şi personal, la producţie în funcţie de eficienţa activelor imobilizate şi valoarea lor şi la fondul de salariu în raport cu salariul nominal şi numărul salariaţilor .Se disting ca modele generale sistemul de indici ai valorii şi sistemul de indici ai preţului mediu, în funcţie de evoluţia preţurilor individuale şi a structurii vânzărilor Într-un proces minimal de construcţie reală se recomandă parcurgerea următoarelor etape: identificarea corectă a unităţii de observare, respectiv a variaţiei; identificarea factorilor calitativi (x) şi a celor calitativi (f); analiza şi evaluarea posibilităţilor de agregare a factorului cantitativ; alegerea corespunzătoare a bazei de raportare ca nivel spaţial sau temporal; schimbarea bazei îmbătrânite sau a bazei lipsite de comparabilitate; alegerea formulei de calcul a indicilor; selectarea tipului adecvat de indice sintetic (medie,raport de medii sau indice agregat); alegerea sistemului de ponderare; racordarea periodică a construcţiilor de sisteme de indici. Metoda indicilor şi-a câştigat un loc important şi binemeritat în analiza, ca şi în descompunerea variaţiei unui fenomen complex, pornind de la factorii de influenţă ai acestuia, cu precădere datorită simplităţii sale. Dacă modelul analizat este multiplicativ, descompunerea variaţiei prin metoda indicilor se regăseşte sub forme diferenţiate ca: metoda bifactorială (metoda substituirii în lanţ–MSL şi metoda restului nedescompus –MRN), metoda multifactorială. Indicele interpret are următoarele caracteristici: a) este un instrument de măsură care furnizează o estimare a evoluţiei preţurilor (bunurilor de consum în IPC, industriale în IPPI); b)înregistrează bunurile înstrăinate şi serviciile prestate (respectiv preţuri şi tarife efectiv practicate); c)determină modificarea preţurilor între o perioadă fixă (de bază) şi una variabilă (curentă). Cei mai utilizaţi indici sunt IPC, IPPI, ICV, IVU, Indice deflator al PIB.

Page 105: Statistic A

Regresie şi corelaţie statistică Capitolul 6

99

Tema 6 REGRESIE ŞI CORELA ŢIE STATISTIC Ă CUPRINS: pag. 6.1 Legătura statistică – noţiuni şi clasificare 99 6.2 Regresie statistică 101 6.3 Corelaţie statistică 106 6.4 Test de autoevaluare şi aplicaţii 112 6.5 Rezumat 115 Obiective:. Obiectivul esenţial al temei este legat de însuşirea metodei regresiei şi corelaţiei. Identificarea legăturilor statistice între fenomenele economice se transpune în înţelegerea şi abstractizarea unei forme de realitate superioarǎ a vieţii economice. Investigaţia prin metoda regresiei şi corelaţiei debutează cu intuiţia grafică şi este urmată de aplicarea metodei celor mai mici pătrate, combinată şi finalizată cu abstractizarea succesivă a factorilor conform principiul stabilităţii anumitor elemente ale analizei statistice (caeteribus paribus). Rolul regresiei sau este completat de capacitatea de analiză multicauzală a corelaţiei. Determinaţia se împleteşte cu nedeterminaţia, parţialitatea cu eroarea şi rezidualitatea în înţelegerea profundă a fenomenului economic. Dobândirea de competenţe privind identificarea existenţei, sensului şi intensităţii legăturilor statistice şi capacitatea de a interpreta valorile unor indicatori speciali (coeficient de regresie şi de corelaţie, raport de corelaţie şi determinaţie) sunt elemente de mare impact în formarea studenţilor. Timpul alocat temei: minim 4 ore - maxim 6 ore Bibliografie Biji,M., Biji,E.,Lilea,E, Anghelache,C.,Tratat de statistică, Ed.Economică,Bucureşti, 2002. Isaic-Maniu, Al., (coord), Dicţionar de statistică generală, Ed.Economică, Bucureşti, 2003. M.Korka,L.,Begu,E.Tusa,Bazele statisticii pentru economişti, Ed.Tribuna Economică, 2002 C., Moineagu, I., Negură, V., Urseanu, Statistica, Ed.ştiinţifică, Bucureşti,1976. G. Săvoiu, Statistică generală.Argumente în favoarea formării gândirii statistice, Ed. Independenţa Economicǎ, Piteşti, 2003. G. Săvoiu, Statistică aplicată în domeniul economic şi social. Elemente teoretice, teste tip grilă, aplicaţii şi studii de caz, Ed. Independenţa Economicǎ, Piteşti, 2004. G. Săvoiu, Statistica.Un mod ştiinţific de gândire, Ed.Universitară, Bucureşti, 2007. G. Săvoiu, Statistica.Mod de gândire şi metode, Ed.Universitară, Bucureşti, 2009. V.Trebici, Mica enciclopedie de statistică,Ed.ştiinţifică şi enciclopedică,Bucureşti, 1985. M. Ţarcă,Tratat de statistică aplicată, Ed. didactică şi pedagogică R.A. Bucureşti, 1998. Webografie ***http://www. insse.ro şi ***http://epp.eurostat.ec.europa.eu/ şi *** http://www. bnr.ro

6.1 Legătura statistică – noţiuni şi clasificare

În varianta extinsă sau generalizată, legătura statistică a două sau mai multe variabile reprezintă influenţa unidirecţională sau reciprocă, manifestată prin dependenţe sau interdependenţe, care conduc la schimbarea nivelului de dezvoltare final. Această variaţie unidirecţională sau reciprocă poate fi numită, fie variaţie a caracteristicii dependente în raport cu o altǎ caracteristicǎ independentă, fie covariaţie sau legătură prezentă între cele două variabile. Variabila independentă

Page 106: Statistic A

Regresie şi corelaţie statistică Capitolul 6

100

este numită explicativă, cauzală sau factorială, în timp ce variabila dependentă apare ca rezultativă, explicată sau ca efect. Legăturile sau covariaţiile dintre diverse fenomene sau procese din natură şi din societate se află sub o permanentă influenţă a legilor dinamice sau de tip statistic. O lege dinamică, transpusă simplificat, generează o legătură dinamică (cauzală), sintetic exprimată prin afirmaţia: unei cauze xi îi corespunde un efect yi, respectiv unui nivel xi îi corespunde un anumit nivel yi . O lege de tip statistic, esenţializată într-o legătură de tip statistic, este caracterizată prin formularea: variabila yi depinde de mai multe cauze x1,x2,…,xi …,xn. Rezultă că legea statistică este caracterizată de o relaţie de multicauzalitate, unele variabile explicative, independente, factoriale deţinând un caracter esenţial, altele unul întâmplător.Legătura dinamică dintre x şi y devine matematic o funcţie univocă sau unifactorială yi= f(xi), în timp ce legătura statistică se transformă într-o funcţie multifactorială yi = f(x1, x2,…, xi,…,xn).În mod concret, conţinutul relaţiilor existente între familia factorilor explicativi x1,x2,…,xi…,xn şi efectul yi descrie: a) o dependenţă statistică (legătură univocă sau dinamică); b)o interdependenţă statistică (legătură biunivocă); c) o interdependenţă falsă (aparentă), care dezvăluie în profunzime o cauză comună; d) o dublă dependenţă compensată al rezultat final asupra lui y este nul; e) descrie un simplu paralelism variaţional între cele două variabile, ce lasă impresia unei legături statistice (xk nefiind un factor al lui y). Dintre cele cinci cazuri descrise, numai primele două merită şi pot fi caracterizate numeric, pentru a intensifica gradul de cunoaştere al variaţiei lui yi, în raport cu factorii x1,x2,…,xi,…,xn . Cazurile c, şi d nu precizează pentru moment informaţii cantitative relevante, iar cazul e este tipic pentru un paralelism variaţional de scurtă sau lungă durată, lipsit de semnificaţie în aprofundarea variaţiei lui yi.În cazul unui asemenea conglomerat dinamic de factori nu este posibil ca relaţia dintre cauză şi efect să poată fi constatată la fiecare manifestare (xi→yi). Relaţia dintre variabila explicativă şi variabila explicată poate fi însǎ sesizată ca o tendinţă medie specifică unui număr suficient de mare de manifestări, elemente, indivizi. Analiza legăturilor şi stabilirea unei regresii sau corelaţii dă rezultate bune atunci când: a) există un număr suficient de mare de cazuri individuale (perechi xi, yi); b) distribuţia abaterilor este o distribuţie normală sau aproximativ normală; c) abstractizarea factorilor se realizează succesiv. Legătura statistică, în forma ei generic numită corelaţie statistică, reprezintă deci o reflectare într-o formă numerică adecvată a interdependenţei dintre fenomenele, procesele, indicatorii diverselor fenomene cercetate, în ceea ce priveşte natura, forma, direcţia (sensul) şi gradul de intensitate. Tipologia legăturilor statistice este una dintre cele mai diverse, având la bază o gamă variată de criterii. Principalele clasificări se realizează în raport de: a) natura relaţiei de cauzalitate [legături funcţionale, univoce sau de cauzalitate simplă de tipul yi=f(xi),precum şi legături statistice (stohastice sau multicauzale) de tipul yi= f(x1,x2,...,xi…,xn )]; b) numărul caracteristicilor factori sau al variabilelor luate în analiză (legături statistice simple, în care apare o singură variabilă rezultativă, dependentă, explicativă sau efect yi şi se abstractizează sau se izolează din mulţimea de cauze posibile numai una singură xi, numită şi variabilă independentă sau explicativă,

Page 107: Statistic A

Regresie şi corelaţie statistică Capitolul 6

101

precum şi legături statistice multiple, în care efectul yi este rezultatul a două sau mai multe variabile factoriale, cauzale concomitente sau asincrone); c) tipul şi natura caracteristicilor (legături referitoare exclusiv la variabilele cantitative şi asociaţii statistice, nerestricţionate dar specifice celor calitative); d) forma legăturii dintre variabile [legături liniare exprimate prin ecuaţia unei drepte (yi=a+bxi) şi legături curbilinii, exprimate prin ecuaţia unei funcţii

exponenţiale (yi=abx), parabolice (yi= a+bxi+2icx ), hiperbolice (yi=a+b 1

xi

) etc. ];

e) direcţia sau sensul în care se produc (legături directe sau de acelaşi sens şi legături inverse sau de sens contrar); f) timpul efectiv în care se realizează (legături sincrone sau concomitente şi legături asincrone sau cu decalaj); g) conţinutul relaţiei dintre variabile (dependenţe şi interdependenţe).

În lipsa unor serii lungi de date, în practica statistică dependenţele şi interdependenţele false, compensate sau paralele - cu sensul de legǎturi artificiale- se lasă greu identificate sau descoperite şi necesită alături de testări semnificative şi o analiza conceptuală, structurală şi funcţională economică şi socială.

6.2 Regresie statistică În mod curent, pentru identificarea şi caracterizarea sumară a legăturilor

statistice se utilizează următoarele metode elementare: metoda seriilor paralele interdependente, metoda grupării, metoda tabelului de corelaţie, metoda grafică sau corelograma, ultima fiind cea mai des folosită. Prima utilizare a conceptului de origine latină regresie (regressio = întoarcere) aparţine lui Francis Galton şi a apărut în Regression toward mediocrity in hereditary stature (1886), din lucrarea Natural inheritance (1889), unde cu ajutorul tabelului de corelaţie şi al seriilor de medii legate, prezintă rezultatele prelucrării observaţiilor culese despre înălţimea părinţilor şi înălţimea fiilor acestora în 928 cazuri, postulând existenţa unei regresii către valoarea medie: din părinţi cu talie superioară regresează copii cu talie inferioară şi invers.De aici au apărut două aspecte majore în teoria regresiei:ecuaţia matematică a regresiei şi intensitatea diferită a tendinţei de regresie, în grupuri diferite. Răspunsul matematic avea să fie dat de către Karl Pearson, la primul aspect prin indicarea funcţiei liniare simple ca fiind singura adecvată problemei lui Francis Galton şi la al doilea aspect prin introducerea celebrului său coeficient de corelaţie. În anul 1909, G.U.Yule a propus, în locul termenului de regresie, impropriu utilizat, un altul de estimare sau de ecuaţie de estimare. S-a constatat însă, că încercarea era tardivă, termenul de regresie intrase şi se extinsese rapid în gândirea statistico-matematică, conform expresiilor analiza de regresie, ecuaţia de regresie, linia de regresie, coeficientul de regresie etc. Regresia statistică sau metoda regresiei selectează funcţia, ce aparţine unei clase de funcţii matematice, care realizează cea mai bună descriere a variaţiei lui yi, bazându-se pe relaţia existentă între xi şi yi, o relaţie liniară de tipul yi=a+bxi.Determinarea rapidă a parametrilor regresiei liniare se realizează prin intermediul metodei celor mai mici pătrate. Metoda este aplicabilă numai acelor funcţii care sunt de formă polinomială

Page 108: Statistic A

Regresie şi corelaţie statistică Capitolul 6

102

sau pot fi aduse la o formă polinomială printr-un artificiu de calcul. Prin mulţimea punctelor care alcătuiesc corelograma sau diagrama de corelaţie se pot trasa practic o infinitate de drepte aparţinând aceleiaşi clase de funcţii. Pentru a determina parametrii funcţiei care se apropie cel mai mult de mulţimea punctelor din grafic se recurge la minimizarea sumei pătratelor diferenţelor dintre punctele graficului Pi(xi,yi) şi punctele situate pe dreapta de regresie Pi(xi, yi = a+bxi). În ipoteza avansată a unei legături liniare (yi depinzând liniar de xi), respectiv yi = y(xi) = a +

bxi, condiţia matematică impusă devine: 2( )( )

ii xy y−∑ =minim, echivalentă

practic cu: 2( )i if y a bx= − −∑ = minim. Pentru a stabili valoarea parametrilor a

şi b care definesc ecuaţia regresiei liniare, minimul funcţiei f se obţine calculând derivatele (parţiale) de ordinul întâi în raport cu cei doi parametrii menţionaţi, derivate ce sunt egalate cu „zero”:

2 ( )( 1) 0i i

fy a bx

a

∂ = − − − =∂ ∑

2 ( )( ) 0i i

fy a bx b

b

∂ = − − − =∂ ∑

Apoi, simplificând cu 2, înmulţind cu cei doi coeficienţi (-1) şi (-xi) şi însumând ecuaţiile pentru toate valorile caracteristicilor xi şi yi se obţine sistemul:

1 1 1

0n n n

i ii i i

a bx y= = =

+ − =∑ ∑ ∑ 1 1

n n

i ii i

na b x y= =

+ =∑ ∑

2

1 1 1

0n n n

i i i ii i i

ax bx x y= = =

+ − =∑ ∑ ∑

2

1 1 1

n n n

i i i ii i i

a x b x x y= = =

+ =∑ ∑ ∑

Apelând la metoda determinanţilor, sistemul va avea următoarele soluţii redactate simplificat, fără a se mai preciza operatorului sumǎ („Σ”) limitele:

2 2

2 2

2

det

( )d e t

y xi ix y x y x x x yi i i i i i i ian xi n x xi ix xi i

∑ ∑ −∑ ∑ ∑ ∑ ∑ ∑ = =

∑ −∑ ∑ ∑ ∑

2 2

2

det

( )det

n yix x y n x y x yi i i i i i ibn xi n x xi ix xi i

−∑ ∑ ∑ ∑ ∑= =

∑ −∑ ∑

∑ ∑

Ecuaţia de regresie căutată yi = a + bxi este identică, în final, cu:

2

2 2( )i i i i i

ii i

y x x x yY

n x x

× − ×= + × −

∑ ∑ ∑ ∑∑ ∑ 2 2( )

i i i ii

i i

n x y x yX

n x x

× − × × −

∑ ∑ ∑∑ ∑

Page 109: Statistic A

Regresie şi corelaţie statistică Capitolul 6

103

Parametrul a este lipsit de semnificaţie, în schimb b sau coeficientul de regresie arată sensul („+” sau „-”) şi mărimea influenţei lui xi asupra lui yi, respectiv sensul şi mărimea reacţiei finale a lui yi la modificarea cu o unitate a lui xi: a) când b > 0 există o legătură directă; b) când b = 0 nu există nici o legătură; c) când b < 0 există o legătură indirectă. De multe ori, apar diferenţe între valorile reale yi şi valorile teoretice

ix iY a bx= + , pentru acelaşi nivel al variabilei cauzale xi, diferenţe care

exprimă efectul celorlalţi factori (secundari), ce perturbă relaţia dintre xi şi yi. Ca urmare funcţia de regresie liniară

ix iY a bx= + sau f(xi)= ia bx+ exprimă tendinţa

medie de modificare liniară a lui yi în funcţie de xi. fiind dreapta care se apropie cel mai mult de norul de puncte pe care îl traversează în corelograma sa specifică. Pentru a evalua capacitatea unei funcţii liniare de a caracteriza variaţia lui yi în raport cu xi se utilizează unul din cei doi indicatori de apreciere a calităţii funcţiei de regresie: coeficientul de determinaţie D şi coeficientul de eroare e.

( )( )

2

21 100ii x

i

y YD

y y

− = − × −

,unde D ∈ (0,100%).Cu cât D este mai apropiat ca valoare de 100%, cu atât funcţia de regresie liniară

ix iY a bx= + descrie mai fidel variaţia lui yi. Valoarea lui

D(%) exprimă procentual acea parte din variaţia lui yi care este surprinsă sau cuprinsă în funcţia de regresie liniară

ix iY a bx= + , adică este explicată prin

influenţa lui xi. Coeficientul de eroare se determină similar coeficientului de

omogenitate, ( )2 / 100Co xσ= × , cu referire la dispersia dintre punctele reale şi

cele teoretice situate pe dreapta ix iY a bx= + :

( )2

1 00

y Yxi iniy

e

−∑

= × ,unde e ∈ (0,100%).

Cu cât e se apropie de valoarea „zero”, cu atât este mai corectă descrierea mulţimii de valori reale ale lui yi prin intermediul funcţiei de regresie liniare

ix iY a bx= + .

Tipul de legătură statistică descrisă anterior este o regresie liniară simplă. Complexitatea fenomenelor şi proceselor analizate conduce la identificarea de legături liniare multiple, funcţia de regresie liniară multiplă având la bază o relaţie cauzală multifactorială (sub acţiunea celor m factori determinanţi):

0 1 1 2 2 ..., ,...1 2 m mY a a x a x a xx x xm= + + + + , unde:

a0 –exprimă influenţa altor factori (secundari) cu acţiune constantă în afara celor m factori analizaţi şi cuprinşi în relaţia de calcul şi a1,a2,…,am –reprezintă coeficienţii

Page 110: Statistic A

Regresie şi corelaţie statistică Capitolul 6

104

de regresie liniară multiplă şi exprimă cu cât a reacţionat în final variabila yi la modificarea cu o unitate a valorii variabilelor xi corespondente (x1,x2,…xm).

Legătura liniară multiplă se transpune grafic sub forma unei suprafeţe multidimensionale, determinarea parametrilor a1,a2,…,am, valorificând aceeaşi metodă a celor mai mici pătrate, prin condiţia de minim a funcţiei:

( )2( ) , ,...,1 21

nf x y Yx x xi mj

= −∑=

= minim şi înlocuind pe

0 1 1 2 2 ..., ,...1 2 m mY a a x a x a xx x xm= + + + + se obţine

( )2

0 1 1 2 21

( ) ...n

i j j m mjj

f x y a a x a x a x=

= − − − − −∑ = minim

Calculând apoi derivatele de ordinul întâi (parţiale), derivate ce sunt egalate în final cu „zero”, se obţine sistemul de ecuaţii:

0 1 11 1 1

20 1 1 1 1 11 1 1 1

20 1 11 1 1 1

n n nna a x a x ym mj jjj j j

n n n na x a x a x x y xm mj jj j j jj j j j

n n n na x a x x a x y xmmj mj mj j mjjj j j j

+ + + =∑ ∑ ∑= = =

+ + + ⋅ = ⋅∑ ∑ ∑ ∑= = = =

+ ⋅ + + ⋅∑ ∑ ∑ ∑= = = =

=

K

K

M

K

Sistemul conţine „m+1” ecuaţii normale şi se soluţionează prin diverse metode clasice (metoda Cramer, metoda simplex etc.). După identificarea, parametrizarea şi aprecierea calităţii unei funcţii liniare de regresie se impune evaluarea finală a intensităţii legăturii statistice.Pentru gândirea econometrică a stabili cât de puternică sau cât de intensă este o legătură statistică este mai ales o problemă de veridicitate (verosimilitate) a modelului ce descrie dependenţa sau interdependenţa unor fenomene reale. O intensitate puternică este echivalentă cu un nivel de încredere ridicat în deciziile ulterioare ce vor fi bazate pe funcţia teoretică identificată şi parametrizată. Pentru a măsura intensitatea legăturii se determină covarianţa şi coeficientul de corelaţie, iar pentru verificarea liniarităţii se apelează şi la raportul de corelaţie. Covarianţa, notată cov(x,y), se determină ca medie aritmetică a produselor abaterilor individuale ale variabilelor faţă de media lor:

( )( )1 1cov( , )

x y i i

n n

i id d x x y y

x yn n

= =− −

= =∑ ∑

Prelucrând relaţia anterioară în care: ( )( ) 1 1

1 1

i i

i i i i

n n

n ni i

i i

x yx x y y x y

n= =

= =− − = −

∑ ∑∑ ∑ se

Page 111: Statistic A

Regresie şi corelaţie statistică Capitolul 6

105

ajunge la: cov( , )x y x yi i i ix y xy x yn n n

∑ ∑ ∑= − × = − ×

Covarianţa este aşadar egală şi cu diferenţa dintre media produsului celor două

variabile (xy) şi produsul celor două medii (x y× ) şi beneficiază de proprietăţi importante. Astfel, semnul covarianţei arată sensul legăturii, iar valoarea „zero” indică inexistenţa acesteia (independenţa variabilelor). Limitele valorice ale covarianţei sunt: -σx σy ≤ cov(x,y) ≤ σx σy , deoarece covarianţa are ca maxim produsul σx σy (atunci când între variabile există o legătură liniară funcţională). Aprecierea intensităţii rezultatului obţinut drept covarianţă rămâne însă dificilă, deoarece valoarea acesteia diferă de la o aplicaţie la alta.Dacă relaţia anterioară se împarte la produsul σx σy se va obţine:

cov( , )x y x y

x y x y x y

x yσ σ σ σσ σ σ σ σ σ

− ≤ ≤ sau cov( , )

1 1x y

x y

σ σ− ≤ ≤

Această nouă relaţie stabilizează sau limitează noul indicator obţinut în intervalul [-1,1]. Parametrul rezultat este denumit coeficient de corelaţie (ry/x):

cov( , )/

x yry x x yσ σ

= = ( )( )

( ) ( )1 1 1 1 1

2 22 2

1 1 1 1

n n n n nd d x x y y n x y x yx y i i i i i ii i i i i

n n n n n nx y x yn x x n y yi i i ii i i i

σ σ σ σ

− − −∑ ∑ ∑ ∑ ∑= = = = == =

− −∑ ∑ ∑ ∑= = = =

Dualitatea în regresie permite calculul coeficientului de regresie pe baza mediei geometrice a coeficienţilor de regresie sau a pantelor celor două drepte de regresie:

/ix y x iY a b x= + × şi /iy x y iX a b y= + × , respectiv: / / /r b by x y x x y= × .

O soluţie practică este şi relaţia de calcul: ( )// /r b x yy x y x σ σ= × , dacă se dispune

cu promptitudine de xσ şi yσ . Coeficientul de corelaţie (ry/x), ca parametru al

distribuţiilor normale bidimensionale ce caracterizează legătura între variabila explicativă xi şi variabila rezultativă yi aparţine intervalului [-1,0) ∪ (0,1]. Pentru ry/x=0 nu există legătură statistică, variabilele xi şi yi fiind independente. Interpretarea unui coeficient de corelaţie se realizează succint în modul matematic

( /ry x ) şi conform acestei interpretări se consideră corecte următoarele afirmaţii:

1. când /ry x ∈(0;0,2] practic nu există legătură statistică sau este foarte slabă;

2. când /ry x ∈(0,2;0,5] legătura este slabă şi trebuie testată statistic;

3. când /ry x ∈(0,5;0,75] legătura este de intensitate medie;

Page 112: Statistic A

Regresie şi corelaţie statistică Capitolul 6

106

4. când /ry x ∈(0,75;0,95] legătura este puternică;

5. când /ry x ∈(0,95;1] legătura este foarte puternică,deterministă (funcţională).

O problemă importantă a regresiei liniare este testarea liniarităţii legăturii ca soluţie exclusivă, în raport cu orice altă funcţie neliniară (curbilinie). Testul de verificare a liniarităţii constă din confruntarea valorii coeficientului (ry/x) şi a raportului de corelaţie (Ry/x). Dacă cele două valori coincid (ry/x= Ry/x), atunci corelaţia este exclusiv de liniară. Raportul de corelaţie măsoară intensitatea legăturii indiferent de forma acesteia (liniară sau neliniară).Raportul de corelaţie (Ry/x) este rezultatul extragerii unui radical elementar (de ordin II ) din coeficientul de determinaţie (R

squared sau R2y/x):( )( )

2

2 1/ / 2

1

1

n

iy x y x n

i

y Yxi iR Ry yi

=

=

−∑= = −

−∑

sau /y xR D= , iar Ry/x ∈ (0,1].

Dacă ( )2

1

n

i xiiy Y

=−∑ tinde către „zero”, raportul de corelaţie tinde spre valoarea

maximă (Ry/x=1). Dacă ry/x ≠ Ry/x , atunci legătura nu este exclusiv de natură liniară.

6.3 Corelaţie statistică

Corelaţia statistică sau conceptul generic al legăturii statistice este reflectarea într-o formă numerică adecvată a interdependenţelor obiective dintre procese sau fenomene. Corelaţia include atât asocierea cât şi regresia, atât legătura liniară cât şi neliniară (curbilinie), atât legătura simplă, cât şi cea multiplă, atât parţială cât şi totală. Conceptul are o istorie iniţial legată de ştiinţele naturii. Termenul corelaţie, exprimă relaţia, legătura reciprocă între două sau mai multe lucruri sau fenomene. Etimologic provine din cuvântul de origine latină correlatio = relaţie cu, fiind preluat din ştiinţele naturii, de la principiul corelaţiei aşa acum a fost el formulat de către naturalistul francez Georges Cuvier (1769-1832): orice fiinţă înzestrată cu organe formează un ansamblu, un sistem unic şi închis, ale cărui părţi se leagă mutual şi concură la aceeaşi acţiune definitivă printr-o reacţie reciprocă. Nici una din aceste părţi nu poate să se schimbe fără ca celelalte să nu se schimbe, şi, prin urmare, fiecare din ele, luată separat, influenţează şi se leagă de toate celelalte. (P.Fouquié, R Saint-Jean-Dictionaire de la langue filosofique). Cea de-a două sursă aparţine lui Charles Darwin, care a folosit expresia variabilitate corelativă înţeleasă ca raporturi reciproce între părţi diverse ale organismului. Tot Francis Galton este cel care a transpus corelaţia cu semnificaţia de raporturi reciproce între variabile în statistica matematică: corelaţiile se observă peste tot unde variaţiile a două fenomene sunt datorate în parte uneia şi aceleiaşi cauze comune.(Correlations and their measurements).În practică, apar variate legături neliniare sau curbilinii specifice dependenţelor dintre variabila explicativă xi şi rezultativă yi. Dacă prin

corelogramă s-a identificat o hiperbolă: 1

ixi

Y a bx

= + , prin metoda celor mai mici

Page 113: Statistic A

Regresie şi corelaţie statistică Capitolul 6

107

pătrate rezultă: ( )2

1

n

i xii

y Y=

−∑ =minim ⇔2

1

1i

i

n

i

y a bx=

− +

∑ =minim, iar sistemul de

ecuaţii util determinării lui a şi b este:

1

1 1

n nna b yii ixi

+ =∑ ∑= =

1 1 1

21 1 1

n n na b yii i ix xxi ii

+ =∑ ∑ ∑= = =

Soluţiile sistemului sunt cele prezentate în continuare:

1

det1 1 1 1 1

2 2

1 11 2( )2det

1 12

yi xi

y y yi i ix x xx xi i ii i

nnxx x ii i

x xi i

a

∑ ∑

∑ ∑ −∑ ∑ ∑ ∑

= =−∑ ∑∑

∑ ∑

d e t 1 1 1 1

1 11 2( )2

d e t1 1

2

n yi

y n y yi i ix x x xi i i i

nnxx x ii i

x xi i

b

∑ ∑ −∑ ∑ ∑

=−∑ ∑∑

∑ ∑

=

Raportul de corelaţie specific bazat pe o funcţie hiperbolică este egal cu:

( )

21

11/ 2

1

ny a bi xi iRy x n

y yii

− −∑=

= −−∑

=

În situaţia când corelograma identifică o funcţie exponenţială: Yxi = abxi funcţia este de forma: lgYxi = lga + xi lgb, care, prin metoda celor mai mici pătrate:

( )2

1i

n

i xi

y Y=

−∑ = minim ⇔2

1

i

nx

ii

y ab=

− ∑ = minim, conduce la următorul sistem

de ecuaţii normale necesar calcului parametrilor a şi b, prin valorile lg a şi lgb :

Page 114: Statistic A

Regresie şi corelaţie statistică Capitolul 6

108

1 1

lg lg lgn n

i ii i

n a x b y= =

+ =∑ ∑

2

1 1 1

lg lg lgn n n

i i i ii i i

x a x b x y= = =

+ =∑ ∑ ∑

Soluţiile sistemului sunt cele descrise în continuare:

lgdet 2 2lg lg lg

anti lg anti lg2 2( )

det 2

y xi i

x y x y x x x yi i i i i i i ian x n x xi i ix xi i

∑ ∑

∑ ∑ −∑ ∑ ∑ ∑= =

∑ −∑ ∑

∑ ∑

lgdet

lg lg lganti lg anti lg

2 2( )det 2

n yix x y n x y x yi i i i i i ibn x n x xi i ix xi i

∑ ∑ −∑ ∑ ∑= =

∑ −∑ ∑

∑ ∑

Raportul de corelaţie specific bazat pe o funcţie exponenţială este egal cu:

( )( )

2

11/ 2

1

n xiy abiiRy x ny yii

−∑== −

−∑=

Dacă funcţia identificată în corelogramă este o funcţie parabolică (de gradul al-II-

lea), 2

ix i iY a bx cx= + + , după aplicarea metodei celor mai mici pătrate:

( )2

1i

n

i xi

y Y=

−∑ = minim ⇔ ( ) 22

i i iy a bx cx − + + ∑ = minim,

se va obţine un sistem de trei ecuaţii, util determinării parametrilor a, b şi c:

2

1 1 1

n n n

i i ii i i

a b x c x y= = =

+ + =∑ ∑ ∑

2 3

1 1 1 1

n n n n

i i i i ii i i i

a x b x c x x y= = = =

+ + =∑ ∑ ∑ ∑

2 3 4 2

1 1 1 1

n n n n

i i i i ii i i i

a x b x c x x y= = = =

+ + =∑ ∑ ∑ ∑

Soluţiile sistemului sunt următoarele:

Page 115: Statistic A

Regresie şi corelaţie statistică Capitolul 6

109

2

2 3

2 3 4

2

2 3

2 3 4

det

det

i i i

i i i i

i i i i

i i

i i i

i i i

y x x

x y x x

x y x xa

n x x

x x x

x x x

=

∑ ∑ ∑∑ ∑ ∑∑ ∑ ∑

∑ ∑∑ ∑ ∑∑ ∑ ∑

,

2

3

2 2 4

2

2 3

2 3 4

det

det

i i

i i i i

i i i i

i i

i i i

i i i

n y x

x x y x

x x y xb

n x x

x x x

x x x

=

∑ ∑∑ ∑ ∑∑ ∑ ∑

∑ ∑∑ ∑ ∑∑ ∑ ∑

şi

2

2 3 2

2

2 3

2 3 4

det

det

i i

i i i i

i i i i

i i

i i i

i i i

n x y

x x x y

x x x yc

n x x

x x x

x x x

=

∑ ∑∑ ∑ ∑∑ ∑ ∑

∑ ∑∑ ∑ ∑∑ ∑ ∑

iar ( )

( )

2211/ 2

1

ny a bx cxi i iiRy x n

y yii

− − −∑== −

−∑=

Fiecare parametru a, b şi c se determină efectiv, utilizând regula lui Cramer pentru sisteme de tip 3×3 (trei rânduri × trei coloane).Funcţiile neliniare sau curbilinii nu se reduc la cele prezentate anterior. Se mai pot identifica prin corelograme şi

funcţii putere(xiY a bxi

= × ),logaritmice ( lg )Y a b xx ii= + etc.Semnificaţia raportului

de corelaţie se verifică prin testul F al a analizei dispersionale, comparând valoarea

lui ( ) ( )2 2n n

x xii ii=1 i=1calculat

Y - y y - YF =

k -1 n - k:

∑ ∑cu valoarea lui Ftabelat(Fteoretic),unde k =

numărul grupelor şi n = numărul unităţilor statistice.Raportul de corelaţie este semnificativ când Fcalculat > Ftabelat pentru k-1 şi respectiv n-k grade de libertate şi pentru un nivel de probabilitate riguros precizat de 0,95; 0,97 sau 0,99 şi mai rar valori superioare. În corelaţia multiplă, specifică distribuţiilor multidimensionale se utilizează un raport de corelaţie generalizat (dreapta) care se particularizează în cazul a două variabile explicative x1 şi x2 (stânga):

( )( )

2n

x ,x ,...xn1 2i=1y/x ,x ,...x 2nn1 2

i=1

y - YiR = 1-

y - yi

şi 2 2

ry/x y/x y/x y/x x /x1 2 1 2 1 2y/x ,x 21 2

x /x1 2

r + r - 2 ×r ×rR =

1- r

Corelaţia parţială este o formă de izolare a unei legături statistice într-un context relaţional mai larg. Acest tip de corelaţie caracterizează intensitatea legăturii într-o ipoteză de menţinere a influenţei unei singure variabile explicative x1 în raport cu o variabilă rezultativă Yx. În cazul a două variabile independente x1 şi x2 explicative şi a unei singure variabile independente Y, coeficientul de corelaţie parţială (de ordinul întâi) se calculează astfel: neglijând influenţa lui x2 sau x1:

Page 116: Statistic A

Regresie şi corelaţie statistică Capitolul 6

110

/ / /1 2 2 1( / ), 2 21 2

/ /2 2 1(1 )(1 )

Y x Y x x x

Y x x

Y x x x

r r rr

r r

− ×=

− − sau

/ 1 /2 2 1( / ), 2 22 1

/ /1 2 1(1 )(1 )

YxY x x xY x x

Y x x x

r r rr

r r

− ×=

− −

Abordarea în timp a corelaţiei extinde noţiunea în sine şi structurează trei tipuri de corelaţii temporale: a) autocorelaţia sau corelaţia internă ca legătură între valorile aceleiaşi variabile, separate printr-un interval de timp; b) corelaţia sincronă sau legătura între valoarea variabilei explicative xi, luată într-un anumit moment şi valoarea variabilei rezultative yi, luată în acelaşi moment; c) corelaţia asincronă sau cu decalaj, ca legătură între valoarea variabilei xi (promptă sau nedecalată), atinsă într-un anumit moment şi valoarea unei alte variabile yi (tardivă sau decalată), atinsă după un interval de timp determinat. Ultima categorie permite calculul unui coeficientul de corelaţie simplă cu decalaj (autori Morice E. şi

Charter F.), după relaţia: ( ) ( )( )( )

n

t-hi=1

x - x - y - yir =h n - h σ σx y

∑, unde: t = numărul de termeni al

seriei iniţiale şi h = numărul de termeni cu care se decalează cea de-a doua serie. Pentru a fixa corect valoarea lui h se reprezintă grafic cele două serii şi se glisează un grafic peste celălalt (reprezentări la aceeaşi scară). Coeficientul rh arată practic legătura între primii termeni ai seriei factoriale xi şi ultimii termeni ai celei tardive rezultative yi, xi: x1,x2,x3,...,xt şi yi:y1+h,y2+h, y3+h,..., yt+h.

Identificarea rapidă şi selectarea unor factori esenţiali apelează şi la metode neparametrice, ce presupun înlocuirea variantelor reale cu numere de ordine (ierarhizare, ranguri etc.) sau cu diferenţe între termeni consecutivi şi prezintă avantaje semnificative prin utilizare când distribuţia variabilelor corelate nu este normală sau nu este cunoscută şi în condiţii de asimetrie a distribuţiilor variabilelor corelate, deoarece: a)permit obţinerea rapidă a confirmării sau infirmării existenţei legăturii statistice (inclusiv a intensităţii, dacă se identifică o corelaţie); b) sunt unica soluţie în situaţia concretă a lipsei de date absolute compensată de existenţa unor clasamente, ierarhii, diferenţe între variante succesive etc.; c) constituie soluţii practice când una sau ambele variabile corelate sunt calitative. I. Coeficientul de asociere definit de Yule G.U. şi Kendall M.G. drept o situaţie în care una dintre variabilele calitative nu poate avea loc fără cealaltă variabilă calitativă, deşi cealaltă poate avea loc fără ca prima să se fi produs este cea mai simplă soluţie practică.Debutul determinării este dat de prezentarea variabilelor xi şi yi cu variantele x1 şi non x1, respectiv y1, şi non y1 într-un tabel sintetic: Tabel nr. 6.1.

yi xi

y1 nony1

sau y2 Total

x1 a b a+b nonx1 sau x2 c d c+d Total a+c b+d a+b+c+d

În condiţiile notaţiilor anterioare, relaţia de calcul a acestui coeficient devine:

Page 117: Statistic A

Regresie şi corelaţie statistică Capitolul 6

111

Y =

ad

bc

ad

bc

+

1

1 sau Y =

bcad

bcad

+− .Cei doi coeficienţi Yule G.U. şi Kendall M.G.

respectiv Q şi Y beneficiază de proprietăţi şi deficienţe asemănătoare, dezavantajul lor major fiind acela de a nu face distincţie între asociere completă, în formele ei pozitivă şi negativă, detaliat pentru cele trei situaţii specifice (fie în forma pozitivă b=c, c=0 sau b=c=0, fie în forma negativă a=0, d=0 sau a=d=0). II. Coeficienţii Charles Eduard Spearman (rs sau ρ) şi Maurice Kendall (rk sau τ) presupun în prealabil acordarea de ranguri (umere de ordine), în funcţie de poziţia deţinută de unitatea statistică, după ce s-a procedat la ordonarea lor crescătoare. a)Ipoteza logică ce stă la baza coeficientului Spearman este aceea că în cazul unei legături directe foarte puternice există o concordanţă aproape deplină între rangurile celor două variabile corelate, iar în cazul unei legături indirecte foarte puternice apare o discordanţă totală între aceleaşi ranguri. Relaţia de calcul a

coeficientului Spearman este rs sau ρ ( ) ( )2 3

11 6 :

n

ii

n nd=

−= × ∑− , unde: di = rangul

după xi- rangul după yi (di = rg xi– rgyi), n=numărul unităţilor la care s-au studiat cele două caracteristici sau numărul perechilor de valori corelate. La stabilirea rangurilor variabilelor corelate apar situaţii variantele pot deţine aceeaşi valoare şi cărora li se va acorda acelaşi rang. În această situaţie se va urmări ca rangul valorii distincte imediat următoare să corespundă cu numărul de unităţi analizate.

b). Relaţia de calcul a coeficientului Kendall este rk sau τ 2

0,5 ( 1) ( 1)

S S

n n n n= =

− −,

unde:1 1

i i

n n

i iS P Q

= == −∑ ∑ sau suma algebrică dintre numărul de ranguri superioare

fiecărui rang (1

nPii

∑=

) şi numărul de ranguri inferioare (1

nQii

∑=

) calculate pentru

caracteristica rezultativă condiţionată de caracteristica factorială (ordonată). De regulă, coeficientul Kendall este mai mic decât coeficientul Spearman, respectiv rk<rs , dar ei se interpretează, în final, ca orice alt coeficient de corelaţie.

III. Coeficientul simplu de covariaţie diferenţială sau coeficientul lui Fechner G. T. este un indicator a calculat pe baza concordanţelor sau discordanţelor de semne ale diferenţelor 1i i ix x x−∆ = − şi 1i i iy y y−∆ = − sau * x x xi i∆ = − şi * y y yi i∆ = − , prin

formula: 1

c dk

c d

−=+

, unde c=concordanţă de semn între ix∆ şi iy∆ sau *xi∆ şi * yi∆ ,

iar d = discordanţe de semn între ix∆ şi iy∆ sau * xi∆ şi * yi∆ , şi c + d reprezintă

numărul total de unităţi statistice (dacă una sau mai multe abateri ix∆ sau iy∆ sau *xi∆ şi * yi∆ sunt nule, perechile (xi, ,yi) ce le-au generat vor fi excluse din calcul).

Page 118: Statistic A

Regresie şi corelaţie statistică Capitolul 6

112

Atunci când există numai concordanţe de semn k1 = (c/c) = 1, iar când se constată numai discordanţe, rezultă un k1 = (–d/d) = –1. Aceste valori reprezintă limita maximă, respectiv minimă a coeficientului Fechner.Coeficientul simplu de covariaţie diferenţială devine egal cu zero când c = d. IV. Coeficientul ponderat de concordanţă Fechner se valorifică dacă se doreşte a

pondera în calcul mărimea abaterilor ix∆ şi iy∆ sau *xi∆ şi * yi∆ , prin formula:

( ) ( )2 :k C D C D= − + ,unde:C = suma produselor pozitiveix∆ × iy∆ şi *xi∆ × * yi∆ , D =

valoarea absolută a sumei produselor negative ix∆ × iy∆ şi *xi∆ × * yi∆ , iar k∈[-1,1]

şi devine egal cu „zero”, atunci când C = D.

V. Un alt coeficient de concordanţă mai echilibrat metodologic şi care nu atinge cu aceeaşi uşurinţă ±1, ca în cazul celorlalţi doi coeficienţi descrişi anterior (uneori şi când legătura descrisă nu este funcţională), este coeficientul Bravais-Pearson:

( ) ( )1

3 2 2

1 1

nx yi iik

n nx yi ii i

∆ ∆∑==

∆ ∆∑ ∑= =

sau

( ) ( )

* *

* *

13 2 2

1 1

n

in n

i i

x yi ik

x yi i

=

= =

∆ ∆∑=

∆ ∆∑ ∑

6.4 Test de autoevaluare şi aplicaţii A) Test de autoevaluare

A1) Întrebări clasice recapitulative

(Completaţi spaţiile goale) 1. Care este termenul corect regresie sau corelaţie în analiza legăturilor şi de ce coexistă ambele noţiuni?

2. Care este esenţa metodei celor mai mici pătrate?

3. Cum se determină un coeficient de regresie şi ce semnificaţie are?

4.Cum se determină şi interpretează raportul de corelaţie?

5.Care sunt principalele instrumente neparametrice în aflarea intensităţii

A2) Întrebări tip gril ă

(Încercuiţi litera răspunsului corect) 6.Un parametru important al funcţiei de regresie:

ˆ 2,6 1,5x iy x= + arată că: a)legătura este de

intensitate ridicată; b)la o creştere cu o unitate a lui x, y creşte în medie cu 1,5 unităţi; c)la o creştere cu o unitate a lui y, x creşte în medie cu 1,5 unităţi; d) există o legătură indirectă între variabile. 7. Alegeţi testul de liniaritate al legăturii dintre relaţiile următoare: a) r= K; b) r = R; c) e = D; d) R2= K2. 8. Identificaţi relaţia simplă şi corectă de calcul pentru coeficientul de corelaţie: a) r = b×(σx):(σy); b) r = (ad-cd):(ad+cd); c) r = 2s:[(n(n-1)]. 9. Două variabile Xi şi Yi, între care s-a identificat o legătură statistică, deţin următoarele date: Tabel nr. 6.2 Xi 4 6 8 10 12 15 20 21 26 28 Yi 85 70 120 165 185 220 215 225 209 206 I. Coeficientul de regresie este: a)5,687; b)0,37449; c) 0,99704; d) 0,78182. II. Raportul de corelaţie

Page 119: Statistic A

Regresie şi corelaţie statistică Capitolul 6

113

corelaţiei?

este: a) 5,687; b) 0,37449; c) 0,99704; d) 0,78182. III. Coeficientul Sperman este: a) 5,687; b) 0,37449; c) 0,99704; d) 0,78182.

B) Aplicaţii rezolvate 1.Care este valoarea coeficientului de asociere dintre nota obţinută de către 25 de studenţi la proiectul statistic şi situaţia lor finală la examen? Tabel nr.6.3

yi xi

y1 non y1

Total Qc=T=

))()()(( cdbdcada

bcad

++++− =0,38

(slabă) x1 11 2 13 non x1 5 7 12 Total 16 9 25

Rezolvare Conform valorii

Q =bcad

bcad

+−

=0,77

Legătura directă şi intensă

Y = bcad

bcad

+

− = 0,47 (legătură slabă)

Notă: x1 =studenţi cu un proiect bun (nota la proiect ≥ media grupei) şi non x1=studenţi cu un proiect slab (nota<media) şi y1 = studenţi promovaţi şi non y1=studenţi nepromovaţi. 2.O firmă turistică deţine 10 agenţii ale sale, plasate în 10 localităţi, iar numărul de salariaţi sau agenţi turistici (xi) şi cifra de afaceri (yi), exprimată în milioane lei, sunt prezentate în următoarea distribuţie de frecvenţe:

xi 6 7 8 9 10 10 11 12 13 14 yi 1,0 1,1 1,2 1,4 1,3 1,6 1,4 1,6 1,7 1,7

Să se identifice grafic existenţa unei legături statistice, să se parametrizeze şi evalueze ca intensitate funcţia matematică de regresie caracteristică. Rezolvare: Prin corelogramă se identifică o legătură statistică de tip liniar (yi = a + bxi), cu b>0 intensă relativ (jumătate din puncte fiind pe dreapta din grafic). Grafic nr. 6.1

Calculul parametrilor a şi b ai legăturii liniare directe, semnalate în grafic: Tabel nr.6.4 Număr de

salariaţi (xi)Cifra de afaceri

(yi mil. lei) 2ix xi × yi Y a bxx ii

= +

6 1.0 36 6,0 1,04 7 1.1 49 7,7 1,13 8 1.2 64 9,6 1,22

4

6

8

10

12

14

16

0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8

CA

SA

LAR

IATI

0.9

1.0

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

4 6 8 10 12 14 16

SALARIATI

CA

Magazine P1 (6;1,0) P2 (7;1,1) P3 (8;1,2) P4 (9;1,4) P5 (10;1,3) P6 (10;1,6) P7 (11;1,4) P8 (12;1,6) P9 (13;1,7) P10 (14;1,7)

Page 120: Statistic A

Regresie şi corelaţie statistică Capitolul 6

114

9 1.4 81 12,6 1,31 10 1.3 100 13,0 1,40 10 1.6 100 16,0 1,40 11 1.4 121 15,4 1,49 12 1.6 144 19,2 1,58 13 1.7 169 22,1 1,67 14 1.7 196 23,8 1,76 100

ix∑

14,0

iy∑

106 2ix∑

145,4

i ix y∑

14,00

xiY∑

devine practic: 10 100 14a b+ =100 1060 145, 4a b+ = şi are ca soluţii: a = 0,5 şi b = 0,09 iar regresia liniară

Y a bxx ii= + parametrizată

este 0,5 0, 09x iiY x= +

Se poate apela la relaţia de control iy∑ = xiY∑ , oricând disponibilă tabelar, pentru

a verifica acurateţea calculelor. Suma termenilor reali este egală cu a termenilor teoretici (ajustaţi). Coeficientul de regresie b = 0,09 arată că la fiecare creştere a lui xi cu o unitate (salariat), cifra de afaceri notată yi, se majorează cu 0,09 milioane lei În exemplul analizat, coeficientul de determinaţie D = 86,8%, ceea ce traduce o calitate satisfăcătoare funcţiei de regresie liniare parametrizate, iar valoarea coeficientului de eroare (e) = 6,67%. Cum valoarea ry/x = Ry/x =0,9315885 şi se poate afirma că între variabila număr de salariaţi şi cifra de afaceri există o legătură statistică de intensitate puternică, exclusiv liniară de forma: 0,5 0, 09x ii

Y x= + .

C) Aplicaţii propuse spre rezolvare 1 Cinci magazine sunt ordonate crescător în raport cu preţul practicat: Tabel nr. 6.5

Magazin

Preţul practicat (xi - lei / kg)

Cantitatea vândută (yi -mii kg)

1 10,0 9,0 2 12,0 8,8 3 15,0 8,2 4 18,0 8,0 5 20,0 8,0

Aplicaţi metoda grafică de identificare a legăturii statistice între xi şi yi, calculaţi parametrii a şi b ai modelului de regresie şi interpretaţi semnificaţia coeficientului de regresie. Analizaţi calitativ funcţia de regresie cu un coeficient de determinaţie şi de eroare şi, în final determinaţi raportul de corelaţie şi coeficientul de corelaţie. Verificaţi liniaritatea legăturii prin testul Rxy = r xy. 2.Pornind de la suprafaţa comercială(xi) şi vânzările firmei (yi), din ultimele 6 luni, parametrizaţi o regresie între cele două variabile de forma yi = a + bxi

, evaluând intensitatea corelaţiei şi estimând vânzările la o suprafaţă de 250 şi 300 mp: Tabel nr.6.6

Luna I II III IV V VI

Suprafaţa comercială (mp) 50 70 80 120 140 210 Valoarea vânzărilor (mii lei ) 480 600 820 1100 1400 2200

Page 121: Statistic A

Regresie şi corelaţie statistică Capitolul 6

115

3. Pornind de la un eşantion alcătuit din 50 de firme s-au obţinut următoarele date despre productivitatea medie şi salariul mediu lunar: Tabel nr. 6.7

Salariul mediu (11600 lei / salariat) Productivitatea medie 135 produse / salariat Mai mic decât media Mai mare decât media

Total

Mai mică decât media 16 6 22 Mai mare decât media 9 19 28

Total 25 25 50 Coeficientul de asociere de tip Yule este: a) 0,243; b) 0,980; c) 0,901; d) 0,698. 6.5 Rezumat Analiza legăturilor şi stabilirea unei regresii şi corelaţii dă rezultate bune atunci când: există un număr suficient de mare de cazuri individuale (perechi xi, yi), distribuţia abaterilor este normală sau aproximativ normală, abstractizarea factorilor se realizează succesiv (pe principiul caeteris paribus). Tipologia legăturilor statistice este una dintre cele mai diverse, având la bază o gamă variată de criterii: natura relaţiei de cauzalitate, numărul caracteristicilor factori sau al variabilelor luate în analiză, tipul şi natura caracteristicilor, forma legăturii, direcţia sau sensul, timpul şi conţinutul relaţiei dintre variabile. Metoda regresiei selectează funcţia ce aparţine unei clase de funcţii matematice, care realizează cea mai bună descriere a variaţiei lui xi, bazându-se pe relaţia existentă între xi şi yi, o relaţie liniară simplă yi=a+bxi sau multiplă

0 1 1 2 2, ,...1 2... m mx x xm

Y a a x a x a x= + + + + .

Ecuaţia de regresie liniară simplă a funcţiei yi = a+bxi este egală cu:

2

2 2( )

y x x x yi i i i iYi n x xi i

× − ×∑ ∑ ∑ ∑= +

× −∑ ∑

2 2( )

n x y x yi i i i Xin x xi i

× − ×∑ ∑ ∑

× −∑ ∑

Pentru a evalua capacitatea unei funcţii liniare de a caracteriza variaţia lui yi în raport cu xi se utilizează coeficientul de determinaţie D sau coeficientul de eroare e:

( )( )

2

21 100y Yxi iDy yi

−∑= − ×

−∑

şi

( )2

100

i xi

i

y Y

ne

y

−∑

= ×

Coeficientul de corelaţie ( )// /r b x yy x y x σ σ= × ,caracterizează intensitatea legăturii dintre

variabila explicativă xi şi rezultativă yi, aparţinând intervalului [-1,0) ∪ (0,1]. Testul de verificare a liniarităţii legăturii confruntă valorile coeficientului (ry/x) şi raportului de corelaţie (Ry/x). Dacă cele două valori coincid (r = R), atunci corelaţia este exclusiv liniară.

Page 122: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

116

Tema 7 ANALIZA CRONOLOGIC Ă ŞI TERITORIAL Ă A SERIILOR DE DATE CUPRINS: pag. 7.1 Particularităţi şi tipologie în seriile cronologice şi teritoriale 116 7.2 Sisteme de indicatori statistici ai seriilor cronologice şi teritoriale 118 7.3 Determinarea trendului şi sezonalităţii în evoluţia fenomenelor 124 7.4 Previziune şi ierarhizare statistică 130 7.5 Test de autoevaluare şi aplicaţii 132 7.6 Rezumat 139 Obiective:Variaţiile în timp şi în spaţiu ale caracteristicilor unor populaţii statistice se supun analizei statistice cronologice şi teritoriale. Obiectivul major al temei îl constituie înţelegerea ciclicităţii, sezonalităţii, oscilaţiilor aleatoare în timp, cât şi a criteriilor de ordonare teritorială şi răspunde, în final, nevoii de previziune şi cerinţelor de confruntare, competiţie sau ierarhizare teritorială. Particularităţile şi tipologia seriilor cronologice şi teritoriale de date statistice, specificitatea sistemelor de indicatori statistici, alături de obligaţia de a acoperi lipsa involuntară a unor termeni interni, dar şi de nevoia de anticipare a lor în exteriorul seriei de date generează dilemele trendului, pe cele ale sezonalităţii, precum şi pe cele ale decalajului sau avansului. Dobândirea de competenţe privind analiza statistică optimă şi de maximă adecvare a seriilor de date cronologice şi teritoriale este de cea mai mare utilitate practică în formarea studenţilor şi viitorilor economişti. Timpul alocat temei: minim 4 ore - maxim 6 ore Bibliografie Biji,M., Biji,E.,Lilea,E, Anghelache,C.,Tratat de statistică, Ed.Economică,Bucureşti, 2002. Isaic-Maniu, Al., (coord), Dicţionar de statistică generală, Ed.Economică, Bucureşti, 2003. M.Korka, E.Tuşa, Statistică pentru afaceri internaţionale,Ed. ASE, Bucureşti, 2004. M.Korka,L.,Begu,E.Tusa,Bazele statisticii pentru economişti, Ed.Tribuna Economică, 2002 G. Săvoiu, Statistică generală.Argumente în favoarea formării gândirii statistice, Ed. Independenţa Economicǎ, Piteşti, 2003. G. Săvoiu, Statistică aplicată în domeniul economic şi social. Elemente teoretice, teste tip grilă, aplicaţii şi studii de caz, Ed. Independenţa Economicǎ, Piteşti, 2004. G. Săvoiu, Statistica.Un mod ştiinţific de gândire, Ed.Universitară, Bucureşti, 2007. G. Săvoiu, Statistica.Mod de gândire şi metode, Ed.Universitară, Bucureşti, 2009. V.Trebici, Mica enciclopedie de statistică,Ed.ştiinţifică şi enciclopedică,Bucureşti, 1985. M. Ţarcă,Tratat de statistică aplicată, Ed. didactică şi pedagogică R.A. Bucureşti, 1998. Webografie ***http://www. insse.ro şi ***http://epp.eurostat.ec.europa.eu/ şi *** http://www. bnr.ro

7.1 Particularităţi şi tipologie în seriile cronologice şi teritoriale

Abordarea temporală şi spaţială impune cunoaşterea metodelor de analiză statistică a seriilor cronologice şi teritoriale de date. Cunoaşterea fenomenelor în succesiunea lor temporală caracterizează seria cronologică, definită drept seria de tip statistic, în care primul şir de valori, respectiv al caracteristicii de grupare, este timpul, iar cel de-al doilea şir este cel al variantelor caracteristicii de interes, în

Page 123: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

117

cadrul fenomenului studiat. Seria cronologică este generatoare de variabile istorice, conform afirmaţiei lui Joseph Schumpeter, şi devine cea mai apreciată soluţie în analiza unor tendinţe pe termen lung sau seculare, după Frederick Mills. În practica statistică, acest tip de serie apare mai ales sub forma unui şir de valori ordonate în funcţie de timp ale unui indicator statistic, economic sau social şi din nefericire, din cauza lipsei unor date cu caracter continuu se utilizează adeseori scale inadecvate de interval sau cardinale (în care momentul de început sau zero este mult prea arbitrar ales) şi nu scale optime de raport (proporţionale).

Seria teritorială este tot un rezultat al grupării statistice, dar de această dată având spaţiul drept caracteristică de grupare sau variante teritoriale în primul şir (teritoriile:A,B,C,…,W) şi variante ale nivelului fenomenului cercetat, în cel de-al şir specific. În practica statistică acest tip de serie apare mai ales sub forma unui indicator prezentat iniţial agregat, ce este ulterior dezmembrat teritorial.

Condiţii specifice de realizare a seriilor cronologice şi teritoriale Caseta nr 7.1

Serii cronologice (temporale) Serii teritoriale (spaţiale) I.Fenomenul primar este cel ce determină alegerea intervalului de timp al seriei. II. Seriile cronologice vor fi omogene ca tip de indicator exprimat în aceleaşi condiţii (nu se construiesc serii mixte de indicatori, ci se acceptă fie numai indicatori absoluţi, fie numai relativi, fie numai medii). III.Cerinţele de comparabilitate statistică se asigură integral (metodologie unitară de calcul, abordare spaţială identică, unitate de măsură similară, preţuri ). IV. Se preferă perioadele de timp egale celor inegale. V.Bazei de comparaţie sau termenului de început i se acordă cea mai mare atenţie.

I.Existenţa unor clasificări recunoscute şi nomenclatoare administrativ - teritoriale acceptate internaţional sunt cerinţe majore. II.Fiecare termen este şi unitate complexă şi element în nivelul agregat al seriei. III. Seriile teritoriale vor fi alcătuite din indicatori similari pentru acelaşi fenomen. IV.Cerinţele de comparabilitate se respectă integral şi în cazul seriilor teritoriale (metodologia unitară, unităţi de măsură identice, unităţi de timp similare, preţuri). V.În dezmembrările spaţiale, agregatul este un termen de control, iar în cazul unui indicator ce nu suportă agregare teritorială (indice, ritm) identificarea unui indicator agregativ este de o importanţă deosebită.

Ambele tipuri de serii, atât cele cronologice cât şi cele teritoriale, beneficiază de criterii de clasificare diverse şi implicit de o tipologie variată.Astfel, seriile cronologice se clasifică în raport cu unitatea de timp specifică în serii de intervale şi de momente, în funcţie de modalitatea concretă de exprimare, în serii de indicatori absoluţi relativi sau medii, iar pornind de la numărul de termeni ai seriei în serii de lungime mică (de 5-10 termeni, cu un pronunţat caracter didactic sau de popularizare), serii de lungime medie (de 15-20 termeni, cu un evident caracter practic) şi serii de lungime mare (de aproape 100 de termeni, cu un vădit caracter istoric sau secular).La rândul lor, seriile teritoriale se împart în funcţie de modalitatea concretă de exprimare în serii de indicatori absoluţi, relativi sau medii, iar în raport de agregarea finală a termenilor în serii teritoriale agregabile (de indicatori, cu precădere, absoluţi, precum şi în serii ce nu se pot agrega sau însuma

Page 124: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

118

logic (mai ales cele alcătuite din indicatori relativi şi medii). Seriile cronologice şi teritoriale se diferenţiază substanţial între ele şi în raport cu alte serii statistice.

Particularit ăţi ale seriilor cronologice şi teritoriale de date Caseta nr. 7.2

Serii cronologice Serii Teritoriale I. Omogenitatea termenilor (yt) (esenţa calitativă comună şi minima dispersare temporală de termeni succesivi)

I. Omogenitatea termenilor (yi) (conţinutul asemănător şi minimizarea variaţiei teritoriale a termenilor)

II. Comparabilitatea termenilor (yt) (satisfacerea unitară a criteriilor: spaţial, organizatoric, al unităţii de măsură, a preţurilor etc.)

II. Comparabilitatea termenilor (yi) (satisfacerea unitară a criteriilor: temporal, organizatoric, al unităţii de măsură, a preţurilor etc.)

III. Interdependenţa termenilor (yt) (valoarea unui termen depinde de cel anterior, din cauza unei tendinţe inerţiale)

III. Independenţa termenilor (yi) (diferite niveluri ale termenilor nu se condiţionează reciproc)

IV. Periodizarea seriei de termeni (delimitarea etapelor calitativ diferite în evoluţia fenomenului prin alegerea bazei)

IV. Simultaneitatea termenilor seriei (variantele teritoriale se referă la acelaşi moment sau interval de timp)

V. Adecvarea lungimii seriei de termeni la fenomenul reflectat (asigurarea unui număr suficient de termeni oferind astfel câmp de acţiune legii numerelor mari)

V. Variabilitatea termenilor (yi) (evidenţierea variaţiei fenomenului reflectat prin termeni de nivel diferit)

Compromisul final al seriei cronologice se realizează practic între tendinţa de adecvare a lungimii seriei şi tendinţa de asigurare a omogenităţii şi comparabilităţii termenilor seriei. O serie cronologică prea lungă este greu de realizat în practică, din punctul de vedere al omogenităţii şi comparabilităţii, în timp ce o serie cronologică prea scurtă, deşi alcătuită din termeni omogeni şi comparabili, nu asigură întotdeauna o reflectare corectă a fenomenului cercetat (nu oferă un câmp de acţiune satisfăcător acţiunii legii numerelor mari). Dilema oricărei serii teritoriale este soluţionarea cât mai corectă a problemei delimitării unităţii statistice spaţiale.Aceasta trebuie să fie complexă, aşa cum se prezintă orice unitate teritorială sau spaţială la o primă analiză, dar şi simplă, în acelaşi timp, în raport cu nivelul de agregare superior, atunci când acesta este posibil. Graficele specifice celor două tipuri de serii diferă şi ele în mod semnificativ. În timp ce seria cronologică este reprezentată cu mare fidelitate prin intermediul cronogramelor sau historiogramelor, alături de diagrame prin benzi sau coloane, diagrame cu scară semilogaritmică sau diagrame radiale (polare), seria teritorială este redată relevant cu ajutorul cartogramelor sau cartodiagramelor, ca grafice speciale, construite pe fondul unei hărţi a unităţilor teritoriale cercetate.

7.2 Sisteme de indicatori statistici ai seriilor cronologice şi teritoriale Impactul sistemului de indicatori are caracter şi analitic, dar şi sintetic (în

acelaşi timp sau în acelaşi spaţiu). A. Sistemul de indicatori statistici ai unei serii cronologice se calculează

pornind practic de la termenii acesteia şi rezultă două clase, una analitică şi alta sintetică de indicatori.În raport însă cu modul de calcul şi de exprimare indicatorii

Page 125: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

119

se structurează în subsisteme specifice: a) subsistemul indicatorilor absoluţi; b) subsistemul indicatorilor relativi; c) subsistemul indicatorilor medii. I. Subsistemul indicatorilor absoluţi ai unei serii cronologice este alcătuit din termenii seriei, din volumul agregat al acestora (numai în cazul seriilor de intervale) şi din modificările absolute, constatate între nivelul termenilor.Termenii

seriei cronologice, notaţi cu yt, unde t = 1T , redau de o manieră statistică nivelul, mărimea specifică a fenomenului analizat la momentele t1, t2, t3 … tT, reliefând, în cazul unor creşteri constante, o evoluţie ascendentă sau în cazul unor diminuări constante, o evoluţie descendentă.Variaţiile oscilant evolutive sub formă de creşteri sau descreşteri alternative, ca şi staţionaritatea de nivel constituie stările posibile ale fenomenului cercetat în timp, stări care rezultă din analiza termenilor seriei cronologice.Volumul agregat al termenilor seriei cronologice se calculează exclusiv pentru serii de intervale, ele fiind agregabile(cumulative). Modificările absolute (diferenţe sau ecart) se concretizează în sporuri sau reduceri absolute şi se clasifică în funcţie de bază în modificări absolute cu bază fixă ( 1/1 y ytt∆ = − ) şi cu

bază mobilă sau în lanţ [( ) ( )tt / t -1 t-1y y∆ = − ].Există două proprietăţi cu semnificaţie

deosebită, prin utilitatea lor în reconstituirile de termeni ai seriilor cronologice. Diferenţa dintre două modificări absolute consecutive cu bază fixă este egală cu modificarea absolută cu bază în lanţ sau mobilă a celor doi termeni consecutivi:

( ) ( ) ( )( ) ( ) ( )/1 1 11 /1 1 1 / 1t t tt t t t ty y y y y y− − − −∆ −∆ = − − − = − = ∆ .

Suma tuturor modificărilor absolute cu bază în lanţ sau mobilă este egală cu modificarea cu bază fixă a ultimului termen faţă de primul termen.

( ) ( ) ( ) 3/2 2/1/ 1 / 1 1 /( 2)2

...T

t t t t t tt

− − − −=

∆ =∆ +∆ + +∆ +∆∑ ( )( ) ( ) ( )( ) ( ) ( ) ( )t t3 2 2 1 1 t/1t-1 t-1 t-2= y -y + y -y +...+ y -y + y -y = y -y =∆

II. Subsistemul indicatorilor relativi ai unei serii cronologice cuprinde: a) indici, care arată de câte ori nivelul fenomenului studiat (yt) est mai mare sau mai mic într-un moment sau într-un interval „t” în raport cu oricare alt moment sau alt interval „t-1” sau „1”; b)ritmuri, care subliniază cu cât s-a modificat nivelul dintre cele două momente sau intervale; c) valori absolute ale unui procent din ritmurile determinate anterior.În general, indicatorii relativi redau fie proporţia între diferite niveluri de dezvoltare în timp a fenomenului studiat, ca în cazul indicilor, fie decalajul sau avansul identificat între aceleaşi niveluri menţionate, ca în cazul ritmurilor. De regulă, indicele se exprimă în coeficienţi sau în procente fie cu bază

fixă (1

/1 100y tt

yI

y= × ), fie cu bază mobilă sau în lanţ ( ( )

( )/ 1

1

100y tt t

t

yI

y−−

= × ). În cazul

indicilor, se reţin alte două proprietăţi esenţiale în demersul practic de reconstituire a termenilor lipsă din şirul specific al seriei cronologice. Produsul tuturor indicilor cu bază mobilă sau în lanţ este egal cu indicele cu bază fixă al ultimului termen, în raport cu primul termen.

Page 126: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

120

( )( )

( )

( )( )

1 3 2/ 1 / 1

2 2 11 2

...T

ty ytt t t t

t t t

yy y yI I

y y y y−

− −= − −

= × × × × =∏ .

Raportul dintre doi indici cu baza fixă, construiţi din doi termeni consecutivi sau succesivi, este egal cu indicele cu bază mobilă sau în lanţ, al celor doi termeni.

( )

( )( )

1/1/ 1

1 1 11 /1

:y

t yt t tt ty

tt

yI y yI

I y y y−

−−−

= = = .

Cele două relaţii anterioare sunt relaţii de recurenţă cu aplicabilitate în multiple domenii economice şi sociale.Ritmul sau rata modificării relative (ca ritm al sporului sau reducerii) reprezintă decalajul sau avansul surprins în valoarea indicelui (sporul sau reducerea).Ritmul sau rata, în calitate de indicator relativ al seriei cronologice, se calculează ca diferenţă între indicele exprimat prin coeficient şi valoarea unu (I–1) sau între indicele exprimat prin procent şi 100%[I(%)–100%]. In cazul ritmului cu bază fixă, relaţiile de calcul sunt următoarele:

/111 1/1 /11 1 1

y yy tt tR It t y y y

∆−= − = − = = sau

( ) ( ) /11% % 100% 100 100 100 100/1 /11 1 1

y yy tt tR It t y y y

∆−= − = × − = × = ×

În cazul ritmului cu bază mobilă sau în lanţ formulele de calcul devin:

( ) ( )( )

( )

( )

( )

( )

1 / 1

/ 1 / 11 1 1

1 1t t t tt

t t t tt t t

y yyR I

y y y− −

− −− − −

− ∆= − = − = = sau

( ) ( ) ( ) ( )( )

( )

( )

( )

( )

1 / 1% % 100% 100 100 100 100/ 1 / 1

1 1 1

y yt t t tytR It t t t y y y

t t t

− ∆− −= − = × − = × = ×− −

− − −

Ritmul sau rata modificării relative reprezintă un raport între modificarea absolută a fenomenului cu bază fixă sau în lanţ şi nivelul bazei fixe sau în lanţ comparate. Valoarea absolută a unui procent din ritmul cu bază fixă (At/1) sau cu bază în lanţ (At/(t-1)) stabileşte concret numărul unităţilor de măsură în care este exprimat fenomenul analizat, unităţi ce corespund unei modificări (creşteri sau reduceri) cu un singur procent.Modificarea absolută a unui procent din ritmul cu bază fixă, redă un procent din baza fixă şi este în fapt o valoare constantă, în timp ce valoarea absolută a unui procent din ritmul cu bază în lanţ sau mobilă reprezintă un procent din termenul anterior:

( )/1 /1 1

/1 % 100/1/1 1001

yt tAt R tty

∆ ∆= = =

∆×

şi ( )

( )

( )

( )

( )

( )

( )/ 1 / 1 1

/ 1 100/ 1/ 1100

1

yt t t t t

At t R t tt t

yt

∆ ∆− − −= = =− ∆ −−

×−

Page 127: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

121

Valoarea absolută a unui procent din ritmul de bază în lanţ sau mobilă este inedită prin aspectele şi mai ales prin tendinţele relevate. Ritmurile cu bază mobilă ale unei serii de termeni în creştere au o tendinţă de diminuare de la un termen la altul iar ritmurile cu bază mobilă ale unei serii de termeni în scădere au o tendinţă de majorare de la un termen la altul. În lumea gândirii statistice, o lume finită, acest lucru se traduce prin formularea nimic nu poate creşte nelimitat tot astfel cum nimic nu se poate reduce la infinit.

III. Subsistemul indicatorilor medii ai unei serii cronologice conţine nivelul mediu al termenilor sau media specifică, modificarea medie absolută, indicele mediu şi ritmul mediu.Nivelul mediu al termenilor se calculează ca medie aritmetică simplă

(yty

T

∑= ) în serii cronologice de intervale sau ca medie cronologică în serii de

momente: ( )( )

12 1

1

...2 2/ 1

1

TT T

cr tt

y yy y

y y TT

=

+ + + += − =

−∑

Media cronologică specifică seriilor de momente este o medie a mediilor intervalelor create între acele momente (evident „T-1” intervale situate între „T” momente).Pentru detalierea specifică gândirii de tip statistic se poate apela şi la o medie cronologică ponderată cu timpul „scurs” între momentele seriei.

( ) ( )

( )

1

1 1 2 2 1 111

1 2 1

1

...

...

T

t tT Tt

cr TT

tt

y t y t y t y ty

t t tt

− −=−

=

× × + × + + ×= =

+ + +

În urma desfăşurării mediilor ty se obţine relaţia :

( )( ) ( ) ( )

( ) ( ) ( )

2 1 11 1 21 2 1

2 1 11 1 2

...2 2 2 2

...2 2 2 2

T T T

TT

crT T T

t t tt t ty y y y

yt t tt t t

− − −−

− − −

++× + × + + × + ×= +++ + + +

Modificarea medie absolută reprezintă media modificărilor absolute cu bază în lanţ

( )/ 12

1

T

t tt

T

−=

∆∆ =

∑, dar cum ( ) /1/ 1

2

T

tt tt

−=

∆ =∆∑ rezultă că: /1

1 1t t iy y

T T

∆ −∆= =− −

.

Modificarea medie absolută este un indicator cu atât mai reprezentativ al seriei cronologice, cu cât modificările de la un fenomen la altul sunt aproximativ egale cu

∆ (similar unei progresii aritmetice a cărei raţie este chiar „∆ ”). Indicele mediu subliniază practic de câte ori s-a modificat „în medie” fenomenul analizat în timp (de la un termen la altul al seriei). Relaţia lui calcul este o medie geometrică:

Page 128: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

122

( ) ( ) ( ) ( )( )1

2/1/ 1 / 1 1 / 22

...T T

t t t t t tt

I I I I I−

− − − −=

= × × × =∏

de (T-1) ori

( )( )1

/ 12

TT

t tt

I I−−

=

= ∏ , rezultă că: ( )1 tT

i

yI

y−= .

Indicele mediu este considerat un indicator cu atât mai reprezentativ al seriei cronologice, cu cât modificările de la un termen la altul sunt aproximativ egale cu

I ( similare unei progresii geometrice a cărei raţie este chiar „I ”). Ritmul mediu identifică în mod concret „cu cât” s-a modificat „în medie” fenomenul analizat în timp (de la un termen la altul al seriei). Relaţia de calcul este una din cele care urmează, în funcţie de modul de exprimare:

( ) ( )/ 1 / 1 1t t t tR I− −= − , atunci când R şi I se exprimă prin coeficienţi şi

( ) ( ) ( ) ( )/ 1 1% % 100%t t tR I− −= − , atunci când R şi I se exprimă în %.

Calitatea analizei efectuate prin intermediul subsistemelor de indicatori absoluţi, relativi şi medii asupra seriei cronologice depinde în mod hotărâtor de calitatea fenomenului primar, de omogenitatea acestuia şi de acurateţea datelor iniţiale.

B.Sistemul de indicatori statistici ai unei serii teritoriale prezintă particularităţile sale deşi, aparent, este alcătuit tot din aceleaşi trei subsisteme: I. Subsistemul indicatorilor absoluţi cuprinde termenii seriei teritoriale şi decalajul absolut sau avansul absolut. II. Subsistemul indicatorilor relativi, ce conţine indici teritoriali, rate de decalaj sau de devansare, iar pentru serii de termeni agregabili cote, ponderi sau greutăţi specifice teritoriale şi indici ai repartiţiei sau ai specializării teritoriale (indicele de concentrare–diversificare Gini–Struck, indicele Herfindahl, indicele Krugman etc). III . subsistemul indicatorilor medii, destul de rar utilizaţi în analize teritoriale şi cu preferinţă axat pe teritoriul median, mai curând decât pe cel mediu aritmetic sau modal.În prezentarea succintă a subsistemului indicatorilor absoluţi specifici se constată, cu uşurinţă, că fiecare termen al seriei teritoriale yi este un indicator de nivel şi exprimă concret volumul caracteristicii în teritoriul i. Decalajul absolut sau avansul absolut al unui teritoriu i faţă de teritoriul j se definesc prin diferenţa dintre nivelul atins de caracteristica studiată, în fiecare din spaţiile menţionate, decalaj în situaţia când diferenţa este negativă şi avans atunci când este pozitivă.

/i j i jy y∆ = − unde : / 0i j∆ < = decalaj absolut

/ 0i j∆ > = avans absolut

Concretizarea indicatorilor prin unităţi de măsură limitează posibilitatea de comparare teritorială a unor populaţii statistice diferite. Într-o astfel de situaţie se apelează la subsistemul indicatorilor relativi sau, mai precis, la indici teritoriali şi rate de decalaj sau rate de devansare.Un indice teritorial este raportul a două

Page 129: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

123

niveluri ale caracteristicii sau a două variante, ca simplu rezultat al variaţiei

spaţiale a fenomenului studiat: /i

i jj

yI

y= , unde:

- / 1i jI < , corespunde decalajului teritoriului i faţă de j (yi - yj < 0),

- / 1i jI > , corespunde devansării (avansului) teritoriului i faţă de j (yi - yj > 0).

Indicele teritorial coexistă prin indici reversibili: / / 1i j j iI I× = , deoarece 1ji

j i

yy

y y× =

Acest lucru permite construcţii de indici teritoriali agregaţi de tip Paasche, Laspeyres sau Fisher, transferând conceptul de bază temporală în bază teritorială pentru fenomene complexe (y = x × f):

/i ix

i jj i

x fP

x f= ∑∑

, /

i j

j j

xi j

x fL

x f= ∑∑

sau /

i ji i

j i j j

xi j

x fx fF

x f x f= ×∑∑∑ ∑

.

Indicii teritoriali pot fi construiţi şi ca indici sub formă de raport de medii:

/ : j ji ixi j

i j

x fx fI

f f= ∑∑∑ ∑

.

Ratele de decalaj sau de devansare se utilizează pentru exprimarea rapidă a diferenţelor dintre cele două niveluri teritoriale (yi - yj), relativizate prin raportare

la ultimul dintre ele (yj): ( )/(%)/ /100 1 100

i j ji j i j

j j

y yi Iy y

∆ −∆ = = × = − ×

Atunci când termenii seriei teritoriale sunt agregabili din punct de vedere logic, se pot valorifica şi indicatori clasici relativi de tipul ponderilor, cotelor-părţi, greutăţilor specifice (gi) şi de tipul indicilor repartiţiei teritoriale, specializării sau diversificării teritoriale (indicele repartiţiei teritoriale Gini-Struck (CG-S), indicii specializării sau diversificării Herfindahl, Krugman:

ii

i

yg

y=∑

sau 2 1

1i

G S

n gC

n−

−=

−∑ , unde: 0 ≤ CG-S ≤ 1

Dacă indicele repartiţiei teritoriale Gini-Struck (CG-S) tinde spre 0, atunci repartiţia fenomenului cercetat în teritoriu este uniformă, echilibrată, în timp ce o tendinţă spre 1 traduce dezechilibre de repartiţie, sub forma unor concentrări într-un număr redus de teritorii pentru acelaşi fenomen cercetat. Concentrarea moderată este delimitată de o valoare a indicelui repartiţie teritoriale de aproximativ 0,3.În cazul subsistemului indicatorilor medii, valoarea de tip median prin teritoriul median este cea mai frecvent utilizată şi ,destul de rar, valoarea medie sau teritoriul mediu.

În concluzie, sistemele de indicatori statistici ale celor două abordări, una de tip temporal, prin serii cronologice şi alta de tip spaţial, prin serii teritoriale, sunt similare ca subsisteme dar diferite prin indicatori caracteristici, calcul tip, aplicaţii practice şi interpretări specifice.

Page 130: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

124

7.3 Determinarea trendului şi sezonalităţii în evoluţia fenomenelor

Într-o serie cronologică de lungime suficient de mare[4] se pot identifica cele trei componente ale unei serii cronologice: componenta sistematică sau trendul ( yt ), oscilatorie sau periodică (St) şi aleatoare sau întâmplătoare ( tε ), ce pot fi

modelate aditiv şi multiplicativ: ˆy y St t t tε= + + sau ˆy y St t t tε= × × .

Componenta sistematică sau trendul ( yt ) se naşte ca urmare a acţiunii factorilor

importanţi, semnificativi şi cu influenţă continuă relativ stabilă şi sesizabilă pe perioade foarte mari de timp. Prin trend se înţelege de altfel, tendinţa centrală de evoluţie, pe întregul orizont de timp analizat, iar principalii factori ai trendului rămân progresul sub toate formele sale, respectiv cultural, ştiinţific, tehnic, economic, politic, social şi evoluţia populaţiei umane cu implicaţii profunde în mai toate fenomenele şi procesele cercetate.Atât din puncte de vedere teoretic cât şi practic, pot apare şi serii cronologice fără trend sau staţionare (din care trendul a

fost eliminat): ˆy y St t t tε− = + sau ˆ

yt St tytε= × .

Componenta oscilatorie sau periodică (St) devine rezultatul acţiunii factorilor secundari cu influenţă schimbătoare dar relativ continuă, iar pe termen scurt este sesizabilă cu mai mare uşurinţă în interiorul unui an. Componenta oscilatorie se manifestă cu o anumită ritmicitate sub denumirile de sezonalitate (în interiorul unui an) sau ciclicitate (pentru un număr mai mare de ani analizaţi).[5] Factorii generatori de influenţe sezonabile sau ciclice sunt cei naturali, climaterici, sociali. Oscilaţiile pot constitui un subiect de analiză pentru gândirea statistică şi pe intervale de variaţie mult mai mici (infralunare în decade sau săptămâni de zile, infrasăptămânale în zile, infrazilnice în ore sau pe schimburi etc). Lungimea perioadei oscilaţiei sau durata acesteia este constantă. Aceasta rămâne o condiţie esenţială a existenţei oricărui tip de componentă periodică (St). Oscilaţia în variaţia fenomenului analizat nu este specifică tuturor seriilor cronologice şi există prin urmare serii fără sezonalitate sau ciclicitate (din care influenţa sezonieră sau ciclică

a fost eliminată): ˆy S yt t t tε− = + sau ˆyt yt tSt

ε= × .

Componenta aleatoare sau întâmplătoare ( )tε este consecinţa apariţiei accidentale

a unei devieri de la trend sau de la oscilaţia specifică a seriei cronologice, sub influenţa unor factori imprevizibili, aleatori sau întâmplători. Este cazul concret al erorilor de observare statistică, al crizelor, al revoluţiilor, al cutremurelor, al inundaţiilor şi al altor fenomene considerate în general imprevizibile. Această componentă rămâne obligatoriu în modelul elementelor specific chiar dacă şi

trendul şi oscilaţia dispar: ˆy y St t t tε− − = sau ˆ

ytty St t

ε=×

Page 131: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

125

Atât trendul sau componenta sistematică ( yt ), cât şi oscilaţia sau componenta

periodică (St) se pot determina şi analiza statistică. Metodele elementare sau mecanice de determinare a trendului sunt diverse. Astfel, o primă metodă simplă este metoda bazată pe indicatorul mediu specific (media, mediana, modul), ce beneficiază de calitatea de imagine esenţială, centrală, tipică pentru seria cronologică analizată. O altă metodă este metoda mediilor mobile, care au rolul de a netezi anumite oscilaţii sau abateri accidentale (fluctuaţii în general). Aceste medii mobile se determină din numere pare sau impare de termeni succesivi ai seriei cronologice, (prin înlocuirea sistematică a primului termen luat în calcul cu primul termen nepreluat încă în calcul din seria cronologică) şi substituie termenii reali. În cazul calculării mediei dintr-un număr impar de termeni este necesar o singură netezire a mediilor obţinute, în locul termenilor iniţiali. Se poate exemplifica apelând la 8 preţuri înregistrate în opt săptămâni succesive, al căror nivel mediu se va calcula din câte 3 şi respectiv din câte 4 termeni succesivi:

• cazul mediei calculate din număr impar de termeni (K = 3)

1 2 3 4 5 6 7 8

1 2 3 4 5 6

p p p p p p p p

p p p p p p

↓ ↓ ↓ ↓ ↓ ↓ 1 2 31 3

p p pp

+ +=

(noua serie cronologică netezită este diminuată cu un număr de K-1 termeni). • cazul mediei calculate din număr par de termeni (K = 4)

5 71 2 3 4 6 8

1 2 3 4 5

1 2 3 4

p p p p p p p p

p p p p p

p p p pc c c c

↓ ↓ ↓ ↓ ↓

↓ ↓ ↓ ↓

1 2 3 4 1 21 1

4 2

p p p p p pp şi p c

+ + + += =

(după prima netezire se obţin cinci preţuri medii ca medii necentrate a câte patru termeni, iar după a doua netezire se ajunge la patru preţuri medii ca medii centrate a câte două preţuri medii necentrate obţinute anterior, în final se pierd K termeni). Numărul final al mediilor ce vor constitui noii termeni ai seriei cronologice, obţinute din câte K termeni (K = 3,4,…,n) este egal cu numărul iniţial de termeni ai seriei diminuat cu K-1 termeni sau cu K termeni la capetele acestuia. Obiecţiile de fond ale utilizării mediilor mobile sunt legate de diminuarea numărului termenilor, modul subiectiv de alegere al lui K şi imposibilitatea de previziune ulterioară, termenii dispăruţi fiind tocmai cei din capetele seriei.O metodă simplă este şi metoda grafică, a cărei ipoteză este aceea că toţi factorii de influenţă prezintă o acţiune constantă pe toată perioada de analiză. Se reprezintă mai întâi datele seriei cronologice printr-o historiogramă sau printr-o cronogramă. Apoi se stabileşte o tendinţă aproximativă a seriei cronologice, trasând vizual o dreaptă sau o curbă cât mai aproape de punctele reale din graficul specific menţionat şi care va uni punctele extreme ale acestui grafic. În acest fel se alege funcţia matematică ce caracterizează cel mai bine tendinţa seriei cronologice, direct din graficul realizat

Page 132: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

126

Metoda modificării medii absolute (a sporului mediu sau a reducerii medii - ∆ ) este recomandată atunci când evoluţia în timp a fenomenului se realizează în modificări absolute aproape egale, de la un termen la altul:

12 1 3 2 4 3 1...

1T

t t

y y

T−−∆ ≈ ∆ ≈ ∆ ≈ ≈ ∆ ≈ ∆ ≈−

Este o metodă de ajustare mecanică ce presupune înlocuirea termenilor reali sau empirici (yt) cu valori ajustate sau teoretizate specifice (y∆ ). Seria ajustată sau

seria termenilor teoretici este rezultatul utilizării unei progresii aritmetice simple cu

raţia egală cu modificarea medie (∆ ). 1 1y y= (primul termen ajustat este identic cu primul termen real),

2 1y y= + ∆ ,

( ) ( )3 1 1ˆ 2y y y= + ∆ + ∆ = + ∆ ,

… ( )1ˆ 1Ty y T= + − ∆ (ultimul termen ajustat este identic cu ultimul real).

Din punct de vedere grafic, metoda modificării medii este o dreaptă oblic ascendentă sau descendentă care uneşte primul termen cu ultimul termen al seriei reale sau empirice.

În concluzie, utilizarea metodei este indicată la acele serii cronologice unde alura graficului este aceea a unei drepte şi acolo unde creşterile sau descreşterile de la un termen real la altul sunt relativ egale. Relaţia de calcul specifică metodei rămâne

( )1ˆ 1y y T∆

= + − ∆ .

Metoda indicelui mediu presupune înlocuirea termenilor seriei empirice cu termenii unei progresii geometrice, pornind de la prima valoare reală (y1) şi

utilizând o raţie egală cu indicele mediu, respectiv I , unde: 1/( 1)

2

TT

t tt

I I− −== ∏ .

Metoda este recomandabilă acelor serii cronologice unde evoluţia în timp a fenomenului analizat îmbracă fie forma unor indici cu bază mobilă sau un lanţ

aproximativ egali: 12 1 3 2 4 3 11

... TTt t

yI I I I I

y−−≈ ≈ ≈ ≈ ≈ ≈ , fie a decalajelor sau a

avansurilor aproximativ egale între termenii succesivi, traduse prin ritmuri aproape

identice cu bază în lanţ: ( 1) ( 1)2 1 3 2 4 3 1

( 1) ( 1)

...t t t

t tt t

y ytR R R R

y y

− −−

− −

∆ −≈ ≈ ≈ ≈ ≈ = .

Este tot o metodă de ajustare mecanică ce substituie termenii seriei reale sau empirice cu termenii unei serii teoretice. Această serie "ajustată" are ca prim termen chiar prima valoare reală şi utilizează o progresie geometrică simplă cu

raţia egală cu indicele mediu (I ) şi care se construieşte astfel.

Page 133: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

127

1 1y y= (primul termen ajustat este identic cu primul termen real),

12y y I= ×

( ) ( ) ( )2

1 13y y I I y I= × = ×

( )1

ˆ 1T

y y IT−

= × (ultimul termen ajustat este identic cu ultimul real).

În cazul metodei indicelui mediu, din punct de vedere grafic, în historiograma sau cronograma finală, locul dreptei oblic ascendente sau descendente, specifice metodei modificării medii absolute, este luat de o curbă exponenţială.

În concluzie, utilizarea metodei este indicată la seriile cronologice unde alura graficului este aceea a unei curbe exponenţiale şi acolo unde creşterile sau descreşterile de la un termen la altul prezintă ritmuri aproape egale.

Relaţia de calcul a metodei indicelui mediu este următoarea: ( 1)

1ˆT

y y It−

= × .

În afara unor metode elementare, trendul sau componenta sistematică a unei serii cronologice (yt ) se poate determina şi prin intermediul metodelor analitice,

bazate pe identificarea unor funcţii matematice, respectiv prin trend liniar şi trend neliniar (exponenţial, parabolic, hiperbolic, etc.). Demersul de parametrizare a trendului liniar sau neliniar este urmarea fireasca a utilizării metodei celor mai mici pătrate, urmărind minimizarea pătratelor abaterilor valorilor ajustate , de la

termenii reali sau empirici: ( )2ˆty yt− =∑ minim

Dacă prin metoda grafică s-a identificat o posibilă funcţie de ajustare

liniară şi se acceptă această ipoteză , respectiv yt = a + bt , unde t = 1T , atunci

parametrii a şi b se calculează ca soluţii simple ale sistemului cunoscut deja de la regresia de tip liniar, în care x este înlocuit cu t. Fără a mai menţiona operatorului sumă limitele evidente, acest sistem devine egal cu:

a + b i tt y=∑ ∑

a 2i i i tt b t t y+ =∑ ∑ ∑

Deoarece timpul nu este o variabilă cauzală sau explicativă, ci o variabilă reper, atunci se facilitează soluţionarea rapidă a sistemului printr-un artificiu de

calcul conform căruia 0it =∑ . Acest lucru se realizează diferenţiat în raport cu

numărul termenilor seriei cronologice. a) Dacă numărul de termeni este impar, atunci t = 0 devine valoarea mediană

(centrală) şi t se retranscrie, ca o progresie aritmetică cu raţia "1", conform exemplului următor:

Anul (t) iniţial: 1 2 3 4 5 6 7 0it⇒ ≠∑

Anul (t) artificializat: -3 -2 -1 0 1 2 3 0it⇒ =∑

b) Dacă numărul termenilor este par se poate proceda în două variante:

Page 134: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

128

• atunci când seria cronologică este mai lungă de 12 termeni se renunţă la primul termen, fără a conduce la o schimbare esenţială a estimării (se artificializează apoi ca la punctul anterior).

• când seria este scurtă, se păstrează toţi termenii; centrarea prin t = 0 nu este posibilă din cauza numărului impar al termenilor, iar pentru cei doi termeni aflaţi în mijlocul seriei se vor folosi valorile "-1" şi "1” , ceea ce modifică raţia, care devine astfel egală cu "2”.

Anul (t) iniţial: 1 2 3 4 5 6 0it⇒ ≠∑

Anul (t) artificializat: -5 -3 -1 1 3 5 0it⇒ =∑

Prin condiţia 0it =∑ , sistemul se simplifică esenţial şi devine urmǎtorul:

na = ty∑ tya y

n⇒ = =∑ (a este media aritmetică a variabilei)

b 2i i tt t y=∑ ∑ 2

i t

i

t yb

t⇒ = ∑

∑ (b este panta trendului liniar)

Parametrul b este esenţial pentru evoluţia în timp a fenomenului studiat, el având semnificaţia unui multiplicator. Astfel, b exprimă efectiv cu câte unităţi de măsură ale variabilei analizate se modifică nivelul fenomenului la o variaţie a timpului t cu o unitate (oră, zi, lună, trimestru, an).Aprecierea calităţii estimării tendinţei generale a fenomenului se realizează prin intermediul a doi coeficienţi:

Coeficientul de eroare (e) sau Coeficientul de determinaţie (D):

e =

( )2ˆ

100

y yt t

n

y

−∑

× D = ( )( )

2

2

ˆ1 100

y yt t

y yt

−∑− ×

−∑

Ambii coeficienţi pot lua valori teoretice cuprinse între 0% şi 100%, coeficientul de eroare a ajustării (e) tinzând în mod evident către zero, iar coeficientul de determinaţie a ajustării (D) către sută la sută. În situaţia în care valorile e şi D nu sunt acceptabile, procentul reprezentat de e fiind mult mai mare decât 5%, iar cel al lui D mult mai mic de 95% (eroarea de 5% fiind limita de acceptare a unei erori în gândirea statistică în ceea ce priveşte analiza fenomenelor sociale şi economice), atunci se revine la metoda grafică, respectiv la historiogramă sau cronogramă, în încercare de emite o altă ipoteză, aceea a unui trend neliniar.

Un trend neliniar de tip exponenţial ( yt = a + bit ) generează în urma aplicării

metodei celor mai mici pătrate sistemul: n lg a + lg lgi tt b y=∑ ∑

2lg lg lgi i i tt a t b t y+ =∑ ∑ ∑ , care prin artificiul it∑ = 0, devine:

Page 135: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

129

n lg a = lglg lg t

t

yy a anti

n

⇒ =

∑∑

22

lglg lg lg i t

i i ti

t yt b t y b anti

t

= ⇒ =

∑∑ ∑∑

Un trend neliniar de tip parabolic (printr-o funcţiei de gradul II yt = a + bti + ct2i ),

în urma aplicării metodei celei mai mici pătrate, conduce la sistemul :

na + bΣ ti + cΣ t 2i = ty∑

2 3i i i i ta t b t c t t y+ + =∑ ∑ ∑ ∑ , care prin it∑ = 0, devine: 2 3 4 2i i i i ta t b t c t t y+ + =∑ ∑ ∑ ∑

2i tna c t y+ =∑ ∑ ( ) ( )( )22 2 2 2 41 t i i i t i ii

a n y t t y n t y t n t ⇒ = − − − ∑ ∑ ∑ ∑ ∑ ∑ ∑

2i i tb t t y=∑ ∑ ( ) 2

i t ib t y t⇒ = ∑ ∑

2 4 2i i i ta t c t t y+ =∑ ∑ ∑ ( ) ( )2 2 2 4

i i i i i ic t y n t y t n y ⇒ = − − ∑ ∑ ∑ ∑ ∑

Un trend neliniar de tip hiperbolic ( yt = a + b1

ti

) dă naştere prin metoda celor mai

mici pătrate sistemului: 1

ti

na b yt

+ =∑ ∑

2

1 1 1t

i i i

a b yt t t

+ = ×∑ ∑ ∑ ; care prin 0it =∑ , devine:

tna y=∑ 1 ta n y a y⇒ = ⇒ =∑

1 1t

i i

b yt t

= ×∑ ∑ 1 1t

i i

b yt t

⇒ = ×

∑ ∑

Există şi alte funcţii matematice de tip neliniar (funcţia logistică yt = ( )1tia bc+ ,

funcţia Gompertz yt =ctia b× etc.) capabile să descrie corect trenduri sau ipoteze

de trend neliniar. Alegerea celei mai îndreptăţite funcţii pentru a caracteriza trendul sau componenta sistematică a unei serii cronologice este realizabilă prin calculul coeficienţilor descrişi e şi D, precum şi prin alte metode specifice de testare a ipotezelor statistice de trend emise. Pentru componenta oscilatorie sau periodică (St), nespecifică tuturor seriilor cronologice, ca şi trendul, se utilizează cu o frecvenţă mai mare, determinarea sezonalităţii în cazul seriilor cronologice staţionare (lipsite de trend).Percepută sub formă de oscilaţii periodice la intervale mai mici de un an, sezonalitatea se determină fie ca vârf sau maxim sezonal, printr-

Page 136: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

130

un raport specific, fie ca val sezonier, prin intermediul indicilor de sezonalitate. În situaţia când datele statistice sunt disponibile numai pentru un singur an, singura soluţie este determinarea vârfului sau a valorii maxime sezonale ca un raport de

tipul:max (St) = max ( )

min ( )

yt

yt, unde yt reprezintă producţia, cifra de afaceri, valoarea

adăugată sau orice alt indicator analizat lunar, trimestrial.Atunci când se deţin informaţii pe o perioadă de trei până la cinci ani consecutivi se poate caracteriza întregul val sau întreaga mişcare oscilatorie prin intermediul indicilor de sezonalitate calculaţi prin metoda mediilor aritmetice, prin metoda mediilor mobile

sau prin metoda trendului.Toate metodele presupun calculul mediilor lunare ty

(reale ca în cazul metodei mediilor aritmetice sau reale şi ajustate ca în situaţia celorlalte două metode, respectiv a mediilor mobile şi a trendului), urmat de

determinarea mediei generale y şi, în final, de evoluarea sezonalităţii prin

intermediul indicelui de sezonalitate: 100ytI St y

= × sau 100ytI St yajustat

= × .

(pentru metoda mediilor aritmetice) (pentru celelalte metode)

7.4 Previziune şi ierarhizare statistică Deşi conştientă de incertitudinea evoluţiei fenomenelor în timp, gândirea

statisticǎ a cǎutat să identifice procedee simple de previziune. La ipoteza creşterii gradului de incertitudine, pe măsura majorării orizontului de previziune se adaugă şi ipoteza autocorecţiei fenomenelor în populaţii finite, care nu suportă accelerări de creştere sau descreştere pentru perioade mai lungi de timp.Orice acceleraţie este practic pândită de o deceleraţie, în seriile cronologice de tip economic, social. Previziunea, apărută din dorinţa de anticipare a evoluţiei viitoare a termenilor unei serii cronologice se concretizează în examinarea atentă atât a trendului cât şi a oscilaţiilor periodice, urmând conturul ciclului fenomenului primar, evoluţia specifică în perioada trecută, factorii cu acţiune semnificativă în viitor, adecvarea perioadei analizate pentru estimarea corectă a sezonalităţii etc. Caseta următoare detaliază câteva concepte nuanţat apropiate de semnificaţia previziunii. Caseta nr. 7.3 Terminologia statistică este destul de variată, previziunea având similitudini aproape depline în conţinut cu prognoza, termen preluat din statistica şi demografia franceză sau relative cu proiectarea, predicţia, estimarea, planificarea, perspectiva, prospecţia, etc. Utilizarea termenului de prognoză subliniază că din mulţimea variantelor a fost atent selectată aceea care deţine cea mai mare probabilitate de a se realiza (semnificaţia meteorologică a termenului forecast fiind relevantă în acest sens). Proiectarea şi estimarea au la bază analiza fenomenului şi ipotezele structurale, dar majoritar exclusiv interne sistemului. Predicţia este rezultatul studiului extins, implicând şi acţiunea factorilor externi procesului sau fenomenului. O planificare bună include în semnificaţia ei generală şi predicţia. Utilizarea în locul planificării sau prognozei a termenului de previziune este menită să sublinieze că nu au fost disponibile date cu un grad ridicat de acoperire, precizie

Page 137: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

131

şi ipoteze complete privind acţiunea cuantificată a tuturor factorilor şi mai ales a celor intercompensaţi. Dacă perspectiva admite că deţine conturul relativ vag al viitorului, înglobând realul în măsură semnificativă ca şi fictivul sau ficţiunea, prospecţia sau prospectologia completează previziunea cu acţiunea în spiritul atingerii acesteia Chiar dacă se va alege cu mare atenţie termenul de previziune sau prognoză, ori un substitut nuanţat al acestora, apar imediat alte întrebări generând alte opţiuni necesare, respectiv conceptul va fi însoţit de o nouă caracteristică adjectivală definitorie exploratorie, tendenţială, oscilatorie, normativă, globală, analitică, fundamentală, secvenţială etc. În mod obişnuit se elaborează mai multe variante de previziune sau prognoză, fie în funcţie de natura şi mărimea parametrilor folosiţi, fie în funcţie de abordarea timpului ca variantă explicativă sau nu, a fenomenului.În mod practic apar două cerinţe: a) prima cerinţă este conferită de lipsa unei date în interiorul unui interval, fapt ce impune o estimare denumită frecvent interpolare (reconstituirea unui singur termen sau a mai multora din seria cronologică iniţială, termeni ce, fie nu au fost determinaţi, fie au dispărut); b) a doua cerinţă este rezultatul dorinţei de a identifica date în afara intervalului, cunoscută ca soluţie de extrapolare.Extrapolarea este tipul de prognoză cu cele mai multe aplicaţii practice. Extrapolarea se realizează prin metode mecanice, dintre care mai frecvent utilizate metoda modificării medii

absolute (∆ ) şi metoda indicelui mediu (I ), dar şi prin metode analitice. Metoda modificării medii absolute este utilizată în ipoteza constatării pe baza analizei aproximativ constante între două momente (intervale) succesive. Relaţia de

calcul devine: ( )1ˆ 1Ky y K∆

= + − ∆ , unde: 1

1Ty y

T

−∆ =−

, iar K > T şi T = 2,n .

Metoda indicelui mediu este folosită în ipoteza identificării pe baza analizei perioadei trecute a unui ritm al modificări aproximativ constant între două

momente (intervale) succesive. Relaţia de calcul este:( )1

1ˆK

KI

y y I−

= × ,unde

1

1

TT

yI

y−= , iar K > T şi T = 2,n .Ambele metode pot fi aplicate şi în cazul în care

se dispune de un număr limitat la numai doi termeni într-o serie cronologică (primul şi respectiv ultimul termen).Extrapolarea prin metode analitice este o prognoză bazată pe funcţia matematică de ajustare a seriei empirice. Aşa cum s-a constatat din analiza trendului liniar şi neliniar, extrapolarea analitică se bazează pe funcţii speciale de tip liniar ( y a bKK = + ), exponenţial ( ˆ K

Ky a b= × ), parabolic

( 2ˆKy a bK cK= + + ), hiperbolic (1

ˆKK

y a b= + × ) etc.

În concluzie, previziunea bazată pe seriile cronologice anticipează relativ corect un anumit termen al seriei cronologice, în funcţie de calitatea datelor, acurateţea metodelor, aprofundarea fenomenului economic. În realitate, componenta aleatoare sau întâmplătoare tε , nefiind practic posibil de prognozat, aceasta va acţiona chiar

şi asupra celor mai bune şi detaliate prognoze. Validarea integrală a anticipărilor statistice este mai curând o imposibilitate, nu există şi nu va exista o previziune sau

Page 138: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

132

o prognoză perfectă. Aşa cum s-a constatat încă de la gruparea statistică sau de la sistematizarea datelor, gândirea de tip statistic ordonează, valorizează, dar şi ierarhizează. Clasificarea definită ca o grupare stabilizată în timp este bazată tot pe ordonare şi ierarhizare. Abordarea simplă, unicriterială este utilă în plan teoretic, dar în plan practic poate fi semnificativ completată şi chiar contrazisă. Prin urmare, ierarhizarea, mai ales cea de tip teritorial este cu atât mai obiectivă cu cât criteriile utilizate sunt mai numeroase şi mai adecvate. O ierarhizare teritorială multicriterială optimă este sinonimă cu discernământul selectării criteriilor şi moderaţia în ceea ce priveşte numărul şi importanţa acestora. Principalele metode de ierarhizare teritorială multicriterială sunt metoda rangurilor, metoda distanţei relative şi metoda matricială. Metoda rangurilor sau a numerelor de ordine constă din următoarele etape: a) acordarea de ranguri pentru fiecare criteriu analizat (caracteristică sau variabilă analizată) în funcţie de nivelul atins de fiecare teritoriu în parte; b) stabilirea scorului realizat de către fiecare teritoriu printr-o simplă cumulare finală (însumare de ranguri parţiale obţinute); c) ierarhizarea finală sau acordarea de ranguri finale, în funcţie de scorul realizat.Metoda are avantajul supleţei şi simplităţii, dar şi marele dezavantaj al incapacităţii de departajare corectă a unităţilor teritorial-administrative între ele, ca distanţe. Astfel, deşi locul I şi al II-lea pot fi destul de apropiate ca scor final, locul al II-lea se poate afla la o distanţă foarte mare fără a cunoaşte concret semnificaţia acestei distanţe.Aşa se face că metoda distanţei relative este special realizată pentru a departaja cât mai clar şi mai ales pentru a evalua distanţele dintre teritoriile ierarhizate.Metoda distanţei relative impune respectarea unor etape: 1. calculul pentru fiecare teritoriu sau unitate teritorial-administrativă a distanţei relative în raport cu distanţa maximă (y maxim); teritoriul ce deţine valoarea maximă capătă distanţa relativă egală cu 100,0%, iar celelalte valori generează indici

teritoriali specifici: 100/maxmax

yid Ir i y= = ×

2.determinarea distanţei medii ca o medie geometrică simplă a distanţelor relative

la nivelul fiecărui teritoriu: / max1 1

n n

n ni i

i i

d I d= =

= =∏ ∏

3. acordarea de ranguri finale fiecărei unităţi teritoriale în raport cu nivelul atins de distanţa medie, pornind de la distanţa medie cea mai mare la cea mai mică. Metoda distanţei relative permite o departajare netă a unităţilor administrativ-teritoriale, inclusiv a unităţilor teritoriale succesive.

7.5 Test de autoevaluare şi aplicaţii A) Test de autoevaluare

A1) Întrebări clasice recapitulative

(Completaţi spaţiile goale) 1. Care este principala diferenţă între seria temporală şi teritorială de date?

A2) Întrebări tip gril ă

(Încercuiţi litera răspunsului corect) 6.Identificaţi varianta de răspuns care nu constituie o proprietate a termenilor seriei

Page 139: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

133

2. Care sunt principalii indicatori relativi şi medii ai seriei cronologice?

3. Care sunt indicatorii specifici ai unei serii teritoriale de date?

4.Care sunt metodele macanice şi analitice de previziune a seriilor cronologice?

5.Care sunt metodele de ierarhizare în cazul seriilor de date teritoriale?

teritoriale: a)simultaneitate; b) omogenitate; c) independenţă; d) interdependenţă. 7. Nu este considerată raţională şi nu se practică însumarea termenilor unei serii cronologice: a) de momente sau de stoc ; b) de intervale sau de flux; c) exprimate în unităţi valorice; d) exprimate în unităţi fizice. 8. Extrapolând datele din tabel prin metoda sporului mediu identificaţi producţia în anul t+5: a) 470 ; b) 475; c) 480 ; d) 485 .

Anul t t+1 t+2 t+3 t+4 Producţia -to 200 260 300 350 420

9. Extrapolând datele din tabel prin metoda indicelui mediu identificaţi profitul în iunie: a) 170,5 ; b) 173,1; c) 175.7 ; d) 178,3 .

Luna I II III IV V Profit -mii lei 110 120 135 148 160

B) Aplicaţii rezolvate 1.Utilizând seriile cronologice următoare să se determine indicatorii: a) absoluţi; b) relativi; c) medii: Ziua 1.X 2.X 3.X 4.X 5.X Luna I II III IV V Preţ (lei) 10,0 10,9 11,5 12,0 12,3 Salariaţi 57 53 49 46 45 Rezolvare: Prima serie este de momente, iar a doua de intervale.

Indicatori absoluţi în seria cronologică de momente

Indicatori absoluţi în seria cronologică de intervale

Tabel nr. 7.1 Modificări absolute cu

bazǎ Data Preţ

-yt- fixă

[ ]/1t∆

în lanţ

( )/ 1t t− ∆

1.X 2.X 3.X 4.X 5.X

10,0 10,9 11,5 12,0 12,3

0 0,9 1,5 2,0 2,3

- 0,9 0,6 0,5 0,3

Total - - 2,3

Tabel nr. 7.2 Modificări absolute cu

bază Luna Număr

salariaţi -yt- fixă

[ ]/1t∆

în lanţ

( )/ 1t t− ∆

I II III IV V

57 53 49 46 45

0 -4 -8 -11 -12

- -4 -4 -3 -1

Total 250 - -12 Indicatori relativi în seria cronologică de momente

Tabel nr. 7.3 Indici cu bază Ritmuri cu bazǎ Valori absolute ale

unui % cu bază fixă în lanţ fixă în lanţ fixă în lanţ

-yt-

I t/1 I t/(t-1) Rt/1 Rt/(t-1) At/1 At/(t-1) 10,0 100,0 - 0,0 - 0,1 - 10,9 109,0 109,0 9,0 9,0 0,1 0,1

Page 140: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

134

11,5 115,0 105,5 15,0 5,5 0,1 0,109 12,0 120,0 104,3 20,0 4,3 0,1 0,115 12,3 123,0 102,5 23,0 2,5 0,1 0,120

Indicatori relativi în seria cronologică de intervale Tabel nr. 7.4

Indici cu bază Ritmuri cu bazǎ Valori absolute ale unui % cu bază

fixă în lanţ fixă în lanţ fixă în lanţ

-yt-

I t/1 I t/(t-1) Rt/1 Rt/(t-1) At/1 At/(t-1) 57 100,0 - 0,0 - 0,57 - 53 93,0 93,0 -7,0 -7,0 0,57 0,57 49 86,0 92,5 -14,0 -6,5 0,57 0,53 46 80,7 93,9 -19,3 -6,1 0,57 0,49 45 78,9 97,8 -21,1 -2,2 0,57 0,46

Indicatori medii în seria de momente Preţul mediu în fiecare din cele patru zile poate fi considerat o medie simplă a preţurilor de la începutul şi sfârşitul zilei (preţul începutului zilei următoare):

p 1-2X= 1 2 10 10,910,45

2 2

p p+ += = lei; p 2-3X= 2 3 10,9 11,511,2

2 2

p p+ += = lei;

p 3-4X= 3 4 11,5 12,011,75

2 2

p p+ += = lei; p 4-5X= 4 5 12,0 12,312,15

2 2

p p+ += = lei

p 1-5X=

512 3 4

1 45,552 2 11,38751 5 1 4

T

tt

ppp p p p

T=

+ + + += = =

− −

∑lei(medie cronologică simplă)

Notă: Dacă preţul mediu era detaliat pe luni se calcula ca o medie cronologică

ponderată astfel : ( )

( ) ( ) ( )

( ) ( ) ( )

2 1 11 1 21 2 1

2 1 11 1 2

...2 2 2 2

...2 2 2 2

T T T

TT

crT T T

t t tt t ty y y y

yt t tt t t

− − −−

− − −

++× + × + + × + ×= +++ + + +

concret : 31 31 28 28 31 31 30 30

10 10,9 11,5 12 12,3 1366,32 2 2 2 231 31 28 28 31 31 30 30 1202 2 2 2 2

pcr

+ + +× + × + × + += = =+ + ++ + + +

=11,38583 lei

Modificarea medie /1

1 1t t iy y

T T

∆ −∆= =− −

iar în cazul preţului ∆ = (2,3: 4) = 0,575 lei.

Indicele mediu ( )1 tT

i

yI

y−= iar în cazul preţului I 4

12,31,0531

10= = sau 105,31%

Ritmul mediu ( ) ( ) ( ) ( )/ 1 1% % 100%t t tR I− −= − , respectiv R preţului = 5,31%

Page 141: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

135

Indicatori medii în seria de intervale

Numărul mediu lunar de salariaţi tyy

T= ∑ = y =250:5=50.

Modificarea medie /1

1 1t t iy y

T T

∆ −∆= =− −

în cazul salariaţilor ∆ = 123

4

− = − persoane

Indicele mediu ( )1 tT

i

yI

y−= iar în cazul salariaţilor I 4

450,9426

57= = sau 94,26%

Ritmul mediu ( ) ( ) ( ) ( )/ 1 1% % 100%t t tR I− −= − , respectivR număr de salariaţi = -5,74%.

2.Care sunt indicatorii seriei teritoriale de mai jos, constituită din cifra de afaceri anuală, în milioane lei, a celor cinci filiale ale unei societăţi comerciale, situate în cinci oraşe distincte: Bucureşti=10,1; Iaşi=5,2; Cluj=4,3;Timişoara=3,0;Piteşti=2,4. Rezolvare:Se calculează tabelar toate sistemele de indicatori specifici.

Indicatori absoluţi ai seriei teritoriale Tabel nr.7.5 Nr. crt.

Filiala teritorială

Cifra de afaceri (yi) (milioane lei RON )

Decalajul absolut faţă de filiala din

Bucureşti ( /i j∆ )

Avansul absolut faţă de filiala din Piteşti

( /i j∆ )

1 2 3 4 5

Bucureşti Iaşi Cluj Timişoara Piteşti

10,1 5,2 4,3 3,0 2,4

0,0 -4,9 -5,8 -7,1 -7,7

7,7 2,8 1,9 0,6 0,0

Indicatori relativi ai seriei teritoriale Tabel nr. 7.6

Indici teritoriali (Ii/j) ai: Rata ( (%)/i j∆ ) de: Nr.

crt. Filiala

teritorială Cifra de

afaceri (yi) milioane lei

RON

decalajului faţă de

Bucureşti

avansului faţă de Piteşti

decalaj faţă de

Bucureşti

avans faţă de Piteşti

1 2 3 4 5

Bucureşti Iaşi Cluj Timişoara Piteşti

10,1 5,2 4,3 3,0 2,4

100,0 51,5 42,6 29,7 23,8

420,8 216,7 179,2 125,0 100,0

0,0 -48,5 -57,4 -70,3 -76,2

320,8 116,7 79,2 25,0 0,0

Indicatorii medii ai seriei teritoriale :

a) cifra medie de afaceri 255

5iy

n= = =∑ milioane lei;

b) cifra mediană de afaceri: etapa I – localizare CAmediană= 13

13

2

ny

+ = ⇒ = ymedian

etapa II – mediana coincide cu filiala Cluj, respectiv cu 4,3 milioane lei; Cifra de afaceri modală nu se poate preciza (serie amodală n1 = n2 = … = ni = 1) .

Page 142: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

136

Indicatori statistici relativi ai seriei teritoriale agregabile Tabel nr. 7.7 Nr. crt.

Filiala teritorială

Cifra de afaceri (yi)

mil lei RON

ii

i

yg

y=∑

g 2

i Indicele de repartiţie teritorială Gini-Struck (CG-

S-) 1 2 3 4 5

Bucureşti Iaşi Cluj Timişoara Piteşti

10,1 5,2 4,3 3,0 2,4

0,404 0,208 0,172 0,120 0,096

0,163216 0,043264 0,029584 0,014400 0,009216

2 10,273

1

n giCG S n

−∑= =− −

pentru n = 5 şi 2 0,25968ig =∑

TOTAL 25,0 1,000 0,25968 Notă: Indicele Gini-Struck obţinut subliniază că filialele prezintă o concentrare spaţială la limita moderaţiei (0,3), existând resurse pentru o repartizare mai echilibrată. 3. Extrapolând datele din tabelul alăturat prin metoda trendului liniar prognozaţi umărul salariaţilor în luna iunie, calculaţi şi interpretaţi valorile parametrilor a şi b, apreciaţi calitatea prognozei cu coeficientul de eroare şi coeficientul de determinaţie .

Tabel nr. 7.8 Luna Număr mediu de

salariaţi (yt) Ianuarie Februarie Martie Aprilie Mai

570 530 490 460 450

Total 2500 Tabel nr. 7.9 Luna Număr mediu

de salariaţi (yt) (ti)

(ti)

2

yt × (ti) yt ( )2

ˆy yt t− ( )2

ty y−

Ianuarie Februarie Martie Aprilie Mai

570 530 490 460 450

-2 -1 0 1 2

4 1 0 1 4

-1140 -530

0 460 900

562 531 500 469 438

64 1

100 81 144

4900 900 100 1600 2500

Total 2500 0 10 -310 2500 390 10000 Parametrii a şi b se obţin din sistemul de ecuaţii următor: 5a = 2500 500a⇒ = salariaţi, de unde yt = 500 - 31t

10b = -310 31b⇒ = − salariaţi/lună Termenii teoretici sau ajustaţi prin metoda trendului liniar sunt calculaţi pe baza funcţiei de gradul I parametrizate yt = 500 - 31t, unde t = -2,-1, 0, 1, 2 (pentru t = -

2 ⇒ yt = 500 - 31 (-2) = 562 etc.).Interpretarea parametrului a subliniază nivelul

mediu al seriei reale sau empirice (a = 500 de salariaţi, ca medie a primelor 5 luni) şi a lui b ilustrează panta trendului liniar sau demultiplicatorul lunar teoretic al numărului mediu al salariaţilor (b = -31 salariaţi, la fiecare schimbare de lună). Prognoza lunii iunie va fiyk= 500 - 31 (k) = 407 salariaţi, pentru k = 3. (iunie) Aprecierea calităţii estimării tendinţei generale de evoluţie a fenomenului Coeficientul de eroare (e) şi coeficientul de determinaţie (D):

Page 143: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

137

e =

( )2ˆ

100

ty ytny

×

∑ = 1,76% D =

( )( )

2

2

ˆ1 100

t

t

y yt

y y

− − × −

∑ = 96,1%.

Coeficientul de eroare de 1,76% traduce în unităţi procentuale cu cât se abat în medie termenii reali (yt) de la linia de tendinţă (trendul liniar yt = 500 - 31t) şi

exprimă o eroare redusă ca urmare a unei bune capacităţi a funcţiei de ajustare şi prognoză de a reflecta evoluţia reală a variabilei. Coeficientul de determinaţie arată că din totalul numărului mediu al salariaţilor 96,1% sunt surprinşi în funcţia liniară de ajustare analitică (96,1% din cota de variaţie este inclusă în totalul variaţiei numărului mediu al salariaţilor sau funcţia matematică parametrizată yt = 500 - 31t surprinde 96,1% din evoluţia şi prognoza variabilei).

4. O societate comercială a realizat trimestrial timp de trei ani consecutivi nivelurile producţiei,prezentate în tabelul alăturat şi exprimate în mii produse standard. Să se determine indicii de sezonalitate specifici acestei firme şi să se identifice trimestrele ideale pentru plecări în concediu de odihnă.

Tabel nr. 7.10 Anul /

Trimestrul

T

T+1

T+2

Total I II III IV

3 4 5

1,5

2 3 4 1

1 2 3

0,5

6 9 12 3

Total 13,5 10 6,5 30

Rezolvare:Calculul indicilor de sezonalitate este prezentat în tabelul de mai jos: Tabel nr. 7.11

Anul / Trimestrul

T T+1 T+2 ty∑

ty ( : ) 100I y ytSt= ×

I II III IV

3 4 5

1,5

2 3 4 1

1 2 3

0,5

6 9 12 3

2 3 4 1

(2/2,5) ×100 = 80,0 (3/2,5) ×100 = 120,0 (4/2,5) ×100 = 160,0 (1/2,5) ×100 = 40,0

Total 13,5 10 6,5 30 y = 2,5 400,0

Trimestrele ideale pentru plecarea în concediu a salariaţilor în raport cu sezonalitatea producţiei sunt I şi IV. 5. Valorificând datele din tabelul alăturat realizaţi ierarhizarea multicriterială a teritoriilor analizate, conform metodelor rangurilor şi a distanţei relative. Apreciaţi calitatea fiecăreia dintre metode în parte.

Tabel nr. 7.12 Caracteristica

Teritoriul -y1- -y2- -y3- -y4- A B C D E F

110,9 78,9

312,7 238,4 49,0 93,0

7,93 10,21 38,63 21,70 5,38

10,18

4,0 3,3 1,0 5,3 3,3 3,6

69,4 73,9 61,9 52,7 56,1 65,1

Page 144: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

138

Rezolvare: Ierarhizarea finală a fiecărui teritoriu după metoda rangurilor este: Tabel nr. 7.13.

Caracteristica Rang conform ri Teritoriul -y1- -y2- -y3- -y4- -y1- -y2- -y3- -y4-

Scor

( ir∑ )

Rang final

A B C D E F

110,9 78,9

312,7 238,4 49,0 93,0

7,93 10,21 38,63 21,70 5,38

10,18

4,0 3,3 1,0 5,3 3,3 3,6

69,4 73,9 61,9 52,7 56,1 65,1

3 5 1 2 6 4

5 3 1 2 6 4

2 4 6 1 4 3

2 1 4 6 5 3

12 13 12 11 21 14

II-III IV

II-III I

VI V

Notă: Rangurile de la 1 la 6 privind nivelul tuturor indicatorilor (yi) s-au acordat pornind de la cea mai mare valoare a indicatorului către cea mai mică, iar rangul final în mod invers. Alegerea subiectivă a criteriilor este problemă de fond a metodei rangurilor, alături de dificultatea departajărilor corecte a teritoriilor ( ex: II şi III). Tabel nr. 7.14

Distanţa relativă (dr = yi/ymax × 100)

Teritoriul

-d1- -d2- -d3- -d4-

Distanţa medie

nd di= ∏

Rangul final

A B C D E F

35,47 25,23

100,00 76,24 15,67 29,74

20,53 26,43

100,00 56,17 13,93 26,35

75,47 62,26 18,87

100,00 62,26 67,92

93,90 100,00 83,76 71,31 75,91 88,09

47,66 45,14 63,05 74,09 31,87 46,53

III V II I

VI IV

Metoda distanţelor relative soluţionează favorabil departajarea aşa cum rezultă din calculul distanţelor relative la nivel de caracteristică ti prin distanţa medie ce conduce la acordarea de ranguri distincte pentru fiecare teritoriu în parte.

C) Aplicaţii propuse spre rezolvare 1. Valorificând indicatorii firmei Z după primele cinci luni, extrapolaţi nivelul acestora pentru luna iunie şi iulie şi calculaţi coeficientul de eroare per metodă: Tabel nr. 7.15

Luna Nr. crt.

Indicator UM

I II III IV V 1 Cifra de afaceri mil lei 13,5 14,0 16,7 18,0 20,5 2 Producţia (Q) to 410 435 480 505 510 3 Număr de salariaţi persoane 104 96 90 82 80 4 Fond de salarii mil.lei 0,45 0,48 0,51 0,52 0,60 5 Profit mil.lei 0,51 0,60 0,64 0,72 0,81

2. Producţia trimestrială de lapte, exprimată în mii hectolitri, realizată în trei ani de către firma Y este prezentată în tabelul următor: Tabel nr. 7.16 - în mii hectolitri-

Producţia realizată Anul Trimestrul I Trimestrul II Trimestrul III Trimestrul IV

T 15,4 25,6 22,3 20,2 T+1 21,2 28,3 25,5 20,7

Page 145: Statistic A

Analiza cronologică şi teritorială a seriilor de date Capitolul 7

139

T+2 20,4 23,5 20,0 21,5 Stabiliţi indicii de sezonalitate prin metodele mediei aritmetice şi mediei mobile. 3. Folosind datele de mai jos să se realizeze ierarhizarea multicriterială a regiunilor analizate, după metoda rangurilor şi metoda distanţei relative: Tabel nr. 7.17

Terito- riul

PIB

$/ loc

Den- sitate

loc/km2

Rata de

activitate %

Rata de ocupare

%

Rata de şomaj

%

Rata

anuală a inflaţiei

%

Gradul de

alfabetizare al populaţiei

adulte %

Speranţa

de viaţă în ani

A 6011 104 39,1 60,5 15,3 20,2 92,9 67,0 B 6142 114 40,2 64,2 14,5 12,5 91,0 69,8 C 6680 98 39,5 65,2 13,9 9,1 93,6 69,0 D 6875 130 41,4 62,8 12,8 14,2 92,8 68,1 E 6556 86 43,5 68,2 14,2 18,4 94,8 69,1 F 7648 92 44,6 68,1 12,0 8,5 93,9 70,5

Comentaţi pe scurt rezultatele obţinute prin cele două metode. 7.6. Rezumat Tendinţele temporale şi spaţiale ale unui fenomen, analizate statistic prin indicatori absoluţi, relativi şi medii, permit atât extrapolări temporale cât şi ierarhizări spaţiale, prin metode specifice axate pe repere esenţiale în înţelegerea ciclicităţii, sezonalităţii, oscilaţiilor aleatoare în timp. Particularităţile şi tipologia seriilor cronologice şi teritoriale de date statistice, specificitatea sistemelor de indicatori statistici, alături de obligaţia de a acoperi lipsa involuntară a unor termeni interni, şi de nevoia de anticipare a lor în exteriorul seriei

de date generează dilema alegerii între metoda sporului mediu: ( )1ˆ 1Ty y T= + − ∆ şi a

indicelui mediu: ( )1

1ˆT

Ty y I−

= × , sau cea analitică a trendului. Dilema este soluţionată prin

aprecierea calităţii metodei de prognoză a tendinţei generale a fenomenului economic analizat cu ajutorul a doi coeficienţi specifici:

Coeficientul de eroare (e) şi Coeficientul de determinaţie (D):

e =

( )2ˆ

100

y yt t

n

y

−∑

× D = ( )( )

2

2

ˆ1 100

y yt t

y yt

−∑− ×

−∑

Ambii coeficienţi pot lua valori teoretice cuprinse între 0% şi 100%, coeficientul de eroare a ajustării (e) tinzând în mod evident către zero, iar coeficientul de determinaţie a ajustării (D) către sută la sută. Alături de prognoză şi ierarhizare studiul seriilor de date cronologice şi teritoriale mai permite pe analize de sezonalitate, precum şi analize de decalaj sau avans teritorial. În situaţia seriilor de date empirice, serii profund diferite atât între ele, cât şi în raport cu propria evoluţie în timp şi spaţiu, ca urmare a fiecărui termen nou apărut, nu va putea exista o unică soluţie de prognoză şi, cu atât mai mult, nici un panaceu metodic de interpolare sau extrapolare iar componenta aleatoare va fi mereu imposibil de estimat.

Page 146: Statistic A

Indicatori statistici economici Capitolul 8

140

Tema 8 INDICATORI STATISTICI ECONOMICI CUPRINS: Pag. 8.1 Metode şi instrumente statistice aplicate în macro şi microeconomie 140 8.2 Test de autoevaluare şi proiect statistic 155 8.3 Rezumat 159

Obiective: Obiectivul major îl constituie înţelegerea necesităţii implicării practice a statisticii în economie şi selectarea principalelor noţiuni microeconomice şi macroeconomice, generatoare de aplicaţii ale instrumentelor statistice (indicatori ai tendinţei centrale, indici, ritmuri etc.) Toate acestea sunt valorificate în cadrul unui proiect statistic aplicativ final. Cunoaşterea teoriei statistice permite cuantificarea corectă a fenomenelor economice, înţelegerea necesităţii prelucrării corecte a seriilor de date statistice cronologice şi teritoriale şi interpretarea corectă a datelor cu ajutorul statisticilor descriptive constituie principalele ţinte ale acestei teme. Timpul alocat temei: minim 6 ore - maxim 8 ore Bibliografie M.,Biji,E.,Biji,E,Lilea,C.,Anghelache, Tratat de statistică, Ed.Economică,Bucureşti, 2002. N., Dobrotă, (coord), Dicţionar de economie, Ed. Economică, ed a III-a, Bucureşti, 2001 Al., Isaic-Maniu, (coord), Dicţionar de statistică generală, Ed.Economică, Bucureşti, 2003. M.Korka, E.Tuşa, Statistică pentru afaceri internaţionale,Ed. ASE, Bucureşti, 2004. M.Korka,L.,Begu,E.Tusa,Bazele statisticii pentru economişti, Ed.Tribuna Economică, 2002 G., Săvoiu, Statistica. Un mod ştiinţific de gândire, Ed. Univeristară, Bucureşti, 2007. G.,Săvoiu,(coord), Cercetări şi modelări de marketing. Metode cantitative în cercetarea pieţei,Ed. Universitară, Bucureşti, 2005 G., Săvoiu, Gândirea statistică aplicată, Ed.Universitară, Bucureşti, 2010. G., Secară, G., Săvoiu, C., Necşulescu, Statistică economică, manual IFR, Ed. Universităţii din Piteşti, 2010 M.,Ţarcă, Tratat de statistică aplicată, Ed.didactică şi pedagogică, Bucureşti, 1998. V.,Trebici, Mica enciclopedie de statistică, Ed. ştiinţifică şi enciclopedică, Bucureşti,1985 Webografie *** http://www. insse.ro *** http://www.bnr.ro *** http://www. guv.ro

8.1 Metode şi instrumente statistice aplicate în macro şi microeconomie Orice s-ar întâmpla şi oricum ar fi construite teoriile şi modelele economice,

metodele, instrumentele şi chiar noţiunile statistice sunt aplicate continuu, cu un impact major, neputându-se realiza o prezentare simplificată şi formalizată a unui fenomen economic, fără ajutorul lor. Sistemul Conturilor Naţionale (SCN), cât şi indicatorii conjuncturali sau pe termen scurt ai afacerilor, omniprezenţi în înţelegerea economiei de piaţă, oferă principalul suport de cunoaştere a acesteia, dar şi conceptele economice şi indicatorii statistici fundamentali. Caseta nr.8.1 Activitatea economică defineşte un proces complex reunind fapte, acte, comportamente şi decizii privind atragerea şi utilizarea resurselor economice, cu scopul de a obţine profit, prin satisfacerea unor nevoi. Activitatea este generatoarea noţiunilor de fenomen şi subiect economic.Fenomenul economic include operaţiunile cu bunuri şi servicii (reale) şi monetare (financiare) ce conferă substanţă principalelor forme de existenţă ale activităţii economice:

Page 147: Statistic A

Indicatori statistici economici Capitolul 8

141

producţia, schimbul, repartiţia, consumul, acumularea (investiţia). Fenomenul economic are loc atât în ţesutul celulelor de bază, care coincid cu cele cinci categorii mari de subiecte, respectiv gospodării private (menaje), întreprinderi (firme), stat (administraţia publică, privată şi asigurări sociale), bănci (instituţii financiare şi de asigurări) şi restul lumii (străinătatea), cât şi la suprafaţa ţesutului, devenind expresia unei generalizări, esenţializări. Între subiectele economice au loc crearea, transformarea, transferul sau lichidarea de valori, prin relaţii generând schimb de proprietate asupra obiectelor activităţii economice (bunuri şi servicii, inclusiv servicii ale factorilor de producţie şi creanţe). Aceste relaţii definesc tranzacţiile economice, fie ele vizibile, (efective, de piaţă sau bilaterale), formalizate ca bunuri şi servicii (tranzacţii reale) sau prin monedă (tranzacţii financiare sau băneşti), fie invizibile (unilaterale), fiind denumite şi transferuri, condiţionat de formele organizatorice complexe şi, mai ales, de materialitatea lor. Tranzacţiile sunt evaluate, datate şi localizate. Totalitatea tranzacţiilor similare reunite generează un flux economic, aşa cum agregarea subiectelor economice de aceeaşi natură dă naştere unui sector economic. Combinând cele două agregări în spaţiul sau teritoriul economic se pot obţine fluxurile intrasectoriale şi intersectoriale. Dacă se însumează fluxurile circulare existente pe teritoriul economic al unui stat se obţine un uriaş circuit economic intern (domestic), iar prin extinderea la o comunitate de state, circuitul devine regional şi, treptat, mondial. Subiectele economice, în raport cu teritoriul economic al unui stat şi cu centrul principal de interes sau de activitate, se împart în rezidente şi nerezidente, în măsura în care cele două criterii coincid sau nu prin localizare. Reunind fluxurile generate de activitatea rezidenţilor naţionali cu fluxurile conaţionalilor rezidenţi în alte teritorii sau state se obţine un circuit naţional. Circuitul intern astfel modelat devine economie internă, aşa cum circuitul naţional se transformă în economie naţională. În economia de piaţă unde prevalează schimbul, priorităţile sunt date de raportul cerere-ofertă şi rezultatele sunt formarea, nivelul şi dinamica preţurilor. SCN prezintă predecesori încă din prima jumătate a secolului al XVIII-lea, în tabloul economic al lui Quesnay. În anul 1947, Richard Stone, în baza rezultatelor cercetărilor întreprinse sub egida Societăţii Naţiunilor Unite, elaborează metodologia Venitului naţional şi a totalurilor legate de acesta. Un prim sistem standardizat de conturi naţionale a fost publicat prima dată în 1952, iar varianta operaţională actuală datează din 1993 şi armonizează SCN cu balanţa de plăţi externe, statistica financiară a statului, statistica monetară şi bancară, cu clasificarea internaţională standard ONU şi cu metodologia în domeniul forţei de muncă elaborată de Biroul Internaţional al Muncii. În paralel, Comunitatea Economică Europeană a renunţat la Sistemul simplificat de contabilitate naţională şi a creat o versiune comunitară a SCN (SEC-Sistemul European de Conturi), la începutul lui 1996 (abreviată SEC 1995). Principalii indicatori de rezultate macroeconomice sunt: Tabel nr. 8.1

Indicatori cu conţinut brut Indicatori cu conţinut net Produsul Intern Brut - PIB (engleză: Gross Domestic Product - GDP)

Produsul Intern Net - PIN (engleză: Net Domestic Product - NDP)

Produsul Naţional Brut - PNB (engleză: Gross National Product - GNP)

Produsul Naţional Net - PNN (engleză: Net National Product - NNP)

La interfaţa dintre subiecte economice, veniturile unora devin cheltuielile altora, ceea ce egalizează producţia finală cu veniturilor realizate şi cu cheltuielilor. Caracterul estimativ al indicatorilor îşi găseşte explicaţia în metode diferite, surse de date variate şi în diverse tehnici de prelucrare. O analiză paralelă a metodelor de calcul subliniază specificitatea lor: Tabel nr. 8.2

Metode în SCN-Obiect agregare Indicatori macroeconomici - Mod de calcul pentru

Page 148: Statistic A

Indicatori statistici economici Capitolul 8

142

şi localizare subiecte economice principalele macroagregate I.Metoda de producţie -fluxurile reale de bunuri şi servicii -subiectele economice din sfera de producere a valorii adăugate brute (VAB)

Produs global brut PGB=∑Bunuri şi servicii Produs intern brut la preţurile pieţei PIBpp=∑VAB pp sau PIBpp=PGB–CI PIBpp=∑VAB pf + (IP+TV) – Sv, unde: IP =impozite pe produs, TV = taxe vamale, Sv = subvenţii Produs intern net la preţurile pieţei PINPP=PIBpp-A, unde A= amortizarea

II.Metoda de consum -fluxurile reale de mărfuri şi servicii nefinanciare -subiectele economice din sfera distribuţiei

Produs intern brut la preţurile pieţei CF=consum final, FBCF=formarea brută de capital fix, ∆S=variaţia de stoc, Enet = (X-M)= export net PIBpp= CF + FBCF + ∆S + (X-M) Produs naţional net la preţurile pieţei PNNpp = PINpp + ∆VFS, unde: ∆VFS=soldul veniturilor factorilor în raport cu străinătatea

III. Metoda veniturilor -fluxurile financiare -factorii de producţie recompensaţi în sfera repartiţiei

Produs intern brut la preţurile pieţei PIBpp=CFM+ENE+A+IIN, unde:CFM=compensarea forţei de muncă, ENE=excedent net de exploatare şi IIN=impozitele indirecte nete Produs intern net la preţurile pieţei PINPP = CFM+ENE+IIN

IV.Metoda cheltuielilor -fluxurile financiare (cheltuieli sau disponibilităţi, economii) -subiectele economice din sfera acumulării şi consumului

Produs intern brut la preţurile pieţei PIBpp=Cpr+EN+ID+IIN+A, (unde Cpr=cheltuieli private EN=economii nete, ID=impozite directe) Produs intern net la preţurile factorilor (venit naţional) VN=PINPf = PIBpp– IIN–A

SCN este creat pentru a asigura estimarea indicatorilor sintetici de rezultate (PIB, PNB, PIN, PNN) dar şi a altor indicatori: formarea brută de capital (fix) sau FBC(F), venitul disponibil sau VD, economii sau E la fel de utili în modelările macroeconometrice. Pentru estimarea PIB-ulu, metodele publicate sunt metoda de producţie şi consum. I. Metoda de producţie:PIBpp =∑∑∑∑VAB pf + (IP+TV)–Sv sau PIBpp =∑∑∑∑VAB pf +IIN Sursa datelor o reprezintă http://www.insse.ro şi Anuarul statistic al României, Ed.INS, Bucureşti,1991-2010, iar PIB-ul este detaliat după metoda de producţie: Tabel nr. 8.3 Anul PIBpp IPIB real

(% ) ∑VABpf IP (impozite

pe produs) TV (taxe vamale)

Sv (Subvenţii)

- miliarde lei (ROL) preţuri curente - 1990 857,9 94,4 788,1 102,0 1,6 -33,8 1991 2203,9 87,1 2066,1 193,2 24,7 -80,1 1992 6029,2 91,2 5915,2 484,8 86,9 -457,7 1993 20035,7 101,5 18579,2 1857,5 303,5 -704,5 1994 49773,2 103,9 45954,7 3848,2 648,9 -678,6 1995 72135,5 107,1 66598,5 5579,4 1189,0 -1231,4 1996 108919,6 103,9 101854,2 7458,7 1852,3 -2245,6 1997 252925,7 93,9 232817,6 18569,1 3808,2 -2269,2 1998 373798,2 95,2 331547,6 39806,6 5859,4 -3415,4 1999 545730,2 98,8 480475,1 61605,7 7242,5 -3593,1

Page 149: Statistic A

Indicatori statistici economici Capitolul 8

143

- milioane lei (RON) preţuri curente - 2000 80984,6 102,4 72736,4 8337,1 912,0 -1000,9 2001 117945,8 105,7 106120,0 11686,4 905,0 -765,6 2002 152017,0 105,1 136922,3 15702,2 986,2 -1593,7 2003 197427,6 105,2 175640,9 21644,2 1381,2 -1238,7 2004 247368,0 108,5 220931,3 25322,8 2531,7 -1417,8 2005 288954,6 104,2 255232,7 33126,1 2685,7 -2089,9 2006 344650,6 107,9 304269,8 38711,5 3238,8 -1569,5 2007 416006,8 106,3 368356,3 48028,1 1210,2 -1587,8 2008 514654,0 107,1 458489,4 56415,6 1192,3 -1443,3 2009* 491273,7* 92,5* 441935,4* Impozie indirecte nete (IIN) = 49338,3* 2010** 513640,8** 98,7** 455924,1** Impozie indirecte nete (IIN) = 57716,7** * Date semidefinitive şi **date provizorii -Buletin statistic lunar nr.1/2010 şi şi 2011, INS, Bucureşti. II.Metoda de consum:PIBpp=CF+FBCF+∆∆∆∆S+(X-M) sau PIBpp=CF+FBC+ Enet Componentele PIB după metoda consumului sunt şi ele detaliate în continuare: Tabel nr. 8.4 Anul PIBpp Deflator (%) CF FBCF ∆S Enet=X-M)

- miliarde lei (ROL) preţuri curente - 1990 857,9 - 679,5 169,8 89,7 -81,1 1991 2203,9 294,9 1672,5 317,0 301,1 -86,7 1992 6029,2 300,0 4642,5 1156,8 736,7 -506,8 1993 20035,7 327,4 15235,8 3583,7 2212,2 -996,0 1994 49773,2 239,1 38452,4 10095,7 2252,6 -1027,5 1995 72135,5 135,3 58662,4 15424,9 2085,1 -4036,9 1996 108919,6 145,3 89939,4 24998,5 3161,4 -9179,7 1997 252925,7 247,3 218619,8 53540,1 -1368,7 -17865,5 1998 373798,2 155,2 337468,6 67919,9 -1586,4 -30003,9 1999 545730,2 147,8 484361,5 96630,4 -8889,9 -26371,8

- milioane lei (RON) preţuri curente - 2000 80984,6 144,9 69587,4 15245,2 444,6 -4292,6 2001 117945,8 137,8 100731,7 24171,4 2014,8 -8972,1 2002 152017,0 122,6 127118,8 32366,5 1079,6 -8547,9 2003 197427,6 123,5 168818,7 42496,6 873,6 -14761,3 2004 247368,0 115,5 211054,6 53850,3 4701,1 -22238,0 2005 288954,6 112,1 251038,1 68526,6 -1240,0 -29370,1 2006 344650,6 110,5 294867,6 88272,0 2916,3 -41405,3 2007 416006,8 113,6 344937,0 125645,3 3213,4 -57788,9 2008 514654,0 115,5 420872,2 164264,4 -3368,2 -67114,4 2009* 491273,7* 103,2* 397273,5* 125825,6* -2633,8* -29191,6* 2010* 513640,8** 105,9 ** 405422,4** 116793,1** 19127,5** -27702,2** * Date semidefinitive şi **date provizorii - Buletin statistic lunar nr.1 /2010 şi 2011, INS, Bucureşti.

Estimarea macroagregatelor SCN conduce la aprecierea evoluţiei economiei dacă este însoţită de evaluarea indicatorului, cunoscut drept creştere economică sau ritmul PIB-ului real, obţinut din indicele procentual al PIB-ului real din care se scade valoarea de 100 de procente: R PIB real (%) = IPIB real ( %) - 100 (%).

Imaginea SCN a principalelor macroagregate în preţuri comparabile asigură un factor important în modelarea macroeconometrică, oferind imaginea reală a

Page 150: Statistic A

Indicatori statistici economici Capitolul 8

144

transformărilor structurale (în preţurile unui acelaşi an t-1 sau „zero” considerat an de bază). Evaluarea este rezultatul produsului între volumul neagregabil în unităţi fizice datorită varietăţii lor şi preţul exprimat prin variaţia medie a preţurilor vizate. Concret se determină rezultatul exprimat în preţuri comparabile al raportului PIB-ului realizat timp de doi ani consecutivi, din indicele PIB-ului în preţuri curente: I PIB preţ uri curente ( %) = (PIB în preţurile anului t : PIB în preţurile anului t-1) x 100,

care de îndată ce a fost obţinut se împarte la un indice de preţ specific, denumit deflatorul implicit al PIB, ceea ce rezultă constituind în fapt indicele PIB-ului real.

IPIB real ( %) = (I PIB preţ uri curente : Deflatorul implicit al PIB ) x 100

Creşterea economică naţională sau modificarea anuală a IPIB real, după 1990 Tabel nr. 8.5 Anul precedent = 100

Anul

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010

Ritmul IPIB real

- 5,

6

-12,

9

- 8,

8

1,5

3,9

7,1

3,9

-6,1

- 4,8

-1,2

2,4

5,7

5,1

5,2

8,5

4,2

7,9

6,3

7,1

-7,5

-1,

3

Surse: Anuarul statistic al României,1991–2010 şi Buletin statistic lunar, nr.1/2011, INS, Bucureşti

Evoluţia ciclică a economiei naţionale după anul 1990

Grafic nr.8.1

-30-25-20-15-10-505

1015

199

0

199

1

1992

199

3

1994

1995

19

96

199

7

19

98

199

9

200

0

200

1

200

2

200

3

200

4

200

5

2006

20

07

2008

20

09

20

10

Sursa: Principalii indicatori statistici privind dezvoltarea economico-socială, Conferinţa INS, 2009 Principiile alcătuirii de sisteme de indicatori statistici capabili să sintetizeze fenomenele economice, exprimate ca cerinţe în modelarea macroeconometrică impun analize de conjunctură, de sezonalitate, de ciclicitate etc. Cea mai simplă prezentare economică conjuncturală (cu sens de ansamblu de factori obiectivi şi subiectivi sau împrejurări ce influenţează pozitiv/negativ economia) este descrisă prin careul magic al strategiei economice şi cuprinde rata creşterii economice, rata inflaţiei, rata şomajului şi soldul balanţei comerciale. Dacă acestui sistem minimal de indicatori i se adaugă raportul între veniturile maxime şi minime (ori medii şi minim garantate), cunoscut drept indice de coeziune se obţine pentagonul magic şi prin adăugarea indicatorilor de mediu se ajunge la hexagonul peren al echilibrelor majore. Se pot selecta şi alţi indicatori alternativi grupaţi în şase clase (domenii), ce oferă informaţii despre principalele echilibre economice, ce delimitează aceste construcţii) de la patrulaterul strategiei, la pentagonul magic şi hexagonul peren).

Page 151: Statistic A

Indicatori statistici economici Capitolul 8

145

Figura nr. 8.1 Modelările macroeconometrice valorifică aceşti indicatori prin regrupare tactică şi sub alte denumiri la fel de expresive:indicatori instrumentali (ex:deficitul bugetului general consolidat ca procent din PIB), indicatori de pilotaj (ex:soldul balanţei comerciale), indicatori de obiective (ex: rata şomajului şi rata inflaţiei) indicatori de supravieţuire (ex:indicatori de mediu) etc. Antreprenorul contemporan şi omul de afaceri abil, preocupaţi de un management axat pe modele microeconometrice fac apel în procesul decizional în condiţii de risc şi incertitudine, dar şi de restricţii ale resurselor (timp şi bani pentru propriile cercetări) la indicatori vectoriali cu calităţi de senzori (reprezentativi) pentru a delimita starea actuală şi perspectivele afacerii, indicatori distinctivi în relansarea economică (numărul înmatriculărilor de noi întreprinderi, de locuri de muncă vacante şi nou create, modificarea şomajului în termeni absoluţi şi relativi, dinamica şi volumul creditelor pentru dezvoltarea de afaceri, dinamica exportului, importului, consumului privat şi al administraţiei publice, precum şi alţi indici specializaţi), în raport cu declinul economic (numărul de falimente, dinamica arieratelor, stocurilor, productivităţii, veniturilor orare, evoluţia conflictelor sociale de orice natură şi a grevelor etc.). Indicatorii pe termen scurt concentrează aceste fenomene şi devin factori ai modelului microeconometric curent decizional, al realizării, evaluării, prognozării fenomenelor printr-un un set minimal, dar şi funcţional care cuprinde:

1. evaluarea de tip cantitativ a activităţii definită prin producţie; 2. anticiparea activităţii sintetizată prin comenzi şi contracte; 3. factorul esenţial al fluctuaţiilor conjuncturale, respectiv investiţiile; 4. anticiparea tendinţelor în domeniul fluctuaţiilor (abordate prin investiţii)

aproximând profitabilitatea prin excedentul brut de exploatare; 5. aproximarea profitabilităţii se realizează prin evidenţierea indicatorilor: cifra

de afaceri compensaţia pentru salariaţi şi excedentul net de exploatare; 6. ajustarea cu asigurarea comparabilităţii prin indici de preţ (indicele preţurilor

produselor industriale, al preţurilor bunurilor de consume, al valorii unitare);

6.Indicatori ai echilibrului mediului sau ecosferei (indicatori statistici referitori la ariile protejate, la resurse de apă asigurate, la calitatea apelor de suprafata, la defolierea arborilor la principalele specii, la cheltuieli pentru protecţia mediului etc.)

1.Indicatori ai echilibrului investiţie - consum şi ai creşterii economice (ritmul creşterii economice reale, rata formării brute de capital fix, ponderea consumului final etc.)

3.Indicatori ai echilibrului pieţei forţei de muncă (gradul şi structura ocupării şi migrării internaţionale a forţei de muncă, rata şomajului, rata de înlocuire etc.)

4.Indicatori ai echilibrului extern al economiei naţionale (indicatorii contului curent al balanţei de plăţi externe, fluxurilor internaţionale în investiţii, îndatorării externe etc.)

5.Indicatori ai echilibrului social şi comunitar (ecartul dintre salariul minim şi maxim, greve şi conflicte, indicele de cost al vieţii şi dezvoltării umane, concentrarea veniturilor)

2.Indicatori ai echilibrului cerere-ofertă prin nivelul preţurilor (indicii preţurilor, rata anuală a inflaţiei, deflatorul PIB-ului, cursul de schimb al monedei, taxa de scont etc)

Page 152: Statistic A

Indicatori statistici economici Capitolul 8

146

7. detalierea privind utilizări şi destinaţii prin stocuri şi fonduri; 8. evaluarea resurselor de muncă prin numărul forţei de muncă şi rata şomajului; 9. utilizarea intensivă a forţei de muncă prin productivitate; 10. comercializarea externă (exporturi şi importuri, sold şi grad de acoperire).

Pentru aplicarea statisticii în economie sunt importante trei aspecte: orizontul de timp (impune compararea cu o perioadă apropiată şi avantajează în fenomenele cu sezonalitate ridicată, dezavantajând dacă situaţia economică sau ciclul afacerilor se apropie de un moment hotărâtor, o inflexiune în dinamica fenomenului), forma indicatorului (un indice care reliefează ciclul tendinţei în încercarea de a elimina fluctuaţiile) şi tipul de valoare finală (media lunară sau mobilă, valorificând avantajul insensibilităţii sau volatilitatea la factori extremi sau la distorsiuni mari).

Pentru evaluarea indicatorilor de rezultate ale activităţii, firmele utilizează şi informaţiile contului de producţie,derivat din logica SCN şi descris în continuare: Tabel nr. 8.6

Cheltuieli Încasări 1.Consumul intermediar - CI 7.Vânzări de bunuri către alte firme -Vz 2.Amortizarea capitalului fix- A 8.Modificarea stocurilor de produse finite ∆S 3.Impozite indirecte - II 9.Bunuri de capital fix rezultate din producţia

proprie - BCPP 4.Remunerarea muncii (salarii, impozit pe salarii etc.) - RM 10.Subvenţii - Sv 5.Dobânzi, rente – D+R 6.Profit (dividende şi impozit pe dividende, impozit pe profit, profit nedistribuit) - Pr Prin intermediul contului de producţie se determină indicatorii valorici de rezultate. Producţia brută a firmei (PBi), cuprinde bunurile şi serviciile vândute altor firme şi pe acelea care au rămas în stoc, care au contribuit la creşterea capitalului firmei: PBi=Vzi+∆Si+BCPPi sau PBi=CIi+Ai+(II-Sv)i+RMi+Di+Ri+Pri. Valoarea adăugată brută a firmei (VAB i) reprezintă valoarea brută a bunurilor şi serviciilor finale produse într-o perioadă de timp. Se exprimă la preţul pieţei când se includ impozitele indirecte nete şi la preţul factorilor când nu se includ aceleaşi impozite.Se pot utiliza metoda producţiei ∪VABpp=PBi-CIi şi metoda veniturilor ∪ VABpp = Ai+(II-Sv)i+RMi+Di+Ri+Pri. Valoarea adăugată netă la preţul factorilor (VANpf) exprimă valoarea nou creată de către firmă în perioada de calcul la preţul factorilor: VANpf =VABpp-Ai-(II-v) i. Excedentul brut de exploatare al firmei la preţul factorilor (EBEpfi) este un indicator al cărui conţinut exprimă ceea ce rămâne la dispoziţia firmei după ce se elimină din valoarea adăugată brută, impozitele indirecte şi elementele care reprezintă remunerarea muncii: EBEpfi = VABpp-RMi-(II-Sv)i. Excedentul net de exploatare al firmei la preţul factorilor (ENEpfi) anticipează profitul întreprinzătorului, fiind un indicator preferat al statisticilor europene conjuncturale pe şi termen scurt: ENEpfi = EBEi-A i La nivel macroeconomic, conceptul de resurse umane se exprimă prin populaţia ocupat, dar, mai ales, prin forţa de muncă. Pentru analiza statistică a volumului forţei de muncă la nivelul firmei se utilizează indicatorul numărul salariaţilor, în

Page 153: Statistic A

Indicatori statistici economici Capitolul 8

147

variantele sale de efectiv al salariaţilor (reprezentând numărul total de angajaţi existent la un anumit moment - indicator de stoc) şi de număr mediu al salariaţilor (calculat ca medie a efectivelor zilnice- un indicator de flux). Eficienţa sau productivitatea sunt cazuri particulare ale intensităţii relaţiei directe ori indirecte, între efecte (rezultate) şi eforturi (consumuri).

Determinarea eficienţei activităţii în economie Tabel nr. 8.7

Metoda directă (Efect / Efort) Metoda indirectă (Efort / Efect) Efect Efort

E1 E2 … En Efort Efect

C1j C2j … Cnj

C1j E1 C2j, E2, … … Cnj

e = (En / Cnj)x 100

En

e = (Cnj / En )x 100

Productivitatea muncii beneficiază de aceeaşi modalitate de determinare generală cu eficienţa fondurilor sau activelor imobilizate ori cu profitabilitatea capitalului.Dintre indicatorii care sintetizează participarea firmei pe piaţă se detaliază în afară de cifra de afaceri în expresie valorică, considerat cel mai important indicator al firmei, cota de piaţă şi indicii raportului de schimb pentru relevanţa lor deosebită în modele microeconometrice. Cota de piaţă reprezintă ponderea deţinută de vânzările unei firme în totalul vânzărilor unui produs sau activităţi pe o anumită piaţă şi se evaluează prin coeficienţi sau procentual astfel:

1. cota de piaţă globală: CAiCp = ×100i CAi∑

,unde:CAi este cifra de afaceri a firmei

analizate, iar ΣCAi descrie cifra de afaceri a tuturor firmelor prezente pe piaţă 2. relativă (CAi firma X : CAi firma Y) x 100, unde CAi firma X este cifra de afaceri a firmei analizate, iar CAi firma Y defineşte cifra de afaceri a concurentului cel mai important (lider, colider, outsider, specialist etc.). 3.specifică (CAi firma X : ΣCAi sector specific) x 100, unde CAi firma X este cifra de afaceri a firmei analizate, iar ΣCAi sector specific delimitează cifra de afaceri a tuturor firmelor existente în sectorul analizat al pieţei.

Indicii raportului de schimb fac posibilă analiza activităţii de comercializare externă şi traduc astfel starea echilibrului extern al economiei naţionale sau al unei firme moderne, cu participare internaţională, simultan importatoare şi exportatoare: Caseta nr.8.2 Premisele teoretice ale determinării indicilor raportului de schimb sunt următoarele: - fluxurile de export şi import au efecte economice şi financiare opuse; - fiecare flux poate fi analizat atât distinct, cât şi combinat ca sold (∆= X-M), unde X şi M = volumul activităţii de export, respectiv import. - fluxurile pot fi evaluate simultan şi prin indicatorul relativ specific denumit grad de acoperire a importurilor prin exporturi [GA = (X/M )x100]; - fluxurile pot fi analizate distinct, dar dinamic prin intermediul indicilor valorii, ai volumului fizic şi ai preţurilor şi (Iv

, Ip, Iq);

Page 154: Statistic A

Indicatori statistici economici Capitolul 8

148

- fluxurile cantitative se analizează prin raportul de schimb brut: RSB = (QX :QM)x100; - fluxurile pot fi analizat distinct, ca nivel, dinamică şi structură, pe destinaţii (exporturi) sau în raport cu sursele de provenienţă (importuri), respectiv prin indici elementari:iX = (X1:X2)x100 sau iM = (M1:M2)x100 şi prin ponderi sau greutăţi specifice: gX = (Xi: Σ Xi ) x100 sau gM = (Mi: Σ Mi ) x100; -fluxurile se analizează şi combinat ca sold al balanţei comerciale (∆), iar în raport cu valoarea atinsă de cei doi indicatori se disting trei situaţii semnificative:

• ∆ < 0 sau balanţa deficitară (sold pasiv sau deficitar) ⇔ X < M, • ∆ = 0 sau balanţa echilibrată (fără sold) ⇔ X = M, • ∆ > 0 sau balanţa excedentară(sold activ sau excedentar)⇔ X > M.

Aprecierea rolului comercializării externe în rezultatul final al economiei se determină ca raport (∆/PIB), analog şi în rezultatul firmei (∆/CA ori ∆/VAB). Raportul între soldul balanţei comerciale şi rezultat relevă contribuţia comercializării externe finale în procente. - fluxurile se mai pot evalua şi prin gradul de acoperire a importurilor prin exporturi (GA), beneficiind de avantajul neglijării semnului caracteristic soldului balanţei comerciale, iar pentru GA exprimat prin coeficienţi (multiplicator sau demultiplicator):

• GA<1 sau balanţa deficitară (sold pasiv sau deficitar) ⇔ X < M, • GA = 1 sau balanţa echilibrată(fără sold)⇔ X=M, • GA >1 sau balanţa excedentară (sold activ sau excedentar)⇔ X > M.

-fluxurile se mai pot caracteriza şi prin indicii valorii, volumului fizic şi ai preţurilor: indicii preţurilor în comercializarea externă sunt denumţi indici ai valorii unitare şi se determină şi pentru export şi pentru import; mărfurile nefiind identice în mulţimea şi diversitatea contractelor de comerţ exterior, nu se poate utiliza termenul de preţ mediu, ci mai curând cel de valoare unitară; relaţia de calcul a indicelui valorii unitare este aceea a unui indice construit ca medie armonică (Paasche):

1 1 1

0 11

. . .1

p

p

v p qI I V U

p qvi

= = =⋅

∑ ∑∑∑

- fluxurile cantitative izolate şi ulterior relativizate conduc şi la raportul de schimb brut. Interpretarea statistică a acestui indicator exprimat prin coeficienţi subliniază prin valoarea obţinută dacă pentru o unitate de măsură (tonă) importată s-au exportat: a) mai puţin de o tonă de produse RSB = (QX:QM)<1; b) tot o tonă de produse RSB = (QX:QM )=1; c)mai mult de o tonă de produse RSB = (QX:QM) >1. Dacă RSB este exprimat ca un coeficient, interpretarea relevă aspecte statice ale echilibrului extern al economiei sau firmei:

• RSB<1 sau „mai puţin de o tonă exportată pentru o tonă importată” subliniază o situaţie favorabilă, bazată pe un export majoritar de produse intens prelucrate şi manufacturate în raport cu importul de produse neprelucrate (materii prime, materiale) sau în stadii incipiente de prelucrare (semifabricate);

• RSB=1 sau echivalenţa „tonă exportată=tonă importată” permite emiterea unei ipoteze de echilibru static cantitativ;

• RSB>1 sau „mai mult de o tonă exportată pentru o tonă importată” identifică o situaţie defavorabilă, fundamentată pe exportul majoritar de produse neprelucrate (materii prime, materiale) sau în stadii incipiente de prelucrare (semifabricate), în raport cu importul de produse prelucrate şi manufacturate . Principalele analize prin indicii raportului de schimb includ următorii indicatori:

Page 155: Statistic A

Indicatori statistici economici Capitolul 8

149

• indicele raportului de schimb valoric (IRSV) cunoscut şi ca indice al gradului

de acoperire a importurilor prin exporturi IGA = GA1:GA0 = :V VX MI I ; IRSV sau

IGA>1 (sau IRSV>100,0%) descrie o evoluţie pozitivă în care valoarea exportului creşte mai repede decât valoarea importurilor şi are ca efect o ameliorare a balanţei comerciale (reducerea deficitului balanţei sau creşterea excedentului balanţei);

• indicele raportului de schimb brut (IRSB) definit şi ca raport de schimb

cantitativ IRSB = :Q QX MI I ; IRSB <1 (sau IRSB<100,0%) identifică o îmbunătăţire

structurală a exporturilor economiei sau firmei, în favoarea exportului de produse cu un plus de manoperă încorporată;

• indicele raportului de schimb net (IRSN = : :P PX M X YI I sauIVU IVU ); IRSN>1

(sau IRSN >100,0%) identifică efectul unei „ieftiniri” relative a importurilor faţă de exporturi şi o îmbunătăţire a raporturilor de schimb în comercializarea externă;

• foarfecele de preţuri în comerţul exterior (FP), calculat numai în condiţiile în care IRSN <1 sau 100 %: FP = (1-IRSN) x 100; foarfecele de preţuri în comerţul exterior este expresia procentuală a pierderii pe care o economie (firmă) o înregistrează prin comercializare externă ca urmare a faptului că preţurile de export nu reuşesc să ţină pasul cu preţurilor importurilor;

• efectul în mărime absolută al deteriorării raportului de schimb net (∆RSN) determinat în condiţii similare cu foarfecele de preţuri, a cărui relaţia de calcul este:

p pX MRSN∆ = ∆ − ∆

, 1 1 0 1p X X X XX p q p q∆ = −∑ ∑ , 1 1 0 1

p M M M MM p q p q∆ = −∑ ∑

• indicele puterii de cumpărare a exporturilor (IPC „X”)

" "" "p v

q q qX XX X M O BTEN ABILEq p

M M

I IIPC X IRSN I I I

I I= × = × = =

qMI

< " "qM OBTENABILEI

arată un efect pozitiv asupra balanţei comerciale ca rezultat al unui import sub limita obtenabilă conform puterii de cumpărare a exporturilor;

• indicele factorial al raportului de schimb (IFRS= IRSN x IW). Macroeconomia financiară îşi are propriile instrumente, concepte, principii,

legi, reguli de funcţionare a căror cunoaştere sau aprofundare este posibilă şi prin intermediul sistemului de indicatori statistici macrofinanciari, ale cărui subsisteme sunt: subsistemul indicatorilor financiari ai bugetului de stat, ai activităţilor privind asigurările de viaţǎ şi de bunuri, ai pieţelor financiare de capital, ai activităţilor bancare, ai raportului de schimb sau ai echilibrului financiar extern. Stabilitatea preţurilor este măsurată prin intermediul a trei indicatori statistici distincţi: indicele preţurilor bunurilor de consum (IPC), în calitate de instrument de evaluare de ansamblu a creşterii preţurilor mărfurilor cumpărate şi a tarifelor serviciilor utilizate de către populaţie, indicele preţurilor produsului intern brut („deflatorul implicit al PIB”–ului), care exprimă modificarea medie a preţurilor bunurilor şi tarifelor serviciilor întregii producţii a economiei naţionale şi indicele preţurilor produselor industriale (IPPI), instrument de măsurare a evoluţiei de ansamblu a

Page 156: Statistic A

Indicatori statistici economici Capitolul 8

150

preţurilor produselor industriale fabricate şi livrate de producători interni. Rata inflaţiei este frecvent valorificată în econometrie, conferind comparabilitate datelor şi se determină astfel: indice de preţ (%)-100%.Variabila economică, este derivată din definiţia dată economiei de către Adam Smith ca investigaţie în lumea naturii şi a cauzelor avuţiei naţiunilor sau din aceea dată de către John Stuart Mill, ca ştiinţă practică a producţiei şi distribuţiei bogăţiei: consumul, producţia, înzestrarea tehnică, capitalul (fix, variabil) etc. Multitudinea factorilor economici devin factori statistici explicativi în modele de corelaţie şi regresie statistică, de unde nu se pot omite preţul, venitul, profitul, dimensiunea sistemică sau corelată a părţilor (abordarea structurală prin produse, servicii, activităţi etc), precum şi dimensiunea teritorială (macro, mezo, microeconomică).Toate aceste concepte economice sunt însoţite de legităţi consacrate ale teoriei economice, legile cererii şi ofertei, echilibrului generat de volumul investiţiilor şi economiilor etc. Pentru a da un exemplu consacrat de aplicare a statisticii în lumea microeconomică se impune o trimitere la coeficientul de elasticitate. Conceptul de elasticitate, cu o istorie mai mică de două secole este un concept important în ştiinţa economicǎ contemporană, un instrument al analizei economice de o varietate tipologicǎ deosebitǎ. Caseta nr. 8.3. Simplǎ sau multiplǎ, parţialǎ sau totalǎ, directǎ sau inversǎ, instantanee sau diacronicǎ, realǎ sau virtuală, certǎ sau aleatoare, elasticitatea a devenit în limbajul obişnuit sinonimǎ cu sensibilitatea, supleţea posibilitatea de adaptare, marja disponibilǎ pentru acţiunile spontane sau dirijate. Gândirea statisticǎ identificǎ elasticitatea cu un instrument de mǎsurǎ, iar la limitǎ cu o caracteristicǎ sau cu un parametru reflectat într-un coeficient. Sensul major statistic al elasticitǎţii oscileazǎ între raport şi mǎsurǎ. Acest concept este definit succesiv şi succint de către P.H. Derycke, ca un raport de variaţii relative ce prezintǎ modificarea unei variabile economice (preţul) ca o acţiune concomitentǎ sau anterioarǎ a altei variabile economice (cantitatea). J. Tinbergen redefineşte elasticitatea drept mǎsurǎ a mobilitǎţii absolute şi relative a unui fenomen prin raportare la un altul cu care se aflǎ într-o legǎturǎ naturalǎ Elasticitatea în gândirea statisticǎ, nǎscutǎ din noţiunile de proporţionalitate şi neproporţionalitate aflate într-o antimonie perpetuǎ, devine concept operaţional în formulǎrile neo-clasice, fiind intuitǎ de Antoine-Augustin Cournot încă din 1838 şi autentificatǎ instrumental de Alfred Marshall în 1885, prin coeficientul de elasticitate.

Elasticitatea exprimǎ sensibilitatea, flexibilitatea, reactivitatea unei variabile rezultative sau dependente faţǎ de modificarea altor variabile explicative sau independente x, z, w etc. (x, z, w fiind variabile cauzale ce explică variaţia lui y). Clasificarea statisticǎ a elasticitǎţii contribuie şi ea la îmbogǎţirea universului ei criterial şi implicit tipologic: a) în raport cu procedura de cuantificare elasticitatea este absolutǎ şi relativǎ; b) în raport cu numǎrul de variabile explicative sau cauzale cuantificate se disting elasticitatea simplǎ şi multiplǎ; c) în raport cu valoarea funcţiei ce o caracterizeazǎ elasticitatea se defineşte de tip iso - sau hetero - respectiv valoarea funcţiei sale este o constantǎ sau o variabilǎ. Soluţionarea problematicii elasticitǎţii impune o analizǎ succesivǎ atât a inelasticitǎţii, drept contrariul sǎu definitoriu şi a limitelor de contact ale celor douǎ noţiuni economice sau antinomii statistice, cât şi a reversibilitǎţii sau ireversibilitǎţii în timp şi mai ales a stabilitǎţii fenomenului denumit elasticitate.Coeficientul de elasticitate se

Page 157: Statistic A

Indicatori statistici economici Capitolul 8

151

referǎ, restricitv, la elasticitatea calculatǎ într-un punct sau într-o porţiune a curbei funcţiei de elasticitate y = f(x). Elasticitatea este, în general, un fenomen de neechivalenţă între modificările relative a două variabile: rezultativă (y) şi explicativă (x). Neechivalenţa este exprimată prin modalitatea de determinare a unui coeficient de elasticitate diferit de |±1|.

Cumy x

y x

∆ ∆≠ ,atunci( / )

y xy xy x

λ∆ ∆= × ,de unde: :( / )

y xy xy x

λ ∆ ∆= .

Coeficientul de elasticitate al unui fenomen măsoară raportul dintre modificarea fenomenului respectiv şi modificarea factorului explicativ. Exemplificând fenomenul prin cerere, se ajunge la cazul elasticităţii cererii, factorii ei fiind preţul sau venitul (ce va completa denumirea coeficientului). Coeficientul de elasticitate-preţ sau elasticitate-venit a cererii se determină prin relaţiile:

( ) ( )c / p c / v

c p c v: şi :

c p c v

∆ ∆ ∆ ∆λ = λ =

(unde:∆p → 0 ) (unde: ∆v → 0) Coeficientul de elasticitate se exprimă şi ca o funcţie de elasticitate a cererii, de tipul y= f(x), fiind egal cu raportul dintre valoarea marginală a funcţiei şi valoarea medie a acesteia. Cele două expresii de calcul al coeficientului de elasticitate-preţ sau de elasticitate-venit al cererii devin următoarele:

( ) ( ) ( ) ( )c/vc/p c/p c/v

dc c dc c c c c c: şi : sau : şi :

dp p dv v p p v v

∆ ∆λ = λ = λ = λ =∆ ∆

(unde:∆p → 0 ) (unde: ∆v → 0) Coeficientul de elasticitate al unui fenomen economic exprimat printr-o funcţie de elasticitate y=f(x), este determinabil şi ca un raport între derivata logaritmică a lui y şi derivata logaritmică a lui x.[10] Cele două relaţii de calcul al coeficientului de elasticitate-preţ sau de elasticitate-venit sunt următoarele:

( )( )( )c/p

d logc dc dp dc p dc p:

d log p c p c dp dp cλ = = = × = × (unde:∆p → 0 )şi

( )( )( )c/v

d logc dc dv dc v dc v:

d log v c v c dv dv cλ = = = × = × (unde: ∆v → 0)

Prin optica seriilor cronologice, relaţia de calcul obişnuită ( ) x

x:

y

yx/y

∆∆=λ , se

transformă într-un raport al ritmurilor de variaţie: ( ) ( ) ( )y x% %y/ x

R / Rλ = .

Coeficientul de elasticitate este şi un raport al ritmurilor de variaţie ale fenomenului y şi ale variabilei sale explicative x.Cele mai simple modalităţi de calcul al coeficientului de elasticitate-preţ sau de elasticitate-venit devin:

( ) ( ) ( )c v% %c/ v

R / Rλ = şi ( ) ( ) ( )c p% %c/p

R / Rλ = .

Page 158: Statistic A

Indicatori statistici economici Capitolul 8

152

Coeficientul de elasticitate se mai poate exprima şi în funcţie de indicii cererii,

preţurilor sau veniturilor: C

1/ 0 1/ 0 1 0 1 0 1/ 0C / V V

0 0 0 0 1/ 0

C V C C V V I 100: :

C V C V I 100

∆ ∆ − − −λ = = =

−,

unde: VC II 0/10/1 , sunt indicii cererii şi ai venitului sau conform relaţiei următoare: C

1/ 0 1/ 0 1 0 1 0 1/ 0C / P

0 0 0 0

P1/ 0

C P C C P P I 100: :

C P C P I 100

∆ ∆ − − −λ = = =

−, unde: C P

1/0 1/0I , I sunt indicii

cererii, respectiv ai preţurilor. O aplicaţie reală are capacitatea de a defini mai rapid modalităţile concrete

de aplicare a statisticii în economie. Astfel, o firmă axată pe producţia şi exportul de aparate frigorifice ecologice, consultând surse de date specializate şi propriile proiecţii pe termen scurt, anticipează o creştere a exporturilor sale de la 4 la 5,6 milioane de euro(€) ca urmare directă a generalizării măsurilor de protecţie a mediului, în următorul an, pe piaţa regiunii europene Y.Analiza aceloraşi baze de date subliniază că, importul de aparate frigorifice ecologice pe aceeaşi piaţa a regiunii Y va creşte cu 25,0%. În condiţiile în care studiile identifică şi o creştere a cererii europene în ansamblu de bunuri de folosinţă îndelungată, în următorul an cu circa 15,0 %, o cercetare efectuată asupra pieţei specifice, estimează o tendinţă de majorare a cererii de aparate frigorifice ecologice în aceeaşi perioadă cu 21,0%. Cum va acţiona firma, prin creşterea competitivităţii firmei sau a produsului? Decizia bazată pe coeficientul de elasticitate detaliază prompt ritmurile analizei:

E =0yy∆:

0xx∆

=0

01

y

yy −:

0

01

x

xx −=

x

y

R

R=1,6 unde:Rx=25,0% şi Ry=

5,6 4,0

4,0

−x100= 40%

La fiecare procent de creştere a cererii de aparate frigorifice ecologice pe piaţa europeană oferta firmei specializate răspunde cu 1,6%, iar∆ =y1-y2=5,6-4,0=1,6 milioane €. Din informaţiile studiului se disting trei ritmuri de creştere a cererii:

I. R1=15,0%× ∗∆ Y iar 10

100

∗∆ =YR

y , respectiv efectul absorbţiei generale a pieţei

europene asupra activităţii firmei( 4,0 0,15 0,6∗ × =∆ =y milioane €). Sub impactul

creşterii generale a cererii europene, exportul firmei ar putea creşte (ipotetic) la 4,0+0,6=4,6 milioane €, suma de 0,6 milioane €, exprimând efectul de absorbţie al pieţei europeneY.

II. 2 20R 21, 0%

100y

Ry∗∗= × ∆ = × , respectiv efectul absorbţiei exportului firmei ca

urmare a specializării în aparate frigorifice (21

4,0 0,84100

y∗∗∆ = × = milioane €).Sub

impactul pozitiv al specializării în producţia de aparate frigorifice (∗∗∆ ⟩ 0), exportul firmei ar putea creşte (ipotetic) la 4,0+0,84=4,84 milioane €.

Page 159: Statistic A

Indicatori statistici economici Capitolul 8

153

III. R 3 =25,0 % × y∗∗∗∆ = y0

3

100

R4,0 0,25= × = 1 milion €. Acest 1 milion € este

expresia efectului atracţiei pentru exportul de aparate frigorifice ecologice pe piaţa

regiunii "Y"(orientarea geografică este bună ∗∗∗ ∗∗∆ ⟩∆y y ).

IV. Diferenţa y y∗∗∗∆ − ∆ =(5,6-4,0)-1,0 = 0,6 milioane €. Cum diferenţa anterioară

este pozitivă, concluzia ce s-ar putea desprinde ar fi aceea că din creşterea exportului cu 1,6 milioane € numai 0,6 milioane € (37,5%) s-ar putea datora competitivităţii firmei, restul de 1 milion € (62,5%) reprezentând efectul cumulat al creşterii cererii, respectiv creşterii absorbţiei pieţei europene a agregatelor frigorifice ecologice în regiunea Y. Concluzia este ca pe viitor, accentul să se deplaseze de la produs pe imaginea şi competitivitatea firmei. Este indicată de urgenţă o cercetare de teren a pieţei pentru schimbarea imaginii firmei. Semnificaţia coeficienţilor de elasticitate în cercetarea pieţei este cu mult mai evidentă, prin prisma analizei practice anterioare: coeficientul de elasticitate-preţ al cererii este un instrument de investigaţie care exprimă procentul cu care se modifică cererea, atunci când are loc o variaţie de un procent a preţului (transcrierea este precedată de semnul minus), iar coeficientul de elasticitate-venit al cererii exprimă procentul cu care se modifică cererea, atunci când are loc o variaţie de un procent a venitului (transcrierea este precedată de plus). Tabelul următor prezintă elasticitatea cererii şi domeniile limită ale coeficientului specific pentru variabilele explicative preţ şi venit. Tabel nr. 8.8

Elasticitatea transversală (încrucişată) are ca substrat posibilitatea de calcul a unui coeficient al elasticităţii cererii, în situaţia unui bun x, în funcţie de modificarea

preţului bunului y, după relaţia: ( )q /px y

p ∆p∆q q ∆q ∆qy yx x x xλ = : = × = :∆p p ∆p q q py y y x x y

= Rqx / Rpy

I. Dacă 0λ> ,această implică o creştere a cererii pentru produsul“x, datorită majorării preţului lui y, cele două produse fiind rivale sau substituibile (miere şi zahăr sau cafea şi ceai). II. Dacă 0λ < , are loc o diminuare a cererii produsului “x”, ca urmare a majorării preţului produsului “y”, cele două produse fiind complementare sau solidare (autoturism şi benzina sau calculator şi imprimantă).

Domeniul de existenţă

Tipul de elasticitate - preţ a cererii

Domeniul de existenţă

Tipul de elasticitate - venit a cererii

λ(c/p) → - ∞ elasticitate perfectă λ(c/v) → + ∞ elasticitate perfectă λ(c/p)∈(-∞,-1) elasticitate supraunitară λ(c/v)∈ (1,+∞) elasticitate supraunitară λ(c/p) = - 1 elasticitate unitară sau

proporţională λ(c/v) = 1 elasticitate unitară sau

proporţională λ(c/p)∈(-1, 0) inelasticitate relativă

(anelasticitate) λ(c/v) ∈ (0, 1) inelasticitate relativă

(anelasticitate) λ(c/p) = 0 inelasticitate perfectă λ(c/v) = 0 inelasticitate perfectă λ(c/p) >0 relativ anormală λ(c/p) < 0 relativ anormală

Page 160: Statistic A

Indicatori statistici economici Capitolul 8

154

III. Dacă 0λ= , produsele sunt independente (situaţie de inelasticitate). O firmă specializată în producţia şi vânzarea de carne proaspătă (x) şi de preparate din carne (y) constată că informaţiile anchetei ABF permit compararea acestor categorii de produse, prin modelul de analiză al coeficienţilor de elasticitate transversali. Ritmurile anuale de creştere publicate, pentru cererea cantitativă a celor două tipuri de produse au fost de 10,2% şi 8,2%,iar ritmurile de creştere a preţurilor conform IPPI (indicele preţurilor produselor industriale) de 6,64% şi 11,54%.Evaluaţi care ar putea fi impactul relaţiei generale existente între preţuri şi cantităţi prin compararea cu programul livrărilor în etapa următoare utilizând modelul coeficienţilor transversali (pornind de la datele firmei, unde sunt prevăzute creşteri cantitative de 20% şi diminuări de10%, pentru primul trimestru, iar limitele de creştere a preţurilor de livrare prevăzute pentru negocieri sunt 140% şi 130%). Prima constatare confirmă rivaliatea produselor, conform valorii coeficienţilor de elasticitate transversală ce se pot determina, pentru produsele x şi y:

( )q /px yλ =Rqx:Rpy =10,2:11,54 = 0,884 şi ( )q /py x

λ = Rqy:Rpx = 8,2:6,64 =1,235.

Valoarea de 0,884 implică o creştere a cererii pentru produsul “x”, datorită majorării preţului produsului “y”,cele două produse fiind rivale sau substituibile. Acest fapt este confirmat şi de valoarea 1,235 cu precizarea că cererea produsului “y”, este mai mare în cazul majorării preţului produsului ”x”.Pornind de la datele consemnate în programul firmei coeficienţii de elasticitate transversală ce se pot determina sunt: ( )q /px y

λ =Rqx:Rpy =20:30=0,67 şi ( )q /py xλ =Rqy:Rpx = -10:40= - 0,25.

Programul de vânzări trebuie refăcut, altfel va fi complet infirmat de piaţă. De altfel cele două categorii de produse conform programului au un caracter contradictoriu prin valorile determinate ale coeficienţilor. Esenţial este însă să se stabilească variabila explicativă ce nu se va modifica substanţial. În ipoteza că aceasta ar fi cantitatea programată a fi produsă conform contract şi negocierile de preţ nu sunt încă definitivate, atunci noile limite de creşteri sau diminuări de preţuri

sunt:

( )q /py x

qypx R

= =-10/1,235= - 8,1% şi

( )q /px y

qxpy R

= = 20/0,884 = 22,6 %.

Cercetarea statistică a reactivităţii cererii, concretizată în evoluţia cheltuielilor consumatorilor în funcţie de evoluţia veniturilor şi a preţurilor se realizează tot prin intermediul coeficienţilor de elasticitate, care măsoară influenţa pe care o exercită factorii venit sau preţ asupra cererii de mărfuri şi servicii, iar valorile obţinute traduc intensitatea cu care răspunde cererea. Prima modelare statistică aparţine lui Engel şi constă în formularea unor veritabile axiome ca rezultat al interpretării valorilor coeficienţilor de elasticitate în cercetarea pieţei. Axioma I Elasticitatea-venit a cererii este variabilă, dar inferioară unităţii sau pragului de proporţionalitate c/ v 1λ < , cazul cheltuielilor cu bunuri alimentare.

Page 161: Statistic A

Indicatori statistici economici Capitolul 8

155

Axioma II Elasticitatea-venit a cererii este egală cu unitatea sau cu pragul de propoţionalitate c/v 1λ = ,cazul cheltuielilor cu locuinţa.

Axioma III Elasticitatea-venit a cererii este variabilă, dar superioară unităţii sau

pragului de proporţionalitate c/ v 1λ > , cazul cheltuielilor cu servicii.

Coeficienţii de elasticitate ierarhizează cererea, iar compararea lor se realizează prin patru metode de analiză: a) compararea aceluiaşi actor al cererii în timpul mai multor perioade (metoda panel, eşantioanele repetitive sau rotaţionale); b) compararea mai multor actori ai cererii, care în cursul unei perioade de referinţă plătesc aproape aceleaşi preţuri (metoda bugetelor de familie); c) compararea cererii totale solvabilizate într-un teritoriu, relativ omogen ca preţuri în mai multe perioade de timp (metoda cronologică); d) compararea cererii totale solvabilizate în mai multe teritorii în acelaşi timp (metoda comparaţiilor internaţionale).Cercetarea statistică a elasticităţii poate ajunge şi în practică în faţa unor paradoxuri, care conduc la un optimism al elasticităţii-preţ a cererii ca evoluţie nefirească a cererii, în mod proporţional cu creşterea preţurilor. Astfel, optimismul elasticităţii preţ se resimte în economia Germaniei, prin creşterea preţurilor bunurilor germane de capital şi investiţie, care nu a condus la diminuarea cererii, alte ţări în lipsa unei industrii naţionale la fel de performante au continuat să importe aceste bunuri. Coeficienţii de elasticitate sunt instrumente utile de cuantificare a capacităţii de absorbţie a pieţelor teritoriale specifice şi ale cunoaşterii direcţiilor în care vor evolua economiile consumatorilor.

8.2 Test de autoevaluare şi proiect statistic A) Test de autoevaluare

A1) Întrebări clasice recapitulative

(Completaţi spaţiile goale) 1. Care sunt principalele metode de estimare a PIB – ului în România?

2. Care sunt cele şase subsisteme de indicatori ai hexagonului peren al economiei de piaţă ?

3.Cum se determină şi interpretează indicele raportului de schimb net?

4. În ce constă soluţia contului de producţie la nivel microeconomic?

5.Care sunt relaţiile de calcul ale

A2) Întrebări tip gril ă

(Încercuiţi litera răspunsului corect) 6. Care este modalitatea eronată de calcul a PIB –ului din cele descrise mai jos? a) PIBpp=∑VABpp sau PIBpp=PGB–CI; b) PIBpp=CF+FBCF+∆S +(X–M); c) PIBpp = Cpr+EN+ID+IIN+A; d) PIBpp= CFM+ENE+A+IIN; e) PIBpp = PINpf–∆VFS – IIN. 7.Cum se determină indicele raportului de schimb net (IRSN) : a) [IV

(X) : IV

(M)]; b) [Iq

(X) : Iq

(M)]; c) [Ip (X) : I

p (M)].

8. Relaţiile corecte de calcul ale coeficientului de elasticitate-preţ şi elasticitate-venit al cererii sunt:

( ) ( )

( ) ( )

c/v

c/v

c/p

c/p

dc c dc ca) : b) :

dp p dv v

dp c dv cd) : d) :

dc p dc v

λ = λ =

λ = λ =

9. Serviciile deţin un coeficient de elasticitate:

Page 162: Statistic A

Indicatori statistici economici Capitolul 8

156

coeficientului de elasticitate?

a) c /v 1λ < ; b) c/v 1λ = ; c) c / v 1λ > .

B) Proiect statistic Studiul de caz A

Pentru un număr de 80 de magazine aferente firmei ALFA s-au înregistrat date, în anexa A, privind următoarele variabile: Nr.crt. Descrierea variabilei studiate Simbol 1 Dimensiune magazin (SMCA/PMCA)

- sub media cifrei de afaceri (SMCA) şi peste medie (PMCA) - z

2 Efectivul salariaţilor - persoane - x 3 Încasări (mii lei) y După extragerea eşantionului individual [n=25 magazine, prin procedeul de tip pas mecanic de numărare, pornind de la numărul de ordine individual din lista alfabetică nominală a grupei cu un pas de 3 (k= N:n = 80:25=3,2) şi reluând extracţia de la prima unitate, unde este cazul]se vor soluţiona următoarele aspecte: 1. Să se detalieze eşantionul individual sub forma următorului tabel: Nr. crt. Dimensiune magazin

(SMCA/PMCA) Efectivul salariaţilor

- persoane - Încasări (mii lei)

0 - z - - x - - y - 1

...

25 Total SMCA= PMCA= ∑ =x ∑ =y

2. Să se sistematizeze, prezinte şi reprezinte datele statistice privind cele 25 de magazine, parcurgând etapele descrise în continuare: a) efectuaţi o grupare simplă pe variante după variaţia fiecărei caracteristici (z, x, y) şi centralizaţi datele; b) efectuaţi grupări pe trei intervale egale pentru caracteristicile x şi y şi centralizaţi datele; c) grupaţi combinat magazinele după caracteristicile statistice luate două câte două [(x,y), (x,z), (y,z)]; d) reprezentaţi grafic rezultatele de la punctele anterioare utilizând diagrama de structură, histograma şi poligonul frecvenţelor, diagrame prin benzi şi coloane. Comentaţi succint informaţiile grupate, prezentate şi reprezentate. 3. Să se calculeze şi să se reprezinte grafic mărimile relative ce se pot obţine folosind rezultatele de la punctul 2b. 4. Să se caracterizeze distribuţia magazinelor numai după caracteristicile x şi y conform grupărilor de la punctele 2a şi 2b, stabilind şi respectiv estimând: a) valoarea mărimilor medii calculate prin algoritm de calcul şi poziţionale, alegând-o în final pe cea mai potrivită pentru a fi utilizată ulterior, comentând succint şi rezultatele obţinute prin gruparea simplă pe variante, comparativ cu cele obţinute prin gruparea pe intervale egale de variaţie; b) valoarea tuturor indicatorilor variaţiei, precizând după care dintre variabile eşantionul magazinelor este mai omogen (x sau y); c) valoarea principalilor indicatori ai asimetriei, comentând rezultatele obţinute. 5. Să se calculeze media şi dispersia variabilei alternative z (SMCA/PMCA). 6.Determinaţi erorile probabile (medie de reprezentativitate şi limită sau maxim admisibilă) ale sondajului în condiţii de Øz=0,97 (z=2,18) pornind de la eşantionul celor 25 de magazine. Determinaţi cât de mare ar trebui să fie un nou eşantion extras aleatoriu repetat şi nerepetat, dintr-o populaţie de 1.000 de magazine, în condiţii de limite de

Page 163: Statistic A

Indicatori statistici economici Capitolul 8

157

interval w∆ sau x∆ = 0,5 şi cu un nivel de siguranţă sau probabilitate de 0,99 (Øz =0,99

sau z =2,58) şi pentru o dispersie egală cu aceea obţinută în calculele de la punctele 4 şi respectiv 5. Comentaţi rezultatele obţinute şi nivelul lor de încredere.

ANEXA A Baza de date a studiului de caz A

Nr. crt.

Dimensiune magazin

SMCA/PMCA

Efectivul salariaţilor - persoane -

Încasări (mii lei)

Nr. crt.

Dimensiune magazin

SMCA/PMCA

Efectivul salariaţilor - persoane -

Încasări (mii lei)

0 - z- - x - - y - 0 - z- - x - - y - 1 SMCA 5 2,51 41 PMCA 15 8,34 2 PMCA 11 5,02 42 PMCA 11 5,83 3 SMCA 6 2,04 43 SMCA 4 2,55 4 SMCA 8 3,08 44 SMCA 5 2,00 5 SMCA 7 2,81 45 SMCA 8 3,91 6 PMCA 12 5,52 46 SMCA 7 3,68 7 SMCA 9 3,53 47 PMCA 12 6,97 8 SMCA 4 2,15 48 PMCA 13 8,34 9 SMCA 5 2,44 49 PMCA 15 8,50 10 PMCA 15 6,83 50 PMCA 15 8,10 11 SMCA 4 2,38 51 PMCA 15 8,05 12 SMCA 4 2,59 52 PMCA 12 7,44 13 SMCA 4 2,45 53 PMCA 14 8,79 14 SMCA 7 2,63 54 PMCA 11 6,23 15 PMCA 13 6,01 55 PMCA 14 6,88 16 PMCA 14 9,10 56 SMCA 4 2,31 17 SMCA 9 3,88 57 SMCA 9 4,59 18 PMCA 4 2,19 58 SMCA 7 3,86 19 SMCA 8 3,75 59 PMCA 14 7,12 20 SMCA 7 3,58 60 PMCA 11 5,25 21 PMCA 11 6,87 61 PMCA 13 6,91 22 PMCA 13 6,94 62 PMCA 10 5,19 23 PMCA 14 8,05 63 SMCA 8 4,20 24 SMCA 7 2,53 64 SMCA 5 2,90 25 SMCA 5 2,36 65 PMCA 15 8,85 26 PMCA 12 5,47 66 PMCA 15 8,05 27 PMCA 11 5,33 67 SMCA 7 3,91 28 PMCA 14 7,02 68 SMCA 7 3,19 29 PMCA 15 8,29 69 SMCA 8 4,08 30 PMCA 13 7,81 70 SMCA 6 3,24 31 PMCA 11 4,54 71 PMCA 14 7,42 32 SMCA 7 3,13 72 PMCA 13 7,03 33 SMCA 6 2,92 73 PMCA 12 6,56 34 SMCA 5 2,61 74 PMCA 10 5,81 35 SMCA 8 4,02 75 PMCA 15 7,94 36 PMCA 10 5,35 76 PMCA 14 6,85 37 SMCA 9 3,96 77 PMCA 11 5,88

Page 164: Statistic A

Indicatori statistici economici Capitolul 8

158

38 PMCA 14 8,17 78 SMCA 9 4,26 39 PMCA 13 8,02 79 PMCA 12 6,57 40 SMCA 6 3,20 80 PMCA 15 7,55 Sursa: Bazele de date existente la nivelul firmei ALFA

Studiul de caz B Preluaţi din anexa B una din cele 40 de serii cronologice de 5 ani consecutivi

(extrase din anuarul statistic al României editat în anul 2009) pornind de la numărul de ordine din lista nominală a grupei. După preluarea seriei cronologice astfel individualizate se cer următoarele: a) să se reprezinte grafic seria cronologică, prin intermediul cronogramei sau historiogramei; b) să se calculeze indicatorii absoluţi, relativi şi medii pentru a caracteriza variaţia în timp a fenomenului ce alcătuieşte seria analizată; c) să se realizeze ajustarea mecanică a seriei cronologice folosind o metodă clasică, prin metoda modificării medii ( ∆ ),prin aceea a indicelui mediu (I ) şi prin metoda analitică; d) să se caracterizeze variaţia reziduală faţă de funcţia de ajustare analitică; e) să se estimeze prin metodele de la punctul c) nivelul indicatorului în următorii 2 ani (2008 şi 2009), apoi să se verifice cu datele reale din anii respectivi (accesaţi pe internet http:// www.insse.ro) şi să se comenteze calitatea estimaţiilor, justificând alegerea celei mai potrivite metode de estimare (extrapolare); suplimentar se pot valorifica şi coeficientul de determinaţie (D) sau de eroare (e)al ajustărilor mecanice (∆ , I )şi analitice în selectarea metodei de estimare (extrapolare).

ANEXA B Baza de date pentru studiul de caz B

Seria 2003 2004 2005 2006 2007 1 10079 9915 9957 9851 10041 2 9234 9223 9158 9147 9313 3 845 692 799 704 728 4 4472493 4403880 4360831 4345581 4404581 5 281272 285861 281034 277318 276849 6 33077 33361 33222 30802 28977 7 115,3 111,9 109,0 106,56 104,84 8 157836,3 186831,6 211081,9 247373,1 276110,4 9 1029 1077 1154 1220 1231 10 13394,0 17992,4 17702,5 23728,0 27229,9 11 5188 5151 5423 5361 5595 12 4607 4662 4906 4889 5115 13 581 489 517 472 480 14 2122226 1996604 1900561 1842208 1789693 15 150510 150168 144489 141601 138972 16 16942 16368 16157 13761 13107 17 114,7 109,5 106,1 103,84 103,89 18 7703,6 8558,0 9914,6 10585,7 12083,8 19 138 132 113 116 108 20 4397,4 5462,0 5208,3 8686,5 11317,0 21 4891 4764 4534 4490 4446 22 4627 4561 4252 4258 4198 23 264 203 282 232 248 24 758917 773843 767439 780925 791348 25 58925 62192 61914 62048 61620 26 9395 9853 10055 8381 8786 27 116,1 113,2 111,3 108,47 104,99

Page 165: Statistic A

Indicatori statistici economici Capitolul 8

159

28 123512,4 148312,0 170129,7 199286,8 222771,4 29 328 461 597 702 736 30 4901,8 6180,6 7336,7 10001,5 12816,0 31 5525 5465 5471 5431 5526 32 5031 5057 4980 5011 5074 33 494 408 491 420 452 34 620785 650335 716464 785506 907353 35 30137 30857 31543 30583 31964 36 6537 6917 6803 8563 6931 37 114,8 114,7 110,5 108,20 106,63 38 26620,3 29961,6 31037,6 37500,6 41255,2 39 781 892 956 1259 1292 40 1665,0 1414,3 1677,4 2011,1 1678,6

Sursa de date: Anuarul statistic al României, ediţia 2009, INS, Bucureşti şi www.insse.ro Notă:Datele prezintă evoluţia între 2003 şi 2007 a următorilor indicatori la nivel naţional: 1,11,21,31 = Populaţie activă totală, urbană, rurală şi de sex masculin, în mii locuitori. 2,12,22,32 = Populaţie ocupată totală, urbană, rurală şi de sex masculin, în mii locuitori. 3,13,23,33 = Număr şomerilor per total, urban, rural şi de sex masculin, în mii locuitori. 4,14,24,34 = Populaţie şcolară totală, gimnazială, liceală, studenţi, la nivel naţional, în persoane. 5,15,25,35 = Număr personal didactic total, gimnazial, liceal, universitar, în persoane. 6,16,26,36 = Număr salariaţi din cercetare total, întreprinderi, guvernamental, înv. sup., în persoane. 7,17,27,37 = Indicii preţurilor bunurilor de consum per total, mărfuri alimentare, nealimentare şi servicii (în raport cu anul anterior şi în %). 8,18,28,38 = Producţie industrială totală, extractivă, prelucrătoare şi energetică, în mil. lei 9,19,29,39 = Număr hoteluri (incl.moteluri), cabane, pensiuni turistice urbane şi rurale. 10,20,30,40 = Investiţii în industrie, transport, comerţ, intermedieri financiare, în mil.lei. 8.3 Rezumat Economia studiază atât fluxuri materiale (producţie/consum), cât şi financiar–bancare (dobânzi, credite, inflaţie şi depreciere monetară, masă monetară, curs de schimb), iar toate acestea se transformă şi devin factori sau variabile de interes în statistică. Din gândirea statisticii aplicate nu pot lipsi obiectivele caracteristice procesului economic în ansamblu (creştere economică, inflaţie, şomaj, deficit bugetar), dar nici firma sau microentitatea cu variabilele sale (cifră de afaceri, excedent brut şi net de exploatare, profit etc.) şi nici chiar individul, prin atributele sale de constituent al cererii agregate sau al ofertei forţei de muncă (câştig salarial net şi real, pensie, grupă de vârstă, ocupare, nivel de pregătire etc.) Anumite variabile de pilotaj economic sau ale politicilor economice sunt studiate statistic (soldul balanţei comerciale, indicii raportului de schimb, fiscalitatea, poziţia investiţională internaţională, deficitul bugetului consolidat etc.). Principalele noţiuni economice selectate au fost cele ale macroagregatelor economice ale SCN, cele macrofinanciare, ale echilibrelor economice conjuncturale şi pe termen scurt, inflaţiei şi comercializării externe, cele legate de eficienţă, de forţa de muncă etc., asupra lor statistica instrumentând metode şi analize specifice. Problemele fundamentale ale statisticii, privind înţelegerea realităţii economice, rezultă din abordarea bazată pe dinamici, structuri, organizări specifice, iar sistemele de indicatori statistici economici reuşesc să descrie aceste fenomene, să le măsoare, substituie prin indicatori absoluţi, prin indicatori relativi, prin indicatori adecvaţi ai tendinţei centrale. Conceptele elementare statistice, alături de cele ale teoriei economice se îmbină în instrumente elaborate de tipul indicilor raportului de schimb, al coeficienţilor de elasticitate, indicilor de preţ etc.

Page 166: Statistic A

Bibliografie selectivă

160

1. Andrei, T., Stancu, S., - Statistică, Ed. ALL, Bucureşti 1995. 2. Baron,T., Biji, E.,Tovissi, L.,Wagner, P., Isaic-Maniu, A., Korka, M., Porojan, D., - Statistică

teoretică şi economică, Ed. didactică şi pedagogică, Bucureşti, 1996. 3. Baron, T., Bădiţă, M., Korka, M., - Statistica pentru afaceri, Ed. Eficient, Bucureşti, 1998. 4. Begu, L.S., - Statistică internaţională, Ed. All - Beck, Bucureşti, 1999. 5. Biji, M.,Biji, E.M.,Lilea,E., Anghelache, C., - Tratat de statisticǎ, Ed. Economicǎ, Bucureşti, 2002. 6. Biji, M., Biji, E., -Statistica teoretică, Ed. didactică şi pedagogică, Bucureşti, 1979. 7. Capanu, I., Wagner, P., Secăreanu, C., - Statistica macroeconomică, Ed. Economică, Bucureşti,

1997. 8. Craiu, V.,-Verificarea ipotezelor statistice, Ed. didactică şi pedagogică, Bucureşti, 1972. 9. Chelcea S., - Metodologia cercetării sociologice, Ed. Economică, Bucureşti, 2004. 10. Demetrescu, M.C., - Elasticitatea cererii populaţiei cu privire la bunurile de consum şi servicii,

Ed. Academiei, Bucureşti, 1967. 11. Fourastie, J., - Les indices statistiques, Edition Dunod, Paris, 1969. 12. Georgescu-Roegen, N., - Metoda statistică.Elemente de statistică matematică, ediţia a II-a, Ed.

Expert, Bucureşti, 1998. 13. Iluţ, P., Rotariu, T., - Ancheta sociologică şi sondajele de opinie, Ed. Polirom, Iaşi 1997. 14. Iosifescu, M., Moineagu, C., Trebici, V., Urşianu, E., - Mica enciclopedie de statistică, Ed.

ştiinţifică şi enciclopedică, Bucureşti, 1985. 15. Isaic-Maniu, A., Mitruţ, C., Voineagu, V., - Statistica, Ed. Universitară, Bucureşti, 2004. 16. Isaic-Maniu, A., Mitruţ, C., Voineagu, V., Săvoiu, G., - Statistica afacerilor, Ed. Independenţa

Economică, Piteşti, 2002. 17. Jaba, E., - Statistică, Ed. economică, Bucureşti, 1998. 18. Korka, M.,Tuşa, E., - Statistică pentru afaceri internaţionale, Ed. ASE, Bucureşti, 2004 19. March L, -Les principes de la méthode statistique, Librairie Felix Alcan Paris 1930 20. Marinescu, I., Moineagu, C., Niculescu, R., Rancu, N., Urseanu, V., - Elemente de statistică

matematică şi aplicaţiile ei, Ed. ştiinţifică, Bucureşti 1966. 21. Martel, J.M., Nadeau, R., - Statistique en gestion et en economie, Editeur Gaetan Morin, Montreal,

1988. 22. Mihoc, G., Urseanu, V., - Matematici aplicate în statistică, Ed. Academiei, Bucureşti, 1962. 23. Mihoc, G., Iosifescu. M., Urseanu, V., - Elemente de teoria probabilitatilor şi aplicaţiile ei, Ed.

ştiinţifică, Bucureşti, 1966. 24. Mills, F., - Metode statistice, Ed. D.C.S. Bucureşti, 1959. 25. Moineagu, C., Negură, I.,Urseanu, V., - Statistica, Ed.ştiinţifică şi enciclopedică, Bucureşti, 1976. 26. Moldovan, I.,-Metodă de calcul şi estimare a indicilor costului vieţii , Ed. Focus, Cluj Napoca 1999 27. Piatier, A., - Statistique descriptive et initiation a l’analyse, Ed. Themis, Paris,1962 28. Porojan, D., - Statistica şi teoria sondajului, Ed. Şansa SRL, Bucureşti 1993. 29. Săvoiu, G., Grigorescu, R., - Statistică financiară,Ed.Independenţa Economicǎ,Piteşti, 2003. 30. Săvoiu, G., - Statistică generală. Argumente în favoarea formării gândirii statistice, Ed.

Independenţa Economicǎ, Piteşti, 2003. 31. Săvoiu, G., - Statistică aplicată în domeniul economic şi social,Ed.Independenţa Economicǎ,

Piteşti, 2004. 32. Săvoiu, G.,(coord), -Cercetări şi modelări de marketing. Metode cantitative în cercetarea

pieţei,Ed. Universitară, Bucureşti, 2005. 33. Săvoiu, G., - Statistica.Un mod ştiinţific de gândire, Ed.Universitară,Bucureşti,2007. 34. Săvoiu, G., - Statistica.Mod de gândire şi metode, Ed.Universitară,Bucureşti, 2009. 35. Săvoiu, G., - Gândirea statistică aplicată, Ed.Universitară,Bucureşti, 2010. 36. Stoetzel, J.,Girard, A., - Sondajele de opinie publică, Ed. ştiinţifică şi enciclopedică,

Bucureşti 1975. 37. Trebici, V., - Mica enciclopedie de statistică, Ed. ştiinţifică şi enciclopedică, Bucureşti,1985. 38. Trebici, V., - Mică enciclopedie de demografie, Ed. ştiinţifică şi enciclopedică,Bucureşti, 1975. 39. Tarcă, M., -Tratat de statistică aplicată, Ed. ştiinţifică şi enciclopedică, Bucureşti 1998. 40. Yulle, G.U.,Kendall, M.C,-Introducere în teoria statisticii, Ed. ştiinţifică,Bucureşti 1969.

Page 167: Statistic A

ANEXE

161

Anexa 1 Funcţia Gauss - Laplace

( )

2

2

0

1

2

x u

z e duΦ =Π ∫

Dacă se doreşte transformarea valorilor lui Z , în corespondenţă cu aria curbei normale de repartiţie sau cu nivelul de probabilitate declarat sau impus, se are în vedere valoarea dublată a celei corespunzătoare din tabel, respectiv Φz = 2Φz. Exemplu: în condiţii de α= 0,05 (col 6), 2Φz=0,95 ,de unde Φz = 0,475 , iar din tabel rezultă: Z=1,9 sau Z=2, 0 .

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0 Col 1 Col 2 Col 3 Col 4 Col 5 Col 6 Col 7 Col 8 Col 9 Col 10

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,239 0,027 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,179 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 ,02611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4727 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,5826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4874 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4816 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4910 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4978 0,4978 0,4080 0,4891 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

Page 168: Statistic A

ANEXE

162

Anexa 2

Valorile variabilei 2χ în funcţie de probabilitatea

2 2( )P αα χ χ= ⟩

şi numărul gradelor de libertate f

α

f

0,990

0,975

0,950

0,900

0,100

0,050

0,025

0,010

0,001

0 Col 1 Col 2 Col 3 Col 4 Col 5 Col 6 Col 7 Col 8 Col 9 1 0,0002 0,0010 0,0039 0,0158 2,71 3,84 5,02 6,63 10,83 2 0,02 0,05 0,10 0,21 4,61 5,99 7,38 9,21 13,82 3 0,12 0,22 0,35 0,58 6,25 7,81 9,35 11,34 16,27 4 0,30 0,48 0,71 1,06 7,78 9,49 11,14 13,28 18,47 5 0,55 0,83 1,15 1,61 9,24 11,07 12,83 15,09 20,52 6 0,87 1,24 1,64 2,20 10,64 12,59 14,45 16,81 22,46 7 1,24 1,69 2,17 2,83 12,02 14,07 16,01 18,47 24,32 8 1,65 2,18 2,73 3,49 13,36 15,51 17,53 20,09 26,13 9 2,09 2,70 3,33 4,17 14,68 16,92 19,02 21,67 27,88 10 2,56 3,25 3,94 4,87 15,99 18,31 20,48 23,21 29,59 11 3,05 3,82 4,57 5,58 17,27 19,67 21,92 24,72 31,26 12 3,57 4,40 5,23 6,30 18,55 21,03 23,34 26,22 32,91 13 4,11 5,01 5,89 7,04 19,81 22,36 24,74 27,69 34,53 14 4,66 5,63 6,57 7,79 21,06 23,68 26,12 29,14 36,12 15 5,23 6,26 7,26 8,55 22,31 25,00 27,49 30,58 37,70 16 5,81 6,91 7,96 9,31 23,54 26,30 28,84 32,00 39,25 17 6,41 7,56 8,67 10,08 24,77 27,59 30,19 33,41 40,79 18 7,01 8,23 9,39 10,86 25,99 28,87 31,53 34,80 42,31 19 7,63 8,91 10,12 11,65 27,20 30,14 32,85 36,19 43,82 20 8,26 9,59 10,85 12,44 28,41 31,41 34,17 37,57 45,32 21 8,90 10,28 11,59 13,24 29,61 32,67 35,48 38,93 46,80 22 9,54 10,98 12,34 14,04 30,81 33,92 36,78 40,29 48,27 23 10,20 11,69 13,09 14,85 32,01 35,17 38,08 41,64 49,73 24 10,86 12,40 13,85 15,66 33,20 36,41 39,37 42,98 51,18 25 11,52 13,12 14,61 16,47 34,38 37,65 40,65 44,31 52,62 26 12,20 13,84 15,38 17,29 35,56 38,88 41,92 45,64 54,05 27 12,88 14,57 16,15 18,11 36,74 40,11 43,19 46,96 55,48 28 13,57 15,31 16,93 18,94 37,92 41,34 44,46 48,28 56,89 29 14,26 16,05 17,71 19,77 39,09 42,56 45,72 49,59 58,30 30 14,95 16,79 18,49 20,60 40,26 43,77 46,98 50,89 59,70

Page 169: Statistic A

ANEXE

163

Anexa 3

Repartiţia Student

Valorile lui t în funcţie de probabilitatea ( )p t tα≤

şi numărul gradelor de libertate f

0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001 0 Col 1 Col 2 Col 3 Col 4 Col 5 Col 6 Col 7 Col 8 Col 9 Col 10 Col 11 Col 12 Col 13 1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 63,619 2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598 3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,929 4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610 5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869 6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959 7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408 8 0,130 0,262 3,990 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,401 9 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781 10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587 11 0,129 0,260 0,396 0,540 0,697 8760 1,088 1,363 1,796 2,201 2,718 3,106 4,437 12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318 13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221 14 0,128 2,580 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140 15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073 16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015 17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965 18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922 19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883 20 0,127 0,391 0,533 0,687 0,860 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850 21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819 22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792 23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,767 24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745 25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,725 26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707 27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,690 28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,674 29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,649 30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,656 40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551 80 0,126 0,254 0,387 0,527 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660 3,460 120 0,126 0,254 0,386 0,526 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373 0,126 0,253 0,385 0,524 0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,291

Page 170: Statistic A

ANEXE

164

Repartiţia Student Valorile lui t în funcţie de probabilitatea ( )p t tα≤ sau pragul de relevanţă al

testului şi numărul gradelor de libertate(g.d.l.) Test t unilateral dreapta

Pragul de semnificaie sau nivelul de relevanţă al testului gdl 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0005

1 0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674 636.6192 2 0.288675 0.816497 1.885618 2.919986 4.30265 6.96456 9.92484 31.5991 3 0.276671 0.764892 1.637744 2.353363 3.18245 4.54070 5.84091 12.9240 4 0.270722 0.740697 1.533206 2.131847 2.77645 3.74695 4.60409 8.6103 5 0.267181 0.726687 1.475884 2.015048 2.57058 3.36493 4.03214 6.8688 6 0.264835 0.717558 1.439756 1.943180 2.44691 3.14267 3.70743 5.9588 7 0.263167 0.711142 1.414924 1.894579 2.36462 2.99795 3.49948 5.4079 8 0.261921 0.706387 1.396815 1.859548 2.30600 2.89646 3.35539 5.0413 9 0.260955 0.702722 1.383029 1.833113 2.26216 2.82144 3.24984 4.7809 10 0.260185 0.699812 1.372184 1.812461 2.22814 2.76377 3.16927 4.5869 11 0.259556 0.697445 1.363430 1.795885 2.20099 2.71808 3.10581 4.4370 12 0.259033 0.695483 1.356217 1.782288 2.17881 2.68100 3.05454 4.3178 13 0.258591 0.693829 1.350171 1.770933 2.16037 2.65031 3.01228 4.2208 14 0.258213 0.692417 1.345030 1.761310 2.14479 2.62449 2.97684 4.1405 15 0.257885 0.691197 1.340606 1.753050 2.13145 2.60248 2.94671 4.0728 16 0.257599 0.690132 1.336757 1.745884 2.11991 2.58349 2.92078 4.0150 17 0.257347 0.689195 1.333379 1.739607 2.10982 2.56693 2.89823 3.9651 18 0.257123 0.688364 1.330391 1.734064 2.10092 2.55238 2.87844 3.9216 19 0.256923 0.687621 1.327728 1.729133 2.09302 2.53948 2.86093 3.8834 20 0.256743 0.686954 1.325341 1.724718 2.08596 2.52798 2.84534 3.8495 21 0.256580 0.686352 1.323188 1.720743 2.07961 2.51765 2.83136 3.8193 22 0.256432 0.685805 1.321237 1.717144 2.07387 2.50832 2.81876 3.7921 23 0.256297 0.685306 1.319460 1.713872 2.06866 2.49987 2.80734 3.7676 24 0.256173 0.684850 1.317836 1.710882 2.06390 2.49216 2.79694 3.7454 25 0.256060 0.684430 1.316345 1.708141 2.05954 2.48511 2.78744 3.7251 26 0.255955 0.684043 1.314972 1.705618 2.05553 2.47863 2.77871 3.7066 27 0.255858 0.683685 1.313703 1.703288 2.05183 2.47266 2.77068 3.6896 28 0.255768 0.683353 1.312527 1.701131 2.04841 2.46714 2.76326 3.6739 29 0.255684 0.683044 1.311434 1.699127 2.04523 2.46202 2.75639 3.6594 30 0.255605 0.682756 1.310415 1.697261 2.04227 2.45726 2.75000 3.6460 ∞∞∞∞

0.253347

0.674490

1.281552

1.644854

1.95996

2.32635

2.57583

3.2905

Page 171: Statistic A

ANEXE

165

Anexa 4

Repartiţia F (Fisher - Snedecor) Valorile funcţiei F (F = S1 / S2) pentru I1, I2 grade de libertate P=0,95 sau P=0,99

,respectiv 0,05α = sau 0,01α = nivel de semnificaţie

I2 I1 =1 I1 =2 I1 =3 I1 =3 I1 =4 α = α = α = α = α =

0,05 0,01 0,05 0,01 0,05 0,01 0,05 0,01 0,05 0,01 1 161,4 4 052 199,5 4 999 215,7 5 403 224,6 5 625 230,2 5 764

2 18,51 98,49 19,00 99,00 19,16 99,17 19,25 99,25 19,30 99,30

3 10,13 34,12 9,55 30,81 9,28 29,46 9,12 28,71 9,01 28,24

4 7,71 21,20 6,94 18,00 6,59 16,69 6,39 15,98 6,26 15,52

5 6,61 16,26 5,79 13,27 5,41 12,06 5,19 11,39 5,05 10,97

6 5,99 13,74 5,14 10,91 4,76 9,78 4,53 9,15 4,39 8,75

7 5,59 12,25 4,74 9,55 4,35 8,45 4,12 7,85 3,97 7,45

8 5,32 11,26 4,46 8,65 4,07 7,59 3,84 7,01 3,69 6,63

9 5,12 10,56 4,26 8,02 3,86 6,99 3,63 6,42 3,48 6,06

10 4,96 10,04 4,10 7,56 3,71 6,55 3,48 5,99 3,33 5,64

11 4,84 9,65 3,98 7,20 3,59 6,22 3,36 5,67 3,20 5,32

12 4,75 9,33 3,88 6,93 3,49 5,95 3,26 5,41 3,11 5,06

13 4,67 9,07 3,80 6,70 3,41 5,74 3,18 5,20 3,02 4,86

14 4,60 8,86 3,74 6,51 3,34 5,56 3,11 5,03 2,96 4,69

15 4,54 8,68 3,68 6,36 3,29 5,42 3,06 4,89 2,90 4,56

16 4,49 8,53 3,63 6,23 3,24 5,29 3,01 4,77 2,85 4,44

17 4,45 8,40 3,59 6,11 3,20 5,18 2,96 4,67 2,81 4,34

18 4,41 8,28 3,55 6,01 3,16 5,09 2,93 4,58 2,77 4,25

19 4,38 8,18 3,52 5,93 3,13 5,01 2,90 4,50 2,74 4,17

20 4,35 8,10 3,49 5,85 3,10 4,94 2,87 4,43 2,71 4,10

21 4,32 8,02 3,47 5,78 3,07 4,87 2,84 4,37 2,68 4,04

22 4,30 7,94 3,44 5,72 3,05 4,82 2,82 4,31 2,66 3,99

23 4,28 7,88 3,42 5,66 3,03 4,76 2,80 4,26 2,64 3,94

24 4,26 7,82 3,40 5,61 3,01 4,72 2,78 4,22 2,62 3,90

25 4,24 7,77 3,38 5,57 2,99 4,68 2,76 4,18 2,60 3,86

26 4,22 7,72 3,37 5,53 2,98 4,64 2,74 4,14 2,59 3,82

27 4,21 7,68 3,35 5,49 2,96 4,60 2,73 4,11 2,57 3,78

28 4,20 7,64 3,34 5,45 2,95 4,57 2,71 4,07 2,56 3,75

29 4,18 7,60 3,33 5,42 2,93 4,54 2,70 4,04 2,54 3,73

30 4,17 7,56 3,32 5,39 2,92 4,51 2,69 4,02 2,53 3,70

40 4,08 7,31 3,23 5,18 2,84 4,31 2,61 3,83 2,45 3,51

60 4,00 7,08 3,15 4,98 2,76 4,13 2,52 3,65 2,37 3,34

120 3,92 6,85 3,07 4,79 2,68 3,95 2,45 3,48 2,29 3,17

∞∞∞∞ 3,84 6,64 2,99 4,60 2,60 3,78 2,37 3,32 2,21 3,02

Page 172: Statistic A

ANEXE

166

Anexa 4 (continuare)

I2 l1=6 l1=12 l1=12 l1=24 l1=25 α = α = α = α = α =

0,05 0,01 0,05 0,01 0,05 0,01 0,05 0,01 0,05 0,01 1 234,0 5 859 238,9 5 981 243,9 6 106 249,0 6 234 254,3 6 366

2 19,33 99,33 19,37 99,36 19,41 99,42 19,45 99,46 19,50 99,50

3 8,94 27,91 8,84 27,49 8,74 27,05 8,64 26,60 8,53 26,12

4 6,16 15,21 6,04 14,80 5,91 14,37 5,77 13,93 5,63 13,46

5 4,95 10,67 4,82 10,27 4,68 9,89 4,53 9,47 4,36 9,02

6 4,28 8,47 4,15 8,10 4,00 7,72 3,84 7,31 3,67 6,88

7 3,87 7,19 3,73 6,84 3,57 6,47 3,41 6,07 3,23 5,65

8 3,58 6,37 3,44 6,03 3,28 5,67 3,12 5,28 2,93 4,86

9 3,37 5,80 3,23 5,47 3,07 5,11 2,90 4,73 2,71 4,31

10 3,22 5,39 3,07 5,06 2,91 4,71 2,74 4,33 2,54 3,91

11 3,09 5,07 2,95 4,74 2,79 4,40 2,61 4,02 2,40 3,60

12 3,00 4,82 2,85 4,50 2,69 4,16 2,50 3,78 2,30 2,36

13 2,92 4,62 2,77 4,30 2,60 3,96 2,42 3,59 2,21 3,16

14 2,85 4,46 2,70 4,14 2,53 3,80 2,35 3,43 2,13 3,00

15 2,79 4,32 2,64 4,00 2,48 3,67 2,29 3,29 2,07 2,87

16 2,74 4,20 2,59 3,89 2,42 3,55 2,24 3,18 2,01 2,75

17 2,70 4,10 2,55 3,79 2,38 2,45 2,19 3,08 1,96 2,65

18 2,66 4,01 2,51 3,71 2,34 3,37 2,15 3,00 1,92 2,57

19 2,63 3,94 2,48 3,63 2,31 3,30 2,11 2,92 1,88 2,49

20 2,60 3,87 2,45 3,56 2,28 3,23 2,08 2,86 1,84 2,42

21 2,57 3,81 2,42 3,51 2,25 3,17 2,05 2,80 1,81 2,36

22 2,55 3,76 2,40 3,45 2,23 3,12 2,03 2,75 1,78 2,31

23 2,53 3,71 2,38 3,41 2,20 3,07 2,00 2,70 1,76 2,26

24 2,51 3,67 2,36 3,36 2,18 3,03 1,98 2,66 1,73 2,21

25 2,49 3,63 2,34 3,32 2,16 2,99 1,96 2,62 1,71 2,17

26 2,47 3,59 2,32 3,29 2,15 2,96 1,95 2,58 1,69 2,13

27 2,46 3,56 2,30 3,26 2,13 2,93 1,93 2,55 1,67 2,10

28 2,44 3,53 2,29 3,23 2,12 2,90 1,91 2,52 1,65 2,06

29 2,43 3,50 2,28 3,20 2,10 2,87 1,90 2,49 1,64 2,03

30 2,42 3,47 2,27 3,17 2,09 2,84 1,89 2,47 1,62 2,01

40 2,34 3,29 2,18 2,99 2,00 2,66 1,79 2,29 1,51 1,80

60 2,25 3,12 2,10 2,82 1,92 2,50 1,70 2,12 1,39 1,60

120 2,17 2,96 2,01 2,66 1,83 2,34 1,61 1,95 1,25 1,38

∞∞∞∞ 2,09 2,80 1,94 2,51 1,75 2,18 1,52 1,79 1,00 1,00


Top Related