Home >Documents >Statistica Descriptiva

Statistica Descriptiva

Date post:04-Jul-2015
Category:
View:1,145 times
Download:12 times
Share this document with a friend
Transcript:

UNIVERSITATEA BABE-BOLYAI, CLUJ-NAPOCA Centrul de Formare Continu i nvmnt la Distan Facultatea de tiine Economice i Gestiunea Afacerilor Specializarea: Trunchi comun Disciplina: Statistic Descriptiv

SUPORT DE CURSANUL II Semestrul 3

Cluj Napoca

2009

I. Informaii generale 1.1.Date de identificare a cursului Date de contact ale titularului de curs: Nume: Prof.univ.dr. Ilie PARPUCEA Birou: FSEGA, str. Teodor Mihali 58-60, birou 346, et.III Telefon: 0264-418652/3/4, int. 5870 Fax: 0264-41.25.70 E-mail: [email protected] Consultaii: Mari 16-17, Miercuri, 10-11 Nume: Conf.univ.dr. Anua BUIGA Birou: FSEGA, str. Teodor Mihali 58-60, birou 346, et.III Telefon: 0264-418652/3/4, int. 5870 Fax: 0264-41.25.70 E-mail: [email protected] Consultaii: Mari 16-17, Miercuri, 10-11 Nume: Conf.univ.dr. Dorina LAZR Birou: FSEGA, str. Teodor Mihali 58-60, birou 526, et. V Telefon: 0264-41.86.52/3/4/5, int. 5859 Fax: 0264-41.25.70 E-mail: [email protected] Consultaii: Mari: 11-12 i Joi: 14-15 Nume: Conf.univ.dr. Cristian DRAGO Birou: FSEGA, str. Teodor Mihali 58-60, birou 231, et. II Telefon: 0264-418654, int. 5857 Fax: 0264-41.25.70 E-mail: [email protected] Consultaii: Marti 16-17, Miercuri, 10-11

Date de identificare curs i contact tutori: Numele cursului Statistic Descriptiv Codul cursului EBExxxx Anul, Semestrul anul 2, sem. 1 Tipul cursului - Obligatoriu Tutori Adrian BUZ E-mail: [email protected] Consultaii: Mari 13-14, Joi 13-14

2

1.2. Condiionri i cunotine prerechizite nscrierea la acest curs este nu este condiionat de parcurgerea i promovarea altor discipline. 1.3. Descrierea cursului Cursul de Statistic Descriptiv face parte din pachetul de discipline fundamentale ale trunchiului comun, nivel licen, din cadrul Facultii de tiine Economice i Gestiunea Afacerilor a Universitii Babe-Bolyai din Cluj-Napoca. Disciplina este un demers incipient n familiarizarea studenilor cu metodele cantitative utilizate n economie, plasnduse pe aceeai tematic cu cursurile de Statistic Inferenial, Analiza Datelor i Econometrie. Tematica acestor discipline se succede sau se completeaz reciproc. Cursul vizeaz descrierea principalelor probleme legate de statistica descriptiv. Scopul acestui curs este de a familiariza studenii din trunchiul comun cu conceptele de statistic, cu modul de analiz i interpretare a datelor. Modulele 1 este consacrat conceptelor de baz, prelucrrii, sistematizrii i prezentrii seriilor statistice. Sunt cuprinse noiunile de baz, care dincolo de aspectul lor matematic, permit nsuirea unor intuiii necesare unei bune nelegeri a statisicii n ansamblu. n modulul 2 vor fi prezentai parametrii repartiiilor empirice unidimensionale. Sunt reprezentai n aceast parte parametrii tendinei centrale, de structur, variaiei, concentraiei, respectiv ai formei. Modulul 3 va conine elemente tehnice i practice care in de legtura dintre variabilele unei repartiii multidimensionale. Sunt avute n vedere corelaia dintre variabile, metoda celor mai mici ptrate, modelul liniar simplu, respectiv modelul liniar multiplu. n ultimul model se va detalia analiza seriilor cronologice, finalizndu-se prin previzionarea unei astfel de serii de timp.

1.4. Organizarea temelor n cadrul cursului Cursul este structurat pe patru module de nvare, corespunznd celor mai utilizate capitole din statistica descriptiv: concepte de baz, parametrii repartiiei unidimensionale, analiza legturilor dintre variabilele unei repartiii multidimensionale, respectiv analiza i previziunea seriilor de timp. Nivelul de nelegere i, implicit, utilitatea informaiilor pe care le regsii n fiecare modul vor fi sensibil optimizate dac, n timpul parcurgerii suportului de curs, vei consulta

3

sursele bibliografice recomandate. n situaia n care nu vei reui s accesai anumite materialele bibliografice, sunteti invitai s contactai tutorii disciplinei.

1.5. Formatul i tipul activitilor implicate de curs Parcurgerea disciplinei presupune att ntlniri fa n fa (program de pregtire i consultaii), ct i munc individual. Consultaiile, pentru care prezena este facultativ, reprezint un sprijin direct acordat dumneavoastr din partea titularului i a tutorilor. Pe durata acestora vom recurge la explicaii alternative, rspunsuri directe la ntrebrile pe care ni le vei adresa. n ceea ce privete activitatea individual, aceasta o vei gestiona dumneavoastr i se va concretiza n parcurgera tuturor materilelor bibliografice obligatorii, rezolvarea lucrrilor de verificare propuse n diversele materiale bibliogarfice.

1.6. Materiale bibliografice obligatorii n suportul de curs sunt precizate att referinele biblografice obligatorii, ct i cele facultative. Sursele bibliografice au fost astfel stabilte nct s ofere posibilitatea adncirii nivelului de analiz i, implicit, nelegerea fiecrei noiuni. 1. Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia, Ed. Presa Universitar Clujean, Cluj-Napoca, 2001; 2. Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiv - curs universitar, Ed. Mediamira, Cluj-Napoca, 2009; 3. Florea I., Parpucea I., Buiga A., Statistic descriptiv, Ed. Continental, Cluj-Napoca,

1998.

Lucrrile menionate la bibliografia obligatorie se regsesc i pot fi mprumutate de la Biblioteca Facultii tiine Economice i Gestiunea Afacerilor sau de la sediul Bibliotecii Centrale Lucian Blaga. 1.7. Materiale i instrumente necesare pentru curs Optimizarea secvenelor de formare reclam accesul studenilor la urmtoarele resurse: - calculator conectat la internet (pentru a putea accesa bazele de date i resursele electronice suplimentare, dar i pentru a putea participa la secvenele de formare interactiv on line) - acces la resursele bibliografice (ex: abonament la Biblioteca Central Lucian Blaga) 4

1.8. Calendar al cursului Pe parcursul n care se studiaz disciplina de fa, este programat o ntlnire fa n fa (consultaii) cu toi studenii; ele sunt destinate soluionrii, nemediate, a oricror nelmuriri de coninut sau a celor privind sarcinile individuale. Studenii au posibilitatea de a solicita titularului i/sau tutorilor sprijin pentru rezolvarea anumitor lucrri, n cazul n care nu au reuit singuri. Pentru a valorifica la maxim timpul alocat celor dou ntlniri studenii sunt atenionai asupra necesitii suplimentrii lecturii din suportul de curs cu parcurgerea obligatorie a cel puin a uneia dintre sursele bibliografice de referin.

1.9. Politica de evaluare i notare Evaluarea final se va realiza pe baza unui examen scris desfurat n sesiunea de la finele semestrului, conform instruciunilor suplimentzare care se vor primi din partea profesorului examinator. Evaluarea i afiarea notelor acordate se va realiza la cel mult 1 sptmn de la data depunerii/primirii lucrrii. Daca studentul considera ca activitatea sa a fost subapreciat de catre evaluatori atunci poate solicita feedback suplimentar prin contactarea titularului sau a tutorilor. 1.10. Elemente de deontologie academic Se vor avea n vedere urmtoarele detalii de natur organizatoric: - Orice tentativ de fraud sau fraud depistat va fi sancionat prin acordrea notei minime sau, n anumite condiii, prin exmatriculare. - Rezultatele finale vor fi puse la dispoziia studenilor prin afiaj electronic. - Contestaiile pot fi adresate n maxim 24 de ore de la afiarea rezultatelor, iar soluionarea lor nu va depi 48 de ore de la momentul depunerii. 1.11. Studeni cu dizabiliti: Titularul cursului i echipa de tutori i exprima disponibilitatea, n limita constrngerilor tehnice i de timp, de a adapta coninutul i metodelor de transmitere a informaiilor precum i modalitile de evaluare (examen oral, examen on line etc) n funcie de tipul dizabilitii cursantului. Altfel spus, avem n vedere, ca o prioritate, facilitarea accesului egal al tuturor cursanilor la activitile didactice i de evaluare.

5

1.12. Strategii de studiu recomandate: Date fiind caracteristicile nvmntului la distan, se recomand studenilor o planificare foarte riguroas a secvenelor de studiu individual, coroborat cu secvene de dialog cu tutorii i respectiv titularul de disciplin. Lectura fiecrui modul i rezolvarea la timp a lucrrilor de evaluare garanteaz nivele nalte de nelegere a coninutului tematic i totodat sporesc ansele promovrii cu succes a acestei discipline.

6

MODULUL 1Concepte de baz. Obiectul statisticii. Observarea, sistematizarea i prezentarea seriilor statistice. Obiective definirea unei populaii statistice, a variabilelor statistice; obinerea de informaii cu privire la fenomenul supus cercetarii; organizarea datelor i prezentarea acestora sub form de serii statistice; evidenierea structurii populaiei n raport cu variabilele observate; evidenierea evoluiei unui fenomen n timp sau spaiu; reprezentarea grafic a datelor.

Concepte de baz populaie statistic, unitate statistic, volum, eantion, variabil statistic, observare statistic, indicator statistic, serie statistic; observare statistic, serii statistice unidimensionale i bidimensionale; reprezentarea grafic a datelor relativ la o variabil cantitativ, la o variabil calitativ i la dou variabile.

Rezultate ateptateCunoaterea i stpnirea noiunilor statistice de baz, cunoaterea tehnicilor de culegere, grupare i prezentare a datelor. Utilizarea indicatorilor statistici cu scopul evidenierii variaiei unei mrimi sau a structurii populaiei supuse studiului.

Sinteza1. Concepte de baz 1.1. Populaia statistic Populaia statistic reprezint mulimea elementelor simple sau complexe, de aceeai natur, care au una sau mai multe nsuiri eseniale comune, proprii elementelor ct i populaiei privit ca un tot unitar. [Florea I.,1998] O populaie este finit dac include un numr determinat de elemente, dar ea poate fi considerat drept reprezentativ pentru o populaie teoretic infinit. Ca urmare apare necesitatea de a delimita o populaie n: coninut, spaiu i timp. Se mai denumete i populaia univers. Exemple de populaii statistice: mulimea persoanelor dintr-o anumit ar (localitate, zon etc.) n anul t, mulimea gospodriilor din Romnia, la momentul t, mulimea consumatorilor unui produs, mulimea societilor productoare sau concurente ale unui produs, mulimea societilor distribuitoare, angajaii unei societi, etc. Se noteaz cu majusculele de la nceputul alfabetului: A, B, C etc. Unitatea statistic constituie elementul component, al populaiei statistice, asupra cruia se va efectua nemijlocit observarea. Unitatea statistic este purttorul originar de informaie sau subiectul logic al informaiei statistice. Datorit varietii aspectelor sub care se poate prezenta n fapt, unitatea

7

statistic comport o definiie precis, care s exclud prin posibilitate de interpretare diferit de ctre observatori i astfel orice eroare ce poate prejudicia valoarea investigaiei. n exemplele citate mai sus, unitile statistice sunt: persoana, gospodria, consumatorul, societatea productoare sau concurent, societatea distribuitoare, angajatul etc. Se noteaz cu minusculele corespunztoare majusculei ce simbolizeaz populaia statistic, respectiv ai, bi etc.. Volumul populaiei reprezint numrul unitilor statistice care alctuiesc populaia statistic, Acesta poate fi finit sau infinit, n funcie de tipul populaiei care poate fi la fel finit sau infinit. Se noteaz cu N, iar pentru o populaie A, avem: A : {a1, a2, ..., aN} Eantion reprezint o submulime a unei populaii statistice, constituit dup criterii bine stabilite. n raport cu procedeul de formare a eantionului avem eantioane aleatoare i eantioane dirijate. Eantionul aleator este format din unitile statistice care rezult printr-un procedeu aleator: procedeul tragerii la sori, tabelul cu numere ntmpltoare, procedeul extragerilor sistematice. Eantionul dirijat este constituit pe baza unor informaii auxiliare existente la nivelul populaiei studiate sau lsnd liber pe anchetator s aleag unitile respectnd doar realizarea structurii eantionului n funcie de criteriile stabilite. Se noteaz cu n. Majoritatea studiilor au ca suport datele provenite de la nivel de eantion, de aici importana constituirii acestuia i implicit, apelarea la inferena statistic, pentru a estima parametrii la nivelul populaiei univers. 1.2. Variabila statistic Variabila statistic reprezint o nsuire sau o trstur comun tuturor unitilor unei populaii. Nivelul nregistrat de o variabil statistic la o unitate oarecare al populaiei se numete realizare sau starea variabile. [Florea I., 1998]. n general se noteaz cu majusculele de la sfritul alfabetului, X, Y, Z etc. Dac se noteaz cu X o variabil statistic oarecare, atunci cu x1, x2, ..., xN se vor nota strile variabilei respective. Variabilele statistice se clasific n raport cu natura, modul de exprimare i modul de variaie. a) Dup natura lor variabilele statistice pot fi atributive, de timp i de spaiu. Variabila atributiv exprim un atribut sau nsuire esenial (alta, dect timpul sau spaiul) unitilor populaiei; Variabila de timp ne arat timpul n care au luat fiin unitile populaiei sau perioada de timp n care au existat (exista); Variabila de spaiu ne arat spaiul n care exist sau au luat natere unitile populaiei. b) Dup modul de exprimare a strilor deosebim: Variabil cantitativ este variabila ale crei stri se exprim prin valori numerice. Se mai numete i variabil metric. Variabil calitativ este variabila ale crei stri se exprim prin cuvinte sau coduri. Se mai numete variabil nominal (strile se exprim prin cuvinte) sau variabil ordinal (strile se exprim prin coduri).

8

c) Dup modul de variaie variabila cantitativ poate fi: Variabil discret este acea variabil care, n intervalul su de definiie nregistreaz cel mult valori raionale, variaia are loc n salturi. Variabil continu este acea variabil care poate lua orice valoare real din intervalul su de variaie. Exemple de variabile statistice relativ la populaia format din mulimea consumatorilor unui produs: - vrsta: variabil atributiv, cantitativ, continu X = { x1 = [15-20) [20-30) ... } - frecvena de cumprare: variabil atributiv calitativ Y = { y1 - foarte rar; y2 rar, ... } - numr de sortimente cumprate relativ la produsul analizat: variabil atributiv, cantitativ, discret: Z = { z1 = 1; z2 = 2, ... } - localizarea magazinelor de unde cumpr: variabil de spaiu, calitativ S = { s1 cartierul M sau s2 strada P1, ... } - data ultimei cumprri a produsului analizat: variabil de timp, cantitativ T = { t1 = 27.01.2002; t2 = 24.02.2002, ... } Variabila aleatoare Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulimi finite sau infinite, cu o anumit probabilitate, rezultat dintr-o funcie asociat variabilei, numit lege de probabilitate. Ca i variabila statistic, variabila aleatoare n raport cu valorile sale poate fi discret sau continu. n timp ce o variabil aleatoare nregistreaz valori la ntmplare, variabila statistic constituie o nsuire cert a unitilor statistice din populaie. Valorile unei variabile aleatoare sunt probabile i n strns legtur cu un anumit experiment. Strile unei variabile statistice nu sunt probabile, ele cuantific o trstur proprie fiecrei uniti din populaie. 1.3. Observarea statistic Observarea statistic const n identificarea unitilor populaiei i nregistrarea strilor variabilelor n raport cu care este studiat. Ansamblul strilor variabilelor rezultate prin observare se numesc statistici. Dup gradul de cuprindere a populaiei statistice, observarea statistic este de dou feluri: total i parial. Observarea total este acel tip de observare statistic n care are loc nregistrarea tuturor unitilor care fac parte din populaie statistic supus studiului. Recensmntul populaiei Romniei este un exemplu de observare total. Observarea parial presupune observarea i nregistrarea unui anumit numr de uniti din populaie, alese dup criterii bine definite. n cercetarea statistic a unei populaii punctul de pornire l poate constitui fie statistice exhaustive rezultate prin observarea populaiei univers , fie statisticile rezultate din observarea parial a unui eantion A, n ambele cazuri scopul final fiind acelai, respectiv obinerea de informaii la nivelul populaiei univers A.

1.4. Seria statisticSeria statistic este o construcie care red fie distribuia unei populaii n raport cu una sau mai multe variabile, fie variaia unei mrimi n timp, n spaiu sau de la o categorie la alta. 9

Seriile statistice se clasific n raport cu mai multe criterii, astfel: 1. n raport cu numrul variabilelor Serii statistice unidimensionale, au la baz o singur variabil; Serii statistice multidimensionale, care au la baz dou sau mai multe variabile. 2. Dup natura variabilelor deosebim: Serii atributive, care au la baz variabile atributive; Serii cronologice (de timp sau istorice), care au la baz variabile de timp; Serii de spaiu sau teritoriale, care au la baz o variabil de spaiu. 3. Dup modul de exprimare a strilor variabilei deosebim: Serii calitative, care au la baz variabile calitative; Serii cantitative, care au la baz variabile cantitative i care dup modul de variaie a variabilei pot fi: discrete (cnd variabila este discret) i continue (cnd variabila este continu). 4. n raport cu natura indicatorului din care este alctuit seria, avem: Serii de frecven sau serii de distribuie (repartiie); Serii de variaie. Seria statistic rednd distribuia populaiei n raport cu una sau mai multe variabile constituie o descompunere a acesteia ntr-un numr R de clase. O astfel de serie este format n exclusivitate din frecvene (absolute cumulate sau necumulate, relative cumulate sau necumulate) i de aceea se numesc serie de frecven, de distribuie sau de repartiie. Prescurtat se mai folosete i denumirea de repartiie statistic sau distribuie statistic. Seria statistic ce red variaia unei mrimi n timp, n spaiu sau de la o categorie la alta se numete serie de variaie. 1.4.1. Seria statistic de repartiie Conform definiiei de mai sus, prin aceast serie se distribuie unitile unei populaii statistice n raport cu una sau mai multe variabile. Fie o serie statistic unidimensional avnd la baz variabila X, respectiv:

x X : 1 N 1

x2 N2

... xi ... N i

... x R ... N R

(1.1)

Ni este frecvena absolut a clasei i, i = 1, R i reprezint numrul de uniti ale populaiei din clasa pentru care variabila X a nregistrat valoarea Xi N1 + N2 + ... + NR = N. Clasa (grupa) de uniti n raport cu o variabil reunete acele uniti din cadrul populaiei care nregistreaz aceeai stare a variabilei sau strile variabilei aparinnd unui anumit interval de variaie . Ca urmare, n raport cu o variabil statistic populaia poate fi structurat ntr-un anumit numr de clase. De asemenea, relativ la seria statistic unidimensional avnd la baz variabila X, poate fi format cu frecvene relative, frecvene cumulate absolute sau relative. Fie seria X format cu frecvene relative: x x 2 ... xi ... x R X : 1 (1.2.) f 1 f 2 ... f i ... f R 10

-

fi - ne arat ponderea unitilor din populaie care au nregistrat pentru variabila X starea xi: N fi = i i = 1, R N

Pornind de la seria (1.1) se poate deduce seria format cu frecvene absolute cumulate, respectiv: x2 ... xi ... xR x X: 1 (1.3) N(x ) N(x ) ... N(x ) ... N(x ) 1 2 i R unde: N(xi) reprezint numrul de uniti din populaia studiat pentru care variabila nregistreaz valori ce nu depesc valoarea xi. Pornind de la seria (1.1) sau (1.2) se poate deduce seria format cu frecvene relative cumulate, respectiv: ... ... x2 xi xR x1 X : (1.4) F ( x ) F ( x ) ... F ( x ) ... F ( x ) N 2 N i N R N 1 unde: FN(xi) - exprim ponderea unitii populaiei studiate pentru care variabila a nregistrat valori ce nu depesc valoarea xi. FN(xi) = f1 + f2 + ... + fi N ( xi ) (.100) i = 1, R FN ( x i ) = Sau N Seria statistic de repartiie bidimensional este o construcie ce red distribuia unei populaii n raport cu dou variabile. Astfel, fie populaia statistic A studiat n raport cu variabilele X i Y, rezultatele observrii se pot grupa ntr-un tabel de forma urmtoare: X Y y1 y2 . . yi . . yI Total unde: - Nij - reprezint numrul de uniti pentru care, variabila X nregistreaz starea xj i variabila Y nregistreaz starea yi ; - Ni. - numrul de uniti pentru care Y = yi, indiferent de nivelul nregistrat de variabila X; - N.j - numrul de uniti pentru care X = xj, indiferent de nivelul nregistrat de variabila Y; - N - numrul total de uniti analizate. x1 N11 N21 Ni1 NI1 N.1 x2 N12 N22 Ni2 NI2 N.2 ... ... ... ... ... ... xj N1j N2j Nij NIj N.j ... ... ... ... ... ... xJ N1J N2J NiJ NIJ N.J Total N1. N2. N i. NI. N

(1.5)

11

Din seria bidimensional se pot extrage serii unidimensionale de forma urmtoare:

x1 X : N .1 y Y : 1 N 1.

x2 N .2

...

xj

... N . j

xJ ... N . J ...

y 2 ... y i ... y I N 2. ... N i. ... N I .

denumite i serii de repartiie marginale, n raport cu X i Y

y1 Y / X = xj : N 1j

y2 N2 j

...

yi

... N ij

yI ... N Ij ...

j = 1, J

denumit serie de repartiie unidimensional n raport cu Y condiionat de X = xj, numrul acestora fiind egal cu numrul de stri a variabilei X.

x1 X / Y = yi : N i1

x2 N i .2

... x j ... N ij

... x J ... N iJ

i = 1, I

denumit serie de repartiie unidimensional n raport cu X condiionat de Y = yi, numrul acestora fiind egal cu numrul de stri a variabilei Y. De asemenea se poate elabora sau deduce seria de repartiie bidimensional format cu frecvene relative, unde: N ij N. j N f i. = i. f ij = f. j = i = 1, I j = 1, J N N N 1.4.2. Seria statistic de variaie

Conform definiiei seria de variaie red variaia unei mrimi, n timp, n spaiu sau de la o categorie la alta. Ca urmare, n continuare vom vorbi de serii cronologice (au la baz o variabil de timp), serii de spaiu (au la baz o variabil de spaiu) i serii categoriale (au la baz variabile atributive). Cele mai des ntlnite sunt seriile cronologice i seriile de spaiu. Seriile de variaie au la baz mrimi absolute i relative. Dup unii autori din cadrul mrimilor absolute fac parte indicatorul de nivel i diferena absolut a unei mrimi, iar din cadrul mrimilor relative fac parte: indicatorul relativ de intensitate, indicele statistic i diferena relativ a unei mrimi. Indicatorul de nivel (Y) este o mrime ce reflect nivelul unui fenomen analizat. De exemplu: producia diferitelor produse, veniturile populaiei, suprafaa cultivat cu principalele culturi, transportul, exportul, importul etc. Diferena absolut a unei mrimi ( Y ) exprim diferena dintre nivelul cercetat i nivelul baz de comparaie al mrimii analizate. Se exprim n aceeai unitate de msur n care este cuantificat fenomenul analizat i ne arat cu ct s-a modificat acesta de la un nivel la altul.

12

Indicele statistic al unei mrimi ( I Y ) exprim raportul dintre nivelul cercetat i nivelul baz de comparaie al mrimii analizate. Ne arat de cte ori se modific acea mrime, de la un nivel la altul. Diferena relativ a unei mrimi ( RY ) exprim raportul dintre diferena absolut a mrimii respective i nivelul baz de comparaie al acesteia. Ne arat cu ct la sut se modific mrimea de la un nivel la altul. Indicatorul relativ de intensitate (d) se definete ca raport ntre doi indicatori de nivel de natur diferit i arat gradul de rspndire a fenomenului cuantificat de indicatorul de la numrtor n raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu: producia diferitelor culturi/ha, densitatea populaiei, producia principalelor produse/locuitor, rata omajului etc. Greutatea specific (g) reflect structura fenomenului analizat n raport cu strile variabile X, de la baza seriei.

Seriile cronologiceSeria cronologic reflect evoluia n timp a unei mrimi. Valorile variabilei ca funcie de timp pot fi fixate la un anumit moment de timp sau s se refere la un interval de timp. Seria cronologic de momente este o serie de observaii ordonate n timp, exprimnd stocuri [Trebici V., 1985]. De exemplu, volumul populaiei, numr de universiti, bnci, instituii, fonduri fixe, numrul salariailor, ntreprinderile mici i mijlocii din diferite domenii de activitate, unitile de cazare turistic etc. ntr-o astfel de serie nsumarea mrimii analizate nu are sens din punct de vedere al coninutului, aceasta fiind permis din considerente de calcul, ajustri etc. Seria cronologic de intervale este o serie de observaii ordonate n timp exprimnd fluxuri. De exemplu: nscuii vii, divorurile, decesele, producia diferitelor culturi sau produse, venituri, cheltuieli, producia industrial, agricol, exportul, importul etc.ntr-o astfel de serie are sens nsumarea mrimii analizate. Fie o serie cronologic de momente sau de intervale ce reflect evoluia n timp a nivelului unei mrimi Y,

0 Y : y 0

1 y1

2 y2

... t ... y t

... T ... yT

(1.6)

Pornind de la aceast serie se pot deduce seriile formate cu diferene absolute, indici i diferene relative. n funcie de modul de raportare a strilor variabilei timp t, mrimile de mai sus se pot calcula cu baz fix (t/t0) (baza de comparaie rmne aceeai) sau cu baz n lan (t/t-1) (baza de comparaie se schimb, fiind considerat cea precedent nivelului comparat). Fie seriile cronologice formate cu: - diferene absolute cu baz fix:

0 1 t y/ t0 : 0 1 / 0 y

2 2y/ 0

... t ... ty/ 0

... T ... Ty/ 0

(1.7)

ty/ 0 = y (t ) y (0)

13

- diferene absolute cu baz n lan

0 1 t y/ t 1 : 1 / 0 y

2 ... ... t T 2 /1 t / t 1 T / T 1 y ... y ... y

(1.8)

ty/ t 1 = y (t ) y (t 1)ntre cele dou tipuri de diferene absolute cu baza fix i cu baz n lan, exist relaii de legtur ce ne permit exprimarea unora n funcie de celelalte. n acest context, nsumnd diferenele absolute cu baza n lan se obin diferenele absolute cu baza fix.

ty/ 0 = 1y/ 0 + 2y/ 1 + 3y/ 2 + ... + t y/ t 1Scznd diferenele succesive cu baz fix se obin diferenele cu baz n lan. t y/ 0 t y 1 / 0 = y (t ) y (0) y (t 1) + y (0) = y (t ) y (t 1) = t y/ t 1

Diferena absolut ne arat cu ct se modific mrimea analizat de la un moment la altul. Se exprim n aceeai unitate de msur n care este cuantificat fenomenul studiat. Dac fenomenul analizat se exprim valoric, atunci diferena absolut nu reflect prea bine modificrile ce intervin, impunndu-se utilizarea mrimilor relative respective, indicele statistic i diferena relativ. Fie seriile cronologice formate cu: - indici statistici cu baz fix 2 ... t 0 1 t I y / t0 : 1/ 0 2/0 t 1 I Iy ... I y / 0 y t I y/ 0 =

... T ... I T / 0 y

(1.9)

y (t ) ( x100) y ( 0)

- indici statistici cu baz n lan 2 ... t ... T 0 1 t I y / t 1 : 1/ 0 2 /1 t / t 1 T / T 1 I Iy ... I y ... I y y t I y / t 1 =

(1.10)

y (t ) ( x100) y (t 1)

ntre cele dou tipuri de indici exist urmtoarele relaii de legtur: Fcnd produsul indicilor cu baz n lan pn la o anumit stare a variabilei t, se obine indicele cu baz fix al clasei respective.2 t I 1 / 0 .I y / 1 . ... .I y / t 1 = y

y (1) y (2) y (t ) y (t ) t = = I y/ 0 . . ... . y (0) y (1) y (t 1) y (0)

14

mprind doi indici succesivi cu baz fix se obine un indice cu baz n lan: y (t ) y (t 1) y (t ) t t t I y / 0 : I y1 / 0 = = = I y / t 1 : y (0) y (0) y (t 1) Indicele statistic ne arat de cte ori se modific fenomenul analizat. Este mrimea cel mai des folosit n caracterizarea evoluiei fenomenelor din economie. Avnd ca baz de referin o serie cronologic de forma (1.7) se pot elabora serii formate cu: - diferene relative cu baz fix

1 0 t R y / t0 : 0 R1 / 0 y Rt/0 y

2 R2/0 y

... t t ... R y / 0

... T ... R T / 0 y

(1.11)

=

ty/ 0 y (0)

=

y (t ) y (0) y (t ) t = 1 = I y/ 0 1 y (0) y (0)

- diferene relative cu baz n lan

1 0 t R y / t 1 : R1 / 0 y Rt / t 1 y

2 ... t ... T 2 /1 t / t 1 T / T 1 Ry ... R y ... R y t = I y / t 1 1

(1.12)

=

t y/ t 1 y (t 1)

sau

t I y / t 1 .100 100

Aceast mrime la fel ca i indicele statistice, se folosete frecvent n caracterizarea fenomenelor din economie. Dac seria cronologic analizat este de intervale, se poate deduce seria format cu greutatea specific:

0 g y : g 0g (t ) =T

1 g1y (t )

2 g2

... t ... g t

... T ... g T

(1.13)

y(t )t =1

Seria statistic de spaiu (teritorial)

Seria statistic de spaiu este o construcie statistic ce reflect variaia n spaiu a unei mrimi. Seria de spaiu prezint o importan din ce n ce mai mare, datorit dezvoltrii sistemului informaional, a necesitii comparaiilor internaionale i a comparaiilor ntre regiunile unei ri. n cadrul Anuarului Statistic al Romniei exist capitole distincte de Statistic teritorial i Statistic internaional. n capitolul de Statistic teritorial sunt cuprinse

15

informaii privind: populaia, fora de munc, condiii de munc, veniturile populaiei, cheltuielile i consumul populaiei, locuine, asisten social, sntate, nvmnt, cultur, sport, conturi naionale, rezultate i performane ale ntreprinderilor, agricultur, silvicultur, industrie, transporturi, pot, telecomunicaii, turism, finane, justiie i starea infracional, pe cele 7 regiuni i Bucureti. La baza seriei de spaiu se gsesc att mrimi absolute (indicator de nivel, diferena absolut), ct i mrimi relative (indicator relativ de intensitate, indicele statistic, diferena relativ). Fie seria statistic Z, de forma urmtoare:s1 s 2 ... s i ... s R s Z : 0 Z (1) Z (2) Z (3) ... Z (i ) ... Z ( R ) (1.14)

unde: si este o stare a variabilei ce exprim spaiul, i = 1, R ; Z(i) exprim o mrime (indicator de nivel sau relativ de intensitate). Plecnd de la seria de forma (1.15) se pot deduce seriile formate cu: - diferene absolute cu baz fix: ... ... s1 s2 si sR s sZ/ s0 : 0 (1.15) 0 s1 / s0 s2 / s0 ... si / s0 ... sR / s0 Z Z Z Z i sZ / s0 = Z (i ) Z (0) - indicii statistici cu baz fix s1 s2 ... si ... s R s s I Z / s0 : 0 0 I s1 / s0 I s2 / s0 ... I si / s0 ... I sR / s0 Z Z Z Z Z (i ) s I Zi / s 0 = .(100) Z ( 0) - diferene relative cu baz fix s1 s2 ... si ... sR s s R Z / s0 : 0 0 R s1 / s0 R s2 / s0 ... R si / s0 ... R sR / s0 Z Z Z Z si / s0 s s I Zi / s0 = Z = I Zi / s0 100 Z (0)

(1.16)

(1.17)

2. Observarea, sistematizarea i prezentarea seriilor statistice 2.1. Observarea statistic

Observarea statistic constituie prima etap n cadrul studierii fenomenelor sociale, economice sau de alt natur, etap n care se culeg datele statistice despre fenomenul supus cercetrii. Cercetarea fenomenelor respective presupune cunoaterea populaiei statistice n vederea surprinderii aciunii legilor care acioneaz la nivelul acesteia. De calitatea acestei etape, ntr-un proces de cercetare statistic, depinde i calitatea rezultatelor obinute n celelalte faze. Observarea statistic presupune identificarea, urmrirea i nregistrarea, dup reguli unitare i precise, a nivelului atins de variabilele statistice studiate la unitile din care este format populaia luat n studiu[Florea I., 1998].

16

Pentru asigurarea unor date, rezultate din observare, valide i pertinente se impun cteva precizri. n primul rnd, observarea statistic presupune urmrirea i nregistrarea unui numr mare de uniti statistice, ceea ce implic un volum mare de munc. n al doilea rnd, pentru ca cercetarea populaiei s-i ating scopul, trebuie precizate care sunt variabilele n raport cu care este studiat populaia. Variabilele statistice ce urmeaz s fie urmrite i nregistrate la nivelul fiecrei uniti din populaie, trebuie s fie eseniale i s prezinte interes din punct de vedere al studiului ntreprins. n al treilea rnd, trebuie stabilite criterii exacte pentru delimitarea corect a unitilor statistice care alctuiesc populaia. i nu n ultimul rnd, dac observarea i nregistrarea datelor este fcut de mai multe persoane este necesar ca acestea s se alinieze unei metodologii unitare pentru a asigura corectitudinea necesar datelor rezultate. Observarea statistic, ca prim etap ntr-un studiu de cercetare presupune: specificarea unitilor statistice care trebuie s fie urmrite i nregistrate, alegerea variabilelor statistice care caracterizeaz cel mai bine populaia i care rspund obiectivului urmrit, nregistrarea strilor variabilelor statistice considerate. Atingerea scopului cercetrii statistice presupune rezolvarea urmtoarelor probleme care s asigure o pregtire tiinific a observrii statistice: - delimitarea populaiei supuse observrii; - definirea unitilor statistice de observat; - timpul i locul unde va avea loc observarea; - programul observrii; - alegerea purttorilor de informaie; - pregtirea persoanelor ce urmeaz s fac observarea. Fiecreia din aceste probleme trebuie s i se acorde importana cuvenit, fiindc fiecare dintre ele conduce la o pregtire ct mai complet a observrii, de rezultatele creia depinde corectitudinea celorlalte etape a cercetrii statistice. Delimitarea populaiei supuse observrii fa de alte populaii statistice cu care aceasta se afl n legtur se realizeaz prin evidenierea nsuirilor i trsturilor comune ce caracterizeaz populaia supus studiului. Definirea unitilor statistice de observat presupune claritate i precizie pentru a nu da loc confuziilor. n momentul observrii trebuie cunoscut exact care sunt unitile statistice ce trebuie nregistrate n raport cu variabilele de studiat. Stabilirea timpului i a locului unde va avea loc observarea are importan din punct de vedere a comparabilitii datelor rezultate din observare. Noiunea de timp a observrii are n statistic dou accepiuni: - momentul sau perioada la care se refer datele nregistrate (timpul de referin); - durata observrii. Locul observrii reprezint punctul din spaiu n care se deruleaz procesul supus cercetrii (incinta unei ntreprinderi, a unui magazin, o localitate n cazul n care populaia o reprezint familiile etc.). n cadrul programului observrii statistice trebuie stabilite variabilele statistice care urmeaz s fie studiate n populaia de cercetat. Alegerea i definirea variabilelor statistice trebuie s fie n consens cu natura populaiei i obiectivul cercetrii statistice ntreprinse. Variabilele statistice care fac parte din programul cercetrii trebuie s surprind aspectele eseniale, s expliciteze fenomenul sau procesul studiat, s permit prelucrarea i generalizarea acestora la nivelul ntregii populaii. Alegerea purttorilor de informaie se face n funcie de volumul datelor ce urmeaz a fi nregistrate. Purttorii de informaie reprezint suporii materiali pe care se nregistreaz datele din observarea unitilor statistice.

17

Observarea statistic se poate desfura n diverse forme n raport cu: natura proceselor social-economice de studiat, obiectivul cercetrii, formele de organizare ct i posibilitile practice de urmrire i nregistrare a unitilor statistice din populaie. Dup cum se tie, n raport cu gradul de cuprindere a populaiei considerate avem: observarea total i observarea parial. Observarea total permite nregistrarea, n raport cu variabilele statistice a tuturor unitilor statistice din populaie, implicnd un volum mare de munc, antreneaz, de obicei, un numr de persoane i dureaz mult timp. Ca urmare se creaz condiii pentru apariia de erori de observare, ceea ce va conduce la micorarea eficienei observrii. Forma cea mai frecvent de observare total o constituie recensmntul populaiei. Observarea total se practic i n domeniul controlului tehnice de calitate, n cazul produselor de nalt tehnicitate , aa cum ar fi: televizoare, maini de splat, frigidere, automobile etc. Este necesar o observare total n acest caz, deoarece constatarea defeciunilor de ctre cumprtori ar implica cheltuieli mult mai mari cu remedierea acestora n comparaie cu organizarea unei observri totale a loturilor de produse ce urmeaz a fi scoase pe pia. n cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt nesemnificative, este suficient realizarea unor observri pariale prin care s se asigure c rebuturile nu depesc un anumit procent admis. O astfel de observare, care include doar o parte din unitile populaiei supuse studiului corespunde observrii pariale. Observarea parial constituie o alternativ la observarea total n cazul populaiilor infinite sau chiar dac sunt finite prin observare are loc distrugerea acestora. Avnd la baz procedeul observrii pariale se pot evalua rezervele de iei, crbune sau alte minerale, se poate evalua masa de material lemnos din fondul silvic a unei zone sau la nivelul ntregii ri. n general, observarea parial se recomand n toate cazurile n care se consider mai avantajoas dect observarea total. Eantionul, ca rezultat al observrii pariale, presupune respectarea cu strictee a principiului reprezentativitii, n conformitate cu care fiecare unitate statistic din populaie general s aib aceeai ans de a face parte din eantion. Asigurarea respectrii principiului reprezentativitii n formarea eantionului de observat permite acestora o structur foarte apropiat cu cea a populaiilor din care sunt formate. Aceasta ne asigur, cu o anumit probabilitate dinainte fixat, c rezultatele obinute la nivelul eantionului pot fi extinse la nivelul ntregii populaii. n raport cu legea de probabilitate urmat de variabilele urmrite n populaia general sunt dou tipuri de eantioane: eantioane de volum mare i eantioane de volum redus. Observarea statistic n raport cu procedeul folosit este de dou feluri: - observarea direct; - observarea indirect. Observarea direct presupune o observare nemijlocit a unitilor din populaie, care sunt prevzute pentru cercetare. Acest mod de observare se realizeaz printr-un contact direct cu unitile statistice, fie prin msurare, fie prin interogare, dac unitile sunt persoane. Acest procedeu permite observatorului perceperea nemijlocit a fenomenelor luate n studiu n vederea msurrii nivelelor nregistrate de variabilele considerate. Observarea indirect presupune un intermediar ntre unitile care urmeaz s fie supuse observrii i observator. Intermediarul poate fi un document special conceput n vederea observrii i atunci observarea este pe baz de document sau intermediarul poate fi o alt persoan dect observatorul, caz n care avem observare prin interogare. Suportul pentru culegerea datelor l reprezint chestionarul.

18

2.2. Sistematizarea i prezentarea datelor statistice

Sistematizarea constituie o etap n cadrul prelucrrii datelor statistice n vederea prezentrii acestora sub form de serie statistic (tabele statistice). Datele obinute ca urmare a procesului de observare statistic, n forma lor brut, permit o caracterizare amnunit a fiecrei uniti din populaia considerat. Deoarece, datele rezultate din observare se prezint sub form dezorganizat nu permit o caracterizare a populaiei n ansamblu. n vederea atingerii scopului cercetrii statistice ntreprinse i anume acela de a da o caracterizare de ansamblu a populaiei considerate este necesar ca datele rezultate din observare s fie supuse unor operaii de sistematizare i prezentare n vederea deducerii a ceea ce este esenial, tipic i general n legtur cu populaia. Deoarece n prelucrarea statistic primul pas l constituie prezentarea datelor observate sub forma de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie s fie n strns dependen cu scopul cercetrii i cu natura fenomenului cercetat. Odat precizate variabilele de la baza seriei, se tie care va fi coninutul primului ir de date i ca urmare este elucidat criteriul n raport cu care informaiile rezultate din observare vor fi ordonate, necunoscndu-se ns cum se face propriu-zis ordonarea i cum se completeaz primul ir al seriei. Operaia de stabilire a claselor presupune mprirea unitilor unei populaii n clase distincte n raport cu una sau mai multe variabile i aranjarea claselor rezultate ntr-o anumit ordine. n urma unei asemenea operaii, fiecare unitate trebuie s se gseasc n una i numai una din clasele rezultate. Aceast operaie nu trebuie s conduc la pierderi de uniti, regsindu-se ns ntr-o alt ordine dect cea dup care s-a realizat observarea. Omogenitatea constituie o proprietate de baz pe care trebuie s o aib clasele. Se spune c o clas este omogen dac, pentru unitile care fac parte din ea, variabila de grupare nregistreaz variaii nesemnificative. n cele ce urmeaz se va prezenta operaia de stabilire a claselor n cazul unei serii unidimensionale. Dac la baza seriei avem o variabil calitativ, atunci clasele se stabilesc n raport cu strile acesteia. Pentru fiecare stare a variabilei se va construi o clas. Ca urmare, n acest caz, ntr-o clas vor intra toate unitile care au nregistrat aceeai stare n timpul observrii n raport cu variabila considerat. n cazul unei serii care are la baz o variabil cantitativ discret (numrul strilor nu este prea mare), clasele se stabilesc n mod asemntor ca i la variabilele calitative, respectiv: x 2 ... x R x X : 1 N N ... N 2 R 1 n condiiile n care cercetarea populaiei presupune elaborarea unei serii care are la baz o variabil cantitativ continu sau o variabil cantitativ discret, dar care n populaia considerat nregistreaz un numr prea mare de stri, clasele nu se mai pot stabili cu ajutorul strilor variabilei. Pentru asemenea cazuri, gruparea unitilor populaiei n clase se face cu ajutorul intervalelor de grupare (variaie), fiecare interval cuprinznd un numr oarecare de valori ale variabilei. Ca urmare, pentru o serie continu, clasele se definesc cu ajutorul intervalelor de grupare. Dou probleme se pun n cazul elaborrii unei serii care are la baz o variabil cantitativ continu: determinarea lungimii intervalelor de variaie; stabilirea formei de scriere a intervalelor de variaie. 19

Determinarea lungimii intervalelor de variaie conduce la dou situaii: serii construire cu intervale de lungime egal; serii construite cu intervale de lungime diferite. Stabilirea numrului de intervale de variaie trebuie s asigure satisfacerea urmtoarelor condiii: - informaia care se pierde n urma operaiei de grupare s nu fie prea mare, iar populaia s nu fie prea frmiat n raport cu variabilele de grupare; - media aritmetic a fiecrei grupe (n raport cu valorile nregistrate) s fie ct mai aproape de centrul intervalului de variaie respectiv; - s nu existe grupe vide; - reprezentarea grafic a seriei rezultate s permit conturarea unei regulariti a fenomenului de studiat din cadrul populaiei. Trebuie remarcat c acest lucru nu este posibil nici n cazul unui numr mic de intervale deoarece se pierd prea multe date, nici n cazul unui numr prea mare de intervale, populaia frmindu-se prea tare. Statisticianul american H.A. Struges a stabilit pentru cazul n care populaia n raport cu variabila X este normal, urmtoarea expresie:lx = xmax xmin 1 + 3,322 lg N

(2.1)

(1+3,322 LgN, avnd semnificaia de numr de intervale), pentru celelalte cazuri rezultatul fiind orientativ, servind la determinarea cu aproximaie a lungimii intervalelor de variaie n cazul n care acestea vor fi de lungime egal. n expresia de calcul a lungimii intervalelor intervine valoarea maxim i cea minim a variabilei, ct i volumul populaiei. n urma stabilirii lungimii intervalelor. Se elaboreaz seria de intervale de lungime egal dup cum urmeaz:

[x ; (x + l )) ... [xmin + (k 1)lx ; (xmin + klx )) ... [xmin + (R 1)lx ; (xmin + R lx )) X : min min x N1 Nk NR dac se presupune c au rezultat R intervale, unde Nk, k = 1, R reprezint volumele claselor n care s-a structurat populaia. Numeroase sunt cazurile practice n care studiul unei populaii n raport cu o variabil sau mai multe presupune mprirea domeniilor de variaie ale acestora n intervale de lungime neegal. n asemenea cazuri nu exist o relaie de calcul n acest sens. Stabilirea intervalelor de variaie se face n direct legtur cu variaia variabilelor i distribuirea unitilor n raport cu acestea. Dac la baza seriei n cauz stau dou sau mai multe variabile calitative sau cantitative atunci clasele se stabilesc n raport cu fiecare din variabilele considerate prin strile acestora (vezi seria 1.5), avem serii bidimensionale sau multidimensionale. Nu este recomandat ca numrul variabilelor n raport cu care se studiaz populaia s fie prea mare, deoarece aceasta duce la o divizare exagerat a populaiei pierzndu-se din vedere aspectele principale. Dup ce clasele au fost definite, are loc repartizarea unitilor populaiei n clasele respective, folosind n acest scop un algoritm adecvat. Pentru elaborarea i prezentarea seriilor statistice se apeleaz la pachete de programe statistice cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA, S.A.S. (Statistical Analysis System), STATGRAPHICS, etc. 20

2.3. Reprezentri grafice

Reprezentarea grafic a unei serii ne d o imagine geometric (n plan sau spaiu) cu privire la forma static sau evoluia dinamic a fenomenului cuantificat de seria respectiv. Graficul asociat unei serii constituie o imagine spaial a fenomenului de cercetat, permind evidenierea rapid a structurii, dinamicii i tendinei de dezvoltare a acestuia. Reprezentrile grafice sunt folosite att n scopul cunoaterii populaiei n cauz, ct i pentru popularizarea unor rezultate din diverse domenii de activitate. Elaborarea complet i corect n acelai timp a unui grafic presupune elucidarea urmtoarelor elemente: titlul graficului, scara de reprezentare, reeaua graficului, semnele convenionale i notele. Titlul graficului trebuie s fie scurt, clar i semnificativ pentru coninutul fenomenului reliefat prin seria considerat. Scara de reprezentare reunete mulimea tuturor punctelor cotate. n cazul n care variabila nregistreaz valori mici, gradarea scrii ncepe n principiu de la zero, dac variabila nregistreaz valori mari se consider o alt origine stabilit cu aproximaie. Pentru a nu ncrca prea mult desenul, se recomand reprezentarea pe scar doar a valorilor dispuse la un anumit interval convenabil ales. Distanele dintre dou puncte cotate consecutive se numete intervalul graficului. Cnd intervalele sunt egale atunci avem scri uniforme, n caz contrar avem scri neuniforme. Reeaua graficului permite identificarea cu uurin n plan sau n spaiu a punctelor corespunztoare valorilor nregistrate de variabilele n cauz. Sistemul axelor rectangulare (n plan sau spaiu) constituie cele mai uzuale reele n reprezentarea grafic a seriilor statistice. Semnele convenionale se pot materializa ntr-o reprezentare grafic prin inscripii, fie printr-o legend. Inscripia trebuie s fie scurt i semnificativ i plasat ct mai bine n raport cu elementul din grafic pe care l expliciteaz. Legenda se folosete pentru a explicita folosirea semnelor, culorilor sau diverselor hauri folosite n graficul n cauz. Legenda se plaseaz nafara graficului, n colul din stnga sau dreapta jos. n cazul graficelor complexe, pentru o nelegere mai bun, sunt necesare unele explicaii, care se dau sub form de note. Notele generale privesc n ansamblu graficul i se plaseaz chiar sub titlul graficului. Notele speciale privesc poriuni din grafic i sunt legate de acestea prin diverse semne de trimitere. Notele se plaseaz n partea de jos a diagramei, n colul din stnga sub reea. n continuare se vor prezenta principalele tehnici de construire a graficelor utilizate n reprezentarea seriilor statistice ce descriu fenomenele social-economice.Histograma

Graficul specific seriilor care au la baz o variabil continu (de intervale) este histograma. Aceasta se construiete ntr-un sistem de axe rectangulare dup cum urmeaz: pe abscis se trec intervalele de variaie, iar pe ordonat se traseaz scara frecvenelor. Scara frecvenelor se construiete n conformitate cu respectarea principiului proporionalitii ntre frecvene i segmentele delimitate pe scara ordonatelor. Pentru fiecare interval de variaie a seriei (xi-1 xi) se construiete un dreptunghi a crui baz este chiar lungimea intervalului, iar cealalt latur se determin din condiia proporionalitii ariei dreptunghiului cu mrimea indicatorului n clasa respectiv. Latura necunoscut a dreptunghiului, notat cu Li se determin din urmtoarea relaie: Li . li = k . Ni (2.2) unde:

21

li = latura cunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi); Li = latura necunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi); Ni = frecvena absolut a clasei i; k = un coeficient de proporionalitate care se alege n raport cu scara de reprezentare. Din relaia (2.2) se deduce Li: N Li = k i , i = 1, R li unde: li = xi - xi-1, adic diferena dintre limita superioar i cea inferioar a intervalului de variaie. Mulimea tuturor dreptunghiurilor astfel determinate, formeaz histograma ataat seriei.Poligonul frecvenelor Este o reprezentare grafic a seriilor statistice avnd la baz o variabil atributiv cantitativ continu i format cu frecvene absolute sau relative, simple sau cumulate. Trasarea acesteia presupune realizarea n prealabil a histogramei. Poligonul frecvenelor se obine unind prin segmente de dreapt mijloacele laturilor superioare ale dreptunghiurilor, din care este alctuit histograma. Poligonul frecvenelor este un grafic important pentru aproximarea formei distribuiei populaiei studiate, ct i pentru compararea a dou distribuii pe aceeai diagram. Exemplu Din Anuarul Statistic al Romniei din anul 2000, am extras o serie de repartiie reprezentnd populaia Romniei sub 40 de ani pe grupe de vrst .Grupa de vrst (ani) 04 59 10 14 15 19 20 24 25 29 30 34 35 39Distributia populatiei Romaniei sub 40 ani pe grupe de varsta

Populaia 1147065 1330733 1737153 1701881 1978835 1792822 1698268 1335039

populatia

04

59

10 14

15 19

20 24

25 29

30 34

35 39

grupa de varsta (ani)

Figura 2.1 Histograma si poligonul frecventelor 22

Diagramele de structur

Punerea n eviden sub form grafic a structurii unei populaii statistice este posibil apelnd la diagramele de structur. n acest sens se prezint: dreptunghiul, ptratul, cercul i semicercul de structur. Aceste tipuri de grafice permit reprezentarea grafic a seriilor unidimensionale construite cu mrimi de structur( frecvene relative, greutate specific). Cel mai des folosit este cercul de structur denumit i diagrama sectorial (piechart).Cercul de structur

Se construiete un cerc de raz oarecare a crei suprafa se consider c reprezint volumul ntregii populaii n cauz (exprimat n frecvene absolute sau relative). Fiecare clas n care este divizat populaia supus studiului este reprezentat printr-un sector de cerc de arie direct proporional cu volumul clasei. Trasarea sectorului de cerc presupune determinarea msurii n grade a unghiurilor la centru a fiecrui sector. Unghiul la centru de 360o corespunde volumului ntregii populaii. Unghiurile sectoarelor de cerc care reprezint clase din populaie trebuie s fie proporionale cu volumul acestora (exprimat n frecvene absolute sau relative). Unui procent i corespunde 3,6o cu procentul corespunztor clasei respective. 360o i = f i (%). (2.3) 100Exemplu Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd distribuia voturilor electoratului pentru Senat (dup redistribuire) la alegerile din 3 noiembrie 1996:Formaiunea Politic Voturi Obinute (%) CDR 37,0 PDSR 28,7 USD 16,1Chart Title

UDMR 7,7

PRM 5,6

PUNR 4,9

PUNR PRM

UDMR

CDR

USD

PDSR

Figura 2.2 Cercul de structura

23

Diagramele prin benzi (barchart)

Acest tip de grafic utilizeaz benzile (barele), pentru a reprezenta distribuia unei populaii n raport cu o variabil cantitativ discret sau calitativ. Benzile au aceeai lime (baz), iar lungimea (nlimea) lor este direct proporional cu frecvena clasei reprezentate. Numrul benzilor este egal cu numrul claselor n care este mprit populaia studiat. De asemenea se pot lua n considerare o variabil sau dou. n reprezentri se utilizeaz benzi simple sau benzi grupate. Poziia benzilor poate fi orizontal sau vertical.Exemplu

Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd nivelul PNB/loc n $ calculat pe baza puterii de cumprare n Romnia i alte ri esteuropene, n 1998ara PNB/loc ($) Bulgaria 4683 Cehia 12197 Polonia 7543 Romnia 6153 Slovacia 9624 Ungaria 9832

PNB/loc ($) in 199814000 12197 12000 10000 8000 6000 4000 2000 0 7543 6153 4683 9624 9832

Bulgaria

Cehia

Polonia

Romnia

Slovacia

Ungaria

Figura 2.3 Diagram prin benzi simpleCronograma (historiograma)

O categorie foarte important de serii o constituie seriile cronologice, a cror reprezentare grafic se realizeaz prin cronograme. Trasarea unei cronograme se realizeaz ntr-un sistem de axe rectangulare. Se consider seria cronologic de forma (1.7):

0 1 2 ... t ... T Y : y y y ... y ... y 1 2 t T 0 unde: t = 0, T , reprezint momentele (sau perioadele) de timp care se reprezint pe axa absciselor, iar mrimile yt se reprezint pe axa ordonatelor. Fiecrei perechi de valori (t, yt),

24

t = 0, T i corespunde un punct n planul axelor rectangulare. Unind prin segmente de dreapt punctele consecutive, astfel determinate, se obine ceea ce se numete cronogram. n acelai sistem de axe pot fi reprezentate una sau mai multe serii cronologice, care pot fi exprimate n aceeai unitate de msur sau n uniti de msur diferite. Cronogramele asociate unor serii cronologice ne permit compararea fenomenelor surprinse de asemenea serii i sesizarea perioadelor critice n evoluia acestora.

Exemplu.

Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd numrul total ta autoturisme nscrise n circulaie la sfritul anului n Romnia n perioada 1994-1999.Anul Autoturisme nmatriculate 1994 2020017 1995 2197477 1996 2391869 1997 2605465 1998 2822254 1999 2980014

Evolutia numarului de autoturisme inscrise in circulatie in perioada 1994-1999

3500000 3000000 2500000 2000000 1500000 1000000 500000 0 1993 1994 1995 1996 anul 1997 1998 1999 2000

numar autoturisme in circulatie

Figura 2.4 CronogramaNorul statistic

Norul statistic constituie o modalitate de reprezentare grafic a seriilor atributive de repartiie bidimensionale. Se consider o serie bidimensional de repartiie n raport cu variabilele discrete X i Y. n sistemul de axe rectangulare xOy se marcheaz toate punctele de coordonate (xj, yi ); i = 1, I; j = 1, J pentru care frecvenele Nij 0. Mrimea acestor frecvene se poate marca pe grafic n dou moduri: - dac frecvenele sunt mici, atunci pentru fiecare punct de pe grafic (xj, yi ); i = 1, I; j = 1, J pentru care Nij 0, se marcheaz attea puncte de cte ori se repet perechea respectiv.

25

dac ns frecvenele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza diagrame areale prin cercuri ale cror arii trebuie s fie proporionale cu rdcina ptrat a frecvenelor pe care le reprezint. n cazul n care cele dou variabile X i Y sunt continue, ntruct la intersecia a dou intervale se formeaz o rubric (csu), frecvenele diferite de zero se reprezint n interiorul acestei rubrici, fie prin puncte, fie prin diagrame areale cu respectarea unuia din cele dou moduri de elaborare mai sus amintite. Exemplu Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la preuri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat s-a nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:Nr. Crt. Cerere (C) Pre (P) 1 15,4 1,4 2 3,2 5,1 3 4,9 2,5 4 10,5 1,7 5 8,0 1,8 6 5,1 3,4 7 7,6 2,1 8 11,3 1,6 9 14,0 3,6 10 6,4 3,5 11 13,2 1,9 12 8,8 1,8 13 12,1 1,9

18 16 14 12 cerere 10 8 6 4 2 0 0 1 2 3 pret 4 5 6

Figura 2.5 Norul de puncte n raport cu Pret i Cerere Cartograma i cartodiagrama

Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafic a seriilor statistice de spaiu. Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spaiului (sub form de hart) n interiorul cruia se manifest fenomenul care este cuantificat de seria de reprezentat. n interiorul hrii astfel realizat, prin diverse culori sau nuane ale aceleiai culori, prin hauri sau prin diferite diagrame, este evideniat intensitatea dezvoltrii fenomenului cercetat precum i mrimea indicatorilor seriei. Cartodiagrama constituie o modalitate de reprezentare grafic a seriilor de spaiu, realizndu-se ca o mbinare ntre cartogram i diferite alte tipuri de diagrame, ca de exemplu diagrame prin benzi, cerc, ptrat, dreptunghi etc. De exemplu, pentru a reprezenta o serie de spaiu ce exprim volumul investiiilor strine pe judee, la noi n ar, se procedeaz astfel: n primul rnd se deseneaz harta Romniei, delimitndu-se judeele; n cadrul fiecrui jude se deseneaz o figur geometric oarecare convenabil aleas, a crei arie sau mrime s fie direct proporional cu volumul investiiilor strine din judeul respectiv. 26

Probleme propuseP1. Dai 5 exemple de populaii statistice a cror cercetare ar prezenta interes i pentru fiecare populaie selectat precizai: - denumirea populaiei, a unitii statistice i volumul acesteia; - scopul cercetrii statistice; - variabilele statistice n raport cu care s-ar face observarea statistic a populaiei. P2. S se extrag din Anuarul Statistic sau alte surse informaionale o serie statistic bidimensional ce red distribuia unei populaii n raport cu dou variabile atributive, relativ la care se cere: 1. denumirea populaiei ce a fost supus observrii i volumul acesteia; 2. unitatea statistic; 3. caracterizarea variabilelor statistice n raport cu care a fost studiat populaia; 4. caracterizarea seriei statistice n raport cu toate criteriile cunoscute; 5. elaborarea seriei bidimensionale format cu frecvene relative, interpretare; 6. extragerea repartiiilor unidimensionale marginale i a celor condiionate; 7. pornind de la o repartiie marginal deducei celelalte serii statistice posibile, interpretare. P3. Din Anuarul Statistic sau alte surse informaionale extragei o serie statistic de repartiie, avnd la baz o variabil de spaiu, relativ la care se cere: 1. denumirea populaiei statistice i volumului ei; 2. unitatea statistic; 3. caracterizarea seriei dup toate criteriile cunoscute; 4. deducerea seriei format cu frecvene relative; 5. interpretare. P4. Din Anuarul Statistic sau alte surse informaionale extragei dou serii cronologice avnd la baz indicatorul de nivel, una de momente, alta de intervale i deducei seriile formate cu diferene absolute, indici statistici, diferene relative, cu baz fix i cu baz n lan (interpretri). P5. Dai 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate. P6. Din Anuarul Statistic sau alte surse informaionale extragei o serie de spaiu format cu indicator de nivel sau indicator relativ de intensitate i deducei seriile formate cu diferene absolute, indici i diferene relative, calculate cu baz fix. Interpretare. P7. Extragei 5 exemple de serii de spaiu ce conin informaii importante pentru domeniul economic. P8. Lund ca exemplu o populaie statistic studiat n raport cu un anumit numr de variabile (stabilite n raport cu obiectivul studiului), se cere: 1. elaborarea tuturor seriilor statistice de repartiie unidimensionale 2. elaborarea a trei serii statistice de repartiie bidimensionale ( una are la baza dou variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ, una are la baz dou variabile cantitative) 3. reprezentarea grafic a: histogramei, poligonului frecvenei, cercului de structur, diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma.

Bibliografie:2. Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia, Ed. Presa Universitar Clujean, Cluj-Napoca, 2001; 3. Buiga, A., Drago C., Lazr D., Parpucea I., Todea A., Statistic I, Ed. Presa Universitar Clujean, Cluj-Napoca, 2003; 4. Florea I., Parpucea I., Buiga A., Statistic descriptiv, Ed. Continental, Cluj-Napoca,

1998.27

MODULUL 2PARAMETRII REPARTIIILOR EMPIRICE UNIDIMENSIONALE Obiective cunoaterea i nelegerea modului de calcul precum i a semnificaiei parametrilor statistici. ilustrarea trsturilor eseniale care caracterizeaz fenomenele social - economice cunoaterea i msurarea variaiei unei mrimi n raport cu nivelul mediu al acesteia

Concepte de bazvaloare medie, median, modal parametrii de structur variaie, abatere medie, dispersie parametrii concentrrii asimetrie i boltire

Rezultate ateptateCunoaterea modului de calcul i a semnificaiei parametrilor tendinei centrale, a gradului de reprezentativitate a mediei, respectiv a medianei, analiza structurii unei populaii i formularea unei concluzii privind forma distribuiei unei populaii.

Sinteza2.1. Parametrii tendinei centrale

Parametrii din aceast grup au menirea de a evidenia poziia n jurul creia se grupeaz ansamblul valorilor unei variabile de la baza unei serii. Aceast poziie exprimat printr-un numr se numete poziie central. Ea poate fi evideniat prin: - valoarea medie X ; - valoarea median (M e ( X )) ; - valoarea modal (M o ( X )) .

( )

A. Valoarea medie Valoarea medie reprezint principalul parametru care caracterizeaz tendina central a unei repartiii statistice. n vederea definirii parametrului valoarea medie se consider o populaie statistic studiat n raport cu variabila cantitativ X i o funcie G(x1,x2,,xR) unde xi, i = 1, R , reprezint strile variabilei X. Funcia G exprim o anumit nsuire esenial, un atribut al populaiei n raport cu variabila X. Aceast funcie se numete funcie determinant. Prin definiie, valoarea medie X a variabilei X este parametrul care las invariant funcia determinant, adic:

28

G (x1 , x 2 ,..., x R ) = G X , X ,..., X .

(

)

(2.0)

Aceast egalitate se ntlnete sub denumirea de relaia lui BOIARSKI-KISINI. n funcie de forma analitic a funciei G, din relaia (2.0) se deduce expresia analitic (indicatorul) de calcul a valorii medii X . Determinarea, pe aceast cale, a valorii medii X , este destul de anevoioas. Utilizarea acesteia presupune stabilirea coninutului (semnificaiei) i a formei analitice a funciei determinante G, pentru fiecare caz n parte. Dar, valoarea medie X poate fi definit ca un raport a dou mrimi din care se deduce aceeai expresie pentru X ca i din (2.0). Exist, aadar, dou modaliti echivalente de definire a valorii medii, criteriul relaiei determinante a lui Boiarski-Kisini i criteriul raportului, ultima fiind mai accesibil. Criteriul raportului presupune raportarea volumului fenomenului cercetat la volumul populaiei. Acesta presupune cuantificarea volumului fenomenului n funcie de natura lui. Pentru a exemplifica cele prezentate mai sus, se consider populaia familiilor dintr-o localitate, cercetat n raport cu numrul de copii. Datele rezultate din observare se prezint ca o serie de repartiie de forma: xi X : N i i =.1, R n acest caz, funcia determinant are urmtoarea form:G ( x1 , x 2 ,..., x R ) = xi N ii =1 R

semnificnd numrul total de copii din localitatea respectiv. Pentru a gsi numrul mediu de copii pe familie se particularizeaz relaia (2.0) dup cum urmeaz

xi Ni = X Nii =1 i =1

R

R

de unde rezult:X =

xi =1 R i =1

R

i

Nii

N

La acelai rezultat se putea ajunge pornind de la faptul c numrul mediu de copii pe familie se poate exprima ca un raport ntre numrul total de copii i numrul de familii din localitatea respectiv, adic:

X =

Nr. total de copii Nr. de familii

(2.1)

n acest exemplu, fenomenul fiind de natur demografic, volumul acestuia se cuantific prin numrul total de copii la nivelul populaiei statistice considerate. Aceasta este n direct concordan cu natura i semnificaia variabilei n raport cu care se face cercetarea statistic. Cunoaterea naturii parametrului valoare medie, conduce la o definiie mai complet i plin de semnificaie.

29

Pentru a nelege semnificaia valorii medii X , trebuie subliniat faptul c, n general, variaia unui fenomen, de orice natur, i n particular variaia unei variabile X n raport cu care este cercetat o populaie, este determinat de aciunea simultan a dou categorii de factori: factori eseniali i factori neeseniali. n categoria factorilor eseniali intr acei factori care acioneaz asupra tuturor unitilor populaiei n mod continuu i n acelai sens, determinnd, n principal, nivelul de dezvoltare a variabilei pentru fiecare unitate component din populaie. Factorii eseniali se conjug n aciunea lor cu factorii neeseniali, care, n general, au un caracter aleator, sunt numeroi i neuniform rspndii printre unitile populaiei. Fiecare din factorii considerai neeseniali acioneaz numai asupra unui anumit numr de uniti din populaie. Ca urmare, acetia pot contribiu fie la creterea nivelului variabilei (pentru unele uniti din populaie), fie la scderea nivelului variabilei (pentru alte uniti din populaie). La rndul lor factorii eseniali nu acioneaz cu aceeai intensitate asupra tuturor unitilor din cadrul populaie considerate, determinnd, n acest fel, variaia neuniform a variabilei respective n cadrul populaiei. n consens cu cele subliniate mai sus, se poate afirma c parametrul valoarea medie a unei serii statistice care are la baz variabila X, constituie acel nivel pe care l-ar putea nregistra variabila n cadrul populaiei cercetate n condiiile n care factorii neeseniali nu sar fi manifestat, iar factorii eseniali ar fi acionat asupra unitilor din populaie cu aceeai intensitate. Parametrul valoarea medie, calculat pentru o serie statistic, pune n eviden ceea ce este comun, general i esenial sub aspectul nivelului de dezvoltare al variabilei, n raport cu care este studiat o populaie. n raport cu natura variabilei ce st la baza seriei, ct i a formei de prezentare a indicatorilor cu care aceasta este construit, exist mai multe posibiliti de calcul a valorii medii. Funcia determinat G, sub forma sa cea mai general, are urmtoarea expresie analitic: R K K G (x1 , x 2 ,..., x R ) = xi f i i =1 1

(2.2)

Pentru diverse valori ale lui k, n strict concordan cu coninutul i semnificaia funciei G, se ntlnesc mai multe tipuri de medii: - media armonic (k = -1); - media aritmetic (k = 1); - media ptratic (k = 2); - media cubic (k = 3); - media de ordinul k n general. n caz concret, valoarea medie real X este aceea care se obine prin indicatorul (mediu) rezultat fie prin aplicarea criteriului relaiei determinante, fie criteriului raportului.

Modaliti de calcul a valorii medii 1. Media aritmetic

30

Acesta este indicatorul cel mai utilizat n calculul parametrului valoarea medie a unei serii statistice, aa cum rezult din practica statistic. Se consider acum dou serii statistice de repartiie, una format din frecvene absolute, iar cealalt din frecvene relative: xi X : N i i =.1, R xi X : f i i =.1, R

(2.3)

(2.4)

Media aritmetic pt cele dou serii se calculeaz astfel: xi N i ; X = xi f i Nj Dac seria este de intevale, construit cu frecvene absolute avem:X=

xi .N i Nj Fie o serie de repartiie, care are la baz o variabil continu X, respectiv,X=

'

xi 1 xi X : f i i =.1, R

Folosind notaiile:

xi + xi 1 = xi' 2 unde x i' reprezint mijlocul intervalului i, obinem relaia:

X = xi' f ii =1

R

Relaia ne arat c media aritmetic a unei serii de intervale se reduce la media aritmetic a unei serii discrete n care clasele sunt reprezentate prin mijloacele intervalelor de variaie.2. Media armonic

Se consider o serie de forma:x X : i N i i =1, R (2.5)

n cazul unei serii discrete de forma (2.5), media armonic notat cu X 1 se definete prin:

31

X 1 =

Ni =1 R

R

i

1 x Ni i =1 i

(2.6)

numit i formula mediei armonice ponderate. Dac ponderile sunt egale ntre ele, adic N1=N2==NR=N*, atunci relaia (2.6) devine:R

X 1 =

Ni =1

*

i =1

R

1 N* xi

=

R

i =1

R

1 xi

(2.7)

care reprezint formula mediei armonice simple. n cazul unei serii care are la baz o variabil continu X, respectiv, x x X : i 1 i N i i =1, R procednd ca la media aritmetic, pentru media armonic rezult:R

X 1 =

Ni =1 R

i

1 x' Ni i =1 i

(2.8)

unde xi reprezint mijlocul intervalului i, i = 1, R . i n acest caz, dac ponderile sunt egale, se obine relaia de calcul a mediei armonice simple, de forma:

X 1 =

R

xi =1

R

1' i

3. Media geometric

Pentru o serie care are la baz variabila discret X, format cu frecvene absolute, media geometric notat cu X g (sau X o ) este definit prin expresia:N N X g = N x1N1 x2 2 ...xR R

(2.9)

Din (2.9), pentru media geometric ponderat exprimat cu frecvene relative se deduce: Xg =N

x

N1

1

R N N N x 2 2 ... x R R = xi i i =1

1/ N

= xii =1

R

Ni / N

= xi if i =1

R

(2.10)

32

Dac variabila X, de la baza seriei este de variaie continu, atunci relaiile de calcul pentru diversele variante de medie geometric, rmn variabile cu singura modificare c valorile xi, i = 1, R , se nlocuiesc cu mijloacele intervalelor de variaie, calculate conform formulei:xi' = xi 1 + xi , 2 i = 1, R

(2.11)

B. Valoarea median

Valoarea median, notat cu M e este acea valoare a variabilei cantitative X care mparte repartiia n dou pri egale, respectiv: FN (M e ) = 1 / 2 sau N ( M e ) =N 2

(2.12)

Calculul valorii mediane se face difereniat, dup cum seria are la baz o variabil discret sau continu.

Pentru o repartiie discret, calculul medianei nu implic probleme deosebite i nici un volum mare de calcule.Se consider o repartiie cu frecvene absolute:

x x2 ... xi ... xR X : 1 N N ... N ... N . 2 i R 1a) volumul N al populaiei este un numr impar; b) volumul N al populaiei este un numr par.

(2.13)

n calculul valorii mediane a unei serii discrete, pot aprea dou situaii:

n ambele cazuri, calculul medianei presupune, n prima faz, determinarea rangului medianei, notat cu rM e , conform urmtoarei relaii:rM e = 1 R N i = N (M e ) 2 i =1

(2.14)

a) Dac volumul populaiei N este un numr impar, rangul medianei este un numr zecimal a N crui parte ntreag indic numrul de uniti din populaie pentru care variabila X a 2 nregistrat valori mai mici ca mediana. Ca urmare, M e trebuie s fie valoarea imediatN urmtoare celei de rang adic: 2 M e = x N +1 2

(2.15)

b) Dac volumul populaiei este un numr par, rangul medianei este un numr ntreg i ca urmare la mijlocul seriei nu se mai afl o valoare a variabilei X cu care s coincid mediana ci se gsesc dou valori, mediana calculndu-se n acest caz ca media aritmetic a acestora. Relaia de calcul a medianei, n acest caz, este:

33

x N + x N Me =2

+1 2

2

(2.16)

Pentru o repartiie continu, calculul valorii mediane presupune verificarea egalitii (2.12) i ca urmare, trebuie cunoscut densitatea de repartiie f(x). Determinarea funciei f(x) implic un volum mare de calcule i deci, din acest motiv, n activitatea practic f(x) este aproximat. Acest lucru va conduce la o expresie aproximativ de calcul a valorii mediane, care necesit un volum redus de calcule.Pentru acesta se consider o repartiie continu n raport cu variabila X, i anume:

x x1 x1 x 2 ... x i 1 x i ... x R 1 x R . X : 0 N Ni N2 NR ... ... 1

(2.17)

unde intervalele xi-1-xi, i = 1, R pot fi de lungime egal sau neegal. Calcularea rangului medianei va permite stabilirea intervalului n care se afl valoarea median, interval numit i interval median. Se cumuleaz frecvenele absolute din aproape n aproape pn ce este ndeplinit inegalitatea:N 1 + N 2 + ... + N i 1 N 2

Ultima frecven Ni cumulat, ne permite s indicm intervalul median [x i 1 x i ) . Formula aproximativ de calcul a medianei:N ( M e ) N ( xi 1 ) ( xi xi 1 ) Ni

M e = xi 1 +

(2.18)

xi 1 = xM e Ni = N M e

- limita inferioar a intervalului median; - frecvena absolut a intervalului median;

xi xi 1 = lM e - lungimea intervalului median,

C. Valoare modal

Valoarea modal Mo(X) a unei repartiii reprezint aceea valoare a variabilei X creia i corespunde frecvena cea mai mare. Acest parametru se mai numete modul, valoare dominant, sau mod se noteaz cu Mo.

Mod de calcul:a) Pentru o serie de repartiie discret, dat sub forma x x ... x i ... x R X : 1 2 f f ... f ... f . i R 1 2

(2.19)

34

valoarea modal se citete direct din serie, nefiind nevoie de nici o tehnic sau formul de calcul. n cazul acestui tip de serie, valoarea modal va fi acea valoare a variabilei X pentru care frecvena este cea mai mare. b) Pentru serii de repartiie continue, respectiv: x x1 x1 x 2 ... x i 2 x i 1 x i 1 x i X : 0 f f i 1 fi f2 ... 1 x i x i +1 ... x R 1 x R f i +1 fR ... (2.20)

Modala nu poate fi determinat direct. Intervalul cruia i corespunde frecvena cea mai mare, se numete intervalul modal i va conine modala. S presupunem c intervalul modal este xi-1-xi. Formula de calcul a modalei:

M o (x ) = x M o +unde:

1 lMo 1 + 1

(2.21)

Mo xMo

- reprezint valoarea modal; - reprezint limita inferioar a intervalului modal;

1 - reprezint diferena dintre frecvena intervalului modal i frecvena intervalului precedent; 1 - reprezint diferena dintre frecvena intervalului modal i frecvena intervalului urmtor;lMo- reprezint lungimea intervalului modal.

O serie poate avea o singur valoare modal, caz n care seria se numete unimodal. Dac o serie are mai multe valori modale, atunci se numete plurimodal. O serie plurimodal evideniaz faptul c populaia n cauz este neomogen. Calculul valorii modale, n asemenea cazuri, presupune o delimitare mai riguroas a obiectului observrii ct i a populaiei care urmeaz s fie studiat. O alt cale, care poate duce la eliminarea unui asemenea neajuns, o constituie comasarea a dou cte dou sau trei cte trei intervale etc., pn se ajunge la o serie unimodal. n cazul unei serii simetrice valoarea modal coincide cu valoarea medie i cu mediana. Pentru serii uor asimetrice, K. Pearson a stabilit urmtoarea relaie ntre cei trei parametri:

Mo = X 3 X Me

(

)

unde X este media aritmetic a variabilei X. Calculul valorii modale reprezint un deosebit interes pentru activitatea practic. Avnd n vedere c semnificaia acestui parametru indic acea valoare a variabilei nregistrat de cele mai multe uniti din populaie se poate afla: ora la care sunt solicitate cele mai multe

35

convorbiri telefonice, ora de vrf privind transportul n comun, mrimea cea mai solicitat la nclminte etc. Dac valoarea modal este identic cu valoarea medie, atunci se poate afirma c valoarea medie se bucur de o mai mare reprezentativitate. Dac, n plus, avem M e = M o = X , innd seama c valoarea median nu este influenat de valorile extreme ale variabilei, se poate afirma c mediana reprezint un grad de reprezentativitate mai mare dect valoarea medie.2.2. Parametrii de structur

Frecvente sunt cazurile cnd este necesar studierea structurii unei populaii n raport cu o variabil sau alta. Parametrii statistici, n forma cea mai general, folosii n caracterizarea structurii unei populaii poart denumirea de valori quantile. Valorile quantile ale unei serii de repartiie unidimensionale sunt acele mrimi nregistrate de variabila X, care mpart seria n n pri egale (mai precis mparte populaia n n pri egale). n acest caz se vor calcula p quantile (p = n-1). Pentru o serie continu, a crei densitate de probabilitate f(x) este cunoscut, urmtoarea egalitate este satisfcut de cele p quantile:q1

x1

f ( x)dx =

q2

q1

f ( x)dx = ... =

xR

q n 1

f ( x)dx =

1 n

(2.22)

unde cele n-1 quantile s-au notat cu q1, q2, , qn-1. Relaia (2.22) se particularizeaz pentru cazul seriilor discrete, cnd seria este construit cu frecvene relative:

x1

q1

f i = f i = ... = f i =q1 q n 1

q2

xR

1 n

(2.23)

Pentru o serie oarecare, quantila de ordinul p poate fi definit astfel:FN (q p ) = p N 1 sau N (q p ) = p , p = 1, n - 1 n n

Modul de calcul a valorilor quantile difer n raport cu tipul seriei.

Fie o serie de repartiie, care are la baz o variabil X discret, de urmtoarea form:

x x2 ... xi ... xR X : 1 N N ... N ... N . 2 i R 1

(2.24)

Pentru calculul valorii quantile de ordinul p ( p = 1, n 1) , n prima etap trebuie determinat rangul acesteia:rq p = N ( q p ) = p N n

(2.25)

Se disting dou cazuri:

36

a) dac pN se divide cu n atunci quantila de ordin p se calculeaz ca o medie aritmetic simpl a valorilor variabilei X, de ordinul rangului i al rangului majorat cu o unitate, dup cum urmeaz:

qp =

x rq p + x ( rq p +1)2

(2.26)

b) dac pN nu se divide cu n atunci quantila de ordin p este egal cu acea valoare a variabilei X corespunztoare pari ntregi a rangului majorat cu 1:q p = x[ rq p +1]

(2.27)

n cazul seriilor care au la baz o variabil continu, conform definiiei, cele n-1 quantile trebuie s satisfac relaia (2.22). Determinarea quantilelor din asemenea egaliti ar presupune cunoaterea densitii de probabilitate f(x). Ori n activitatea practic f(x) se aproximeaz prin diverse procedee, implicnd un volum exagerat de calcule.n vederea gsirii unor formule aproximative de calcul a quantilei de ordin p ( p = 1, n 1) se consider o serie de variaie continu, ale crei intervale de variaie nu trebuie s fie neaprat egale ca lungime:

x x1 x1 x 2 ... x i 1 x i ... x R 1 x R . X : 0 N Ni N2 NR ... ... 1

(2.28)

n prima etap se determin rangul quantilei de ordinul p ( p = 1, n 1) conform urmtoarei relaii:1 R rq p = N ( q p ) = p N i n i =1

(2.29)

Cunoscnd rangul, se poate identifica intervalul n care se afl quantila de ordinul p, numit i intervalul quantilei de ordinul p ( p = 1, n 1) . Cumulnd frecvenele pe clase pn la egalarea s-au depirea rangului, conform inegalitii:1 R N 1 + N 2 + ... + N i p N i n i =1

(2.29)

ultima frecven adunat va corespunde intervalului quantilei de ordinul p ( p = 1, n 1) . Prin urmare, quantila de ordinul p, qp, se calculeaz conform relaiei:

q p = x i 1 +

N (q p ) N ( x i 1 ) Ni

( x i x i 1 )

(2.30)

x q p = x i 1 - reprezentnd limita inferioar a intervalului quantilei de ordinul p; l q p = x i x i 1 - reprezint lungimea intervalului quantilei de ordinul p; N q p = N i - reprezint frecvena absolut a intervalului quantilei qp,37

Procedeul de determinare a quantilei de ordinul p = 1, n 1 este acelai i n cazul n care seria (2.28) este format din frecvene relative. Caracterizarea structurii unei serii se poate face utiliznd diverse cazuri particulare de valori quantile.

Valoarea median (Me) este i un parametru de structur obinndu-se ca un caz particular de quantil, cnd n=2. Dac pentru o serie se cunoate Me (quantila de ordinul 2), atunci structura populaiei poate fi redat astfel: X Me X : min 50%

M e xmax 50%

(2.31)

semnificnd faptul c jumtate din populaia supus studiului a nregistrat pentru variabila X valori cuprinse ntre valoarea minim a lui X i median, iar cealalt jumtate din populaie a nregistrat pentru X valori cuprinse ntre median i valoarea maxim a lui X. Valorile quartile reprezint acel caz particular al valorilor quantile pentru care n=4. Cele trei quartile, care se obin, notate: Q1, Q2 i Q3 sunt acei parametri de structur care mpart populaia n patru pri egale. n raport cu mediana, quartila nti Q1, se numete quartila mic (inferioar), quartila a doua Q2 coincide cu mediana i se numete quartila mijlocie, iar quartila a treia Q3 se numete quartila mare (superioar). Cunoscndu-se cele trei quartile, rezult urmtoarea structur a populaiei n raport cu variabila X: x Q1 Q1 Q2 X : min 25% 25%

Q2 Q3 25%

Q3 X max 25%

(2.32)

ceea ce semnific o structurare a populaiei supus studiului n patru pari egale. Aceasta nseamn c 25% din unitile popupaiei nregistreaz valori pentru variabila X mai mici dect quartila mic, 25% din unitile populaiei nregistreaz valori, n raport cu aceeai variabil X, cuprinse ntre quartila mic i cea mijlocie, 25% vor avea valori cuprinse ntre quartila mijlocie i quartila mare, iar restul 25% din unitile populaiei vor avea valorile pentru variabila X cuprinse ntre quartila mare i valoarea maxim a lui X.

2.3. Parametrii variaiei

Studiul unor populaii statistice prezint importan numai din punct de vedere al unor mrimi care variaz de la o unitatea la alta sau de la un grup de uniti la altul. Valorile nregistrate de o variabil cantitativ, n raport cu care este studiat o populaie, se datoresc aciunii diferiilor factori eseniali i neeseniali. Intensitatea diferit cu care se pot manifesta factorii eseniali ct i sensul contrar cu care pot aciona factorii neeseniali n raport cu fiecare unitate, provoac nivele diferite nregistrate de variabile n raport cu care este studiat populaia. Problema msurrii variaiei unei variabile cantitative este important pentru a vedea n ce msur valoarea medie a acesteia poate reprezenta ntrega populaie.

38

Dac abaterile de la valoarea medie sunt neeseniale atunci se poate afirma c populaia este omogen i c acest parametru poate reprezenta tendina central, iar dac aceste abateri sunt mari atunci populaia este eterogen i valoarea medie nu are capacitatea de a reprezenta populaia. Pentru unele serii, valoarea medie nu se poate calcula. n asemenea cazuri, parametrul valoarea median poate s-i ia locul. Aceeai problem se pune i n acest caz, de a vedea n ce msur valoarea median este sau nu reprezentativ pentru populaia n cauz. O alt problem care nu se poate rezolva fr a studia i msura variaia nregistrat de o variabil n raport cu care este studiat o populaie, o constituie verificarea de ipoteze. n activitatea practic, de multe ori pornind de la valorile unor parametrii calculai pe baza datelor culese relativ la un numr mic de uniti, este necesar a fi extini la nivelul ntregii populaii sau de a se verifica anumite ipoteze statistice. Parametrii variaiei se pot calcula att sub form absolut ct i relativ, i msoar mprtierea valorilor unei variabile cantitative fa de valoarea medie sau valoarea median. Ca urmare, n funcie de elementul de referin folosit n msurarea variaiei, deosebim: parametrii variaiei n raport cu valoarea medie; parametrii variaiei n raport cu valoarea median.

2.3.1. Parametrii variaiei n raport cu valoarea medie Abaterea medie liniar

Abaterea medie liniar, notat cu d x , reprezint media aritmetic a abaterilor variabilei X de la valoarea medie a acesteia, luate n valoare absolut:

dx = M X XRelaia (2.33) se particularizeaz n :

(2.33)

dx =

xi =1

R

i R

X Ni(2.34)i

Ni =1

Dac seria are la baz o variabil continu i se cunoate f(x), atunci abaterea medie liniar se calculeaz astfel:

dx =

xR

x1

x X f ( x)dx

(2.35)

Densitatea de probabilitate f(x) se poate aproxima cu densitatea empiric i atunci pentru abaterea medie liniar se pot obine relaii de calcul aproximativ, frecvent utilizate n activitatea practic, de forma:

39

dx =

xi =1

R

'i

X NiR

Nii =1

sau d x = x 'i X fii =1

R

(2.36)

dup cum seria n cauz este format cu frecvene absolute sau relative, unde:

x i' =

x i 1 + x i , i = 1, R 2

este mijlocul intervalului i. Acest parametru servete caracterizrii sintetice a gradului de reprezentativitate a valorii medii, artnd cu ct se abate n medie orice valoare a variabilei X de la valoarea medie X , ntr-un sens sau altul. Sub forma relativ, acest indicator poart denumirea de coeficient simplu de variaie i se calculeaz conform relaiei:

Vx =

dx X

100

(2.37)

Coeficientul simplu de variaie (Vx) arat cu ct se abate n medie orice valoare a variabilei X de la valoarea medie echivalent cu 1 sau 100%. Calculat pentru dou serii diferite, se poate aprecia gradul de reprezentativitate a celor dou medii. Se apreciaz mai reprezentativ acea valoare medie pentru care coeficientul simplu de variaie este mai mic. Parametrul abaterea medie liniar, n forma absolut sau relativ, prezint unele deficiene deoarece nu este suficient de sensibil la abaterile mici, adugndu-se i unele inconveniente de natur teoretic, generate de exprimarea abaterilor n valoarea absolut. nlturarea acestor deficiene se poate realiza apelnd la un nou parametru privind msurarea variaiei, numit abatarea medie ptratic.Abaterea medie ptratic

Acest indicator este utilizat att pentru caracterizarea gradului de reprezentativitate a valorii medii ct i n scopul estimrii unor parametri necunoscui. Abaterea medie ptratic, notat cu x , se definete ca fiind media ptratic a abaterilor valorilor variabilei X, de la valoarea medie X , adic:

x = M (X X )2

(2.38)

Un calcul intermediar n aflarea acestui parametru, l constituie calcularea ptratului abaterii medii ptratice, care se numete dispersie sau varian i are urmtoarea expresie de calcul:2 x = M (X X )2 = D2 (X )

(2.39)

V(x) reprezint o alt notaie pentru varian, pe lng 2x . Variana fiind un calcul intermediar n aflarea abaterii medii ptratice, n cele ce urmeaz se va prezenta modul de calcul al acesteia.

40

Relaia de calcul a varianei se particularizeaz n raport cu tipul seriei. n cazul unei serii care are la baz o variabil X discret, conform definiiei, variana are expresia:

2 x =

(xi =1

R

i

X )2 NiR

Ni =1

(2.40)i

n cazul unei serii care are la baz o variabil X continu, variana se calculeaz conform urmtoarei relaii:

=2 x

xR

x1

(x X )

2

f ( x) dx

(2.41)

a crei aplicare presupune cunoaterea densitii de repartiie f(x). Pentru o serie dat, variana calculat nu are interpretare, dar dac se extrage rdcina ptrat din acesta se obine un numr care se exprim n aceleai uniti de msur ca i variabila de la baza seriei. Acest numr (valoare) reprezint abaterea medie ptratic, simboliznd cu ct se abate n medie n plus sau minus orice valoare xi a variabilei X de la valoarea medie X . Parametrul abaterea medie ptratic se poate exprima i sub form relativ, caz n care se numete coeficientul de variaie a lui Pearson, i se noteaz cu Vx. Expresia de calcul este:

Vx =

xX

100

(2.42)

i reprezint abaterea medie a orcrei valori a variabilei X de la valoarea medie, considerat egal cu 1 sau 100. Coeficientul de variaie a lui Pearson calculat pentru dou sau mai multe serii, poate fi folosit n aprecieri comparative privind gradul de reprezentativitate a valorii medii calculate. Deoarece gradul de reprezentativitate a valorii medii este n raport invers cu mrimea coeficientului de variaie a lui Pearson, se poate afirma, n cazul mai multor serii, c este mai reprezentativ valoarea medie a acelei serii pentru care Vx este mai mic. n concluzie, trebuie reinut c parametrul abaterea medie ptratic sub form absolut x i sub form relativ Vx sunt indicatori fundamentali utilizai n msurarea variaiei unei variabile. Att abaterea medie liniar, ct i abaterea medie ptratic constituie o msur a variaiei medii, primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (d x x ) .2.3.2. Parametrii variaiei n raport cu valoarea median Abaterea interquartil

Abaterea interquartil, prin definiie, este media aritmetic simpl a segmentelor Me Q1 i Q3 Me, respectiv:Q= M e Q1 + Q3 M e Q3 Q1 = 2 2

(2.43)

41

i arat cu ct se abat n medie, n plus sau n minus, de la median, cele 50% din valorile variabilei cuprinse ntre Q1 i Q3. Forma relativ a acestui indicator notat cu Qr:Qr = Q Q Q1 100 = 3 100 2 Me Me

(2.44)

se numete coeficient de variaie interquartilic i arat cu ct se abat n medie de la median (considerat egal cu 100), valorile variabilei nregistrate pentru cele 50% din unitile populaiei cuprinse ntre Q1 i Q3. Ca atare, se apreciaz c mprtierea unitilor n cadrul populaiei studiate este cu att mai mare, n raport cu variabila de studiat, cu ct abaterea interquartil n valoarea absolut (2.43) sau relativ (2.44) este mai mare.Abaterea interquantil

Pentru acest parametru, sub form absolut, avem:q= qn 1 M e + M e q1 qn 1 q1 = 2 2q q q 100 = n 1 1 100 2 Me Me

(2.45)

iar sub form relativ denumit i coeficient de variaie interquantilic este:qr =

(2.46)

Cu ct abaterea interquantilic (relativ sau absolut) este mai mic, cu att valoarea median este mai reprezentativ.2.4. Parametrii concentrrii Energia informaional

Acest parametru a fost introdus de Acad. Octav Onicescu. Prin definiie:E = fi 2i =1 R

unde s-a notat cu E energia informaional. Este un parametru utilizat n cazul n care seria are la baz o variant nenumeric. n cazul unei populaii caracterizat de un grad de concentrare maxim, va exista o clas care va avea frecvena relativ egal cu 1, iar celelalte vor avea frecvenele relative 0 i ca urmare: Emax = 1. Dac populaia este caracterizat de o concentrare minim, atunci:

x2 ... xR x X : 1 1 / R 1 / R ... 1 / R

42

iarEmin = R 1 1 = 2 R R

Se observ c:1 E 1 R

Forma relativ a acestui parametru, notat cu Er, se deduce astfel:

1 E R = Er = 1 1 R de unde:

fi =1

R

2 i

1 R

1 R

1

0 Er 1Referitor la populaia dat, studiat n raport cu o variabil X, se calculeaz Er, iar dac: - Er se apropie de 1, atunci populaia respectiv este caracterizat de un grad nalt de concentrare; - Er se apropie de 0, populai

Click here to load reader

Reader Image
Embed Size (px)
Recommended