+ All Categories
Home > Documents > Statistic A Descriptiva Suport de Curs

Statistic A Descriptiva Suport de Curs

Date post: 15-Jul-2015
Category:
Upload: vasile-pustai
View: 64 times
Download: 2 times
Share this document with a friend

of 105

Transcript

UNIVERSITATEA BABE -BOLYAI, CLUJ-NAPOCA Centrul de Formare Continu i nv mnt la Distan Facultatea de tiin e Economice i Gestiunea Afacerilor Specializarea: Trunchi Comun Disciplina: Statistic Descriptiv

SUPORT DE CURSANUL II Semestrul 1

Cluj Napoca 2011

1

I. Informa ii generale 1.1. Date de identificare a cursului Date de contact ale titularilor de curs: 1. Nume: Conf. univ.dr. Anu a Buiga Birou: Birou 346 sediul Fac. de tiin e Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: [email protected] 2. Nume: Conf.univ.dr. Drago Cristian Birou: Birou 231 sediul Fac. de tiin e Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: [email protected] 3. Nume: Conf.univ.dr. Dorina Laz r Birou: Birou 527 sediul Fac. de tiin e Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: [email protected] 4. Nume: Lect.univ.dr. Cristian Litan Birou: Birou 231 sediul Fac. de tiin e Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: [email protected] 5. Nume: Lect.univ.dr. Codruta Mare Birou: Birou 346 sediul Fac. de tiin e Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: [email protected]

2

MODULUL 1Concepte de baz . Obiectul statisticii. Observarea, sistematizarea i prezentarea seriilor statistice. Obiectivey y y y y y definirea unei popula ii statistice, a variabilelor statistice ob inerea de informa ii cu privire la fenomenul supus cercetarii organizarea datelor i prezentarea acestora sub form de serii statistice eviden ierea structurii popula iei n raport cu variabilele observate eviden ierea evolu iei unui fenomen n timp sau spa iu reprezentarea grafic a datelor

Concepte de bazy y y popula ie statistic , unitate statistic , volum, e antion, variabil statistic , observare statistic , indicator statistic, serie statistic observare statistic , serii statistice unidimensionale i bidimensionale reprezentarea grafic a datelor relativ la o variabil cantitativ , la o variabil calitativ i la dou variabile

Rezultate a teptateCunoa terea i st pnirea no iunilor statistice de baz , cunoa terea tehnicilor de culegere, grupare i prezentare a datelor. Utilizarea indicatorilor statistici cu scopul eviden ierii varia iei unei m rimi sau a structurii popula iei supuse studiului.

Sinteza1. Concepte de baz 1.1. Popula ia statistic Popula ia statistic reprezint mul imea elementelor simple sau complexe, de aceea i natur , care au una sau mai multe nsu iri esen iale comune, proprii elementelor ct i popula iei privit ca un tot unitar. [Florea I.,1998] O popula ie este finit dac include un num r determinat de elemente, dar ea poate fi considerat drept reprezentativ pentru o popula ie teoretic infinit . Ca urmare apare necesitatea de a delimita o popula ie n: con inut, spa iu i timp. Se mai denume te i popula ia univers. Exemple de popula ii statistice: mul imea persoanelor dintr-o anumit ar (localitate, zon etc.) n anul t, mul imea gospod riilor din Romnia, la momentul t, mul imea consumatorilor unui produs, mul imea societ ilor produc toare sau concurente ale unui produs, mul imea societ ilor distribuitoare, angaja ii unei societ i, etc. Se noteaz cu majusculele de la nceputul alfabetului: A, B, C etc. Unitatea statistic constituie elementul component, al popula iei statistice, asupra c ruia se va efectua nemijlocit observarea. 3

Unitatea statistic este purt torul originar de informa ie sau subiectul logic al informa iei statistice. Datorit variet ii aspectelor sub care se poate prezenta n fapt, unitatea statistic comport o defini ie precis , care s exclud prin posibilitate de interpretare diferit de c tre observatori i astfel orice eroare ce poate prejudicia valoarea investiga iei. n exemplele citate mai sus, unit ile statistice sunt: persoana, gospod ria, consumatorul, societatea produc toare sau concurent , societatea distribuitoare, angajatul etc. Se noteaz cu minusculele corespunz toare majusculei ce simbolizeaz popula ia statistic , respectiv ai, bi etc.. Volumul popula iei reprezint num rul unit ilor statistice care alc tuiesc popula ia statistic , Acesta poate fi finit sau infinit, n func ie de tipul popula iei care poate fi la fel finit sau infinit . Se noteaz cu N, iar pentru o popula ie A, avem: A : {a1, a2, ..., aN} E antion reprezint o submul ime a unei popula ii statistice, constituit dup criterii bine stabilite. n raport cu procedeul de formare a e antionului avem e antioane aleatoare i e antioane dirijate. E antionul aleator este format din unit ile statistice care rezult printr-un procedeu aleator: procedeul tragerii la sor i, tabelul cu numere ntmpl toare, procedeul extragerilor sistematice. E antionul dirijat este constituit pe baza unor informa ii auxiliare existente la nivelul popula iei studiate sau l snd liber pe anchetator s aleag unit ile respectnd doar realizarea structurii e antionului n func ie de criteriile stabilite. Se noteaz cu n. Majoritatea studiilor au ca suport datele provenite de la nivel de e antion, de aici importan a constituirii acestuia i implicit, apelarea la inferen a statistic , pentru a estima parametrii la nivelul popula iei univers. 1.2. Variabila statistic Variabila statistic reprezint o nsu ire sau o tr s tur comun tuturor unit ilor unei popula ii. Nivelul nregistrat de o variabil statistic la o unitate oarecare al popula iei se nume te realizare sau starea variabile. [Florea I., 1998]. n general se noteaz cu majusculele de la sfr itul alfabetului, X, Y, Z etc. Dac se noteaz cu X o variabil statistic oarecare, atunci cu x1, x2, ..., xN se vor nota st rile variabilei respective. Variabilele statistice se clasific n raport cu natura, modul de exprimare i modul de varia ie. a) Dup natura lor variabilele statistice pot fi atributive, de timp i de spa iu. y Variabila atributiv exprim un atribut sau nsu ire esen ial (alta, dect timpul sau spa iul) unit ilor popula iei; y Variabila de timp ne arat timpul n care au luat fiin unit ile popula iei sau perioada de timp n care au existat (exista); y Variabila de spa iu ne arat spa iul n care exist sau au luat na tere unit ile popula iei. b) Dup modul de exprimare a st rilor deosebim: y Variabil cantitativ este variabila ale c rei st ri se exprim prin valori numerice. Se mai nume te i variabil metric .

4

Variabil calitativ este variabila ale c rei st ri se exprim prin cuvinte sau coduri. Se mai nume te variabil nominal (st rile se exprim prin cuvinte) sau variabil ordinal (st rile se exprim prin coduri). c) Dup modul de varia ie variabila cantitativ poate fi: y Variabil discret este acea variabil care, n intervalul s u de defini ie nregistreaz cel mult valori ra ionale, varia ia are loc n salturi. y Variabil continu este acea variabil care poate lua orice valoare real din intervalul s u de varia ie. Exemple de variabile statistice relativ la popula ia format din mul imea consumatorilor unui produs: - vrsta: variabil atributiv , cantitativ , continu X = { x1 = [15-20) [20-30) ... } - frecven a de cump rare: variabil atributiv calitativ Y = { y1 - foarte rar; y2 rar, ... } - num r de sortimente cump rate relativ la produsul analizat: variabil atributiv , cantitativ , discret : Z = { z1 = 1; z2 = 2, ... } - localizarea magazinelor de unde cump r : variabil de spa iu, calitativ S = { s1 cartierul M sau s2 strada P1, ... } - data ultimei cump r ri a produsului analizat: variabil de timp, cantitativ T = { t1 = 27.01.2002; t2 = 24.02.2002, ... } Variabila aleatoare Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mul imi finite sau infinite, cu o anumit probabilitate, rezultat dintr-o func ie asociat variabilei, numit lege de probabilitate. Ca i variabila statistic , variabila aleatoare n raport cu valorile sale poate fi discret sau continu . n timp ce o variabil aleatoare nregistreaz valori la ntmplare, variabila statistic constituie o nsu ire cert a unit ilor statistice din popula ie. Valorile unei variabile aleatoare sunt probabile i n strns leg tur cu un anumit experiment. St rile unei variabile statistice nu sunt probabile, ele cuantific o tr s tur proprie fiec rei unit i din popula ie. 1.3. Observarea statistic Observarea statistic const n identificarea unit ilor popula iei i nregistrarea st rilor variabilelor n raport cu care este studiat . Ansamblul st rilor variabilelor rezultate prin observare se numesc statistici. Dup gradul de cuprindere a popula iei statistice, observarea statistic este de dou feluri: total i par ial . Observarea total este acel tip de observare statistic n care are loc nregistrarea tuturor unit ilor care fac parte din popula ie statistic supus studiului. Recens mntul popula iei Romniei este un exemplu de observare total . Observarea par ial presupune observarea i nregistrarea unui anumit num r de unit i din popula ie, alese dup criterii bine definite. n cercetarea statistic a unei popula ii punctul de pornire l poate constitui fie statistice exhaustive rezultate prin observarea popula iei univers , fie statisticile rezultate din observarea par ial a unui e antion A, n ambele cazuri scopul final fiind acela i, respectiv ob inerea de informa ii la nivelul popula iei univers A.

y

5

1.4. Seria statisticSeria statistic este o construc ie care red fie distribu ia unei popula ii n raport cu una sau mai multe variabile, fie varia ia unei m rimi n timp, n spa iu sau de la o categorie la alta. Seriile statistice se clasific n raport cu mai multe criterii, astfel: 1. n raport cu num rul variabilelor y Serii statistice unidimensionale, au la baz o singur variabil ; y Serii statistice multidimensionale, care au la baz dou sau mai multe variabile. 2. Dup natura variabilelor deosebim: y Serii atributive, care au la baz variabile atributive; y Serii cronologice (de timp sau istorice), care au la baz variabile de timp; y Serii de spa iu sau teritoriale, care au la baz o variabil de spa iu. 3. Dup modul de exprimare a st rilor variabilei deosebim: y Serii calitative, care au la baz variabile calitative; y Serii cantitative, care au la baz variabile cantitative i care dup modul de varia ie a variabilei pot fi: discrete (cnd variabila este discret ) i continue (cnd variabila este continu ). 4. n raport cu natura indicatorului din care este alc tuit seria, avem: y Serii de frecven sau serii de distribu ie (reparti ie); y Serii de varia ie. Seria statistic rednd distribu ia popula iei n raport cu una sau mai multe variabile constituie o descompunere a acesteia ntr-un num r R de clase. O astfel de serie este format n exclusivitate din frecven e (absolute cumulate sau necumulate, relative cumulate sau necumulate) i de aceea se numesc serie de frecven , de distribu ie sau de reparti ie. Prescurtat se mai folose te i denumirea de reparti ie statistic sau distribu ie statistic . Seria statistic ce red varia ia unei m rimi n timp, n spa iu sau de la o categorie la alta se nume te serie de varia ie. 1.4.1. Seria statistic de reparti ie Conform defini iei de mai sus, prin aceast serie se distribuie unit ile unei popula ii statistice n raport cu una sau mai multe variabile. Fie o serie statistic unidimensional avnd la baz variabila X, respectiv: x X : 1 N 1 x2 N2 ... xi ... xR ... N R (1.1)

... N i

Ni este frecven a absolut a clasei i, i ! 1, R i reprezint num rul de unit i ale popula iei din clasa pentru care variabila X a nregistrat valoarea Xi N1 + N2 + ... + NR = N. Clasa (grupa) de unit i n raport cu o variabil reune te acele unit i din cadrul popula iei care nregistreaz aceea i stare a variabilei sau st rile variabilei apar innd unui anumit interval de varia ie . Ca urmare, n raport cu o variabil statistic popula ia poate fi structurat ntr-un anumit num r de clase. De asemenea, relativ la seria statistic unidimensional avnd la baz variabila X, poate fi format cu frecven e relative, frecven e cumulate absolute sau relative. Fie seria X format cu frecven e relative:

6

x X : 1 f 1 -

x2 f2

... xi ... fi

... x R ... f R

(1.2.)

fi - ne arat ponderea unit ilor din popula ie care au nregistrat pentru variabila X starea xi: N fi ! i i ! 1, R N

Pornind de la seria (1.1) se poate deduce seria format cu frecven e absolute cumulate, respectiv: x2 ... xi ... xR x (1.3) X: 1 N(x ) N(x ) ... N(x ) ... N(x ) 1 2 i R unde: N(xi) reprezint num rul de unit i din popula ia studiat pentru care variabila nregistreaz valori ce nu dep esc valoarea xi. Pornind de la seria (1.1) sau (1.2) se poate deduce seria format cu frecven e relative cumulate, respectiv: x2 ... xi ... xR x1 (1.4) X : F ( x ) F ( x ) ... F ( x ) ... F ( x ) N 1 N 2 N i N R unde: FN(xi) - exprim ponderea unit ii popula iei studiate pentru care variabila a nregistrat valori ce nu dep esc valoarea xi. FN(xi) = f1 + f2 + ... + fi N ( xi ) Sau FN ( xi ) ! (.100) i ! 1, R N Seria statistic de reparti ie bidimensional este o construc ie ce red distribu ia unei popula ii n raport cu dou variabile. Astfel, fie popula ia statistic A studiat n raport cu variabilele X i Y, rezultatele observ rii se pot grupa ntr-un tabel de forma urm toare: X Y y1 y2 . . yi . . yI Total unde: - Nij - reprezint num rul de unit i pentru care, variabila X nregistreaz starea xj i variabila Y nregistreaz starea yi ; - Ni. - num rul de unit i pentru care Y = yi, indiferent de nivelul nregistrat de variabila X; 7 x1 N11 N21 Ni1 NI1 N.1 x2 N12 N22 Ni2 NI2 N.2 ... ... ... ... ... ... xj N1j N2j Nij NIj N.j ... ... ... ... ... ... xJ N1J N2J NiJ NIJ N.J Total N1. N2. Ni. NI. N

(1.5)

- N.j - num rul de unit i pentru care X = xj, indiferent de nivelul nregistrat de variabila Y; - N - num rul total de unit i analizate. Din seria bidimensional se pot extrage serii unidimensionale de forma urm toare: x1 X : N .1 y Y : 1 N 1. x2 N .2 y2 ... xj ... xJ ... N . J ... yI ... N I .

... N . j ... yi

N 2. ... N i.

denumite i serii de reparti ie marginale, n raport cu X i Y ... ...

y1 Y / X ! xj : N 1j

y2 N2j

yi

... N ij

yI ... N Ij

j ! 1, J Y condi ionat de

denumit serie de reparti ie unidimensional n raport cu X = xj, num rul acestora fiind egal cu num rul de st ri a variabilei X. x1 X / Y ! yi : N i1 x2 N i .2 ... x j ... N ij ... x J ... N iJ i ! 1, I

denumit serie de reparti ie unidimensional n raport cu X condi ionat de Y = yi, num rul acestora fiind egal cu num rul de st ri a variabilei Y. De asemenea se poate elabora sau deduce seria de reparti ie bidimensional format cu frecven e relative, unde: N ij N. j N f ij ! f i. ! i. f. j ! i ! 1, I j ! 1, J N N N 1.4.2. Seria statistic de varia ie Conform defini iei seria de varia ie red varia ia unei m rimi, n timp, n spa iu sau de la o categorie la alta. Ca urmare, n continuare vom vorbi de serii cronologice (au la baz o variabil de timp), serii de spa iu (au la baz o variabil de spa iu) i serii categoriale (au la baz variabile atributive). Cele mai des ntlnite sunt seriile cronologice i seriile de spa iu. Seriile de varia ie au la baz m rimi absolute i relative. Dup unii autori din cadrul m rimilor absolute fac parte indicatorul de nivel i diferen a absolut a unei m rimi, iar din cadrul m rimilor relative fac parte: indicatorul relativ de intensitate, indicele statistic i diferen a relativ a unei m rimi. Indicatorul de nivel (Y) este o m rime ce reflect nivelul unui fenomen analizat. De exemplu: produc ia diferitelor produse, veniturile popula iei, suprafa a cultivat cu principalele culturi, transportul, exportul, importul etc. Diferen a absolut a unei m rimi ( ( Y ) exprim diferen a dintre nivelul cercetat i nivelul baz de compara ie al m rimii analizate. Se exprim n aceea i unitate de m sur n care este cuantificat fenomenul analizat i ne arat cu ct s-a modificat acesta de la un nivel la altul. 8

Indicele statistic al unei m rimi ( I Y ) exprim raportul dintre nivelul cercetat i nivelul baz de compara ie al m rimii analizate. Ne arat de cte ori se modific acea m rime, de la un nivel la altul. Diferen a relativ a unei m rimi ( RY ) exprim raportul dintre diferen a absolut a m rimii respective i nivelul baz de compara ie al acesteia. Ne arat cu ct la sut se modific m rimea de la un nivel la altul. Indicatorul relativ de intensitate (d) se define te ca raport ntre doi indicatori de nivel de natur diferit i arat gradul de r spndire a fenomenului cuantificat de indicatorul de la num r tor n raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu: produc ia diferitelor culturi / ha, densitatea popula iei, produc ia principalelor produse / locuitor, rata omajului etc. Greutatea specific (g) reflect structura fenomenului analizat n raport cu st rile variabile X, de la baza seriei.

Seriile cronologiceSeria cronologic reflect evolu ia n timp a unei m rimi. Valorile variabilei ca func ie de timp pot fi fixate la un anumit moment de timp sau s se refere la un interval de timp. Seria cronologic de momente este o serie de observa ii ordonate n timp, exprimnd stocuri [Trebici V., 1985]. De exemplu, volumul popula iei, num r de universit i, b nci, institu ii, fonduri fixe, num rul salaria ilor, ntreprinderile mici i mijlocii din diferite domenii de activitate, unit ile de cazare turistic etc. ntr-o astfel de serie nsumarea m rimii analizate nu are sens din punct de vedere al con inutului, aceasta fiind permis din considerente de calcul, ajust ri etc. Seria cronologic de intervale este o serie de observa ii ordonate n timp exprimnd fluxuri. De exemplu: n scu ii vii, divor urile, decesele, produc ia diferitelor culturi sau produse, venituri, cheltuieli, produc ia industrial , agricol , exportul, importul etc.ntr-o astfel de serie are sens nsumarea m rimii analizate. Fie o serie cronologic de momente sau de intervale ce reflect evolu ia n timp a nivelului unei m rimi Y, 0 1 2 ... t ... T (1.6) Y : y 0 y1 y 2 ... y t ... yT Pornind de la aceast serie se pot deduce seriile formate cu diferen e absolute, indici i diferen e relative. n func ie de modul de raportare a st rilor variabilei timp t, m rimile de mai sus se pot calcula cu baz fix (t / t0) (baza de compara ie r mne aceea i) sau cu baz n lan (t / t-1) (baza de compara ie se schimb , fiind considerat cea precedent nivelului comparat). Fie seriile cronologice formate cu: - diferen e absolute cu baz fix : 0 1 (t y/ t 0 : 0 (1 / 0 y 2 (2/0 y

...

tt/0 y

...

... (

T ... (Ty/ 0

(1.7)

(t y/ 0 ! y (t ) y(0) - diferen e absolute cu baz n lan

9

1 0 (t y/ t 1 : (1 / 0 y

2 (2 /1 y

... ... (

tt / t 1 y

... ... (

TT / T 1 y

(1.8)

(t y/ t 1 ! y (t ) y(t 1) ntre cele dou tipuri de diferen e absolute cu baza fix i cu baz n lan , exist rela ii de leg tur ce ne permit exprimarea unora n func ie de celelalte. n acest context, nsumnd diferen ele absolute cu baza n lan se ob in diferen ele absolute cu baza fix . (t y/ 0 ! (1y/ 0 (2y/ 1 (3y/ 2 ... (t y/ t 1 Sc znd diferen ele succesive cu baz fix se ob in diferen ele cu baz n lan . (t y/ 0 (t y 1 / 0 ! y (t ) y (0) y (t 1) y (0) ! y (t ) y (t 1) ! (t y/ t 1

Diferen a absolut ne arat cu ct se modific m rimea analizat de la un moment la altul. Se exprim n aceea i unitate de m sur n care este cuantificat fenomenul studiat. Dac fenomenul analizat se exprim valoric, atunci diferen a absolut nu reflect prea bine modific rile ce intervin, impunndu-se utilizarea m rimilor relative respective, indicele statistic i diferen a relativ . Fie seriile cronologice formate cu: - indici statistici cu baz fix 2 ... t 0 1 I ty / t0 : t 1/ 0 2/0 1 I Iy ... I y / 0 y t I y/ 0 !

... T ... I T / 0 y

(1.9)

y (t ) ( x100) y (0)

- indici statistici cu baz n lan 2 ... ... t T 0 1 t I y / t 1 : 1/ 0 2 /1 t / t 1 T / T 1 I ... I y ... I y Iy y I ty / t 1 ! y (t ) ( x100) y (t 1)

(1.10)

ntre cele dou tipuri de indici exist urm toarele rela ii de leg tur : y F cnd produsul indicilor cu baz n lan pn la o anumit stare a variabilei t, se ob ine indicele cu baz fix al clasei respective. y(1) y(2) y (t ) y (t ) 2 t . . ... . I 1 / 0 .I y / 1 . ... .I ty / t 1 ! ! ! I y/ 0 y y(0) y (1) y (t 1) y (0) y mp r ind doi indici succesivi cu baz fix se ob ine un indice cu baz n lan : y(t ) y(t 1) y (t ) t I ty / 0 : I y1 / 0 ! : ! ! I ty / t 1 y(0) y (0) y (t 1)

10

Indicele statistic ne arat de cte ori se modific fenomenul analizat. Este m rimea cel mai des folosit n caracterizarea evolu iei fenomenelor din economie. Avnd ca baz de referin o serie cronologic de forma (1.7) se pot elabora serii formate cu: - diferen e relative cu baz fix 1 0 t R y / t0 : 0 R1 / 0 y R ty / 0 ! (t y/ 0 y (0 ) ! 2 R2/0 y

t ... t ... R y / 0

... T ... R T / 0 y

(1.11)

y (t ) y (0) y (t ) t ! 1 ! I y/ 0 1 y (0 ) y (0)

- diferen e relative cu baz n lan 1 0 t R y / t 1 : R1 / 0 y Rt / t 1 y

2 R2 /1 y

... ... R

tt / t 1 y

... ... R

TT / T 1 y

(1.12)

!

(t y/ t 1 y (t 1)

! I ty / t 1 1

sau

t I y / t 1 .100 100

Aceast m rime la fel ca i indicele statistice, se folose te frecvent n caracterizarea fenomenelor din economie. Dac seria cronologic analizat este de intervale, se poate deduce seria format cu greutatea specific : 0 g y : g 0 g (t ) !T

1 g1 y (t )

2 g2

...

t

... g t

T ... g T ...

(1.13)

y (t )t !1

Seria statistic de spa iu (teritorial ) Seria statistic de spa iu este o construc ie statistic ce reflect varia ia n spa iu a unei m rimi. Seria de spa iu prezint o importan din ce n ce mai mare, datorit dezvolt rii sistemului informa ional, a necesit ii compara iilor interna ionale i a compara iilor ntre regiunile unei ri. n cadrul Anuarului Statistic al Romniei exist capitole distincte de Statistic teritorial i Statistic interna ional . n capitolul de Statistic teritorial sunt cuprinse informa ii privind: popula ia, for a de munc , condi ii de munc , veniturile popula iei, cheltuielile i consumul popula iei, locuin e, asisten social , s n tate, nv mnt, cultur , sport, conturi na ionale, rezultate i performan e ale ntreprinderilor, agricultur , silvicultur ,

11

industrie, transporturi, po t , telecomunica ii, turism, finan e, justi ie i starea infrac ional , pe cele 7 regiuni i Bucure ti. La baza seriei de spa iu se g sesc att m rimi absolute (indicator de nivel, diferen a absolut ), ct i m rimi relative (indicator relativ de intensitate, indicele statistic, diferen a relativ ). Fie seria statistic Z, de forma urm toare: s1 s 2 ... s i ... s R s Z : 0 Z (1) Z (2) Z (3) ... Z (i ) ... Z ( R) (1.14)

unde: si este o stare a variabilei ce exprim spa iul, i ! 1, R ; Z(i) exprim o m rime (indicator de nivel sau relativ de intensitate). Plecnd de la seria de forma (1.15) se pot deduce seriile formate cu: - diferen e absolute cu baz fix : ... ... s1 s2 si sR s (sZ/ s0 : 0 0 (s1 / s0 (s2 / s0 ... (si / s0 ... (s R / s0 (1.15) Z Z Z Zi (sZ / s 0 ! Z (i ) Z (0) - indicii statistici cu baz fix ... ... s1 s2 si sR s s (1.16) I Z / s0 : 0 0 I s1 / s0 I s2 / s0 ... I si / s0 ... I s R / s0 Z Z Z Z Z (i ) s .(100) I Zi / s0 ! Z (0) - diferen e relative cu baz fix s1 s2 si sR ... ... s s RZ / s 0 : 0 0 R s1 / s0 R s2 / s0 ... R si / s0 ... R sR / s0 (1.17) Z Z Z Z

s I Zi / s0 !

i (sZ / s0 s ! I Zi / s0 100 Z (0 )

2. Observarea, sistematizarea i prezentarea seriilor statistice 2.1. Observarea statistic Observarea statistic constituie prima etap n cadrul studierii fenomenelor sociale, economice sau de alt natur , etap n care se culeg datele statistice despre fenomenul supus cercet rii. Cercetarea fenomenelor respective presupune cunoa terea popula iei statistice n vederea surprinderii ac iunii legilor care ac ioneaz la nivelul acesteia. De calitatea acestei etape, ntr-un proces de cercetare statistic , depinde i calitatea rezultatelor ob inute n celelalte faze. Observarea statistic presupune identificarea, urm rirea i nregistrarea, dup reguli unitare i precise, a nivelului atins de variabilele statistice studiate la unit ile din care este format popula ia luat n studiu[Florea I., 1998]. Pentru asigurarea unor date, rezultate din observare, valide i pertinente se impun cteva preciz ri. n primul rnd, observarea statistic presupune urm rirea i nregistrarea unui num r mare de unit i statistice, ceea ce implic un volum mare de munc . n al doilea rnd, pentru ca cercetarea popula iei s - i ating scopul, trebuie precizate care sunt variabilele 12

n raport cu care este studiat popula ia. Variabilele statistice ce urmeaz s fie urm rite i nregistrate la nivelul fiec rei unit i din popula ie, trebuie s fie esen iale i s prezinte interes din punct de vedere al studiului ntreprins. n al treilea rnd, trebuie stabilite criterii exacte pentru delimitarea corect a unit ilor statistice care alc tuiesc popula ia. i nu n ultimul rnd, dac observarea i nregistrarea datelor este f cut de mai multe persoane este necesar ca acestea s se alinieze unei metodologii unitare pentru a asigura corectitudinea necesar datelor rezultate. Observarea statistic , ca prim etap ntr-un studiu de cercetare presupune: specificarea unit ilor statistice care trebuie s fie urm rite i nregistrate, alegerea variabilelor statistice care caracterizeaz cel mai bine popula ia i care r spund obiectivului urm rit, nregistrarea st rilor variabilelor statistice considerate. Atingerea scopului cercet rii statistice presupune rezolvarea urm toarelor probleme care s asigure o preg tire tiin ific a observ rii statistice: - delimitarea popula iei supuse observ rii; - definirea unit ilor statistice de observat; - timpul i locul unde va avea loc observarea; - programul observ rii; - alegerea purt torilor de informa ie; - preg tirea persoanelor ce urmeaz s fac observarea. Fiec reia din aceste probleme trebuie s i se acorde importan a cuvenit , fiindc fiecare dintre ele conduce la o preg tire ct mai complet a observ rii, de rezultatele c reia depinde corectitudinea celorlalte etape a cercet rii statistice. Delimitarea popula iei supuse observ rii fa de alte popula ii statistice cu care aceasta se afl n leg tur se realizeaz prin eviden ierea nsu irilor i tr s turilor comune ce caracterizeaz popula ia supus studiului. Definirea unit ilor statistice de observat presupune claritate i precizie pentru a nu da loc confuziilor. n momentul observ rii trebuie cunoscut exact care sunt unit ile statistice ce trebuie nregistrate n raport cu variabilele de studiat. Stabilirea timpului i a locului unde va avea loc observarea are importan din punct de vedere a comparabilit ii datelor rezultate din observare. No iunea de timp a observ rii are n statistic dou accep iuni: - momentul sau perioada la care se refer datele nregistrate (timpul de referin ); - durata observ rii. Locul observ rii reprezint punctul din spa iu n care se deruleaz procesul supus cercet rii (incinta unei ntreprinderi, a unui magazin, o localitate n cazul n care popula ia o reprezint familiile etc.). n cadrul programului observ rii statistice trebuie stabilite variabilele statistice care urmeaz s fie studiate n popula ia de cercetat. Alegerea i definirea variabilelor statistice trebuie s fie n consens cu natura popula iei i obiectivul cercet rii statistice ntreprinse. Variabilele statistice care fac parte din programul cercet rii trebuie s surprind aspectele esen iale, s expliciteze fenomenul sau procesul studiat, s permit prelucrarea i generalizarea acestora la nivelul ntregii popula ii. Alegerea purt torilor de informa ie se face n func ie de volumul datelor ce urmeaz a fi nregistrate. Purt torii de informa ie reprezint supor ii materiali pe care se nregistreaz datele din observarea unit ilor statistice. Observarea statistic se poate desf ura n diverse forme n raport cu: natura proceselor social-economice de studiat, obiectivul cercet rii, formele de organizare ct i posibilit ile practice de urm rire i nregistrare a unit ilor statistice din popula ie. Dup cum se tie, n raport cu gradul de cuprindere a popula iei considerate avem: observarea total i observarea par ial . Observarea total permite nregistrarea, n raport cu

13

variabilele statistice a tuturor unit ilor statistice din popula ie, implicnd un volum mare de munc , antreneaz , de obicei, un num r de persoane i dureaz mult timp. Ca urmare se creaz condi ii pentru apari ia de erori de observare, ceea ce va conduce la mic orarea eficien ei observ rii. Forma cea mai frecvent de observare total o constituie recens mntul popula ieiObservarea total se practic i n domeniul controlului tehnice de calitate, n cazul produselor de nalt tehnicitate , a a cum ar fi: televizoare, ma ini de sp lat, frigidere, automobile etc. Este necesar o observare total n acest caz, deoarece constatarea defec iunilor de c tre cump r tori ar implica cheltuieli mult mai mari cu remedierea acestora n compara ie cu organizarea unei observ ri totale a loturilor de produse ce urmeaz a fi scoase pe pia . n cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt nesemnificative, este suficient realizarea unor observ ri par iale prin care s se asigure c rebuturile nu dep esc un anumit procent admis. O astfel de observare, care include doar o parte din unit ile popula iei supuse studiului corespunde observ rii par iale. Observarea par ial constituie o alternativ la observarea total n cazul popula iilor infinite sau chiar dac sunt finite prin observare are loc distrugerea acestora. Avnd la baz procedeul observ rii par iale se pot evalua rezervele de i ei, c rbune sau alte minerale, se poate evalua masa de material lemnos din fondul silvic a unei zone sau la nivelul ntregii ri. n general, observarea par ial se recomand n toate cazurile n care se consider mai avantajoas dect observarea total . E antionul, ca rezultat al observ rii par iale, presupune respectarea cu stricte e a principiului reprezentativit ii, n conformitate cu care fiecare unitate statistic din popula ie general s aib aceea i ans de a face parte din e antion. Asigurarea respect rii principiului reprezentativit ii n formarea e antionului de observat permite acestora o structur foarte apropiat cu cea a popula iilor din care sunt formate. Aceasta ne asigur , cu o anumit probabilitate dinainte fixat , c rezultatele ob inute la nivelul e antionului pot fi extinse la nivelul ntregii popula ii. n raport cu legea de probabilitate urmat de variabilele urm rite n popula ia general sunt dou tipuri de e antioane: e antioane de volum mare i e antioane de volum redus. Observarea statistic n raport cu procedeul folosit este de dou feluri: - observarea direct ; - observarea indirect . Observarea direct presupune o observare nemijlocit a unit ilor din popula ie, care sunt prev zute pentru cercetare. Acest mod de observare se realizeaz printr-un contact direct cu unit ile statistice, fie prin m surare, fie prin interogare, dac unit ile sunt persoane. Acest procedeu permite observatorului perceperea nemijlocit a fenomenelor luate n studiu n vederea m sur rii nivelelor nregistrate de variabilele considerate. Observarea indirect presupune un intermediar ntre unit ile care urmeaz s fie supuse observ rii i observator. Intermediarul poate fi un document special conceput n vederea observ rii i atunci observarea este pe baz de document sau intermediarul poate fi o alt persoan dect observatorul, caz n care avem observare prin interogare. Suportul pentru culegerea datelor l reprezint chestionarul. 2.2. Sistematizarea i prezentarea datelor statistice Sistematizarea constituie o etap n cadrul prelucr rii datelor statistice n vederea prezent rii acestora sub form de serie statistic (tabele statistice). Datele ob inute ca urmare a procesului de observare statistic , n forma lor brut , permit o caracterizare am nun it a fiec rei unit i din popula ia considerat . Deoarece, datele

14

rezultate din observare se prezint sub form dezorganizat nu permit o caracterizare a popula iei n ansamblu. n vederea atingerii scopului cercet rii statistice ntreprinse i anume acela de a da o caracterizare de ansamblu a popula iei considerate este necesar ca datele rezultate din observare s fie supuse unor opera ii de sistematizare i prezentare n vederea deducerii a ceea ce este esen ial, tipic i general n leg tur cu popula ia. Deoarece n prelucrarea statistic primul pas l constituie prezentarea datelor observate sub forma de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie s fie n strns dependen cu scopul cercet rii i cu natura fenomenului cercetat. Odat precizate variabilele de la baza seriei, se tie care va fi con inutul primului ir de date i ca urmare este elucidat criteriul n raport cu care informa iile rezultate din observare vor fi ordonate, necunoscndu-se ns cum se face propriu-zis ordonarea i cum se completeaz primul ir al seriei. Opera ia de stabilire a claselor presupune mp r irea unit ilor unei popula ii n clase distincte n raport cu una sau mai multe variabile i aranjarea claselor rezultate ntr-o anumit ordine. n urma unei asemenea opera ii, fiecare unitate trebuie s se g seasc n una i numai una din clasele rezultate. Aceast opera ie nu trebuie s conduc la pierderi de unit i, reg sindu-se ns ntr-o alt ordine dect cea dup care s-a realizat observarea. Omogenitatea constituie o proprietate de baz pe care trebuie s o aib clasele. Se spune c o clas este omogen dac , pentru unit ile care fac parte din ea, variabila de grupare nregistreaz varia ii nesemnificative. n cele ce urmeaz se va prezenta opera ia de stabilire a claselor n cazul unei serii unidimensionale. Dac la baza seriei avem o variabil calitativ , atunci clasele se stabilesc n raport cu st rile acesteia. Pentru fiecare stare a variabilei se va construi o clas . Ca urmare, n acest caz, ntr-o clas vor intra toate unit ile care au nregistrat aceea i stare n timpul observ rii n raport cu variabila considerat . n cazul unei serii care are la baz o variabil cantitativ discret (num rul st rilor nu este prea mare), clasele se stabilesc n mod asem n tor ca i la variabilele calitative, respectiv: x 2 ... x R x X : 1 N N ... N 1 2 R n condi iile n care cercetarea popula iei presupune elaborarea unei serii care are la baz o variabil cantitativ continu sau o variabil cantitativ discret , dar care n popula ia considerat nregistreaz un num r prea mare de st ri, clasele nu se mai pot stabili cu ajutorul st rilor variabilei. Pentru asemenea cazuri, gruparea unit ilor popula iei n clase se face cu ajutorul intervalelor de grupare (varia ie), fiecare interval cuprinznd un num r oarecare de valori ale variabilei. Ca urmare, pentru o serie continu , clasele se definesc cu ajutorul intervalelor de grupare. Dou probleme se pun n cazul elabor rii unei serii care are la baz o variabil cantitativ continu : y determinarea lungimii intervalelor de varia ie; y stabilirea formei de scriere a intervalelor de varia ie. Determinarea lungimii intervalelor de varia ie conduce la dou situa ii: y serii construire cu intervale de lungime egal ; y serii construite cu intervale de lungime diferite. Stabilirea num rului de intervale de varia ie trebuie s asigure satisfacerea urm toarelor condi ii:

15

informa ia care se pierde n urma opera iei de grupare s nu fie prea mare, iar popula ia s nu fie prea f rmi at n raport cu variabilele de grupare; - media aritmetic a fiec rei grupe (n raport cu valorile nregistrate) s fie ct mai aproape de centrul intervalului de varia ie respectiv; - s nu existe grupe vide; - reprezentarea grafic a seriei rezultate s permit conturarea unei regularit i a fenomenului de studiat din cadrul popula iei. Trebuie remarcat c acest lucru nu este posibil nici n cazul unui num r mic de intervale deoarece se pierd prea multe date, nici n cazul unui num r prea mare de intervale, popula ia f rmi ndu-se prea tare. Statisticianul american H.A. Struges a stabilit pentru cazul n care popula ia n raport cu variabila X este normal , urm toarea expresie: lx ! xmax xmin 1 3,322 lg N (2.1)

-

(1+3,322 LgN, avnd semnifica ia de num r de intervale), pentru celelalte cazuri rezultatul fiind orientativ, servind la determinarea cu aproxima ie a lungimii intervalelor de varia ie n cazul n care acestea vor fi de lungime egal . n expresia de calcul a lungimii intervalelor intervine valoarea maxim i cea minim a variabilei, ct i volumul popula iei. n urma stabilirii lungimii intervalelor. Se elaboreaz seria de intervale de lungime egal dup cum urmeaz : ?x ; ( x l ) ... ?xmin (k 1)l x ; ( x min kl x ) ... ?x min ( R 1)l x ; ( xmin R l x ) X : min min x N1 Nk NR dac se presupune c au rezultat R intervale, unde Nk, k ! 1, R reprezint volumele claselor n care s-a structurat popula ia. Numeroase sunt cazurile practice n care studiul unei popula ii n raport cu o variabil sau mai multe presupune mp r irea domeniilor de varia ie ale acestora n intervale de lungime neegal . n asemenea cazuri nu exist o rela ie de calcul n acest sens. Stabilirea intervalelor de varia ie se face n direct leg tur cu varia ia variabilelor i distribuirea unit ilor n raport cu acestea. Dac la baza seriei n cauz stau dou sau mai multe variabile calitative sau cantitative atunci clasele se stabilesc n raport cu fiecare din variabilele considerate prin st rile acestora (vezi seria 1.5), avem serii bidimensionale sau multidimensionale. Nu este recomandat ca num rul variabilelor n raport cu care se studiaz popula ia s fie prea mare, deoarece aceasta duce la o divizare exagerat a popula iei pierzndu-se din vedere aspectele principale. Dup ce clasele au fost definite, are loc repartizarea unit ilor popula iei n clasele respective, folosind n acest scop un algoritm adecvat. Pentru elaborarea i prezentarea seriilor statistice se apeleaz la pachete de programe statistice cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA, S.A.S. (Statistical Analysis System), STATGRAPHICS, etc. 2.3. Reprezent ri grafice Reprezentarea grafic a unei serii ne d o imagine geometric (n plan sau spa iu) cu privire la forma static sau evolu ia dinamic a fenomenului cuantificat de seria respectiv . 16

Graficul asociat unei serii constituie o imagine spa ial a fenomenului de cercetat, permi nd eviden ierea rapid a structurii, dinamicii i tendin ei de dezvoltare a acestuia. Reprezent rile grafice sunt folosite att n scopul cunoa terii popula iei n cauz , ct i pentru popularizarea unor rezultate din diverse domenii de activitate. Elaborarea complet i corect n acela i timp a unui grafic presupune elucidarea urm toarelor elemente: titlul graficului, scara de reprezentare, re eaua graficului, semnele conven ionale i notele. Titlul graficului trebuie s fie scurt, clar i semnificativ pentru con inutul fenomenului reliefat prin seria considerat . Scara de reprezentare reune te mul imea tuturor punctelor cotate. n cazul n care variabila nregistreaz valori mici, gradarea sc rii ncepe n principiu de la zero, dac variabila nregistreaz valori mari se consider o alt origine stabilit cu aproxima ie. Pentru a nu nc rca prea mult desenul, se recomand reprezentarea pe scar doar a valorilor dispuse la un anumit interval convenabil ales. Distan ele dintre dou puncte cotate consecutive se nume te intervalul graficului. Cnd intervalele sunt egale atunci avem sc ri uniforme, n caz contrar avem sc ri neuniforme. Re eaua graficului permite identificarea cu u urin n plan sau n spa iu a punctelor corespunz toare valorilor nregistrate de variabilele n cauz . Sistemul axelor rectangulare (n plan sau spa iu) constituie cele mai uzuale re ele n reprezentarea grafic a seriilor statistice. Semnele conven ionale se pot materializa ntr-o reprezentare grafic prin inscrip ii, fie printr-o legend . Inscrip ia trebuie s fie scurt i semnificativ i plasat ct mai bine n raport cu elementul din grafic pe care l expliciteaz . Legenda se folose te pentru a explicita folosirea semnelor, culorilor sau diverselor ha uri folosite n graficul n cauz . Legenda se plaseaz nafara graficului, n col ul din stnga sau dreapta jos. n cazul graficelor complexe, pentru o n elegere mai bun , sunt necesare unele explica ii, care se dau sub form de note. Notele generale privesc n ansamblu graficul i se plaseaz chiar sub titlul graficului. Notele speciale privesc por iuni din grafic i sunt legate de acestea prin diverse semne de trimitere. Notele se plaseaz n partea de jos a diagramei, n col ul din stnga sub re ea. n continuare se vor prezenta principalele tehnici de construire a graficelor utilizate n reprezentarea seriilor statistice ce descriu fenomenele social-economice.

Histograma Graficul specific seriilor care au la baz o variabil continu (de intervale) este istograma. Aceasta se construie te ntr-un sistem de axe rectangulare dup cum urmeaz : pe abscis se trec intervalele de varia ie, iar pe ordonat se traseaz scara frecven elor. Scara frecven elor se construie te n conformitate cu respectarea principiului propor ionalit ii ntre frecven e i segmentele delimitate pe scara ordonatelor. Pentru fiecare interval de varia ie a seriei (xi-1 xi) se construie te un dreptunghi a c rui baz este chiar lungimea intervalului, iar cealalt latur se determin din condi ia propor ionalit ii ariei dreptunghiului cu m rimea indicatorului n clasa respectiv . Latura necunoscut a dreptunghiului, notat cu Li se determin din urm toarea rela ie: Li . li = k . Ni (2.2) unde: li = latura cunoscut a dreptunghiului corespunz tor intervalului (xi-1 - xi); Li = latura necunoscut a dreptunghiului corespunz tor intervalului (xi-1 - xi);

17

Ni = frecven a absolut a clasei i; k = un coeficient de propor ionalitate care se alege n raport cu scara de reprezentare. Din rela ia (2.2) se deduce Li: N Li ! k i , i ! 1, R li unde: li = xi - xi-1, adic diferen a dintre limita superioar i cea inferioar a intervalului de varia ie. Mul imea tuturor dreptunghiurilor astfel determinate, formeaz histograma ata at seriei. Poligonul frecven elor Este o reprezentare grafic a seriilor statistice avnd la baz o variabil atributiv cantitativ continu i format cu frecven e absolute sau relative, simple sau cumulate. Trasarea acesteia presupune realizarea n prealabil a histogramei. Poligonul frecven elor se ob ine unind prin segmente de dreapt mijloacele laturilor superioare ale dreptunghiurilor, din care este alc tuit histograma. Poligonul frecven elor este un grafic important pentru aproximarea formei distribu iei popula iei studiate, ct i pentru compararea a dou distribu ii pe aceea i diagram . Exemplu Din Anuarul Statistic al Romniei din anul 2000, am extras o serie de reparti ie reprezentnd popula ia Romniei sub 40 de ani pe grupe de vrst .Grupa de vrst (ani) 04 59 10 14 15 19 20 24 25 29 30 34 35 39 Popula ia 1147065 1330733 1737153 1701881 1978835 1792822 1698268 1335039

18

Distributia populatiei Romaniei sub 40 ani pe grupe de varsta

populatia04

59

10 14

15 19

20 24

25 29

30 34

35 39

grupa de varsta (ani)

Figura 2.1 Histograma si poligonul frecventelor Diagramele de structur Punerea n eviden sub form grafic a structurii unei popula ii statistice este posibil apelnd la diagramele de structur . n acest sens se prezint : dreptunghiul, p tratul, cercul i semicercul de structur . Aceste tipuri de grafice permit reprezentarea grafic a seriilor unidimensionale construite cu m rimi de structur ( frecven e relative, greutate specific ). Cel mai des folosit este cercul de structur denumit i diagrama sectorial (piechart). Cercul de structur Se construie te un cerc de raz oarecare a c rei suprafa se consider c reprezint volumul ntregii popula ii n cauz (exprimat n frecven e absolute sau relative). Fiecare clas n care este divizat popula ia supus studiului este reprezentat printr-un sector de cerc de arie direct propor ional cu volumul clasei. Trasarea sectorului de cerc presupune determinarea m surii n grade a unghiurilor la centru a fiec rui sector. Unghiul la centru de 360o corespunde volumului ntregii popula ii. Unghiurile sectoarelor de cerc care reprezint clase din popula ie trebuie s fie propor ionale cu volumul acestora (exprimat n frecven e absolute sau relative). Unui procent i corespunde 3,6o cu procentul corespunz tor clasei respective. 360 o Qi ! f i (%). (2.3) 100 Exemplu Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz , rednd distribu ia voturilor electoratului pentru Senat (dup redistribuire) la alegerile din 3 noiembrie 1996:Forma iunea Politic Voturi Ob inute (%) CDR 37,0 PDSR 28,7 USD 16,1 UDMR 7,7 PRM 5,6 PUNR 4,9

19

Rezultatele alegerilor parlamentare pentru Senat din 3 nov 1996

5,60% 7,70%

4,90%

37%

16,10%

CDR PDSR USD UDMR PRM PUNR

28,70%

Figura 2.2 Cercul de structura Diagramele prin benzi (barchart) Acest tip de grafic utilizeaz benzile (barele), pentru a reprezenta distribu ia unei popula ii n raport cu o variabil cantitativ discret sau calitativ . Benzile au aceea i l ime (baz ), iar lungimea (n l imea) lor este direct propor ional cu frecven a clasei reprezentate. Num rul benzilor este egal cu num rul claselor n care este mp r it popula ia studiat . De asemenea se pot lua n considerare o variabil sau dou . n reprezent ri se utilizeaz benzi simple sau benzi grupate. Pozi ia benzilor poate fi orizontal sau vertical . Exemplu Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz , rednd nivelul PNB/loc n $ calculat pe baza puterii de cump rare n Romnia i alte ri esteuropene, n 1998ara PNB/loc ($) Bulgaria 4683 Cehia 12197 Polonia 7543 Romnia 6153 Slovacia 9624 Ungaria 9832

20

PNB/loc ($) in 199814000 12197 12000 10000 8000 6000 4683 4000 2000 0 7543 6153 9624 9832

Bulgaria

Cehia

Polonia

Romnia

Slovacia

Ungaria

Figura 2.3 Diagram prin benzi simple Cronograma (historiograma) O categorie foarte important de serii o constituie seriile cronologice, a c ror reprezentare grafic se realizeaz prin cronograme. Trasarea unei cronograme se realizeaz ntr-un sistem de axe rectangulare. Se consider seria cronologic de forma (1.7): 0 Y : y 0 1 y1 2 ... t T ... yT ...

y2 ... yt

unde: t ! 0,T , reprezint momentele (sau perioadele) de timp care se reprezint pe axa absciselor, iar m rimile yt se reprezint pe axa ordonatelor. Fiec rei perechi de valori (t, yt), t ! 0,T i corespunde un punct n planul axelor rectangulare. Unind prin segmente de dreapt punctele consecutive, astfel determinate, se ob ine ceea ce se nume te cronogram . n acela i sistem de axe pot fi reprezentate una sau mai multe serii cronologice, care pot fi exprimate n aceea i unitate de m sur sau n unit i de m sur diferite. Cronogramele asociate unor serii cronologice ne permit compararea fenomenelor surprinse de asemenea serii i sesizarea perioadelor critice n evolu ia acestora. Exemplu. Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz , rednd num rul total ta autoturisme nscrise n circula ie la sfr itul anului n Romnia n perioada 1994-1999.

21

Anul Autoturisme nmatriculate

1994 2020017

1995 2197477

1996 2391869

1997 2605465

1998 2822254

1999 2980014

Evolutia numarului de autoturisme inscrise in circulatie in perioada 1994-19993500000 numar autoturisme in circulatie 3000000 2500000 2000000 1500000 1000000 500000 0 1993

1994

1995

1996 anul

1997

1998

1999

2000

Figura 2.4 Cronograma Norul statistic Norul statistic constituie o modalitate de reprezentare grafic a seriilor atributive de reparti ie bidimensionale. Se consider o serie bidimensional de reparti ie n raport cu variabilele discrete X i Y. n sistemul de axe rectangulare xOy se marcheaz toate punctele de coordonate (xj, yi ); i ! 1, I; j ! 1, J pentru care frecven ele Nij { 0. M rimea acestor frecven e se poate marca pe grafic n dou moduri: - dac frecven ele sunt mici, atunci pentru fiecare punct de pe grafic (xj, yi ); i ! 1, I; j ! 1, J pentru care Nij { 0, se marcheaz attea puncte de cte ori se repet perechea respectiv . - dac ns frecven ele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza diagrame areale prin cercuri ale c ror arii trebuie s fie propor ionale cu r d cina p trat a frecven elor pe care le reprezint . n cazul n care cele dou variabile X i Y sunt continue, ntruct la intersec ia a dou intervale se formeaz o rubric (c su ), frecven ele diferite de zero se reprezint n interiorul acestei rubrici, fie prin puncte, fie prin diagrame areale cu respectarea unuia din cele dou moduri de elaborare mai sus amintite. Exemplu Un produs a fost lansat simultan pe 13 pie e. Pe aceste pie e, produsul a fost propus la pre uri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat s-a nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urm tor:

22

Nr. Crt. Cerere (C) Pre (P)

1 15,4 1,4

2 3,2 5,1

3 4,9 2,5

4 10,5 1,7

5 8,0 1,8

6 5,1 3,4

7 7,6 2,1

8 11,3 1,6

9 14,0 3,6

10 6,4 3,5

11 13,2 1,9

12 8,8 1,8

13 12,1 1,9

18 16 14 12 cerere 10 8 6 4 2 0 0 1 2 3 pret 4 5 6

Figura 2.5 Norul de puncte n raport cu Pret i Cerere Cartograma i cartodiagrama Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafic a seriilor statistice de spa iu. Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spa iului (sub form de hart ) n interiorul c ruia se manifest fenomenul care este cuantificat de seria de reprezentat. n interiorul h r ii astfel realizat , prin diverse culori sau nuan e ale aceleia i culori, prin ha uri sau prin diferite diagrame, este eviden iat intensitatea dezvolt rii fenomenului cercetat precum i m rimea indicatorilor seriei. Cartodiagrama constituie o modalitate de reprezentare grafic a seriilor de spa iu, realizndu-se ca o mbinare ntre cartogram i diferite alte tipuri de diagrame, ca de exemplu diagrame prin benzi, cerc, p trat, dreptunghi etc. De exemplu, pentru a reprezenta o serie de spa iu ce exprim volumul investi iilor str ine pe jude e, la noi n ar , se procedeaz astfel: n primul rnd se deseneaz harta Romniei, delimitndu-se jude ele; n cadrul fiec rui jude se deseneaz o figur geometric oarecare convenabil aleas , a c rei arie sau m rime s fie direct propor ional cu volumul investi iilor str ine din jude ul respectiv.

Probleme propuseP1. Da i 5 exemple de popula ii statistice a c ror cercetare ar prezenta interes i pentru fiecare popula ie selectat preciza i: - denumirea popula iei, a unit ii statistice i volumul acesteia; - scopul cercet rii statistice; - variabilele statistice n raport cu care s-ar face observarea statistic a popula iei. P2. S se extrag din Anuarul Statistic sau alte surse informa ionale o serie statistic bidimensional ce red distribu ia unei popula ii n raport cu dou variabile atributive, relativ la care se cere: 23

denumirea popula iei ce a fost supus observ rii i volumul acesteia; unitatea statistic ; caracterizarea variabilelor statistice n raport cu care a fost studiat popula ia; caracterizarea seriei statistice n raport cu toate criteriile cunoscute; elaborarea seriei bidimensionale format cu frecven e relative, interpretare; extragerea reparti iilor unidimensionale marginale i a celor condi ionate; pornind de la o reparti ie marginal deduce i celelalte serii statistice posibile, interpretare. P3. Din Anuarul Statistic sau alte surse informa ionale extrage i o serie statistic de reparti ie, avnd la baz o variabil de spa iu, relativ la care se cere: 1. denumirea popula iei statistice i volumului ei; 2. unitatea statistic ; 3. caracterizarea seriei dup toate criteriile cunoscute; 4. deducerea seriei format cu frecven e relative; 5. interpretare. P4. Din Anuarul Statistic sau alte surse informa ionale extrage i dou serii cronologice avnd la baz indicatorul de nivel, una de momente, alta de intervale i deduce i seriile formate cu diferen e absolute, indici statistici, diferen e relative, cu baz fix i cu baz n lan (interpret ri). P5. Da i 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate. P6. Din Anuarul Statistic sau alte surse informa ionale extrage i o serie de spa iu format cu indicator de nivel sau indicator relativ de intensitate i deduce i seriile formate cu diferen e absolute, indici i diferen e relative, calculate cu baz fix . Interpretare. P7. Extrage i 5 exemple de serii de spa iu ce con in informa ii importante pentru domeniul economic. P8. Luand ca exemplu o popula ie statistic studiat n raport cu un anumit num r de variabile (stabilite n raport cu obiectivul studiului), se cere: 1. elaborarea tuturor seriilor statistice de reparti ie unidimensionale 2. elaborarea a trei serii statistice de reparti ie bidimensionale ( una are la baza dou variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ , una are la baz dou variabile cantitative) 3. reprezentarea grafic a: histogramei, poligonului frecven ei, cercului de structur , diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma.

1. 2. 3. 4. 5. 6. 7.

Bibliografie:1. Buiga, A., Drago C., Laz r D., Parpucea I., Statistic descriptiva, Ed. Mediamira, Cluj-Napoca, 2010; 2. Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia , Ed. Presa Universitar Clujean , Cluj-Napoca, 2001; 3. Florea I., Parpucea I., Buiga A., Statistic descriptiv , Ed. Continental, Cluj-Napoca, 1998.

24

MODULUL 2PARAMETRII REPARTI IILOR EMPIRICE UNIDIMENSIONALE Obiectivey y y cunoa terea i n elegerea modului de calcul precum i a semnifica iei parametrilor statistici. ilustrarea tr s turilor esen iale care caracterizeaz fenomenele social - economice cunoa terea i m surarea varia iei unei m rimi n raport cu nivelul mediu al acesteia

Concepte de bazy y y y y valoare medie, median , modal parametrii de structur varia ie, abatere medie, dispersie parametrii concentr rii asimetrie i boltire

Rezultate a teptateCunoa terea modului de calcul i a semnifica iei parametrilor tendin ei centrale, a gradului de reprezentativitate a mediei, respectiv a medianei, analiza structurii unei popula ii i formularea unei concluzii privind forma distribu iei unei popula ii.

Sinteza2.1. Parametrii tendin ei centrale Parametrii din aceast grup au menirea de a eviden ia pozi ia n jurul c reia se grupeaz ansamblul valorilor unei variabile de la baza unei serii. Aceast pozi ie exprimat printr-un num r se nume te pozi ie central . Ea poate fi eviden iat prin: - valoarea medie X ; - valoarea median M e X

; - valoarea modal M o X

.

A. Valoarea medie Valoarea medie reprezint principalul parametru care caracterizeaz tendin a central a unei reparti ii statistice. n vederea definirii parametrului valoarea medie se consider o popula ie statistic studiat n raport cu variabila cantitativ X i o func ie G(x1,x2,,xR) unde xi, i ! 1, R , reprezint st rile variabilei X. Func ia G exprim o anumit nsu ire esen ial , un atribut al popula iei n raport cu variabila X. Aceast func ie se nume te func ie determinant .

25

Prin defini ie, valoarea medie X a variabilei X este parametrul care las invariant func ia determinant , adic : Gx1 , x 2 ,..., x R ! G X , X ,..., X .

(2.0)

Aceast egalitate se ntlne te sub denumirea de rela ia lui BOIARSKI-KISINI. n func ie de forma analitic a func iei G, din rela ia (2.0) se deduce expresia analitic (indicatorul) de calcul a valorii medii X . Determinarea, pe aceast cale, a valorii medii X , este destul de anevoioas . Utilizarea acesteia presupune stabilirea con inutului (semnifica iei) i a formei analitice a func iei determinante G, pentru fiecare caz n parte. Dar, valoarea medie X poate fi definit ca un raport a dou m rimi din care se deduce aceea i expresie pentru X ca i din (2.0). Exist , a adar, dou modalit i echivalente de definire a valorii medii, criteriul rela iei determinante a lui Boiarski-Kisini i criteriul raportului, ultima fiind mai accesibil . Criteriul raportului presupune raportarea volumului fenomenului cercetat la volumul popula iei. Acesta presupune cuantificarea volumului fenomenului n func ie de natura lui. Pentru a exemplifica cele prezentate mai sus, se consider popula ia familiilor dintr-o localitate, cercetat n raport cu num rul de copii. Datele rezultate din observare se prezint ca o serie de reparti ie de forma: xi X : N i i !.1, R n acest caz, func ia determinant are urm toarea form : G x1 , x2 ,..., x R ! xi N ii !1 R

semnificnd num rul total de copii din localitatea respectiv . Pentru a g si num rul mediu de copii pe familie se particularizeaz rela ia (2.0) dup cum urmeaz

xi N i ! X Nii !1 i !1

R

R

de unde rezult : X !

xi !1 R i !1

R

i

Nii

N

La acela i rezultat se putea ajunge pornind de la faptul c num rul mediu de copii pe familie se poate exprima ca un raport ntre num rul total de copii i num rul de familii din localitatea respectiv , adic : X ! Nr. total de copii Nr. de familii (2.1)

n acest exemplu, fenomenul fiind de natur demografic , volumul acestuia se cuantific prin num rul total de copii la nivelul popula iei statistice considerate. Aceasta este

26

n direct concordan cu natura i semnifica ia variabilei n raport cu care se face cercetarea statistic . Cunoa terea naturii parametrului valoare medie, conduce la o defini ie mai complet i plin de semnifica ie. Pentru a n elege semnifica ia valorii medii X , trebuie subliniat faptul c , n general, varia ia unui fenomen, de orice natur , i n particular varia ia unei variabile X n raport cu care este cercetat o popula ie, este determinat de ac iunea simultan a dou categorii de factori: factori esen iali i factori neesen iali. n categoria factorilor esen iali intr acei factori care ac ioneaz asupra tuturor unit ilor popula iei n mod continuu i n acela i sens, determinnd, n principal, nivelul de dezvoltare a variabilei pentru fiecare unitate component din popula ie. Factorii esen iali se conjug n ac iunea lor cu factorii neesen iali, care, n general, au un caracter aleator, sunt numero i i neuniform r spndi i printre unit ile popula iei. Fiecare din factorii considera i neesen iali ac ioneaz numai asupra unui anumit num r de unit i din popula ie. Ca urmare, ace tia pot contribiu fie la cre terea nivelului variabilei (pentru unele unit i din popula ie), fie la sc derea nivelului variabilei (pentru alte unit i din popula ie). La rndul lor factorii esen iali nu ac ioneaz cu aceea i intensitate asupra tuturor unit ilor din cadrul popula ie considerate, determinnd, n acest fel, varia ia neuniform a variabilei respective n cadrul popula iei. n consens cu cele subliniate mai sus, se poate afirma c parametrul valoarea medie a unei serii statistice care are la baz variabila X, constituie acel nivel pe care l-ar putea nregistra variabila n cadrul popula iei cercetate n condi iile n care factorii neesen iali nu sar fi manifestat, iar factorii esen iali ar fi ac ionat asupra unit ilor din popula ie cu aceea i intensitate. Parametrul valoarea medie, calculat pentru o serie statistic , pune n eviden ceea ce este comun, general i esen ial sub aspectul nivelului de dezvoltare al variabilei, n raport cu care este studiat o popula ie. n raport cu natura variabilei ce st la baza seriei, ct i a formei de prezentare a indicatorilor cu care aceasta este construit , exist mai multe posibilit i de calcul a valorii medii. Func ia determinat G, sub forma sa cea mai general , are urm toarea expresie analitic :1

R K K Gx1 , x 2 ,..., x R ! xi f i i !1

(2.2)

Pentru diverse valori ale lui k, n strict concordan cu con inutul i semnifica ia func iei G, se ntlnesc mai multe tipuri de medii: - media armonic (k = -1); - media aritmetic (k = 1); - media p tratic (k = 2); - media cubic (k = 3); - media de ordinul k n general. n caz concret, valoarea medie real X este aceea care se ob ine prin indicatorul (mediu) rezultat fie prin aplicarea criteriului rela iei determinante, fie criteriului raportului. Modalit i de calcul a valorii medii

27

1. Media aritmetic Acesta este indicatorul cel mai utilizat n calculul parametrului valoarea medie a unei serii statistice, a a cum rezult din practica statistic . Se consider acum dou serii statistice de reparti ie, una format din frecven e absolute, iar cealalt din frecven e relative: xi X : N i i !.1, R xi X : f i i !.1, R

(2.3)

(2.4)

Media aritmetic pt cele dou serii se calculeaz astfel: xi N i ; X ! xi f i Nj Dac seria este de intevale, construit cu frecven e absolute avem:X!

xi .N i N j Fie o serie de reparti ie, care are la baz o variabil continu X, respectiv,X!

'

xi 1 xi X : f i i !.1, R xi xi 1 ! xi' 2 unde x i' reprezint mijlocul intervalului i, ob inem rela ia: Folosind nota iile: X ! xi' f ii !1 R

Rela ia ne arat c media aritmetic a unei serii de intervale se reduce la media aritmetic a unei serii discrete n care clasele sunt reprezentate prin mijloacele intervalelor de varia ie.

2. Media armonic Se consider o serie de forma: 28

xi X : N i i !1, R

(2.5)

n cazul unei serii discrete de forma (2.5), media armonic notat cu X 1 se define te prin:

X 1 !

Ni !1

R

i

i !1

R

1 Ni xi

(2.6)

numit

i formula mediei armonice ponderate.R

Dac ponderile sunt egale ntre ele, adic N1=N2==NR=N*, atunci rela ia (2.6) devine:

X 1 !

Ni !1 R

*

1 x N* i !1 i

!

R

i !1

R

1 xi

(2.7)

care reprezint formula mediei armonice simple. n cazul unei serii care are la baz o variabil continu X, respectiv, x x X : i 1 i N i i !1, R procednd ca la media aritmetic , pentru media armonic rezult :

X 1 !

Ni !1 R

R

i

1 x' Ni i !1 i

(2.8)

unde xi reprezint mijlocul intervalului i, i ! 1, R . i n acest caz, dac ponderile sunt egale, se ob ine rela ia de calcul a mediei armonice simple, de forma: X 1 ! R

xi !1

R

1' i

3. Media geometric Pentru o serie care are la baz variabila discret X, format cu frecven e absolute, media geometric notat cu X g (sau X o ) este definit prin expresia:N N X g ! N x1N1 x2 2 ...xR R

(2.9)

Din (2.9), pentru media geometric ponderat exprimat cu frecven e relative se deduce:

29

Xg !

N

x

N1

1

x 2 ... x R

N2

NR

R N ! xi i i !1

1/ N

! xii !1

R

Ni / N

! xi if i !1

R

(2.10)

Dac variabila X, de la baza seriei este de varia ie continu , atunci rela iile de calcul pentru diversele variante de medie geometric , r mn variabile cu singura modificare c valorile xi, i ! 1, R , se nlocuiesc cu mijloacele intervalelor de varia ie, calculate conform formulei: xi' ! xi 1 xi , 2 i ! 1, R (2.11)

B. Valoarea median Valoarea median , notat cu M e este acea valoare a variabilei cantitative X care mparte reparti ia n dou p r i egale, respectiv: FN (M e ) ! 1 / 2 sau N (M e ) ! N 2 (2.12)

Calculul valorii mediane se face diferen iat, dup cum seria are la baz o variabil discret sau continu . Pentru o reparti ie discret , calculul medianei nu implic probleme deosebite i nici un volum mare de calcule. Se consider o reparti ie cu frecven e absolute: x x2 ... xi ... xR X : 1 N N ... N ... N . 2 1 i R a) volumul N al popula iei este un num r impar; b) volumul N al popula iei este un num r par. n ambele cazuri, calculul medianei presupune, n prima faz , determinarea rangului medianei, notat cu rM e , conform urm toarei rela ii: rM e ! 1 R N i ! N (M e ) 2 i !1 (2.14) (2.13)

n calculul valorii mediane a unei serii discrete, pot ap rea dou situa ii:

a) Dac volumul popula iei N este un num r impar, rangul medianei este un num r zecimal a N c rui parte ntreag indic num rul de unit i din popula ie pentru care variabila X a 2 nregistrat valori mai mici ca mediana. Ca urmare, M e trebuie s fie valoarea imediat N urm toare celei de rang adic : 2 M e ! x N 2 1

(2.15)

30

b) Dac volumul popula iei este un num r par, rangul medianei este un num r ntreg i ca urmare la mijlocul seriei nu se mai afl o valoare a variabilei X cu care s coincid mediana ci se g sesc dou valori, mediana calculndu-se n acest caz ca media aritmetic a acestora. Rela ia de calcul a medianei, n acest caz, este: x N x N Me !2 1 2

2

(2.16)

Pentru o reparti ie continu , calculul valorii mediane presupune verificarea egalit ii (2.12) i ca urmare, trebuie cunoscut densitatea de reparti ie f(x). Determinarea func iei f(x) implic un volum mare de calcule i deci, din acest motiv, n activitatea practic f(x) este aproximat. Acest lucru va conduce la o expresie aproximativ de calcul a valorii mediane, care necesit un volum redus de calcule. Pentru acesta se consider o reparti ie continu n raport cu variabila X, i anume: x x1 x1 x 2 ... x i 1 x i ... x R 1 x R . X : 0 N ... ... N2 Ni NR 1 (2.17)

unde intervalele xi-1-xi, i ! 1, R pot fi de lungime egal sau neegal . Calcularea rangului medianei va permite stabilirea intervalului n care se afl valoarea median , interval numit i interval median. Se cumuleaz frecven ele absolute din aproape n aproape pn ce este ndeplinit inegalitatea: N 1 N 2 ... N i u 1 N 2

Ultima frecven Ni cumulat , ne permite s indic m intervalul median ?x i 1 x i . Formula aproximativ de calcul a medianei: N (M e ) N ( xi 1 ) xi xi 1 Ni

M e ! xi 1

(2.18)

xi 1 ! xM e Ni ! N M e

- limita inferioar a intervalului median; - frecven a absolut a intervalului median;

xi xi 1 ! lM e - lungimea intervalului median, C. Valoare modal Valoarea modal Mo (X) a unei reparti ii reprezint aceea valoare a variabilei X c reia i corespunde frecven a cea mai mare. Acest parametru se mai nume te modul, valoare dominant , sau mod se noteaz cu Mo. Mod de calcul: 31

a)

Pentru o serie de reparti ie discret , dat sub forma x x ... x i ... x R X : 1 2 f f ... f ... f . 1 2 i R

(2.19)

valoarea modal se cite te direct din serie, nefiind nevoie de nici o tehnic sau formul de calcul. n cazul acestui tip de serie, valoarea modal va fi acea valoare a variabilei X pentru care frecven a este cea mai mare. b) Pentru serii de reparti ie continue, respectiv: x x1 x1 x 2 ... x i 2 x i 1 x i 1 x i X : 0 f f2 f i 1 fi ... 1 x i x i 1 ... x R 1 x R f i 1 fR ... (2.20)

Modala nu poate fi determinat direct. Intervalul c ruia i corespunde frecven a cea mai mare, se nume te intervalul modal i va con ine modala. S presupunem c intervalul modal este xi-1-xi. Formula de calcul a modalei: M o x ! x M o unde: Mo xMo - reprezint valoarea modal ; - reprezint limita inferioar a intervalului modal; ( 1 lMo ( 1 ( 1 (2.21)

- reprezint diferen a dintre frecven a intervalului modal i frecven a intervalului ( 1 precedent; ( 1 - reprezint diferen a dintre frecven a intervalului modal i frecven a urm tor; lMo - reprezint lungimea intervalului modal. intervalului

O serie poate avea o singur valoare modal , caz n care seria se nume te unimodal . Dac o serie are mai multe valori modale, atunci se nume te plurimodal . O serie plurimodal eviden iaz faptul c popula ia n cauz este neomogen . Calculul valorii modale, n asemenea cazuri, presupune o delimitare mai riguroas a obiectului observ rii ct i a popula iei care urmeaz s fie studiat . O alt cale, care poate duce la eliminarea unui asemenea neajuns, o constituie comasarea a dou cte dou sau trei cte trei intervale etc., pn se ajunge la o serie unimodal . n cazul unei serii simetrice valoarea modal coincide cu valoarea medie i cu mediana. Pentru serii u or asimetrice, K. Pearson a stabilit urm toarea rela ie ntre cei trei parametri: Mo ! X 3 X Me

unde X este media aritmetic a variabilei X. 32

Calculul valorii modale reprezint un deosebit interes pentru activitatea practic . Avnd n vedere c semnifica ia acestui parametru indic acea valoare a variabilei nregistrat de cele mai multe unit i din popula ie se poate afla: ora la care sunt solicitate cele mai multe convorbiri telefonice, ora de vrf privind transportul n comun, m rimea cea mai solicitat la nc l minte etc. Dac valoarea modal este identic cu valoarea medie, atunci se poate afirma c valoarea medie se bucur de o mai mare reprezentativitate. Dac , n plus, avem M e ! M o ! X , innd seama c valoarea median nu este influen at de valorile extreme ale variabilei, se poate afirma c mediana reprezint un grad de reprezentativitate mai mare dect valoarea medie. 2.2. Parametrii de structur Frecvente sunt cazurile cnd este necesar studierea structurii unei popula ii n raport cu o variabil sau alta. Parametrii statistici, n forma cea mai general , folosi i n caracterizarea structurii unei popula ii poart denumirea de valori quantile. Valorile quantile ale unei serii de reparti ie unidimensionale sunt acele m rimi nregistrate de variabila X, care mpart seria n n p r i egale (mai precis mparte popula ia n n p r i egale). n acest caz se vor calcula p quantile (p = n-1). Pentru o serie continu , a c rei densitate de probabilitate f(x) este cunoscut , urm toarea egalitate este satisf cut de cele p quantile:q1

x1

f ( x)dx ! f ( x)dx ! ... ! q1

q2

xR

f ( x)dx !

q n 1

1 n

(2.22)

unde cele n-1 quantile s-au notat cu q1, q2, , qn-1. Rela ia (2.22) se particularizeaz pentru cazul seriilor discrete, cnd seria este construit cu frecven e relative:

f ! fi x1 q1

q1

q2

i

! ... ! f i !q n 1

xR

1 n

(2.23)

Pentru o serie oarecare, quantila de ordinul p poate fi definit astfel: FN p ! p q N 1 sau N (q p ) ! p , p ! 1, n - 1 n n

Modul de calcul a valorilor quantile difer n raport cu tipul seriei. Fie o serie de reparti ie, care are la baz o variabil X discret , de urm toarea form : x x2 ... xi ... xR X : 1 N N ... N ... N . 2 1 i R (2.24)

Pentru calculul valorii quantile de ordinul p ( p ! 1, n 1) , n prima etap trebuie determinat rangul acesteia:

33

rq p ! N (q p ) ! p Se disting dou cazuri:

N n

(2.25)

a) dac pN se divide cu n atunci quantila de ordin p se calculeaz ca o medie aritmetic simpl a valorilor variabilei X, de ordinul rangului i al rangului majorat cu o unitate, dup cum urmeaz : qp ! x rq p x ( rq p 1) 2 (2.26)

b) dac pN nu se divide cu n atunci quantila de ordin p este egal cu acea valoare a variabilei X corespunz toare par i ntregi a rangului majorat cu 1: q p ! x[ rq (2.27)

p

1]

n cazul seriilor care au la baz o variabil continu , conform defini iei, cele n-1 quantile trebuie s satisfac rela ia (2.22). Determinarea quantilelor din asemenea egalit i ar presupune cunoa terea densit ii de probabilitate f(x). Ori n activitatea practic f(x) se aproximeaz prin diverse procedee, implicnd un volum exagerat de calcule. n vederea g sirii unor formule aproximative de calcul a quantilei de ordin p ( p ! 1, n 1) se consider o serie de varia ie continu , ale c rei intervale de varia ie nu trebuie s fie neap rat egale ca lungime: x x1 x1 x 2 ... x i 1 x i ... x R 1 x R . X : 0 N ... ... N2 Ni NR 1 (2.28)

n prima etap se determin rangul quantilei de ordinul p ( p ! 1, n 1) conform urm toarei rela ii: 1 R rq p ! N (q p ) ! p N i n i !1 (2.29)

Cunoscnd rangul, se poate identifica intervalul n care se afl quantila de ordinul p, numit i intervalul quantilei de ordinul p ( p ! 1, n 1) . Cumulnd frecven ele pe clase pn la egalarea s-au dep irea rangului, conform inegalit ii: 1 R N 1 N 2 ... N i u p N i n i !1 (2.29)

ultima frecven adunat va corespunde intervalului quantilei de ordinul p ( p ! 1, n 1) . Prin urmare, quantila de ordinul p, qp, se calculeaz conform rela iei: q p ! x i 1 N (q p ) N ( x i 1 ) Ni ( x i x i 1 ) (2.30)

34

x q p ! x i 1 - reprezentnd limita inferioar a intervalului quantilei de ordinul p; l q p ! x i x i 1 - reprezint lungimea intervalului quantilei de ordinul p; N q p ! N i - reprezint frecven a absolut a intervalului quantilei qp,

Procedeul de determinare a quantilei de ordinul p ! 1, n 1 este acela i i n cazul n care seria (2.28) este format din frecven e relative. Caracterizarea structurii unei serii se poate face utiliznd diverse cazuri particulare de valori quantile. Valoarea median (Me) este i un parametru de structur ob inndu-se ca un caz particular de quantil , cnd n=2. Dac pentru o serie se cunoa te Me (quantila de ordinul 2), atunci structura popula iei poate fi redat astfel: X Me X : min 50% M e xmax 50% (2.31)

semnificnd faptul c jum tate din popula ia supus studiului a nregistrat pentru variabila X valori cuprinse ntre valoarea minim a lui X i median , iar cealalt jum tate din popula ie a nregistrat pentru X valori cuprinse ntre median i valoarea maxim a lui X. Valorile quartile reprezint acel caz particular al valorilor quantile pentru care n=4. Cele trei quartile, care se ob in, notate: Q1, Q2 i Q3 sunt acei parametri de structur care mpart popula ia n patru p r i egale. n raport cu mediana, quartila nti Q1, se nume te quartila mic (inferioar ), quartila a doua Q2 coincide cu mediana i se nume te quartila mijlocie, iar quartila a treia Q3 se nume te quartila mare (superioar ). Cunoscndu-se cele trei quartile, rezult urm toarea structur a popula iei n raport cu variabila X: x Q1 X : min 25% Q1 Q2 25% Q2 Q3 25% Q3 X max 25% (2.32)

ceea ce semnific o structurare a popula iei supus studiului n patru par i egale. Aceasta nseamn c 25% din unit ile popupa iei nregistreaz valori pentru variabila X mai mici dect quartila mic , 25% din unit ile popula iei nregistreaz valori, n raport cu aceea i variabil X, cuprinse ntre quartila mic i cea mijlocie, 25% vor avea valori cuprinse ntre quartila mijlocie i quartila mare, iar restul 25% din unit ile popula iei vor avea valorile pentru variabila X cuprinse ntre quartila mare i valoarea maxim a lui X.

2.3. Parametrii varia iei Studiul unor popula ii statistice prezint importan numai din punct de vedere al unor m rimi care variaz de la o unitatea la alta sau de la un grup de unit i la altul.

35

Valorile nregistrate de o variabil cantitativ , n raport cu care este studiat o popula ie, se datoresc ac iunii diferi ilor factori esen iali i neesen iali. Intensitatea diferit cu care se pot manifesta factorii esen iali ct i sensul contrar cu care pot ac iona factorii neesen iali n raport cu fiecare unitate, provoac nivele diferite nregistrate de variabile n raport cu care este studiat popula ia. Problema m sur rii varia iei unei variabile cantitative este important pentru a vedea n ce m sur valoarea medie a acesteia poate reprezenta ntrega popula ie. Dac abaterile de la valoarea medie sunt neesen iale atunci se poate afirma c popula ia este omogen i c acest parametru poate reprezenta tendin a central , iar dac aceste abateri sunt mari atunci popula ia este eterogen i valoarea medie nu are capacitatea de a reprezenta popula ia. Pentru unele serii, valoarea medie nu se poate calcula. n asemenea cazuri, parametrul valoarea median poate s -i ia locul. Aceea i problem se pune i n acest caz, de a vedea n ce m sur valoarea median este sau nu reprezentativ pentru popula ia n cauz . O alt problem care nu se poate rezolva f r a studia i m sura varia ia nregistrat de o variabil n raport cu care este studiat o popula ie, o constituie verificarea de ipoteze. n activitatea practic , de multe ori pornind de la valorile unor parametrii calcula i pe baza datelor culese relativ la un num r mic de unit i, este necesar a fi extin i la nivelul ntregii popula ii sau de a se verifica anumite ipoteze statistice. Parametrii varia iei se pot calcula att sub form absolut ct i relativ , i m soar mpr tierea valorilor unei variabile cantitative fa de valoarea medie sau valoarea median . Ca urmare, n func ie de elementul de referin folosit n m surarea varia iei, deosebim: parametrii varia iei n raport cu valoarea medie; parametrii varia iei n raport cu valoarea median .

2.3.1. Parametrii varia iei n raport cu valoarea medie Abaterea medie liniar Abaterea medie liniar , notat cu d x , reprezint media aritmetic a abaterilor variabilei X de la valoarea medie a acesteia, luate n valoare absolut : dx ! M X X Rela ia (2.33) se particularizeaz n : (2.33)

dx !

xi !1

R

i R

X Ni (2.34)i

Ni !1

Dac seria are la baz o variabil continu calculeaz astfel:

i se cunoa te f(x), atunci abaterea medie liniar se

36

xR

dx !

x1

x X f ( x)dx

(2.35)

Densitatea de probabilitate f(x) se poate aproxima cu densitatea empiric i atunci pentru abaterea medie liniar se pot ob ine rela ii de calcul aproximativ, frecvent utilizate n activitatea practic , de forma:

dx !

xi !1

R

'i

X NiR

Nii !1

sau

d x ! x 'i X fii !1

R

(2.36)

dup cum seria n cauz este format cu frecven e absolute sau relative, unde: x i' ! x i 1 x i , i ! 1, R 2

este mijlocul intervalului i. Acest parametru serve te caracteriz rii sintetice a gradului de reprezentativitate a valorii medii, ar tnd cu ct se abate n medie orice valoare a variabilei X de la valoarea medie X , ntr-un sens sau altul. Sub forma relativ , acest indicator poart denumirea de coeficient simplu de varia ie i se calculeaz conform rela iei: Vx ! dx X 100 (2.37)

Coeficientul simplu de varia ie (Vx) arat cu ct se abate n medie orice valoare a variabilei X de la valoarea medie echivalent cu 1 sau 100%. Calculat pentru dou serii diferite, se poate aprecia gradul de reprezentativitate a celor dou medii. Se apreciaz mai reprezentativ acea valoare medie pentru care coeficientul simplu de varia ie este mai mic. Parametrul abaterea medie liniar , n forma absolut sau relativ , prezint unele deficien e deoarece nu este suficient de sensibil la abaterile mici, ad ugndu-se i unele inconveniente de natur teoretic , generate de exprimarea abaterilor n valoarea absolut . nl turarea acestor deficien e se poate realiza apelnd la un nou parametru privind m surarea varia iei, numit abatarea medie p tratic . Abaterea medie p tratic Acest indicator este utilizat att pentru caracterizarea gradului de reprezentativitate a valorii medii ct i n scopul estim rii unor parametri necunoscu i. Abaterea medie p tratic , notat cu x , se define te ca fiind media p tratic a abaterilor valorilor variabilei X, de la valoarea medie X , adic : W x ! M (X X )2 (2.38)

Un calcul intermediar n aflarea acestui parametru, l constituie calcularea p tratului abaterii medii p tratice, care se nume te dispersie sau varian i are urm toarea expresie de calcul: 37

2 W x ! M (X X )2 ! D 2 (X )

(2.39)2 x.

V(x) reprezint o alt nota ie pentru varian , pe lng

Varian a fiind un calcul intermediar n aflarea abaterii medii p tratice, n cele ce urmeaz se va prezenta modul de calcul al acesteia. Rela ia de calcul a varian ei se particularizeaz n raport cu tipul seriei. n cazul unei serii care are la baz o variabil X discret , conform defini iei, varian a are expresia:

2 Wx !

(xi !1

R

i

X )2 NiR

(2.40)i

Ni !1

n cazul unei serii care are la baz o variabil X continu , varian a se calculeaz conform urm toarei rela ii:xR 2 Wx !

x1

x X f ( x) dx2

(2.41)

a c rei aplicare presupune cunoa terea densit ii de reparti ie f(x). Pentru o serie dat , varian a calculat nu are interpretare, dar dac se extrage r d cina p trat din acesta se ob ine un num r care se exprim n acelea i unit i de m sur ca i variabila de la baza seriei. Acest num r (valoare) reprezint abaterea medie p tratic , simboliznd cu ct se abate n medie n plus sau minus orice valoare xi a variabilei X de la valoarea medie X . Parametrul abaterea medie p tratic se poate exprima i sub form relativ , caz n care se nume te coeficientul de varia ie a lui Pearson, i se noteaz cu Vx. Expresia de calcul este: Vx ! Wx X 100 (2.42)

i reprezint abaterea medie a orc rei valori a variabilei X de la valoarea medie, considerat egal cu 1 sau 100. Coeficientul de varia ie a lui Pearson calculat pentru dou sau mai multe serii, poate fi folosit n aprecieri comparative privind gradul de reprezentativitate a valorii medii calculate. Deoarece gradul de reprezentativitate a valorii medii este n raport invers cu m rimea coeficientului de varia ie a lui Pearson, se poate afirma, n cazul mai multor serii, c este mai reprezentativ valoarea medie a acelei serii pentru care Vx este mai mic. n concluzie, trebuie re inut c parametrul abaterea medie p tratic sub form absolut x i sub form relativ Vx sunt indicatori fundamentali utiliza i n m surarea varia iei unei variabile. Att abaterea medie liniar , ct i abaterea medie p tratic constituie o m sur a varia iei medii, primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (d x e W x ) . 2.3.2. Parametrii varia iei n raport cu valoarea median Abaterea interquartil

38

Abaterea interquartil , prin defini ie, este media aritmetic simpl a segmentelor Me Q1 i Q3 Me, respectiv: Q! M e Q1 Q3 M e Q3 Q1 ! 2 2 (2.43)

i arat cu ct se abat n medie, n plus sau n minus, de la median , cele 50% din valorile variabilei cuprinse ntre Q1 i Q3. Forma relativ a acestui indicator notat cu Qr : Qr ! Q Q Q1 100 ! 3 100 Me 2 Me (2.44)

se nume te coeficient de varia ie interquartilic i arat cu ct se abat n medie de la median (considerat egal cu 100), valorile variabilei nregistrate pentru cele 50% din unit ile popula iei cuprinse ntre Q1 i Q3. Ca atare, se apreciaz c mpr tierea unit ilor n cadrul popula iei studiate este cu att mai mare, n raport cu variabila de studiat, cu ct abaterea interquartil n valoarea absolut (2.43) sau relativ (2.44) este mai mare. Abaterea interquantil Pentru acest parametru, sub form absolut , avem: q! qn 1 M e M e q1 qn 1 q1 ! 2 2 q q q 100 ! n 1 1 100 Me 2 Me (2.45)

iar sub form relativ denumit qr !

i coeficient de varia ie interquantilic este: (2.46)

Cu ct abaterea interquantilic (relativ sau absolut ) este mai mic , cu att valoarea median este mai reprezentativ . 2.4. Parametrii concentr rii Energia informa ional Acest parametru a fost introdus de Acad. Octav Onicescu. Prin defini ie: E ! fi2i !1 R

unde s-a notat cu E energia informa ional . Este un parametru utilizat n cazul n care seria are la baz o variant nenumeric .

39

n cazul unei popula ii caracterizat de un grad de concentrare maxim, va exista o clas care va avea frecven a relativ egal cu 1, iar celelalte vor avea frecven ele relative 0 i ca urmare: Emax = 1. Dac popula ia este caracterizat de o concentrare minim , atunci: x2 ... xR x X : 1 1 / R 1 / R ... 1 / R iar Emin ! R Se observ c : 1 e E e1 R Forma relativ a acestui parametru, notat cu Er, se deduce astfel: 1 E R ! Er ! 1 1 R de unde: 0 e Er e 1 Referitor la popula ia dat , studiat n raport cu o variabil X, se calculeaz Er, iar dac : - Er se apropie de 1, atunci popula ia respectiv este caracterizat de un grad nalt de concentrare; - Er se apropie de 0, popula ia n cauz se caracterizeaz printr-o concentrare minim . 2.5. Parametrii formei Din aplica iile practice, precum i din alte surse, s-au constatat c graficele pot avea diverse forme, dintre care: form de coplot, form de U, J, L sau alte forme. Ceea ce prezint importan , nefiind surprins de nici un parametru prezentat, l constituie modul de repartizare a valorilor variabilei de o parte i de alta a valorii medii, considerat i centrul de greutate a seriei. Acest lucru nu nseamn altceva dect eviden ierea acelei curbe care aproximeaz cel mai bine conturul poligonal al seriei respective i n acela i timp o imagine mai clar asupra gradului de reprezentativitate a valorii medii. n marea majoritate a cazurilor, distribu ia unit ilor unei popula ii se face dup un clopot (dup legea normal a lui Gauss). Dar unit tile nu se distribuie uniform n jurul valorii medii, ceea ce poate conduce la nclina ii ntr-o direc ie sau alta a valorii medii. Aceast distribuire neuniform poate conduce la cazul cnd diferite serii (diferit distribuite n jurul valorii medii) s aib aceea i medie, acela i i totu i o curb s fie mai aplatizat dect cealalt , simetric sau mai pu in simetric . Eviden ierea acestor diferen e poate fi realizat cu ajutorul parametrilor formei. Parametrii formei unei serii de reparti ie, dup con inut, se clasific n dou grupe:R

1 1 ! 2 R R

fi !1

2 i

1 R

1 R

1

40

-

parametrii asimetriei; parametrii boltirii.

2.5.1. Parametrii asimetriei Asimetria unei serii se define te n raport cu dispunerea unit ilor ntr-o parte sau alta a valorii medii. n acest sens, o serie de reparti ie este simetric n raport cu media sa dac frecven ele valorilor variabilei X egal dep rtate de valoarea medie sunt egale ntre ele, adic : f X H ! f X H

oricare ar fi astfel nct X H i X H s se afle printre valorile lui X. Coeficientul de asimetrie al lui Fisher Acest parametru se noteaz cu3,

iar expresia sa de calcul este:

M XX E3 ! 3 WX sau ntr-o form echivalent : E3 !

3

(2.47)

M X X M XX3 2

3

Calculnd valoarea acestui parametru, n func ie de semnul ei, avem urm toarele cazuri: 1. 3 = 0, ceea ce nseamn c M X X = 0, adic suma tuturor abaterilor cu semnul minus este egal cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a treia. Ca urmare n acest caz se poate spune c seria este simetric . 2. 3 > 0, ceea ce nseamn c M X X > 0. Aceasta este echivalent cu faptul c pe total suma abaterilor cu semnul plus de la valoarea medie este mai mare dect suma abaterilor cu semnul minus i ca urmare seria prezint o asimetrie pozitiv . 3. 3 < 0, deci M X X < 0. Aceasta nseamn c pe total, suma abaterilor cu semnul minus este mai mare dect suma abaterilor cu semnul plus de la valoarea medie. O astfel de serie se spune c reprezint o asimetrie negativ .

3

3

3

2.5.2. Parametrii boltirii 41

Aprecierea boltirii unei serii este util n caracterizarea gradului de reprezentativitate a valorii medii ct i pentru compararea reprezentativit ii a dou sau mai multe valori medii ce reprezint serii diferite. Parametrul M X X d o caracterizare numeric sub form absolut a gradului de boltire a unei serii. Sub form relativ , gradul de boltire se m soar cu parametrul: M X X B4 ! 4 WX

4

4

(2.48)

Pentru a n elege semnifica ia boltirii unei serii, se consider dou serii statistice care au la baz variabilele X i Y, iar X ! Y; W X ! WY Mai presupunem, n plus, c cele dou distribu ii au form de clopot pentru care 3X = 3Y , adic ambele sunt simetrice. De i s-ar p rea c cele dou serii nu au nimic care s le deosebeasc , totu i reprezentndu-le grafic rezult dou curbe de forma:

X

Y

X !Y

W X ! WY

unde graficul lui X este mai nalt, iar al celeilalte mai plat. Ca urmate, se observ c cele dou serii nu sunt caracterizate de aceea i boltire. Boltirea unei serii este util pentru a da o caracetrizare mai exact reprezentativit ii valorii medii. n cazul exemplului prezentat mai sus, att mediile ct i abaterile medii p tratice sunt egale i ca urmare, coeficientul de varia ie al lui Pearson este acela i pentru cele dou serii. Deci rezult c ambele valori medii prezint acela i grad de reprezentativitate. Cu toate acestea, graficele celor dou serii contrazic concluzia dedus n urma compar rii celor doi coeficien i de varia ie. Valoarea medie cea mai reprezentativ n seria n care cele mai multe unit i ale popula iei cercetate au nregistrat valori, mai apropiate de valoarea medie. Pentru o astfel de serie, mpr tierea fa de valoarea medie fiind mic , graficul are o form mai ascu it n cazul seriei X i mai plat n cazul seriei Y.

42

Nivelul boltirii pentru o serie oarecare dat se m soar cu ajutorul parametrului B4, a c rui expresie de calcul este dat de rela ia (2.48). Valoarea lui B4 pentru o distribu ie normal este egal cu 3. Pentru orice alt curb corespunz toare unei serii date i aproximat cu un clopot, raportul ntre momentul centrat de ordinul patru i p tratul momentului centrat de ordinul al doilea, este un num r diferit de 3, curba respectiv fiind mai ascu it sau mai plat dect curba normal a lui Gauss. Comparnd gradul de boltire al unei serii oarecare i gradul de boltire al clopotului lui Gauss, Fisher a stabilit urm toarea expresie de calcul al coeficientului boltirii, notat cu B4: M XX B ! 4 WX' 4

34

sau:

B4 = B4-3

expresie cunoscut n literatura de specialitate sub denumirea de exces al seriei. Urm toarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii: - dac B4 =0 (adic B4 = 3) atunci seria n cauz prezint aceea i boltire cu a curbei normale (excesul este nul); - dac B4 > 0 (adic B4 > 3) atunci boltirea corespunz toare curbei respective este mai nalt i mai ascu it dect curba normal (serie leptokurtic ); - dac B4 <


Recommended