Home > Documents > Metoda Statistica

Metoda Statistica

Date post: 18-Oct-2015
Category:
Author: il-kook-song
View: 266 times
Download: 1 times
Share this document with a friend
Description:
Metoda statistică
Embed Size (px)

of 41

Transcript

Capitolul 3

Capitolul 3. Fundamentarea strategiei economice prin metoda statistic

3.1. Definirea metodei statistice

Cunoaterea statistic a evoluiei fenomenelor i proceselor economico-sociale depinde de existena unor informaii pe baza crora se face o analiz profund a realitii i se fundamenteaz programele de dezvoltare ce urmeaz a fi luate de ctre factorii de decizie.

Datele i informaiile culese de la furnizorii de date prin intermediul sistemului informaional statistic (SIS) sunt prelucrate de ctre Comisia Naional pentru Statistic (CNS), care, n final, le prezint beneficiarilor de informaii.

n Legea nr. 11/1994 sunt precizate principiile fundamentale de funcionare a statisticii publice romneti, asemntoare cu cele existente pe plan internaional. Ele au n vedere: autonomia metodologic, confidenialitatea, transparena, specializarea, proporionalitatea i deontologia statistic.

Culegerea datelor i valorificarea informaiilor obinute din acestea prin mulimea operaiilor de prelucrare i analiza poart denumirea de cercetare statistic sau investigate statistic. Putem spune c cercetarea statistic reprezint procesul de cunoatere a fenomenelor de mas cu ajutorul metodei statistice.

Metoda statisticii cuprinde totalitatea procedeelor, tehnicilor i principiilor utilizate pentru efectuarea observrii fenomenelor sociale de mas, pentru prelucrarea datelor obinute prin observare i pentru analiz i interpretarea rezultatelor statistice obinute.

Materialul obinut prin observare este supus cu ajutorul unor procedee specifice statisticii (metoda gruprii, metoda mediilor, analiza dispersional, analiza corelaiei, metoda indicilor etc.), unor prelucrri succesive. n aceast etap tot ceea ce este ntmpltor i neesenial n manifestrile individuale se elimin i se pstreaz numai ceea ce este comun i esenial fenomenului analizat. Aplicarea acestor metode i procedee are ca rezultat obinerea sistemului de indicatori format din mrimi absolute i relative, mrimi medii, indicatori de variaie i corelaie, indici, ecuaii de estimare a tendinelor.

Aceste etape ale cercetrii statistice constituie un tot unitar i trebuie organizate n aa fel nct s se reduc la minimum riscul unor erori de culegere, prelucrare sau analiz. n acest scop se elaboreaz un program al cercetrii statistice care cuprinde principiile i problemele ce trebuie rezolvate n fiecare etap. El are la baz programul analizei, programul prelucrrii i programul observrii, pe care le voi prezenta pe msur ce voi descrie fiecare etap a cercetrii statistice. Cercetarea statistic trebuie privit ca un proces complex ce are form ciclic, cum se poate observa n schema urmtoare:

Figura 1.Ciclul cercetrii statistice

Sursa: Gabriela Neacu, Statistic microeconomic i macroeconomic-Concepte i metode, Editura Universitar, Bucureti, 2006, p. 19

n organizarea i realizarea unei cercetri este necesar s se foloseasc un limbaj unitar, specific fiecrei discipline tiinifice. De aceea statistica ca disciplin i-a elaborat propriile noiuni, concepte de baz pe care s la foloseasc pe parcursul demersului statistic. Principalele concepte cu care lucreaz statistica sunt prezentate n Anexa 3(vezi i Anexa 4).

3.2. Culegerea datelor statistice

3.2.1. Metode de culegere a datelor folosite n cercetarea statistic economic

Pentru satisfacerea nevoii de informaii este necesar s se organizeze cercetri, investigaii statistice. Prin cercetare statistic, n funcie de scopul urmrit, se culeg date care apoi se prelucreaz n mod corespunztor, pentru ca n final s se obin, ntr-o form statistic, informaiile necesare desfurrii procesului de conducere.

n faa complexitii fenomenelor i proceselor economice, actul conducerii nu realizeaz obiectivele fixate fr un sistem informaional statistic. Sistemul informaional statistic (SIS) ca subsistem al sistemului informaional economico-social sub aspect funcional conine mulimea operaiilor de culegere, filtrare, prelucrare i stocare a informaiilor statistice. Cercetarea statistic, parte a SIS presupune parcurgerea unor etape aflate n succesiune logic.

Spre deosebire de numerele abstracte cu care opereaz matematica, datele statistice sunt mrimi concrete obinute din experimente, observaii, numrare, msurare sau din calcule, n modul general, prin date statistice se nelege o caracterizare numeric, cantitativ, obinut de statistic despre unitile colectivitii analizate. n practic culegerea datelor se realizeaz prin diferite tipuri de observri(Anexa 5).

Prin definiie, observarea statistic presupune soluionarea unor probleme metodologice i organizatorice laborioase, participarea unui numr mare de persoane. n programul de organizare a unei observri statistice trebuie s se precizeze anumite elemente, care se constituie n planul observrii statistice(Anexa 6).

3.2.2. Observarea statistic. Erori de nregistrare statistic

Observarea statistic este, dup cum a rezultat mai sus, prima etap a cercetrii statistice. Observarea statistic const n culegerea, dup criterii bine stabilite pentru toate unitile colectivitii studiate, a valorilor/variantelor caracteristicilor prevzute n programul cercetrii.Datele rezultate n procesul observrii statistice trebuie s ndeplineasc urmtoarele condiii: condiia de volum, care presupune culegerea datelor de la toate unitile colectivitii studiate i condiia de calitate, care impune nregistrarea unor date autentice, reale, care s nu prezinte erori. Observarea statistic este o operaie de mare amploare care necesit importante fore umane, cheltuieli bneti i materiale. Acestea sunt prevzute n programul observrii statistice.

n general, prin eroare de nregistrare statistic, exprimat absolut sau relativ, se nelege diferena dintre rezultatul obinut prin nregistrare i mrimea real a caracteristicilor observate. Aceste diferene, erori sunt determinate de volumul nregistrrilor, de precizia mijloacelor de nregistrare i de diverse alte surse.

Cele mai importante surse de erori care se regsesc n domenii care vizeaz nregistrarea sunt prezentate n Anexa 7.

n timpul cercetrii statistice, pot exista factori obiectivi i subiectivi care conduc la erori de nregistrare ntmpltoare, sistematice i, de asemenea, la greeli de nregistrare. O vizualizare a tipologiei generale a erorilor de nregistrare se prezint n figura 2.

Figura 2. Ciclul cercetrii statistice

Sursa: Isaic-Maniu Alexandru, Mitru Constantin, Voineagu Vergil, Statistic, Editura Universitar, Bucureti, 2003, p. 373.3. Tipuri de selecie folosite n cercetarea economic

n practica statistic se folosesc mai multe tipuri de selecie (sondaje) care, n condiiile unor eforturi minime materiale i de munc, s permit obinerea unor informaii ct mai precise.

Aceste tipuri de selecie sunt determinate de anumite particulariti, i anume: gradul i forma de variaie a caracteristicilor studiate, modul de organizare a colectivitii totale, modul de repartiie teritorial a unitatilor, procedeu de formare a esantionului etc.

Dup modul n care se combin sistemul de organizare, felul unitilor de selecie i procedeul de selecie folosit, se disting urmtoarele tipuri de selecie:

selecie ntmpltoare simpl

selecie mecanic

selecie tipic (stratificat)

selecie de serii etc.

Pentru fiecare tip de selecie se calculeaz trei indicatori, i anume: eroarea medie de reprezentativitate (sx), eroarea-limit (Dx) i volumul esantionului (n). Formulele de baz pentru calculul acestor indicatori corespund seleciei ntmpltoare simple. Cu mici modificri, innd seama de particularitile respective, sunt valabile i pentru celelalte tipuri de selecie.

Selecia ntmpltoare simpl

Este tipul utilizat n special pentru colectiviti statistice negrupate, formate dintr-un numar de uniti simple i care se caracterizeaza printr-uii anumit grad de omogenitate. Nu se folosete pentru colectiviti eterogene, deoarece se vor obine erori mari. Formarea eantionului const n extragerea unitilor n mod repetat sau nerepetat, dintr-o urn sau de pe o list stabilit dinainte. Pentru calculul indicatorilor de selecie se foloseste dispersia total (so2) sau dispersia de selecie (sx) care msoar variaia total a caracteristicilor studiate.

Stabilirea volumului eantionului (n)

Precizia cu care se estimeaz parametrii colectivitii generate depinde de mrimea variaiei msurate prin dispersie, de probabilitatea cu care se garanteaz apariia rezultatelor, de intervalul de valori n care se afl eroarea limit i, n ultima instan, de mrimea eantionului. Volumul eantionului trebuie corelat cu fondurile bneti alocate cercetrii selective i cu operativitatea obinerii rezultatelor respective. Deoarece n practic se lucreaz cu o eroare de selecie limitat, calculul volumului eantionului se face folosind formula erorii medii limit.

=> (1)

Rezult c volumul eantionului pentru selecia ntmpltoare simpl repetat este:

(2)Pentru selecia ntmpltoare nerepetat rezult:

(3)Coeficientul de probabilitate "z" este direct proporional cu eroarea medie limit i invers proporional cu eroarea medie de reprezentativitate. Din relaia Dx = zxsx (pentru caracteristica nealternativ) rezult c:

(4)Funcia de probabilitate Fz este direct proporional cu mrimea coeficientului z"; ea se apropie de 1 (ctre certitudine) proporional cu creterea coeficientului z". n mod normal, creterea probabilitii se manifest prin mrirea intervalului de ncredere, ceea ce duce la o precizie mai sczut a rezultatelor. Se observ c, pe msur ce crete probabilitatea, scade precizia i invers.

Rezolvarea acestei probleme are o singur soluie, i anume, n condiii de probabilitate, creterea preciziei rezultatelor se obine prin mrirea volumului de selecie, ceea ce face ca distribuia colectivitii de selecie s fie asimptotic normal. Pentru aceasta, nainte de a se calcula indicatorii de selecie, se impune verifcarea normalitii eantionului.(vezi subcapitolul 3.4.4.)

Selecia mecanic

Selecia mecanic se folosete ca tip i ca procedeu de selecie cnd se combin cu alte tipuri de selecie. Pentru calculul erorilor de selecie se folosesc formulele de la selecia ntmpltoare simpl repetat. Acest tip de selecie se aplic cel mai frecvent n studiile bazate pe cercetrile de laborator i la estimarea recoltei medii la hectar a produciei agricole nainte de recoltare.

Selecia tipic (stratificat)

Selecia tipic se aplic cel mai frecvent n studiul fenomenelor social-economice care n prealabil au fost mprite n grupe omogene (straturi sau tipuri de uniti) - dup o caracteristic esenial - notate cu N1, N2, ... Nr i reprezentate n sondaje prin volumul subeantioanelor n1, n2, ... nr .Dac grupele n care a fost mprit colectivitatea sunt omogene, mediile de grup (xi) au valori apropiate de valorile individuale din care s-au calculat, abaterile ntr-un sens sau altul sunt mici, iar gradul de variaie este mic. n acest caz, variaia mediilor de selecie posibile va fi n funcie de variaia fiecrei grupe, msurat prin dispersiile de grup (si2) i sintetizat prin media dispersiilor pariale (s2). Deci pentru calculul erorilor medii de sondaj se va folosi media dispersiilor de grup din colectivitatea total (s02) sau cea din colectivitatea de selecie (s2).Media dispersiilor de grup sau pariale (so2; s2) se calculeaz ca o medie aritmetic ponderat a dispersiilor de grupa astfel:

(5)respectiv,

(6)unde r" este numrul grupelor din colectivitatea general sau cea de selecie Media de selecie (x) se va calcula ca o medie aritmetic ponderat a mediilor subeantioanelor, respectiv:

(7)n cazul seleciei tipice, eroarea medie de selecie este mai mic dect n cazul seleciei ntmpltoare simple i se verific relaia: (8)Selecia tipic poate fi: simpl, proporional i optim.

Selecia tipic simpl se caracterizeaz prin faptul c extragerea unitilor din fiecare grup se face la ntmplare, fr a ine seama de ponderea unitilor din fiecare grup a colectivitii generate. Volumul subeantioanelor este acelai n toate grupele. Dac se noteaz cu r" numrul grupelor, atunci: (9)Selecia tipic proporional este acea selecie la care volumul subeantioanelor difer n raport cu ponderea pe care o are fiecare grup n colectivitatea general i se respect proporia de selecie:. Volumul fiecarui subeantion va fi:

(10)

iar structura pe grupe este aceeai att n colectivitatea general, ct i n colectivitatea de selecie.

Selecia tipic optim. La formarea eantionului se ia n considerate ponderea pe care o au grupele n colectivitatea general i mrimea variaiei din interiorul grupelor, msurat prin abaterea medie ptratic. Volumul subeantioanelor pe grupe (ni) se va calcula dup relaia:

(11)

n care: Ni - numrul unitilor pe grupe din colectivitatea total;

sio - abaterea medie ptratic pe grupe ale colectivitii totale.

Selecia tipic d cele mai mici erori n activitatea practic, i este greu de aplicat.

Selecia de serii

Se folosete cnd colectivitatea general este format din uniti complexe, numite i serii (echipe, brigzi, magazine etc.). Unitile complexe sunt formate la rndul lor din uniti simple ce posed caracteristici (nsuiri) ce le deosebesc una de alta, au caracter eterogen, n raport cu unitile componente ale grupelor tipice care se caracterizeaz prin omogenitate. Aici nu se poate aplica selecia individual bazat pe uniti simple de sondaj. Constituirea eantionului se face prin procedeele cunoscute, selectnd uniti complexe sau serii ntregi de uniti simple.

Caracteristic pentru acest tip de selecie este faptul c, n locul variantelor concrete ale caracteristicilor de la sondajele, bazate pe uniti simple, se vor folosi indicatori de selecie calculai la nivelul seriei. Cerina reprezentativitii se va asigura prin apropierea mediilor din seriile de uniti selectate din mediile colectivitii generale. Mediile de serii (xi) se calculeaz prin formula mediei aritmetice simple sau ponderate i servesc la estimarea mediei de sondaj (x0). Abaterile dintre mediile seriilor selectate i media de sondaj se msoar sintetic prin dispersia dintre serii (s0y/x2). Deci, n acest tip de sondaj, dispersia dintre serii nlocuiete dispersia general (s02) din sondajul simplu i, ca atare, erorile de reprezentativitate vor fi mai mici sau cel mult egale cu rorile de la sondajul simplu, deoarece

(12)Dispersia dintre serii o vom nota cu dx2 (pentru caracteristica nealternativ) i cu dw2 (pentru caracteristica alternativ): ea reflect variaia dintre mediile seriilor selectate i media pe ntregul eantion i se calculeaz dup una dintre formulele:

(13)

n care: r - numrul seriilor selectate;

ni- numrul unitilor simple din fiecare serie.

Dispersia dintre serii are o valoare mic n eantioanele ce conin serii sau au aceeai structur ca i a colectivitii generale. Eantionarea fcndu-se pe baz de serii, numrul acestora se va nota cu r" n colectivitatea de selecie i cu R" n colectivitatea total. Indicatorii de sondaj sunt aceiai ca i la sondajele anterioare, cu meniunea ca n locul s02 se foloseste dx2, iar coeficientul de corecie al erorilor de sondaj va fi: . Nu se mai renun la 1 de la numitor, deoarece el reprezint o serie ca unitate complex.

3.4. Prelucrarea primar a datelor

3.4.1. Metoda gruprii

Gruparea statistic reprezint prima sistematizare a unor date individuale, obinute n urma unei observri statistice.

Gruparea statistic const n separarea unitilor unei colectiviti n colectiviti omogene din punctul de vedere al uneia sau al mai multor caracteristici. O subcolectivitate (grup) este considerat omogen atunci cnd unitile de observare componente difer n mic msura una de alta, nct se poate afirma c n esen aparin aceluiai tip calitativ. Aadar, condiia de baz a aplicrii metodei gruprii o reprezint asigurarea omogenitii grupelor.

Principalele motive pentru care se apeleaz la metoda gruprii sunt:

asigurarea unei structuri care s fac posibile ncadrarea i stocarea datelor, n scopul inerii unei evidente sistematice;

cunoaterea structurii colectivitii la un moment dat, precum i a mutaiilor structurale care au intervenit n decursul timpului;

aprofundarea cunoaterii modului de manifestare a fenomenelor, prin evidenierea efectului cauzelor sistematice.

Noiunile de baz folosite de metoda gruprii statistice sunt: caracteristica de grupare i intervalul de grupare.

Caracteristica de grupare reprezint acea variabil fa de care unitile colectivitii sunt repartizate n grupe distincte, ct mai omogene. Mrimea variabilei, considerat drept caracteristic de grupare, poate fi exprimat prin cifre sau prin cuvinte. Exist i situaii n care caracteristica este de tip alternativ, n sensul c prezint doar dou situaii posibile n raport cu care pot fi grupate unitile. Gruprile se pot clasifica dup anumite caracteristici de grupare (vezi Anexa 8).

Intervalul de variaie reprezint un grup omogen de variante desprit de restul colectivitii prin cele dou limite ale grupei: inferioar i superioar. Intervalele de grupare pot fi:

intervale egale i neegale; intervale nchise i deschise;

intervale cu variaie discret i cu variaie continu.

Modul de lucru, n vederea sistematizrii datelor prin grupare, este urmtorul:

1. se stabilete amplitudinea variaiei A cu relaia:

A= xmax - xmin (14)unde: xmax este nivelul maxim al caracteristicii, iar xmin este nivelul minim al caracteristicii.

2. se stabilete mrimea intervalului de grupare (k). Aici se disting dou situaii sau cazuri:

cazul cnd se d sau se tie numrul de grupe (r). Relaia de calcul este:

(15)cazul cnd nu se fixeaz numrul degrupe. Atunci se folosete formula lui H. A. Sturges, respectiv:

(16), unde n este numrul de uniti statistice.

3. se formeaz intervale de grupare pornind de la (nivelul minim al caracteristicii) sau de la o valoare puin mai mic, la care se adaug mrimea intervalului de grupare.

Mrimea intervalului de grupare se obine fcnd diferena ntre dou limite inferioare a dou grupe alturate, fie ntre limitele lor superioare, fie ntre limita superioar i limita inferioar a aceluiai interval.

3.4.2. Eliminarea valorilor aberante (Criteriul Chauvenet)

Fiind dat un ir de valori experimentale x1,x2, ..., xn, se consider c valoarea xi este afectat de erori aberante dac este verificat condiia:

(17)

unde i reprezint media aritmetic, respectiv abaterea standard a irului de valori, iar mrimea z se alege din Tabelul 1 n funcie de numrul n de valori din ir.

Tabelul 1

Nznznz

51,64142,1027 292,37

61,73152,1230 332,41

71,80162,1434 382,46

81,87172,1739 452,51

91,91182,2046 552,58

101,96192,2356 712,65

112,0020 212,2672 1002,75

122,0422 232,29101 1662,88

132,0724 - 262,33167 - 5003,09

=

EMBED Equation.3

(18)Valoarea z din Tabelul 1. poate fi determinat i cu ajutorul relaiei

(19)

unde :

(20)

3.4.3. Verificarea caracterului aleator

Unul dintre testele cele mai utilizate pentru verificarea caracterului aleator al unui eantion de valori experimentale este testul Young, descris prin algoritmul de mai jos.

Pasul 1: Fiind dat un ir de valori experimentale , se calculeaz mrimea

(21)

i mrimea

(22)

Pasul 2: Se compar mrimea M cu valorile VCI (valoare critic inferioar) i VCS (valoare critic superioar), alese din tabelul 2, i se consider c irul de valori experimentale are un caracter aleator, cu probabilitatea , dac este ndeplinit condiia

VCI < M < VCS(23)

Tabelul 2

VCIVCS

n = 0,95 = 0,99 = 0,95 = 0,99

40,780,533,223,47

50,820,543,183,46

60,890,563,113,44

70,940,613,063,39

80,980,663,023,34

91,020,712,983,29

101,060,752,943,25

111,100,792,903,21

121,130,832,873,17

151,210,922,793,08

201,301,042,702,96

251,371,132,632,87

Se poate observa c testul nu poate fi aplicat dect pentru eantioane coninnd cel mult 25 de valori experimentale.

Parametrul din tabelul 2 are semnificaia unui coeficient de ncredere i poate fi ales orientativ, n funcie de volumul eantionului, din tabelul 3.

Tabelul 3

n56789101214

0,9600,9700,9760,9800,9830,9850,9880,990

n161820253050100150

0,9910,9920,9930,9940,9950,9960,9970,997

Dac volumul eantionului se afl ntre dou valori din tabelul 3, este indicat s se aleag valoarea corespunztoare unui volum mai mic al eantionului.

Alegerea coeficientului de ncredere din tabelul 3 poate fi nlocuit de determinarea acestuia cu ajutorul relaiei

(24)

Dac valoarea aleas sau calculat a coeficientului de ncredere se afl ntre valorile disponibile n tabelul 2, este indicat s se aleag valoarea disponibil inferioar.

Alegerea valorilor VCI i VCS din tabelul 2 poate fi nlocuit cu determinarea acestora cu ajutorul relaiilor

(25)

(26)

Daca, n urma aplicarii testului, rezulta ca una dintre valorile testate este afectata de erori aberante, valoarea respectiva este eliminata din cadrul esantionului, se recalculeaza valorile mediei si abaterii standard pentru valorile ramase si se reia verificarea conditiei (1.1), algoritmul aplicndu-se pna cnd condiia respectiva nu mai este verificata pentru nici una dintre cele doua valori extreme ale esantionului.

3.4.4. Verificarea normalitiiIpoteza c valorile experimentale din cadrul unui eantion sunt repartizate dup o lege de distribuie normal (Gauss) poate fi testat, ntr-o prim aproximare, prin verificarea urmtoarelor criterii:

-histograma eantionului de valori experimentale s aib un singur vrf (punct de maxim);

-diferena dintre media teoretic a eantionului i valoarea median a acestuia s fie nul, unde valoarea median poate fi determinat cu relaia

(27)

unde indicii superiori, ntre paranteze rotunde, semnific poziia n cadrul irului ordonat cresctor;

- diferena dintre media teoretic a eantionului i modulul acestuia s fie nul (condiie echivalent cu cea anterioar), unde modulul poate fi determinat cu relaia

(28)

- s fie satisfcut urmtoarea condiie referitoare la coeficientul de boltire :

(29)

unde reprezint momentul centrat de ordinul 4, determinat cu relaia

(30)

iar abaterea standard s este determinat de aceast dat din relaia

(31)

-s fie satisfcut urmtoarea condiie (echivalent cu cea anterioar) referitoare la valoarea excesului E al eantionului de valori experimentale:

(32)

Dac verificarea criteriilor prezentate mai sus nu conduce la rezultate elocvente, pentru verificarea ipotezei referitoare la distribuia normal a valorilor din eantionul experimental se poate apela la unul din testele Massey sau , alegerea unuia sau altuia dintre cele dou teste fcndu-se n funcie de valoarea volumului eantionului de date experimentale.

3.4.5. Prezentarea datelor statistice

n vederea aplicrii metodelor de calcul i de interpretare statistic, rezultatele sistematizrii datelor se prezint sub form de serii, tabele i grafice. Rezultatele gruprii pot fi destinate publicrii lor n anuare, buletine statistice etc. n acest caz, prezentarea datelor ncheie procesul de cunoatere statistic.

Serii statistice

Seria statistic este prezentarea paralel a dou iruri de date, n care primul ir prezint caracteristica de grupare, iar cel de-al doilea, rezultatul centralizrii frecvenelor sau valorile unei alte caracteristici cu care se afl n raport de interdependen.

Seriile statistice se pot clasifica dup coninutul caracteristicii de grupare(vezi Anexa 9).

Prezentarea datelor sub form de serie statistic prezint o serie de avantaje, ntre care amintesc:

cerinele de ordonare a datelor, de inere a unei evidene n raport cu un anumit criteriu (timpul, teritoriul etc.);

st la baza calculrii indicatorilor derivai;

poate facilita desprinderea unor tendine, aprecierea unor repetabiliti.

Din aceste motive, seriile statistice au fost considerate materia prim" a analizelor statistice.

Tabele Statistice

Tabelul statistic constituie o form de prezentare a datelor care au rezultat din observarea sau prelucrarea statistic.

Tabelul statistic, n general, se prezint sub forma a dou coloane: una conine valorile variabilei studiate (cercetate) care delimiteaz grupele (sau clasele) i alta conine efectivele (ni) obinute pentru fiecare grup sau clas.

Tabelele statistice sunt extrem de variate i se folosesc n toate cele trei etape ale cercetrii statistice. Aa, de exemplu, n etapa observrii statistice, se ntocmesc tabele descriptive sau enumerative care se folosesc pentru nregistrarea datelor primare. n etapa de prelucrare a datelor (centralizarea datelor, calculul unor indicatori etc.) se utilizeaz tabele de prelucrare sau de lucru.

n raport cu numarul de caracteristici care au stat la baza gruprii datelor, ntocmim: tabele simple, tabele pe grupe, tabele combinate, tabele cu dubl intrare, tabele de asociaie etc (vezi Anexa 10).

Din cele prezentate rezulta c, n marea majoritate a cazurilor, ntre gruprile statistice i tabelele statistice exist o simetrie.

Graficele statistice

Alturi de seriile statistice i tabelele statistice, reprezentrile grafice constituie o modalitate extrem de expresiv pentru prezentarea datelor statistice. Graficul este o imagine spaial, cu caracter convenional, care, prin diferite mijloace plastice de reprezentare, reliefeaz ceea ce este caracateristic, esenial, pentru obiectul cercetrii. Principalele tipuri de grafice statistice sunt prezentate n Anexa 11. Reprezentrile grafice sunt diferite n funcie de tipul variabilelor studiate (Anexa 12).

3.5. Indicatorii statisticiIndicatorul statistic este expresia numeric a manifestrilor unor fenomene, procese, activiti sau categorii economice i sociale, delimitate n timp, spaiu i structur organizatoric. Obinut ca rezultat al procesului cercetrii statistice, indicatorul are un coninut real, obiectiv determinat, o formul proprie de calcul i o form specific de exprimare.

Indicatorii folosii n cercetarea statistic se subdivid n indicatori primari i n indicatori derivai.

Indicatorii primari sau absolui (mrimi absolute) exprim direct nivelul real de dezvoltare al caracteristicii cercetate, caracteriznd fenomenul la modul cel mai general din punct de vedere cantitativ. Ei rezult n urma observrii i centralizrii statistice a datelor individuale de mas, fie prin nregistrarea direct, fie prin nsumare parial sau total a datelor individuale de acelai fel. Putem spune c indicatorii absolui exprim volumul grupelor i a ntregii colectiviti, precum i nivelul cumulat al diferitelor caracteristici pe grupe de uniti i pe ansamblul colectivitii.

Indicatorii derivai se obin n faza de prelucrare statistic a mrimilor absolute prin aplicarea variatelor metode i procedee de calcul statistic (comparaii, abstractizri, generalizri). Indicatorii derivai au menirea de a pune n lumin i de a face posibil analiza aspectelor calitative ale fenomenelor i proceselor cercetate, n acest scop, ei exprim: raporturile cantitative dintre diferitele caracteristici statistice, dintre diferitele pri ale unei colectiviti sau dintre fenomenele ce se gsesc ntr-un anumit grad de interdependen.

3.5.1. Indicatorii tendinei centrale

Indicatorii tendinei centrale se determin n general ca indicatori medii sau ca indicatori de poziie (ai localizrii), n funcie de natura caracteristicilor (variabilelor) urmrite n colectivitatea investigat, de scopul investigaiei. Sunt dese situaiile n care tendina central se caracterizeaz printr-un anumit tip de medie (aritmetic, armonic, ptratic, geometric etc.), dar i situaiile de utilizare a indicatorilor de poziie (modulul, cuantilele) .Media este o msur a tendinei centrale, iar valoarea sa calculat sintetizeaz ntr-un singur nivel reprezentativ tot ceea ce este tipic, esenial, comun i obiectiv n apariia i manifestarea fenomenelor de mas.

Media aritmetic (). n sena statistic, media aritmetic (sau momentul iniial de ordin unu) a valorilor individuale ale caracteristicii numerice X reprezint acea valoare () care s-ar fi nregistrat dac toi factorii de influen ar fi acionat constant la nivelul fiecrei uniti de nregistrare.

() (33)

Media armonic () Ca msur a tendinei centrale ntr-un ansamblu de observaii cantitative, se definete ca valoare invers a mediei aritmetice a inverselor valorilor individuale nregistrate.

EMBED Equation.3(34)

Media ptratic () exprim tendina central a valorilor nregistrate pentru variabila observat dac are sens obiectiv nsumarea ptratelor valorilor individuale.

(35)

(36)

Media geometric (). Media geometric reprezint acea valoare a caracteristicii observate care dac ar nlocui fiecare valoare individual din serie produsul acestora nu s-ar modifica.

(37)

Media geometric, uneori, se mai numete i medie logaritmic deoarece se poate determina prin logaritmii valorilor individuale. Astfel :

, de unde (38)

Valoarea modal a caracteristicii (numit i valoare dominant, valoarea cea mai probabil sau modul) reprezint acea valoare a caracteristicii care corespunde celui mai mare numr de uniti sau aceea care are cea mai mare frecven de apariie. Intervalul modal este intervalul cu frecvena (absolut sau relativ) cea mai mare sau intervalul cu densitatea frecvenelor maxim, n interiorul intervalului modal se caut (se estimeaz) valoarea modal.

Mediana (cuantil de ordinul 2) reprezint acea valoare a caracteristicii localizat n mijlocul seriei sau repartiiei statistice cu valori individuale aranjate n ordine cresctoare sau descresctoare. Cu alte cuvinte, mediana mparte numrul unitilor investigate n dou pri egale: numrul valorilor individuale superioare medianei este egal cu numrul valorilor individuale mai mici dect mediana.

(39)

3.5.2. Indicatorii variaiei

n statistic prin noiunea general de mprtiere (variaie sau dispersare) se au n vedere abaterile msurabile ale valorilor individuale fa de o valoare central (tipic). Noiunea de dispersare, mprtiere, completeaz informaiile despre seriile statistice investigate. Calculul i analiza indicatorilor variaiei sau mprtierii valorilor individuale fa de tendina central ofer posibilitatea rezolvrii unor probleme de cunoatere statistic. Dintre acestea se disting:

1) analiza gradului de omogenitate a datelor din care s-au calculat indicatorii tendinei centrale i verificarea reprezentativitii acestora;

2) compararea n timp i (sau) spaiu a mai multor serii de repartiie dup caracteristici independente sau (i) interdependente;

3) selectarea obiectiv a factorilor semnificativi de influen dup care se structureaz unitile unei colectiviti statistice;

4) separarea aciunilor factorilor eseniali de aciunea factorilor ntmpltori, identificarea felului n care factorii eseniali i modific aciunea de la o grup (clas) Ia alta;

5) concentrarea valorilor individuale ale caracteristicilor i deplasarea acestora fa de valorile tipice;

6) aplicarea diferitelor teste ale statisticii matematice.

n analizele statistice indicatorii sunt clasificai dup mai multe criterii:

Dup numrul variantelor luate n calcul (sau dup gradul lor de sintez) exist indicatori simpli i indicatori sintetici;

Indicatori simpli ai mprtierii:

a) Amplitudinea mprtierii sau variaiei (A) se definete prin diferena dintre cea mai mare i cea mai mic valoare individual nregistrat.

(40)

unde:

; ; = valori individuale nregistrate

Amplitudinea se exprim n unitatea de msur a caracteristicii urmrite, dac se calculeaz dup relaia de mai sus sau n procente dac se calculeaz sub form relativ dup relaia urmtoare:

(41)

b) Abaterile individuale ca msuri ale mprtierii ntr-o serie exprim cu cte uniti de msur sau de cte ori (sau ct la sut) valoarea caracteristicii urmrit, la fiecare unitate a colectivitii, se abate de la mrimea calculat a unui indicator al tendinei centrale.

Prin urmare, tendina central se exprim prin media aritmetic, abaterile individuale n mrimi absolute sau relative i se calculeaz astfel:

sau (pentru orice ) (42)

Indicatori sintetici ai mprtierii:

a) Abaterea medie absolut reprezint media aritmetic simpl sau ponderat a abaterilor absolute ale termenilor seriei de la tendina lor central, caracterizat cu ajutorul mediei sau al medianei.

n cazul n care abaterea valorilor individuale sunt calculate i analizate fa de medie atunci abaterea medie absolut se determin astfel:

- cazul seriei simple:

(43)

- cazul seriei de distribuie de frecvene:

sau (44)

unde:

k= numrul de variante distincte sau intervale de grupare;

(cu ) = frecvene absolute;

(cu ) = frecvene relative, exprimate sub form de coeficieni.

Este posibil ca n unele analize statistice s prezinte interes abaterea medie absolut a abaterilor valorilor individuale de median . n asemenea situaii aceasta se determin dup urmtoarele relaii:

- cazul seriei simple:

(45)

- cazul seriei de distribuie de frecvene:

sau (46)

b) Dispersia (). Valoarea absolut a diferenelor elimin sensul abaterilor fa de tendina central. Acelai obiectiv poate fi atins dac diferenele respective se ridic la ptrat. Lundu-se n considerare ptratele abaterilor valorilor individuale de la tendina lor central se obine o valoare tipic a mprtierii, numit dispersie .

Prin urmare, dispersia ca msur sintetic a mprtierii (variaiei) reprezint media aritmetic (simpl sau ponderat) a ptratelor abaterilor valorilor individuale de la tendina lor central. Aceasta nseamn c n calculul dispersiei poate fi luat n considerare media sau alt indicator al tendinei centrale (de exemplu, mediana). Deci, relaiile de calcul ale dispersiei fa de media aritmetic, sunt urmtoarele:

- cazul seriei simple:

(47)

- cazul seriei de distribuie de frecvene:

sau (48)

c) Abaterea medie ptratic () (numit i abaterea standard sau abaterea tip) se definete ca medie ptratic, simpl sau ponderat, a abaterilor valorilor individuale de la tendina central sau ca rdcin ptratic a dispersiei. Potrivit acestei definiii relaia de calcul a abaterii medii ptratice este urmtoarea:

(49)

d) Coeficientul de omogenitate (de variaie) este o msur a dispersiei relative care descrie abaterea medie ptratic ca procent din media aritmetic. Acest coeficient de variaie permite compararea mprtierii valorilor care nu sunt exprimate n aceeai unitate.

Coeficientul de variaie (CV) se definete ca raport ntre abaterea medie ptratic i media aritmetic a ansamblului de observaii. Astfel:

(50) Dup modul de sistematizare a datelor primare exist indicatori ai variaiei calculai pentru serii de distribuie unidimensionale i indicatori ai variaiei calculai pentru serii multidimensionale; Dup modul de calcul i exprimare exist indicatori ai variaiei calculai ca mrimi absolute i ca mrimi relative.Indiferent de natura lor, indicatorii de variaie calculai ofer informaii necesare nu numai pentru cunoaterea variabilitii din seriile statistice analizate, dar i pentru aprecierea calitii".

3.5.3.Indicatori ai determinrii i nedeterminrii

Dispersia general poate fi determinat i cu ajutorul formulei:

(51)

relaie cunoscut sub numele de regula adunrii dispersiilor. Aceasta relaie permite nu numai determinarea dispersiei ntr-o colectivitate structurat n mai multe pri ci pune n eviden i alte aspecte.

Coeficienii de determinare i nedeterminare se pot calcula cu formula:

1=K +R

(52)

unde: - coeficient de determinare (53)

- coeficient de nedeterminare (54)

Coeficientul R exprima msura n care variaia general este explicat de factorul de grupare considerat; cu alte cuvinte ct din variaia variabilei observate x se datoreaz factorului de grupare (cauzal) adic intensitatea legturii dintre X i Y.

Cu ct valorile lui R sunt mai apropiate de 1, legatura este mai strns i cu ct valorile sale sunt mai apropiate de 0 legtura dintre X i Y este mai slab. Daca R = 0 nseamna c ntre variaia celor 2 variabile nu exist nici o legtur.

Coeficientul K exprim msura n care variaia variabilei analizate este explicat de factorii reziduali (aleatori) care acioneaza n interiorul fiecrei grupe j. Coeficientul K este complementar lui R i se interpreteaz ca atare.

R* 100 se numete grad de determinare i exprim ct la suta din dispersia general este explicat n funcie de factorul de care s-a structurat colectivitatea general.

K* 100 se numete grad de nedeterminare i evideniaz ct la sut din dispersia general este explicat de factorii aleatori, care acioneaz n fiecare subcolectivitate a colectivitii generale.

3.5.4. Analiza statistic a legturilor dintre fenomelele i procesele social-economice. Corelaia i regresia

A. Metoda regresiei

Const n cercetarea legturilor existente ntre fenomene cu ajutorul unor funcii matematice, denumite funcii de regresie.

n folosirea acestei metode este important s se identifice funcia ce exprim cel mai bine dependena dintre caracteristicile studiate. Funcia de regresie poate avea forme variate, fie de funcie liniar sau neliniar, de producie sau logistic.

a. Modelul regresiei simple (unifactoriale), exprim dependena caracteristicii rezultative y, numai n raport cu caracteristica factorial (x), fcnd abstracie de toi ceilali factori de influen, considerndu-i constani i este de forma:

Unde ( este variabila aleatoare cu dispersia constant i media nul, numit eroare, ce nsumeaz influena factorilor nenregistrai.

Modelul este o reflectare schematic, simplificat a realitii, construit dup identificarea dependenelor i specificarea formei legturii dintre cele dou fenomene.

b. Modelul regresiei multiple (multifactoriale), exprim dependena caracteristicii rezultative (y), n raport cu un numr mare de factori, respectiv de caracteristici factoriale i are forma:

Y = f(x1, x2,xk,xm) + (; xk caracteristici factoriale independente.

B. Metoda corelaiei

Metoda corelaiei, permite o ierarhizare a factorilor de influen. Aceasta const n calcularea unor indicatori ai corelaiei.

Aceasta const n calcularea unor indicatori ai corelaiei.

Covariaia

Este un indicator ce se utilizeaz pentru msurarea legturii liniare ntre o caracteristic rezultativ (y) i una factorial.

COV(x,y)=

(55)

Dac COV(x,y) = 0 ( x, y sunt independente, ntre ele nu exist legtur;

Dac COV(x,y) > 0 ( evideniaz o legtur direct;

Dac COV(x,y) < 0 ( evideniaz o legtur invers.

Cu ct valoarea covariaiei este mai mare, cu att legtura este mai intens i invers.

Coeficientul de corelaie liniar Msoar intensitatea n cazul legturilor liniare, fiind independent de unitile de msur ale caracteristicilor din care se determin.

Formula de calcul este:

Coeficientul de corelaie ia valori n intervalul (-1, 1(.

Dac: r((0,1( ( legtur direct;

r((-1,0( ( legtur invers;

r = 0 ( x i y sunt caracteristici independente sau necorelate liniar.

Cu ct rezultatul coeficientului r se apropie de 1 sau de 1, cu att legtura este mai intens. Coeficienii de corelaie a rangurilor

Se utilizeaz pentru msurarea intensitii legturii dintre cele dou caracteristici, n cazul n care una sau ambele caracteristic sunt exprimate numeric, respectiv sunt cuantificate cu ajutorul scalei ordinale prin atribuirea de ranguri sau n cazul caracteristicilor exprimate ca mrimi relative de intensitate.

n cazul acestor caracteristici, pentru determinarea coeficienilor de corelaie a rangurilor, se parcurg urmtoarele etape:

1) se ordoneaz valorile ambelor caracteristici cresctor sau descresctor;

2) se acord ranguri att pentru caracteristica x, ct i pentru caracteristica y, ranguri ce se noteaz Rx , respectiv Ry , astfel:

- rangul pentru x va fi Rx = 1, 2, , n unde n reprezint numrul de observaii;

- rangul pentru y va fi Ry = 1, 2, , n;

3) se determin diferenele de rang pentru fiecare cuplu de valori (xi, yi): Di = Ryi - Rxi ;

4) stabilete pentru fiecare valoare a caracteristicii rezultative (yi) asociat caracteristicii factoriale (xi):

- numrul de ranguri superioare, notat P;

- numrul de ranguri inferioare, notat Q;

5) se calculeaz scorul S, dup formula:S = P - Q

Legtura dintre x i y se caracterizeaz cu ajutorul urmtorilor coeficieni de corelaie a rangurilor:

- Coeficientul lui Spearman care are formula:

- Coeficientul Kendall are forma:

Unde: S scorul determinat;

n numrul de cupluri.

Cei doi indicatori iau valori n intervalul : (-1; 1(.

- Dac CS i CK ( (0; 1( , ntre x i y exist o legtur direct.

- Dac CS i CK ( (-1; 0( , ntre x i y este o legtur invers.

- Cu ct se apropie de 1 i de 1, cu att legtura este mai intens.

3.5.5. Determinarea trendurilor din evoluia fenomenelor

Variaia n evoluia unui fenomen este produs de factori eseniali care dau tendina (trendul) fenomenului i factori neeseniali care produc abateri de la tendina general. Departajarea, aproximarea componentei tendin se face prin ajustare. Exist mai multe procedee de ajustare: - metoda mediilor mobile;

- metoda grafic;

- metoda sporului mediu;

n continuare v voi prezenta metoda mediilor mobile.

Metoda mediilor mobile, presupune nlocuirea termenilor reali ai seriei cronologice cu mediile lor mobile. Prin aceast operaie se nltur influena factorilor care provoac oscilaiile periodice i se obine o nou serie cronologic care evideniaz micarea larg, continu din evoluia fenomenului analizat.

Mediile mobile (MM) sunt medii aritmetice pariale calculate din doi, trei sau mai muli termeni succesivi ai seriei cronologice. Numrul termenilor din care se calculeaz MM este stabilit n funcie de periodicitatea oscilaiilor din seria cronologic. Cu ct este mai mare numrul de termeni din care se calculeaz MM cu att ajustarea este mai pronunat, cu att este mai lin graficul obinut prin unirea mediilor mobile succcesive.

cazul cnd MM se calculeaz dintr-un numr impar de termeni (de exemplu, p=3). Procedura de aflare a termenilor care estimeaz trendul este urmtoarea:

se calculeaz prima media mobil din primii trei termeni (Y1,Y2,Y3) care va nlocui termenul Y2.

se calculeaz a doua medie mobil din Y2, Y3, Y4 care va nlocui termenul Y3 .a.m.d.

Tabelul 4. Ajustarea seriei cronologice prin metoda MMM (cnd p este impar)tiyiMEDII MOBILE (MM)VALORILE AJUSTATE

1Y1=(Y1+Y2+Y3)/3

=(Y2+Y3+Y4)/3

=(Y3+Y4+Y5)/3

=Y1=Y2=Y3

2Y2

3Y3

4Y4

5Y5

6Y6

7Y7

Cazul cnd mediile mobile se calculeaz dintr-un numr par de termeni (p=4)

n aceast situaie procedura de determinare a trendului este urmtoarea:

- se calculeaz MM dup procedeul descris (cnd p este impar). Aceste medii mobile provizorii, deoarece se plaseaz ntre termenii reali, iar acetia nu pot fi nlocuii. Pe baza MM provizorii se calculeaz MM finale din doi termeni succesivi, iar acetia coincid cu valorile ajustate (MM finale plasndu-se n dreptul termenilor reali i va nlocui pe acetia).

Tabelul 5. Ajustarea seriei cronologice prin metoda MMM (cnd p este par)

tiyiMM provozoriiMM finale (valori ajustate)

1Y1=(Y1+Y2+Y3+Y4)/4

=(Y2+Y3+Y4+Y5)/4

=(Y3+Y4+Y5+Y6)/4

=( Y1+Y2)=Y1

=( Y2+Y3)=Y2

2Y2

3Y3

4Y4

5Y5

6Y6

7Y7

3.6. Analiza statistic a seriilor cronologice

n domeniul economic n general, prezint o importan deosebit analiza i cunoaterea evoluiilor n timp a diferitelor activiti, fenomene, procese ce au loc att la nivel microeconomic, ct i la cel macroeconomic.Aceste analize au rolul de a fundamenta, pe baza a ceea ce s-a realizat n trecut, viitoarele decizii ce vor trebui adoptate n vederea atingerii i ndeplinirii diferitelor obiective.

O serie cronologic se prezint sub forma unui ir sistematizat de valori, ale unei caracteristici, realizate la momente sau intervale de timp succesive. Deci, o serie cronologic poate fi scris astfel: y = f(t) unde:

- variabila "timp" t, ia valorile (cu i = 1,n) i nu trebuie interpretat ca factor de influen al variabilei y.

- variabila "y" ia valorile individuale . Indicatori medii ai SCR

1)Modificarea medie absolut

Se calculeaza ca medie aritmetic simpl a modificrilor absolute cu baz mobil, determinate pe orizontul de timp al SCR:

(59)

unde T-1= numarul modificarilor absolute cu baz mobil

=Yt-Yt-1;(t=1,T)=modificarea absolut cu baz mobil

2)Indicele mediu de dinamic

Se calculeaz ca medie geometric a indicilor de dinamic cu baz mobil

(60)

unde:

(t=1,T) - indicele de dinamic cu baz mobil

Relaia (60) arat de cte ori sau ct la sut s-a modificat fenomenul analizat, n medie, n cadrul orizontului de timp al SCR.

3) Ritmul mediu al dinamicii

Arat cu cte procente fenomenul analizat s-a modificat n medie de la un interval/moment de timp la altul.

(61)

3.7. Estimri i verificri de ipoteze

Considerm o variabil aleatoare X, la care legea de repartiie este exprimat printr-o funcie dat (densitatea de repartiie sau funcie de repartiie). Aceast funcie este specificat, n cazul n care conine anumii parametri necunoscui sau complet specificat, dac sunt cunoscui toi parametrii. Dac repartiia nu se cunoate se poate spune c repartiia este nespecificat. Operaia prin care se determin valorile parametrilor se numete estimaie. Deci estimarea nseamn, n general, a cerceta i determina parametrii unei legi de repartiie date sau a determina indicatorii teoretici pe baza datelor de eantion.

Pentru a efectua estimarea, regula aleas sau statistica utilizat, se numete estimator. Estimatorul este la rndul su o variabil aleatoare dependent de eantion.

Estimaia poate fi punctual, dac parametrul a al populaiei se estimeaz printr-o valoare izolat determinat cu un estimator pe baza datelor eantionare sau poate fi o estimaie cu interval de ncredere dac se stabilete un interval care s includ, cu o probabilitate dat P, valoarea adevarat a, a parametrului estimat, .

n general, un bun estimator trebuie s ndeplineasc urmtoarele condiii (condiiile Yule): s fie obiectiv, s depind de toate observaiile seriei, s aib semnificaii concrete, s fie simplu i uor de calculat i s fie puin sensibil la fluctuaiile eantionului.

Ca notaii se folosesc n general litere latine , m, s pentru parametrii eantionului (valori estimate) i literele greceti (, , ) pentru cei ai populaiei (valori adevrate).

3.7.1. Intervale de ncredere

A. Intervalul de ncredere pentru media teoretic a unei caracteristici cu repartiie normal

Cazul caracteristicii cu dispersie cunoscut

Se consider o populaie a crei caracteristic X are o repartiie normal. Se extrage din aceast populaie un eantion de volum n. S estimm media cu un interval de ncredere de 95% cu risc bilateral simetric. Nivelul de semnificaie este . Se tie c media de eantion are o repartiie normal , parametrul , fiind necunoscut, urmeaz s se construiasc un interval de ncredere pentru aceast mrime cu limitele (-z, z) stabilite cu ajutorul repartiiei Laplace.

Se tie c variabila aleatoare:

(62)

are o repartiie normal N(O, 1).

Conform tabelului repartiiei probabilitatea de 95% se definete n intervalul (1,96;+ 1,96). Din aceasta relaie se poate scrie dubla inegalitate:

(63)

de unde se obin limitele intervalului:

(64)

S-a construit astfel pentru intervalul de ncredere de 95%. Rezultatul mai poate fi scris sub forma:

(65)

intervalul fiind simetric n raport cu valoarea .

n cazul general la un nivel de semnificaie , cu ajutorul variabilei aleatoare normale normata se poate construi pentru un interval de ncredere cu risc bilateral simetric dat de relaia:

(66)

unde reprezint valoarea variabilei z corespunztoare probabilitii , sau cuantila de ordin , iar reprezint valoarea care nu este depit cu o probabilitate egal cu sau cuantila de ordin .

Cazul caracteristicii cu dispersie necunoascut

Fie o variabil aleatoare X cu repartitie dar i sunt necunoascute. Dac se consider un eantion de volum n cu estimaiile i , determinate cu relaiile cunoscute, atunci statistica:

(67)

nu mai urmeaz o lege normal. Se tie c: are o repartiie normal, o repartiie , iar statistica urmeaz o lege de repartiie Student cu v = n-1 grade de libertate.

Similar cazului anterior intervalul de ncredere bilateral pentru media este definit de relaia:

(68)

de unde se poate deduce urmatorul interval de ncredere pentru :

(69)

Dac intervalul este simetric:

(70)

B. Intervalul de ncredere pentru dispersia teoretic

Fie X o variabil aleatoare cu repartiie normal cu media i dispersia necunoscute.

Dispersia este estimat punctual cu ajutorul estimatorului corectat .

Se tie c statistica:

(71)

are o repartiie cu v = n-l grade de libertate.

Pentru un nivel de semnificaie se poate scrie relaia:

(72)

unde i sunt cuantilele de ordin i . Expresia devine:

(73)

Pentru abaterea standard un mod mai simplu de a calcula intervalul de ncredere este dat de relaia:

(74)

unde q are valorile calculate pentru nivelele de semnificaie 0,05 i 0,01.

Pentru intervalul este deoarece ntotdeauna .

n acelai mod se poate determina intervalul unilateral stnga sau dreapta, respectiv valoarea minim a dispersiei adevrate cu risc stnga este:

(75)

Tabelul 6. Valorile coeficientului k de estimare a dispersiei.n-11-n-11-

0,950,990,950,99

5

10

15

20

22

24

26

28

30

35

40

45

501,090

0,590

0,440

0,358

0,336

0,318

0,302

0,288

0,276

0,253

0,234

0,219

0,2072,010

0,980

0,700

0,556

0,518

0,478

0,460

0,437

0,416

0,375

0,343

0,318

0,29755

60

65

70

80

90

100

110

120

150

200

250

3000,196

0,187

0,179

0,172

0,160

0,150

0,142

0,135

0,129

0,115

0,099

0,089

0,0810,280

0,266

0,253

0,242

0,224

0,209

0,196

0,186

0,177

0,159

0,135

0,120

0,109

3.7.2. Testarea ipotezelor

Metodele de verificare ale ipotezelor statistice se numesc teste statistice. Testele care se refer la ipotezele ce privesc numai valorile parametrilor unei repartiii se numesc teste parametrice. Ipotezele sunt n general presupuneri care se refer la populaie i nu la eantioane. Dac ipoteza este adevarat, dar pe baza eantionului se respinge ca fals, se comite o eroare de genul 1. Probabilitatea acestei erori se noteaz cu . Se poate ntampla i invers; s se accepte ca ipotez adevarat o ipotez fals. n acest caz se face o eroare de genul 2. Probabilitatea acestei erori se noteaz cu. De asemenea pot exista eantioane dintr-un lot nacceptabil cu , dar care s verifice ipoteza fcut i n acest caz se comite eroarea de genul 2 cu o probabilitate egal cu . Acceptare a ipotezei potrivit creia lotul din care s-a extras eantionul are media sau nu, revine la a compara eantionul x cu o valoare limit determinat cu ajutorul nivelului de semnifIcaie i care reprezint criteriul de acceptare sau de respingere. Valoarea erorii de genul 2 va depinde de valoarea adevarat . Probabilitatea de respingere a unei ipoteze false, egal cu , este denumita puterea testului. Considernd o populaie avnd o caracteristic X estimat prin paranletrul , verificm ipoteza potrivit creia parametrul are valoarea specificat . Notm aceast ipotez astfel:

Pe lng valoarea mai pot fi i alte valori admisibile ale acestui parametru (,etc.). Pentru a distinge ipoteza de restul ipotezelor admisibile aceasta se numete ipotez nul (ipotez iniial) oricare alt ipotez fiind denumit ipoteza alternativ. Dac se testeaz o ipotez cu alternativa cu ajutorul valor unei statistici u denumit i funcie dicriminant, se definete pentru nivelul de semnificaie adoptat un interval de acceptare w, denumit regiune de acceptare, astfel:

Mulimea complementar este denumit regiune critic. Regiunea de acceptare nu este determinat unic existnd deci i alte teste pentru verificarea aceleiai ipoteze. Acceptarea unei ipoteze nu nseamn c ea este i adevarat. Pot exista i mici diferene care nu pot fi explicate i se numesc diferene nesemnificative.

Verificarea ipotezelor statistice prezint, n general, urmtoarele etape:

1. enunarea ipotezei;

2. alegerea parametrilor;

3. calculul statisticii pe baza datelor experimentale (funcia discriminant) i stabilirea regulii de decizie;

4. acceptarea sau respingerea ipotezei.

n unele cazuri ipotezele se refer la o variabil aleatoare, la care numai abaterea ntr-o singur direcie se limiteaz. Se utilizeaz astfel teste cu specificare unilateral funcie de valoarea la care se limiteaz variabila sau teste cu specificare bilateral dac variabila se ncadereaz intervalului specificat de riscurile bilaterale.

n general, ipotezele se refer la valorile tipi ce specificate, , ale diferitelor caracteristici.

Ipotezele mai pot fi formulate n 2 moduri, foarte frecvent impuse de problemele tehnice astfel:

1) testeaz ipoteza dac o mrime este inferioar sau egal () contra ipotezei alternative c ea este superioar () i2) testeaz ipoteza c o mrime este superioar sau cel puin egal (), contra ipotezei alternative c ea este inferioar (). n ambele cazuri riscul este cu specificare unilateral.

Testul Z

Fie caracteristica X ce urmeaz legea normal cu necunoscut i cunoscut. Vrem s verificm ipoteza nul H0:m=m0 n

ipoteza alternativ cu probabilitatea de risc i datele de selecie x1, x2, xn.

Considerm statistica ce urmeaz legea normal N(0,1). Deci pentru dat putem determina intervalul:

a.. . (76)

Se definete regiunea critic U prin:

U. (77)

Astfel am obinut:

(78)

Folosind regiunea critic U vom respinge ipoteza nul H0 dac (x1, x2,,xn) U, adic (79) i o admitem dac U, adic . (80)

1) Deoarece regiunea critic U corespunde complementarei

intervalului de ncredere pentru statistica Z, n continuare nu vom pune n eviden de fiecare dat regiunea critic U, ci numai intervalul de ncredere pentru statistica utilizat.

2)Testul Z se poate folosi i pentru o caracteristic X ce nu urmeaz legea normal atunci cnd volumul seleciei este mare (n>30).

3)Ipoteza alternativ este testul Z se numete testul Z bilateral. Dac se consider H1:m1. Dac F


Recommended