+ All Categories
Home > Documents > Statistic A ID

Statistic A ID

Date post: 13-Jul-2015
Category:
Upload: annemarie-pop
View: 66 times
Download: 0 times
Share this document with a friend

of 132

Transcript

Date de identificare a cursuluiDate de contact tituar curs Nume: Conf.univ.dr. Cristian Chifu Birou: Facultatea de Business, Str. Horea nr.7, cam.213 Telefon: 0264-599170 Fax: 0264 590110 E-mail: [email protected] Consultaii: vineri 10.00 12.00; rspuns la ntrebrile adresate prin e-mail max. 48 de ore Date de identificare curs i contact tutori Denumire curs: Prelucrri statistice pe computer Cod: IAA2120 ECTS: 6 An II Semestrul: III Tip curs: obligatoriu Pagina web: www.tbs.ubbcluj.ro https://portal.portalid.ubbcluj.ro Tutori: Asist.drd. Ionu Traian Luca

Condiionri i cunotine prerechizite:Pentru a parcurge aceast disciplin, studenii trebuie s aib o serie de cunotine minime, dobndite n cadrul disciplinei Statistic aplicat Susinerea examenului la aceast disciplin este condiionat de promovarea examenului la disciplina Statistic Aplicat.

Descrierea cursuluiCursul presupune dezvoltarea unor abiliti de utilizare a tehnicilor statististice n analizarea unor fenomene economice. Obiectivele cursului sunt: dobndirea de cunotine i aptitudini ntr-un domeniu cu o aplicabilitate deosebit de mare n economie: statistica aplicat; dezvoltarea abilitilor de studiu a unui fenomen economic cu ajutorul instrumentelor statistice; dezvoltarea abilitilor de comunicare n limbajul statisticii aplicate; dezvoltarea abilitilor de conexiune ntre disciplina Statistic aplicat i disciplinele de profil.

Organizarea temelor n cadrul cursuluiTemele abordate n cadrul acestui curs sunt structurate astfel nct s permit atingerea principalelor obiective prezentate n descrierea cursului. Parcurgerea coninutului disciplinei conduce la atingerea urmtoarelor obiectivelor mai sus menionate. Datorit dinamicii informaionale, n fiecare an sursele de informare se vor modifica n conformitate cu ultimele evoluii n domeniu i vor fi comunicate n timp util pe platforma https://portal.portalid.ubbcluj.ro. De asemenea, sursele

1

de informare vor fi disponibile i pe CD-ul care va conine materialele aferente acestui curs. O detaliere a temelor se gsete n calendarul cursului.

Formatul i tipul activitilor implicateLaboratorul este gndit ca unul interactiv; studenii pot s trimit comentariile cu privire la temele abordate i/sau pot s completeze informaiile furnizate cu noi informaii la care au acces. Studenii dispun de libertatea de a-i gestiona singuri modalitatea i timpul de parcurgere a cursului. Este, ns, recomandat parcurgerea succesiv a modulelor n ordinea indicat i ndeplinirea sarcinilor indicate n cadrul fiecrui modul. Studenii vor putea beneficia de consultaii att la sediul facultii, n cadrul orelor precizate anterior, precum i prin intermediul comunicrii prin e-mail.

Materialele i instrumentele necesare pentru cursAa cum artam ntr-un paragraf anterior, pe lng materialele puse la dispoziie pe CD i/ sau n form tiprit, studenii vor lucra mult cu informaiile disponibile (n mod gratuit) pe Internet, precum i cu studiile de caz i articolele puse la dispoziie de cadrul didactic. De asemenea, se vor folosi soft-uri specializate.

Calendarul cursuluin derularea acestei discipline sunt programate 4 ntlniri (fa n fa) cu studenii nscrii. n cadrul primei ntlniri se vor parcurge primele trei uniti; pentru a doua ntlnire este programat parcurgerea unitilor 4, 5, n urmtoarea ntlnire se vor parcurge unitile 6, 7, 8, 9 i 10, iar ultima ntlnire este destinat unitilor 11 i 12. Pentru ca aceste ntlniri s devin cu adevrat interactive i pentru a se putea focaliza pe aspectele importante dar i a detaliilor necesare, studenilor li se recomand s parcurg suportul de curs pus la dispoziie la nceputul semestrului; ulterior ntlnirii se recomand rezolvarea sarcinilor indicate.

Tematica cursurilor predate n cadrul acestei discipline cuprinde:1. Tematica cursului: Selecii statistice Selecia simpl. Selecia stratificat.Metoda clusterelor. Selecia sistematic. 2. Tematica cursului: Distribuii de selecie Distribuia de selecie a mediei. Distribuia de selecie a proporiei. 3. Tematica cursului: Distribuii de selecie Distribuia de selecie a diferenei a dou medii. Distribuia de selecie a diferenei a dou proporii.

2

4. Tematica cursului: Estimarea parametrilor Estimarea punctual aparametrilor. Estimarea parametrilor prin intervale de ncredere. Interval de ncredere pentru valoarea medie. Interval de ncredere pentru proporie. 5. Tematica cursului: Estimarea parametrilor Interval de ncredere pentru diferena a dou medii. Interval de ncredere pentru diferena a dou proporii. Interval de ncredere pentru valoarea median. 6. Tematica cursului: Verificarea ipotezelor statistice Verificarea ipotezelor asupra valorii medii i asupra proporiei. 7. Tematica cursului: Verificarea ipotezelor statistice Verificarea ipotezelor asupra diferenei valorilor medii. 8. Tematica cursului: Verificarea ipotezelor statistice Verificarea ipotezelor asupra diferenei proporiilor. 9. Tematica cursului: Verificarea ipotezelor statistice Teste de concordan 10. Tematica cursului: Analiza varianei ANOVA 11. Tematica cursului: Analiza legturilor dintre variabile Regresia liniar simpl. 12. Tematica cursului: Analiza legturilor dintre variabile Regresia liniar multipl. 13. Tematica cursului: Analiza legturilor dintre variabile Alte tipuri de regresie.

Politica de evaluare i notareEvaluarea se va face pe parcursul semestrului i la final prin: 1) realizarea unui raport reprezentnd 50% din nota final ; 2) examenul final reprezentnd 50% din nota final. Raportul final completat se va trimite prin e-mail pn cel trziu n ultima zi a semestrului. Examenul din sesiune cu o pondere de 50% din nota final, este considerat promovat dac s-a obinut minim nota 5 (cinci). Prin temele de control i proiectele pe care trebuie s le ntocmeasc, studenii vor dobndi competenele necesare pentru aplicarea cunotinelor dobndite la nivel practic. Rezultatele obinute la aceast disciplin se vor comunica pe parcurs, prin anunarea notelor pariale i la final prin anunarea notei finale. Aceast comunicare se poate realiza att fa n fa, ct i prin afiarea notelor pe platforma aflat la dispoziia studenilor la aceast form de nvmnt. Fiecare student poate solicita un feed-back suplimentar prin contactarea titularului de curs i/sau a tutorilor prin intermediul adresei de e-mail.

3

Elemente de deontologie academicPrezena la cursuri i seminarii nu este obligatorie. Prezentarea la examen nu este condiionat de un numr minim de prezene la curs sau la seminar. Tocmai de aceea se va da posibilitatea studenilor de a trimite sarcinile de lucru fie on-line fie prin pot pn la o dat ce se va anuna pe platform. Se consider plagiat orice lucrare care reproduce n proporie de minim 40% informaii din alte surse nespecificate. Constatarea plagiatului duce la anularea evalurii lucrrii respective, precum i la alte sanciuni prevzute n regulamentele studeneti; se poate ajunge pn la neprimirea studentului n sesiunea de examene programat. n cazul n care se utilizeaz frauda la examen, procesul de examinare va fi sistat imediat, iar lucrarea va fi anulat. Rezultatele procesului de examinare vor fi puse la dispoziia studenilor pe platforma dedicat acestora. Contestaiile trebuie s fie depuse n maxim 24 de ore de la afiarea rezultatelor; rspunsul la contestaii se va da n maxim 48 de ore.

Studenii cu dizabilitiMetodele de transmitere a informaiilor cu privire la aceast disciplin se pot adapta n funcie de tipul de dizabiliti ntlnite n rndul cursanilor. Accesul egal la informaie i la activitile didactice pentru cursani se va asigura prin toate msurile (rezonabile) cu putin.

Strategii de studiu recomandateEste recomandat parcurgerea sistematic a modulelor (structurate pe cele 11 uniti de curs); se pune accentul pe pregtirea individual continu, prin acumulare constant a cunotinelor, precum i pe evalurile formative de pe parcursul semestrului. Numrul de ore necesare parcurgerii i nsuirii cunotinelor necesare promovrii acestei discipline este, n funcie de capacitile fiecruia, ntre 50 i 55 de ore. Documentarea i elaborarea proiectelor necesit un interval de 25-35 de ore. Aceste ore vor fi alocate, pe parcursul semestrului, de fiecare student, n funcie de preferinele individuale.

4

SUPORT DE CURS

5

Modulul I Distribuii de selecieUnitatea 1: Selecia simpl. Selecia stratificat. Metoda clusterelor. Selecia sistematic. Unitatea 2: Distribuia de selecie a mediei. Distribuia de selecie a proporiei. Unitatea 3: Distribuia de selecie a diferenei a dou medii. Distribuia de selecie a diferenei a dou proporii.

Scop i obiectiveScop Acest modul urmrete s familiarizeze studenii diferitele modaliti de construire a eantioanelor, prezentndu-se cteva modaliti de selecie a elementelor dintr-o populaie statistic. Pe lng acest scop, un altul este acela de a introduce noiunea de distribuie de selecie a diferiilor parametrii cu care studenii au fost familiarizai n semestru II. Obiective specifice urmrite Deprinderea diferitelor tipuri de selecie statistic i nelegerea particularitilor acestora; Inelegerea conceptului de distribuie de selecie; Deprinderea relaiilor ntre parametrii distribuiilor de selecie i cei calculai la nivel de populaie ; Deprinderea modalitilor de determinare a formei distribuiei de selecie. Concepte de baz Eantion; selecie simpl; distribuii de selecie.

6

Unitatea 1 Selecii statistice1.1. Introduceren semestrul II al anului I ne-am ocupat cu prezentarea elementelor legate de statistica descriptiv. Statistica descriptiv este acea parte a statisticii ce folosete metode tabelare, grafice i numerice n vederea organizrii i prezentrii datelor. Am vzut aadar cum se organizeaz datele sub form de serie statistic, cum se reprezint acestea grafic precum i cum anume se calculeaz anumii parametrii cum ar fi parametrii tendinei centrale, parametrii de structur sau parametrii variaiei. S-au definitit conceptele de populaie i eantion ca fiind dou dintre cele mai importante concepte ale studiilor statistice. Populaia statistic este un ansamblu de elemente (uniti) considerate ntr-un studiu iar eantionul este un subansamblu al unei populaii. De cele mai multe ori n practic studierea comportamentului unei ntregi populaii n raport cu una sau mai multe variabile ori nu este posibil ori nu este raional implicnd cel mai adesea costuri prea ridicate. Tocmai de aceea cercetarea ce se dorete a fi efectuat se va rezuma doar la un eantion extras prin metode specifice din populaia considerat. Studiind eantioanele extrase din diferite populaii ajungem la o alt parte deosebit de important a statisticii i anume statistica inferenial. Din punct de vedere al etimologiei, cuvntul inferen provine din limba francez inference i nseamn o operaie logic de derivare a unui enun din altul, prin care se admite o judecat (al crei adevr nu este verificat direct) n virtutea unei legturi a ei cu alte judeci considerate ca fiind adevrate. Adaptnd aceast definiie a cuvntului inferen vom spune c statistica inferenial ce este acea parte a statisticii care folosete informaiile obinute pe un eantion n testarea unor ipoteze asupra populaiei. Aadar, scopul statisticii infereniale este acela de a face inferene relativ la o populaie pornind de la informaiile coninute de un eantion. Studiul inferenelor statistice presupune tratarea a dou mari probleme i anume: 1. estimarea parametrilor necunoscui ai populaiei din care a fost extras eantionul; 2. verificarea ipotezelor statistice asupra valorilor parametrilor populaiei. Pentru a face ct mai clar problematica studiului inferenelor statistice s considerm urmtorul exemplu: Exemplul 1.1.1. Un productor de lmpi de iluminat dorete s scoat pe pia un nou tip de bec la care consumul de energie este foarte mic. nainte de lansare productorul dorete s afle informaii despre durata medie de funcionare a unui asemenea bec. Cum testarea ntregii producii de becuri este practic imposibil productorul va culege informaii pe baza unui eantion de becuri care sunt folosite nentrerupt pn la 7

ardere. Rezultatele obinute n baza acestui experiment vor putea fi apoi folosite n estimarea duratei medii de via a noului tip de bec. Spre exemplu productorul selecteaz un eantion de 100 de becuri. Testul a condus la o medie de funcionare a noului tip de bec de 240 zile. De aici rezult o estimare a duratei medii de funcionare a noului tip de bec i anume 240 zile. Este clar c rezultatele obinute la nivel de eantion furnizeaz doar estimri ale valorilor la nivel de populaie. Apare astfel ntrebarea ct de bune sunt aceste estimri?

1.2. Selecii statisticeConsiderm o populaie statistic de volum N. Din aceast populaie pot fi extrase un umr mare de eantioane. O modalitate de extragere a unui eantion de volum n< N este aceea de a selecta din elementele populaiei n elemente, acest procedeu fiind cunoscut sub numele de selecie statistic. Una dintre cele mai simple modaliti de formare a eantioanelor cu ajutorul elementelor unei populaii este selecia simpl.

1.2.1. Selecia simplO prim problem care imprim seleciei simple anumite particulariti este tipul populaiei din care sunt selectate elementele. Astfel apar dou tipuri de selecii simple i anume: selecia simpl dintr-o populaie finit; selecia simpl dintr-o populaie infinit. Selecia simpl dintr-o populaie finit Selecia dintr-o populaie finit presupune c orice eantion de volum n poate fi extras cu aceeai probabilitate. Selecia dintr-o populaie finit poate fi fcut n dou moduri i anume: cu repetare; fr repetare. Selecia simpl repetat presupune faptul c odat ce un element a fost extras din populaia originar el este apoi reintrodus n colectivitate astfel c el poate fi selectat din nou. Selecia simpl repetat are urmtoarele caracteristici: volumul populaiei rmne acelai pe tot parcursul selectrii unitilor ce vor forma eantioanele; la fiecare extragere orice element are aceeai probabilitate de a fi selecionat; acelai element al colectivitii poate fi extras de mai multe ori, ceea ce influeneaz negativ precizia rezultatului seleciei; numrul eantioanelor de volum n ce pot fi extrase prin selecie simpl repetat dintr-o populaie de volum N este Nn. Selecia simpl nerepetat presupune faptul c odat ce un element a fost extras din populaia originar el nu mai este reintrodus n colectivitate. 8

Selecia simpl nerepetat are urmtoarele caracteristici: volumul populaiei scade consecutiv cu cte o unitate pe msura ce se extrag elemente pentru formarea eantionului, astfel c la sfritul procesului de eantionare volumul populaiei va fi N-n; scderea continu a volumului populaiei face ca elementele ce particip la urmtoarea extragere s aib o probabilitate din ce n ce mai mare de a fi selectate; acelai element nu poate fi inclus de mai multe ori ntr-un eantion, ceea ce conduce la erori de reprezentativitate mai mici dect n cazul seleciei simple repetate; numrul eantioanelor de volum n ce pot fi extrase prin selecie n simpl nerepetat dintr-o populaie de volum N este C N . Exemplul 1.2.1. O populaie originar este format din ase firme, fiecare avnd o cifr de afaceri anual de 10, 12, 15, 18, 20, 25 mii RON. Folosind selecia simpl repetat i cea nerepetat vom forma toate eantioanele de volum n=2. Eantioanele selectate cu ajutorul seleciei simple repetate vor fi: (10,10) (10,12) (10,15) (10,18) (10,20) (10,25) (12,10) (12,12) (12,15) (12,18) (12,20) (12,25) (15,10) (15,12) (15,15) (15,18) (15,20) (15,25) (18,10) (18,12) (18,15) (18,18) (18,20) (18,25) (20,10) (20,12) (20,15) (20,18) (20,20) (20,25) (25,10) (25,12) (25,15) (25,18) (25,20) (25,25)

Observm c toate caracteristicile seleciei repetate sunt respectate adic: volumul populaiei rmne acelai pe tot parcursul seleciei i anume 6; la fiecare extragere orice element are aceeai probabilitate de a fi selecionat i anume

1 ; 6

numrul eantioanelor de volum n ce pot fi extrase prin selecie simpl repetat dintr-o populaie de volum N este Nn=62=36. Eantioanele formate cu ajutorul seleciei simple nerepetate vor fi: (10,12) (10,15) (10,18) (10,20) (10,25) (12,15) (12,18) (12,20) (12,25) (15,18) (15,20) (15,25) (18,20) (18,25) (20,25)

i n acest caz toate caracteristicile seleciei nerepetate sunt respectate: volumul populaiei scade consecutiv cu cte o unitate pe msura ce se extrag elemente pentru formarea eantionului;

9

scderea continu a volumului populaiei face ca elementele ce particip la urmtoarea extragere s aib o probabilitate din ce n ce mai mare de a fi selectate; acelai element nu poate fi inclus de mai multe ori ntr-un eantion, ceea ce conduce la erori de reprezentativitate mai mici dect n cazul seleciei simple repetate. numrul eantioanelor de volum n ce pot fi extrase prin selecie simpl nerepetat dintr-o populaie de volum N este 2 n C N = C6 =15. Selecia simpl dintr-o populaie infinit Cele mai multe cazuri n economie n care apare nevoia eantionrii implic o populaie originar finit. Totui exist cazuri n care populaia originar este fie infinit fie att de mare nct va fi presupus infinit. n selecia fcut dintr-o populaie infinit trebuie ndeplinite urmtoarele condiii: fiecare element selectat provine din aceeai populaie; fiecare element selectat este independent de celelalte. Exemplul 1.2.2. Managerii unui supermarket urmresc valoarea cumprturilor fcute ntr-o anumit zi de ctre clieni. Aadar populaia supus studiului este format din clienii supermarketului populaie ce evident, netiindu-se volumul su, poate fi considerat infinit. Din aceast populaie se va extrage un eantion de un anumit volum. Este evident c fiecare element selectat provine din aceeai populaie i anume clienii supermarketului. Pe de alt parte este la fel de evident c elementele selectate sunt independente. n concluzie se observ c n acest exemplu caracteristicile seleciei dintr-o populaie infinit sunt respectate.

1.2.2. Selecia stratificatSelecia stratificat se aplic n special atunci cnd populaia nu este omogen. innd cont de aceast caracteristic a populaiei, selecia simpl ar conduce la eantioane nereprezentative. n selecia stratificat se mparte mai nti populaia n grupe de elemente, grupe ce se vor numi straturi. O caracteristic a acestor straturi este c un element al populaiei poate aparine doar unui singur strat. Spre exemplu dac am considera o companie ce are 10 departamente atunci fiecare departament poate constitui un strat. n constituirea stratului trebuie avut n vederea ca acestea s fie ct de ct omogene. Dup stabilirea straturilor folosind selecia simpl, din fiecare strat se vor extrage elemente pn la constituirea eantionului. Apar urmtoarea ntrebare: Cum se stabilete numrul de uniti ce vor fi extrase din fiecare strat? Presupunem c avem o populaie de volum N. Elementele populaiei vor fi mprite pe r straturi de volume Ni, i= 1, r . Din fiecare strat se vor extrage ni elemente, una dintre metodele stabilirii lui ni fiind metoda proporiilor: 10

ni n n = ni= N i . Ni N N

Exemplul 1.2.3. O companie ce deine patru departamente are 1000 de angajai mprii astfel: N1=200, N2=250, N3=400, N4=150. S se extrag un eantion de volum 100. Soluie n acest caz avem N=1000, n=100. Astfel obinem: 1 ni= Ni 10 Folosind aceast relaie obinem: n1=20, n2=25, n3=40, n4=15.

1.2.3. Metoda clusterelorMetoda clusterelor se aplic n special n cazul sondrii unei populaii care este aezat pe o arie extins iar ntre diferitele zone exist diferene importante. Metoda clusterelor const n mprirea teritoriului n zone geografice (clustere) iar dup stabilirea unor cote, selectarea aleatoare a elementelor din aceste zone. Metoda poate fi combinat i cu selecia stratificat ce poate fi aplicat n interiorul clusterelor. Aceast metod furnizeaz cele mai bune rezultate atunci cnd elementele coninute n clustere sunt eterogene. n cazul ideal fiecare cluster este o reprezentare la scar mai mic a populaiei originare.

1.2.4. Selecia sistematicSelecia sistematic se aplic n cazul unei populaii de volum mare. S presupunem c dorim studierea unei populaii de volum N=10000 i dorim extragerea unui eantion de volum n=50. Folosind selecia sistematic vom proceda la extragerea unui element iar apoi vom extrage tot al 200-lea element pn la constituirea eantionului. Astfel eantionul va fi format din elementele: 1, 200, 400, 600,..., 9800, 10000. De cele mai multe ori se consider c selecia sistematic are aceleai caracteristici ca i selecia simpl.

11

Unitatea 2 Distribuii de selecie IAa cum spuneam puin mai devreme dintr-o populaie originar de volum N pot fi extrase un numr mare de eantioane de diferite volume. Calculnd valorile unui anumit parametru pentru fiecare eantion vom obine valori diferite ale acestuia pentru fiecare eantion. Toate valorile posibile ale parametrului respectiv vor forma distribuia de selecie a parametrului. Trei lucruri ne vor interesa n ceea ce privete o distribuie de selecie i anume: 1. definiia; 2. parametrii distribuiei de selecie; 3. forma distribuiei de selecie.

2.1. Distribuia de selecie a medieiDefiniia

Distribuia de selecie a mediei este distribuia de probabilitate a tuturor valorilor posibile ale mediei de eantion x .Exemplul 2.1.1. Relativ la eantioanele extrase n exemplul 1.2.1. vom obine urmtoarele distribuii de selecie a mediei (se calculeaz valoarea medie pentru fiecare eantion obinut): cazul seleciei repetate 11 12 13,5 15 16 18,5 12,5 13,5 15 16,5 17,5 20 14 15 16,5 18 19 21,5 15 16 17,5 19 20 22,5 17,5 18,5 20 21,5 22,5 25

10 11 12,5 14 15 17,5

Distribuia de selecie a mediei n acest caz va fi: Media de eantion 10 11 12 12,5 13,5 14 15 16 16,5 Frecvena 1 2 1 2 2 2 5 2 2 12 Probabilitatea de apariie 1/36 2/36 1/36 2/36 2/36 2/36 5/36 2/36 2/36

17,5 18 18,5 19 20 21,5 22,5 25 cazul seleciei nerepetate 11 12,5 14 15 17,5 13,5 15 16 18,5

4 1 2 2 3 2 2 1

4/36 1/36 2/36 2/36 3/36 2/36 2/36 1/36

16,5 17,5 20

19 21,5

22,5

Distribuia de selecie a mediei n acest caz va fi: Media de eantion 11 12,5 13,5 14 15 16 16,5 17,5 18,5 19 20 21,5 22,5 Frecvena 1 1 1 1 2 1 1 2 1 1 1 1 1 Probabilitatea de apariie 1/15 1/15 1/15 1/15 2/15 1/15 1/15 2/15 1/15 1/15 1/15 1/15 1/15

Parametrii distribuiei de selecie Media distribuiei de selecie x Media distribuiei de selecie este valoarea medie a tuturor mediilor de eantion. S calculm valoarea medie n cazul distribuiilor de selecie obinute n exemplul 2.1.1. cazul seleciei simple repetate

x =

10 1 + 11 2 + ... + 22 ,5 2 + 25 1 =16,66 mld. ROL 36

13

n cazul seleciei nerepetate vom avea:

x =

11 1 + 12 ,5 1 + ... + 21,5 1 + 22 ,5 1 =16,66 mii RON. 15

S calculm acum valoarea medie a populaiei:

=

10 + 12 + 15 + 18 + 20 + 25 =16,66 mii RON. 6

Observm aadar c indiferent de tipul de selecie utilizat media distribuiei de selecie este egal cu media populaiei adic x =.2 Dispersia distribuiei de selecie x

Dispersia distribuiei de selecie este dispersia mediilor de eantion. S calculm valoarea dispersiei n cazul distribuiilor de selecie obinute n exemplul 1.2.1. cazul seleciei simple repetate vom avea: (10 16 ,66 )2 1 + (11 16 ,66 )2 2 + ... + (22 ,5 16 ,66 )2 2 + (25 16 ,66 )2 1 = 2 x = 36 =12,61.

2 x =

(11 16 ,66 )2 1 + (12 ,5 16 ,66 )2 1 + ... + (22 ,5 16 ,66 )2 1 =10,088.15

cazul seleciei nerepetate vom avea:

S calculm acum dispersia populaiei: (10 16 ,66 )2 + ... + (25 16 ,66 )2 =25,22. 2 x = 6 Observm c proprietatea existent n cazul mediilor nu se mai menine i n cazul dispersiilor. Cu alte cuvinte dispersia calculat n cazul populaiei nu mai este egal cu dispersia distribuiei de selecie n nici una dintre cele dou tipuri de selecie. Acest lucru se datoreaz tocmai modalitii de selectare a elementelor eantioanelor adic se datoreaz tocmai modalitilor de eantionare. Pornind de aici, n continuare pentru a msura variaia n cazul unei distribuii de selecie nu vom folosi abaterea medie ptratic ci aa numita eroare standard a mediei (ERS). Mai nti vom vedea care este legtura dintre dispersia la nivel de populaie i dispersia la nivel de eantion n fiecare din cele dou tipuri de selecii prezentate mai sus.

Selecia simpl repetat2 x =12,61= 2 25 ,22 x = . 2 n

14

Observm c n cazul seleciei simple repetate valoarea dispersie distribuiei de selecie este egal cu dispersia populaiei mprit la volumul eantionului (n=2), aadar:2 x = 2 x

n

.

Selecia simpl nerepetat2 x =10,088= 2 25 ,22 4 x N n = . 2 5 n N 1

Observm c n cazul seleciei simple nerepetate apare un nou factor i anume numit factor de corecie astfel c n acest caz vom obine: 2 x N n 2 x = n N 1 Aadar eroarea standard a mediei ERS se va calcula astfel:

N n N 1

Populaie infinit: ERS = x = Populaie finit: ERS= = x =

xnn

;

x

N n . N 1

Observaie n cazul n care volumul populaiei este mare iar selecia este nerepetat atunci factorul de corecie poate fi neglijat. Pentru a avea o idee asupra situaiilor n care putem neglija factorul de corecie, vom spune c acesta poate fi neglijat atunci cnd volumul eantionului n este mai mic dect 5% din volumul populaiei N, adic n< 0,05N. Forma distribuiei de selecie a medieiEste clar c una sau alta dintre tipurile de selecie simpl conduce la anumite erori numite erori de eantionare generate de diferena dintre media de eantion i media populaiei x (abatere). Acestea pot s apar sau nu cu o anumit probabilitate. Astfel apare urmtoarea ntrebare: Cum poate fi msurat probabilitatea de eroare ce apare ca rezultat al eantionrii? Rspunsul este dat de studiul relaiilor dintre distribuia de selecie i populaia originar nu n termenii statisticii descriptive ci n termenii distribuiilor de probabilitate. Astfel apare o problem deosebit de interesant i n acelai timp important i anume cea a formei distribuiei de selecie a mediei. Aceast problem trebuie discutat n dou cazuri i anume: cnd nu se cunoate forma distribuiei populaiei originare i cazul n care distribuia populaiei originare este normal. n primul caz forma distribuiei mediei de selecie se determin ca o consecin a teoremei limite centrale i anume:

15

n cazul n care nu se cunoate forma distribuiei populaiei, distribuia de selecie a mediei poate fi aproximat cu o distribuie normal, ori de cte ori volumul de selecie este mare (n 30). Cu alte cuvinte, distribuia de selecie poate fi considerat normal indiferent de populaia originar, dac volumul de selecie este destul de mare.n cel de al doilea caz avem urmtorul rezultat:

n cazul n care distribuia populaiei originare este normal atunci distribuia de selecie a mediei este de asemenea normal.Pentru clarificarea noiunilor discutate pn aici vom da n continuare cteva exemple:

Exemplul 2.1.2. Dou sute de firme au un profit mediu de 3 mii RON cu o abatere medie ptratic de 1 mld. ROL i o distribuie normal. S se determine probabilitatea ca un eantion de 100 de firme s aib un profit mediu: 1. cuprins ntre 290 i 310 mii RON; 2. mai mare de 320 mii RON. Soluie 1. Observm c populaia urmeaz legea de distribuie normal. Aadar orice eantion ce va fi extras din populaia originar va urma legea normal ceea ce nseamn c forma distribuiei de selecie a mediei va fi normal. Acest lucru nseamn c x N( x , x ) de unde obinem c variabila

z=

x x

x

N(0,1). Dar cum x = obinem c z=

x

x

N(0,1) (vezi Capitolul 9).

Trebuie determinat urmtoarea probabilitate:

310 290 = P x > 3 ,2 100 Dac x =2,9 atunci z=

(

)

(

)

16

3 ,2 3 = 2,86. 0 ,07 Vom avea P x > 3 ,2 = P ( z > 2 ,86 ) =0,5 P(0 < z < 2 ,86 ) = 0,5 0,4979= 0,0021.Dac x =3,2 atunci z=

(

)

2.2. Distribuia de selecie a proporiein multe situaii ce intervin n practica economic, variabila n raport cu care este studiat populaia exprim o caracteristic pe care o posed anumite elemente ale populaiei. Spre exemplu relativ la angajaii unei firme o caracteristic poate fi reprezentat de nivelul de calificare. Vom fi interesai n acest caz de proporia angajailor care posed un anumit nivel de calificare. Presupunem c dintr-o populaie originar se extrage un eantion de volum n, iar din cele n elemente, k posed o anumit caracteristic. n acest caz proporia la nivel de eantion ca fi:

p=

k . n

Exemplul 2.2.1. La ieirea din secia de votare 150 persoane au fost chestionate n legtur cu candidatul pentru care au votat. Din cele 150 de persoane 45 au afirmat c au votat cu candidatul X. n acest caz proporia la nivel de eantion a celor care au votat cu X va fi:

p=Definiia

45 = 0 ,3 (30%). 150

Distribuia de selecie a proporiei este distribuia de probabilitate a tuturor valorilor posibile ale proporiei de eantion p .Parametrii Media distribuiei de selecie p :

p = p,unde p este proporia la nivel de populaie.

Dispersia distribuiei de selecie 2 p

p( 1 p ) n cazul populaiei infinite; n p( 1 p ) N n 2= n cazul populaiei finite. p n N 1

2= p

17

Eroarea standard a proporiei

p= p=

p( 1 p ) n cazul populaiei infinite; n p( 1 p ) N n n cazul populaiei finite. n N 1

Forma distribuiei de selecie a proporiei Distribuia de selecie a proporiei poate fi aproximat cu o distribuie normal ori de cte ori np 5 i n(1-p) 5. Exemplul 2.2.2. Un eantion de volum n=400 este selectat dintr-o populaie n care p=0,2. S se determine media distribuiei de selecie a proporiei, eroarea standard a proporiei precum i forma distribuiei de selecie a proporiei. Care este probabilitatea ca proporia la nivel de eantion s se abat de la proporia populaiei cu 0,025? Soluie:

p = p= 0,2.

Deoarece nu cunoatem volumul populaiei putem presupune c aceasta este infinit. n consecin n calculul erorii standard a proporiei nu trebuie introdus factorul de corecie. Astfel vom obine:

p=

p( 1 p ) 0 ,2 0 ,6 = =0,02. n 400

Pentru a determina forma distribuiei vom calcula cele dou produse: np = 4000,2 =80 5 n(1-p) = 4000,8 = 320 5. n consecin distribuia de selecie a proporiei poate fi aproximat cu distribuia normal. Deoarece distribuia de selecie a proporie urmeaz legea normal adic

p N( p , p ), obinem c variabila z=z=

p p

p

N(0,1). Cum p =p obinem c

p p

p

N(0,1).

Trebuie determinat probabilitatea: P 0 ,025 < p p < 0 ,025 .

(

)

0 ,025 = - 1,25. 0 ,02 0 ,025 Dac p p = -0,025 atunci z= = 1,25. 0 ,02 Vom avea P 0 ,025 < p p < 0 ,025 =P ( 1,25 < z < 1,25 ) =0,7888.Dac p p = -0,025 atunci z=

(

)

18

Unitatea 3 Distribuii de selecie 23.1. Distribuia de selecie a diferenei a dou valori mediiDe multe ori n practica economic intervine problema comparrii unor grupuri extrase din aceeai populaie sau din populaii diferite. Spre exemplu se dorete compararea performanelor muncitorilor din dou secii diferite ale aceleai fabrici sau se dorete compararea performanelor unui nou model de automobil cu performanele modelelor anterioare. n acest caz din punct de vedere statistic se vor compara valorile medii ale populaiilor din care provin cele dou eantioane. Considerm dou populaii originare studiate n raport cu o anumit variabil. 2 2 Fie 1 i 2 valorile medii ale celor dou populaii iar 1 respectiv 2 dispersiile celor dou populaii. Scopul nostru este acela de a estima diferena 1 - 2. Pentru aceasta din fiecare populaie extragem cte un eantion de volum n1 respectiv n2. Presupunem c mediile de eantion sunt x1 respectiv x2 . n cele ce urmeaz introducem noiunea de distribuie de selecie a diferenei mediilor:

Definiie

Numim distribuia de selecie a diferenei mediilor, distribuia de probabilitate a diferenelor tuturor perechilor posibile de medii de eantion.Parametrii Media distribuiei de selecie: x x =1 - 2;1 2

Eroarea standard a diferenei mediilor: x x =1 2

12n1

+

2 2

n2

.

Forma distribuiei1. Dac populaiile din care sunt extrase eantioanele sunt normal distribuite atunci distribuia de selecie a diferenei mediilor este normal. 2. Dac n1 30, n2 30, atunci distribuia de selecie a diferenei mediilor poate fi aproximat cu o distribuie normal.

19

3.2. Distribuia de selecie a diferenei a dou proporiin foarte multe aplicaii statistice un interes deosebit l reprezint compararea a dou proporii. Considerm c din dou populaii s-au extras dou eantioane de volume n1 i respectiv n2. Presupunem totodat c proporiile la nivel de populaii sunt p1 respectiv p2. Fie p1 respectiv p 2 proporiile la nivel de eantion: n ceea ce privete distribuia de selecie a diferenei a dou proporii avem urmtoarele:

Parametrii Media distribuiei de selecie: p1 p2

=p1 p2;1 p2

Eroarea standard a diferenei proporiilor: p Forma distribuiei

=

p1 (1 p1 ) p 2 (1 p 2 ) . + n1 n2

n cazul n care n1p15, n1(1-p1)5, n2p25, n2(1-p2)5 atunci distribuia de selecie a diferenei a dou proporii poate fi aproximat cu distribuia normal.

Verificarea cunotinelor1. Fie Z o variabil aleatoare ce urmeaz legea normal standard. Calculai: 1. P(0 Z 0,35); 2. P(-1,24 Z 0); 3. P(Z< 2,35); 4. P(Z -0,47); 5. P(|Z| 0,17). 2. Determinai valoarea zo variabilei aleatoare Z care urmeaz legea normal standard, tiind c: 1. aria poriunii mrginit de graficul distribuiei normale, 0 i zo este 0,1544. 2. aria poriunii mrginit de graficul distribuiei normale, aflat la dreapta lui zo, este 0,2335. 3. Fie X o variabil aleatoare ce urmeaz legea normal cu =100, =20. Calculai: 1. P(90 X 120); 2. P(X 150); 3. P(X< 50). 4. O populaie normal distribuit are =100 i =25. Se extrage un eantion de volum n=50. Se cere: 1. media distribuiei de selecie; 2. eroarea standard a mediei; 3. forma distribuiei de selecie a mediei; 4. probabilitatea ca media de eantion s se abat de la media

20

populaiei cu 5. 5. probabilitatea ca abaterea mediei de eantion de la media populaiei s fie: a. cel mult 2; b. cel puin 3. 5. Greutile sacilor de fin dintr-o moar sunt normal distribuite cu o medie de 120 kg. i o abatere medie de 2 kg. Dac se iau la ntmplare 5 saci care este probabilitatea ca: 1. greutatea total s fie de cel mult 400 kg.; 2. greutatea medie s fie de cel puin 103 kg. 6. Se consider o populaie originar de volum N=5000. Din aceast populaie se extrage un eantion de volum n=50. 1. trebuie folosit n acest caz factorul de corecie pentru calcularea erori standard a mediei? 2. dac =10, calculai eroarea standard a mediei n ambele cazuri; 3. care este probabilitatea ca abaterea mediei de eantion de la media populaiei s fie cuprins ntre 5? 7. Pentru a estima durata medie de via a celor 2000 de baterii produse zilnic de o companie se extarge un eantion de 200 de baterii. 1. care este forma distribuiei de selecie? 2. dac abaterea medie ptratic timpului de funcionare a bateriilor este =2 zile determinai eroarea standard a mediei; 3. determinai probabilitatea ca media de eantion s se abat de la timpul mediu de funcionare cu 2 zile. 8. Preul mediu unui automobil marca X este 25.000 euro cu o abatere medie de 5000 euro. Se consider un eantion de de n=100 de automobile. Determinai probabilitatea ca media de eantion s se abat de la preul mediu cu 1000 euro respectiv 500 euro. 9. 200 de firme au o cifr de afaceri medie de 2 mil. RON cu o abatere medie de 0,5 mil. RON. Care este probabilitatea ca un eantion de 50 de firme s aib cifra de afaceri total cuprins ntre 90 i 100 mil. RON? 10. Un motor electric are durata medie de via de 3 ani cu o abatere medie de 0,5 ani. Care este probabilitatea ca un eantion de 40 de motoare electrice s aib durata medie de via mai mare de 4 ani? 11. Folosind selecia simpl, dintr-o populaie n care p=0,28, se extrage un eantion de volum n=200. Determinai media distribuiei de selecie a proporiei, eroarea standard a proporiei precum i forma distribuiei de selecie a proporiei. 12. Un eantion de volum n=200, este extras dintr-o populaie n care p=0,7. Care este probabilitatea ca proporia la nivel de eantion s se abat de la proporia populaiei cu 0,09.

21

Modulul II Estimarea parametrilorUnitatea 4: Estimarea parametrilor I Unitatea 5: Estimarea parametrilor II

Scop i obiectiveScop Acest modul are ca scop creare de abiliti n calcularea i estimarea parametrilor unei populaii pornind de la datele obinute la nivel de eantion Obiective specifice urmrite

Deprinderea modalitilor de determinare a parametrilor repartiiilor unidimensionale. nelegerea conceptelor de estimare i estimator n contextul inferenelor statistice. nelegerea noiunilor de estimator punctual i interval de ncredere. Deprinderea modalitilor de determinare a intervalelor de ncredere. Deprinderea modalitilor de determinare a volumului unui eantion. Deprinderea modalitilor de lucru cu mai multe eantioane. Eantioane independente, eantioane perechi.Concepte de baz Estimator punctual; interval de ncredere; nivel de semnificaie; nivel de ncredere.

22

Unitatea 4 Estimarea parametrilor I4.1. IntroducereAa cum am vzut n Unitatea 1, statistica inferenial este acea parte a statisticii n care pornind de la informaiile furnizate de eantion se ncearc realizarea unor inferene la nivel de populaie. Una dintre marile probleme tratate prin intermediul inferenelor statistice este cea a estimrii parametrilor necunoscui ai populaiei din care a fost extras eantionul. Cu alte cuvinte pornind de la valorile parametrilor calculai la nivel de eantion se ncearc estimarea parametrilor corespunztori la nivel de populaie. n general sunt folosite dou tipuri de estimare a parametrilor populaiei i anume: 1. estimarea punctual a parametrilor; 2. estimarea parametrilor prin intervale de ncredere.

4.2. Estimarea punctual a parametrilorn acest tip de estimare valorile parametrilor calculai la nivel de eantion sunt folosite pentru a estima parametrii corespunztori ai populaiei originare. S presupunem c dintr-o populaie originar s-a extras un eantion de un anumit volum. Fie un parametru al populaiei (necunoscut) i fie corespondentul su la nivel de eantion (cunoscut).

se numete:

1. estimator nedeplasat al lui dac =;

3. estimator consistent al lui dac valorile sale tind spre pe msur ce volumul eantionului crete.

2. estimator eficient dac eroarea standard a parametrului este minim, adic este minim;

Observaie 1. Un estimator nedeplasat este n acelai timp i un estimator consistent. 2. este un bun estimator punctual pentru dac posed toate cele trei caracteristici de mai sus.

n cele ce urmeaz vom puncta pe scurt estimatori punctuali ai principalilor parametrii.Exemplul 4.2.1. Datele urmtoare corespund unui eantion de 8 angajai ai unei companii studiai n raport cu salariul lunar exprimat n mii RON. 6, 8, 10, 7, 10, 12, 14, 5. Pe de alt parte se tie c 2 din cei 8 angajai au urmat un curs de calificare.

23

S se estimeze punctual: 1. media populaiei; 2. abaterea medie ptratic a populaiei; 3. eroarea standard a mediei; 4. proporia populaiei.

Soluie Estimatorul punctual al valorii medii a populaiei este media de eantion

x=

xi .n

Aceast afirmaie se bazeaz pe relaiile cunoscute n cazul parametrilor distribuiei de selecie a mediei i anume: x =

x =x =x=

xx

nn

n cazul populaiei infinite;

N n n cazul populaiei finite. N 1

Conform celor de mai sus, calculnd media de eantion obinem:

xi = 6 + 8 + 10 + 7 + 10 + 12 + 14 + 5 = 72 =9.n 8 8

Aadar putem estima c salarul mediu lunar al angajailor companiei este de 9000 RON.2 Estimatorul punctual al dispersiei populaiei x este dispersia de eantion

s

2 x

(xi x ) =n 1

2

.

Estimatorul punctual al abaterii medii ptratice a populaiei x este abaterea medie ptratic de eantion2 sx= s x .

Vom calcula dispersia la nivel de eantion:

s

2 x

(xi x ) =n 12 x

2

(6 9 )2 + ... + (5 9 )2 = 66 =9,43. =7 7

sx= s = 9 ,43 =3,011.Estimm c salariile angajailor companiei se abat n medie de la salariul mediu cu 3011 RON.

Estimatorul punctual al erorii standard a mediei x este s x unde:

24

sx =sx =

sx nsx n

n cazul populaiei infinite;

N n n cazul populaiei finite. N 1 sx n=

Calculnd eroarea standard a medie vom obine: s x =

3 ,07 = 1,08. 8

Estimatorul punctual al proporiei populaiei p este proporia la nivel de eantion p.Aceast afirmaie se bazeaz pe relaiile cunoscute n cazul parametrilor distribuiei de selecie a proporiei i anume: p = p,

p= p=

p( 1 p ) n cazul seleciei repetate; n p( 1 p ) N n n cazul seleciei nerepetate. n N 12 8

Calculnd proporia la nivel de eantion vom obine: p = =0,25. Aadar estimm c

25% din angajaii companiei au urmat un curs de calificare.

4.3. Estimarea parametrilor prin intervale de ncredereEstimarea punctual a parametrilor furnizeaz rareori rezultate bune. Acest lucru se datoreaz n primul rnd erorilor de eantionare. Astfel c n cele mai multe cazuri valorile estimate punctual ale parametrilor populaiei sunt departe de cele reale. Tocmai de aceea se ncearc determinarea unor intervale pentru parametrul ce se vrea a fi estimat. Astfel problema care se pune este cea a determinrii pentru fiecare parametru a unui interval astfel nct cu o anumit probabilitate valoarea real a parametrului s se gseasc n interiorul intervalului.

Intervalul (1,2) se numete interval de ncredere pentru parametrul necunoscut dac P(1< < 2)= 1, unde (1) se numete coeficient (nivel) de ncredere iar se numete coeficient (nivel) de semnificaie.Observaie Dac este un estimator punctual al parametrului necunoscut atunci intervalul de ncredere pentru parametrul va avea forma: (eroarea de eantion)

25

Observaie Nivelul de ncredere 1 reprezint probabilitatea cu care valoarea parametrului la nivel de eantion va furniza o anumit valoarea a erorii de eantion.

4.3.1. Interval de ncredere pentru estimarea valorii medii Cunoatem faptul c media de eantion x este un estimator punctual al mediei populaiei . Astfel un interval de ncredere pentru valoarea medie a populaiei va fi de forma: x (eroarea de eantion) Problema care se pune acum este cea a determinrii erorii de eantion cu un coeficient (nivel) de ncredere de 1. Pentru aceasta va trebui s lum n considerare mai multe cazuri i anume:

Cazul eantioanelor de volum mare (n30)n acest caz eroarea de eantion sau marginea erorii se va calcula astfel: dac se cunoate dispersia populaiei 2 atunci eroarea de eantion va fi z 2 x ; dac nu se cunoate dispersia populaiei aceasta va fi nlocuit cu estimatorul su punctual s2 astfel c eroarea de eantion va fi z 2 s x .

Observaie Expresia z 2 x ( z 2 s x ) se mai numete i margine a erorii.n concluzie un interval de ncredere pentru valoarea medie cu un coeficient de ncredere de 1 va fi de urmtoarea form: Dac se cunoate dispersia populaiei atunci:

x z 2 xunde x =

(

)

n

sau x =

N n N 1 n

Dac nu se cunoate dispersia populaiei atunci:

x z 2 s xunde s x =

(

)

sx n

sau s x =

N n sx N 1 n

Observaie 1. Valoarea lui z 2 se citete din tabelul distribuiei normale innd cont derelaia:

P(0< z < z

2

)=

1 2

26

2. n general sunt folosite urmtoarele valori ale nivelului de ncredere:

Nivel de semnificaie Nivel de ncredere P(0< z < z ) z 2 2 1 0,1 0,90 0,45 1,65 0,05 0,95 0,475 1,96 0,01 0,99 0,495 2,58Exemplul 4.3.1. Pentru a estima costul mediu al cazrii/noapte ntr-o anumit staiune este studiat un eantion de 64 de turiti. Datele obinute au artat un cost mediu de 32 euro. 1. Presupunnd c abaterea medie ptratic la nivel de populaie este =2,4 euro determinai un interval de ncredere pentru valoarea medie cu un coeficient de ncredere de 0,95. 2. Presupunnd c nu se cunoate dispersia populaiei dar c eantionul a 2 furnizat o dispersie s x =4, determinai un interval de ncredere pentru valoarea medie cu un coeficient de ncredere de 0,95. Soluie 1. n primul caz abaterea medie ptratic a populaiei se cunoate, astfel c un interval de ncredere pentru valoarea medie a populaiei va fi de forma:

x z 2 x x = =

(

)

2 ,4 = 0,3; n 64 1 - = 0,95 z 2 =1,96.Marginea erorii va fi: z 2 x = 1,960,3=0,588. Astfel obinem:

(32-0,588; 32+0,588) (31,412; 32,588)

Aadar costul mediu al cazrii/noapte este cuprins ntre 31,412 i 32,588 euro. 2. n cel de al doilea caz nu cunoatem dispersia populaiei astfel c ea va fi 2 nlocuit cu estimatorul ei punctual s x =4. Astfel c un interval de ncredere pentru valoarea medie a populaiei va fi de forma:

x z 2 s xsx = sx =

(

)

2 =0,25; n 64 1 - = 0,95 z 2 =1,96.Marginea erorii va fi: z 2 x = 1,960,25=0,49. Astfel obinem:

(32-0,49; 32+0,49) (31,51; 32,49)

Aadar costul mediu al cazrii/noapte este cuprins ntre 31,51 i 32,49 euro.

27

Determinarea volumului eantionuluiAdesea se pune urmtoarea ntrebare: Ct de mare trebuie s fie eantionul extras pentru ca eroarea de eantion s aib o anumit limit impus?

z 2 z 2 x E n E ; 2 z 2 s x z 2 s x E n E (n cazul n care nu se cunoate dispersia populaiei).Exemplul 4.3.2. O populaie originar are abaterea medie ptratic =7,5. Ct de mare trebuie s fie un eantion extras din aceast populaie astfel nct cu un coeficient de ncredere de 0,95, marginea erorii s fie de cel mult 1,5 ? Soluie n acest caz avem E=1,5, z 2 =1,96, =7,5. Vom obine:

2

z 2 1,96 7 ,5 n E = 1,5 =96. Cazul eantioanelor de volum mic (n< 30)2

2

Aa cum am vzut n cazul anterior, dac se cunoate abaterea medie a populaiei () sau dac volumul eantionului extras este suficient de mare (n 30) atunci distribuia de selecie a mediei poate fi aproximat cu distribuia normal astfel c n calculul erorii de eantion se va folosi statistica z. Dac volumul eantionul extras din populaia studiat este mic nu vom putea presupune c distribuia de selecie poate fi aproximat cu cea normal. n acest caz statistica z se va nlocui cu statistica t =

x , statistic ce sx

urmeaz legea Student cu n-1 grade de libertate, unde n este volumul eantionului extras.

Observaie 1. Gradele de libertate indic numrul valorilor lsate s varieze libere n cadrul unui eantion de volum dat. Pe msur ce numrul gradelor de libertate crete, distribuia Student se apropie de distribuia normal. 2. Numrul gradelor de libertate pierdute este egal cu numrul parametrilor populaiei estimai ca baz n determinarea inferenelor statistice.n acest caz un interval de ncredere pentru valoarea medie cu un coeficient de ncredere de 1 va fi de forma:

(x t 2;(n1) gl s x )

28

unde s x =

sx n

sau s x =

N n sx N 1 n

Observaie Valorile lui t 2;(n 1) gl se citesc din tabelul distribuiei Student (Anexa 2). Spre exemplu pentru un eantion de volum n=13 i un nivel de semnificaie =0,05 i corespunde t0,025;12=2,179. Exemplul 4.3.3. S se determine un interval de ncredere pentru salarul mediu al angajailor companiei de la Exemplul 2.2.1. cu un nivel de ncredere de 0,95. Soluie Problema se ncadreaz n acest caz deoarece volumul eantionului este 8. Aadar un interval de ncredere pentru salarul mediu va avea forma: x t 2;(n1) gl s x .

(

)

sx =

sx n

=

3 ,07 = 1,08. 8

Cum coeficientul de ncredere este 0,95 vom obine = 1 0,95 = 0,05. Pe de alt parte cum volumul eantionului este 8, numrul gradelor de libertate va fi 8 1 = 11. Astfel n tabelul distribuiei Student vom cuta valoarea lui: t0,025;7=2,365. Marginea erorii va fi n acest caz: t0,025;7 s x = 2,3651,08=2,55. Astfel vom obine, cu un nivel de ncredere de 95%, c salariul mediu lunar al angajailor companiei se afl n intervalul: (9-2,55;9+2,55); (6,45; 11,55).

4.3.2. Interval de ncredere pentru estimarea proporiein general cnd se dorete estimarea proporiei dintr-o populaie se lucreaz cu eantioane de volum mare astfel c relaiile np5 respectiv n(1-p)5 sunt n general ndeplinite. n aceste condiii tim c distribuia de selecie a proporiei poate fi aproximat cu distribuia normal. Pe de alt parte estimatorul punctual al proporiei populaiei p este proporia la nivel de eantion p . Un interval de ncredere pentru estimarea proporiei populaiei cu un nivel de ncredere de 1 va fi de forma:

p p z 2 s punde s p =

(

p 1 p sau s p = n

(

)

)

N n N 1

p 1 p n

(

)

29

Exemplul 4.3.4. Se consider un eantion de 250 de persoane chestionate n legtur cu satisfacia oferit de locul de munc. Din cele 250 de persoane, 175 s-au declarat satisfcute de locul de munc deinut n prezent. Se cere: 1. estimai proporia populaiei ce se declar mulumit de locul de munc deinut; 2. Cu un nivel de ncredere de 90% determinai un interval de ncredere pentru proporia populaiei ce se declar mulumit de locul de munc. Soluie 1. Pentru a estima proporia populaiei ce se declar mulumit de locul de munc vom determina proporia la nivel de eantion:

p=

175 = 0,70. 250

Aadar estimm c 70% din populaie se declar mulumit de locul de munc deinut. 2. p p z 2 s p

(

p 1 p 0 ,70 0 ,30 = =0,0289. 250 n 1 - = 0,90 z 2 =1,65 sp =Marginea erorii va fi: z 2 s p = 1,650,0289=0,0476. Astfel vom obine c cu un nivel de ncredere de 90% proporia populaiei ce se declar mulumit de locul de munc deinut se afl n intervalul: p (0,70 0,0476;0,70+0,0476); p (0,6524; 0,7476).

(

)

)

Determinarea volumului eantionuluiDac se dorete determinarea mrimii unui eantion astfel nct proporia populaiei p s aib o anumit valoare cu o margine a erorii de cel mult E i cu un nivel de ncredere de 1 atunci:

n

2 z 2 p (1 p )

E2

.

Exemplul 4.3.5. Ct de mare trebuie s fie eantionul n cazul exemplului 2.3.4. pentru ca proporia populaiei s fie 0,85 cu o eroare de cel mult 3%. Soluie2 z 2 p (1 p )

n

E2

(1,65 )2 0 ,85(1 0 ,85 ) 386 persoane. = (0 ,03)2

Observaie Cnd nu avem nici o informaie asupra proporiei populaiei vom considera p=0,50.30

Unitatea 5 Estimarea parametrilor II5.1. Interval de ncredere pentru estimarea diferenei a dou valori mediiDe multe ori n practica economic intervine problema comparrii unor grupuri extrase din aceeai populaie sau din populaii diferite. Spre exemplu se dorete compararea performanelor muncitorilor din dou secii diferite ale aceleai fabrici sau se dorete compararea performanelor unui nou model de automobil cu performanele modelelor anterioare. n acest caz din punct de vedere statistic se vor compara valorile medii ale populaiilor din care provin cele dou eantioane. Problema diferenei valorilor medii trebuie discutat n dou cazuri distincte i anume: 1. eantioane independente; 2. eantioane perechi.

Cazul eantioanelor independenteS trecem acum la estimarea prin intervale de ncredere a diferenei valorilor medii. Ca i n cazul estimrii valorii medii i aici suntem nevoii s considerm dou cazuri mari i anume eantioane independente de volum mare i eantioane independente de volum mic.

o Eantioane independente de volum mare (n1 30, n2 30)n cazul eantioanelor independente de volum mare un interval de ncredere pentru diferena mediilor cu un nivele de ncredere de 1 va avea forma:

1 2 x1 x2 z 2 x x1

(

2

)

unde x x =1 2

12n1

+

2 2

n2

.

Dac nu se cunosc dispersiile populaiilor atunci acestea se nlocuiesc cu 2 2 estimatorii lor punctuali i anume dispersiile de eantion s 1 , s 2 , iar x x se1 2

nlocuiete cu estimatorul su punctual s x

1 x2

=

2 2 s1 s 2 + . n1 n 2

Astfel n acest caz intervalul va avea urmtoarea form: 1 2 x1 x2 z 2 s x x .

(

1

2

)

Exemplul 5.1.1. Se consider dou populaii originare studiate n raport cu aceeai variabil. Din prima populaie se extrage un eantion de volum n1=50 ce a furnizat o valoare medie x1 =15 cu o abatere medie s1=4. Din cea de a doua populaia s-a extras uneantion de volum n2=75 ce a furnizat o medie x2 =12 cu o abatere medie s2=3. Cu

31

un nivel de ncredere de 95% s se determine un interval de ncredere pentru diferena valorilor medii ale celor dou populaii.

Soluie Deoarece nu cunoatem dispersiile celor dou populaii vom folosii cea de a doua form a intervalului de ncredere i anume:

1 2 x1 x2 z 2 s x x1

(

2

)

2 2 s1 s 2 16 9 + + = =0,36. sx x = 1 2 n1 n2 50 75 1 - = 0,95 z 2 =1,96

z 2 s x x =1,960,36 =0,71 2

1-2(3-0,7;3+0,7) 1-2(2,3;3,7).

o Cazul eantioanelor de volum mic (n1< 30, n2< 30)Acest caz se mparte la rndul su n dou subcazuri i anume:2 2 Cazul populaiilor cu dispersii egale ( 1 = 2 = 2 )

Aceast situaie este des ntlnit mai ales n cazul proceselor de producie ndelungate n care pe baza experienelor trecute se tie c variaia n cadrul fiecrei populaii este aceeai. n acest caz dispersia populaiilor se va nlocui cu estimatorul su punctual s2 care se va calcula ca o medie ponderat a dispersiilor de eantion i se va numi dispersie combinat:

s

2

(n1 1)s 12 + (n 2 1)s 22 . = (n1 + n 2 2 )sx1 x2

Eroarea standard va avea expresia:

=s

1 1 + , n1 n 2

iar un interval de ncredere pentru diferena valorilor medii cu un coeficient de ncredere de 1 va fi de forma: 1 2 x1 x 2 t 2; gl s x x ,

(

1

2

)

unde gl este numrul gradelor de libertate care n acest caz este n1+n22.

Exemplul 5.1.2. Din dou populaii originare avnd dispersii egale s-au extras urmtoarele dou eantioane: 2, 5, 5, 3, 4, 7, 4, 2, 5, 3; 2, 4, 5, 3, 1, 2, 3, 4. Cu un nivel de ncredere de 95% s se determine un interval de ncredere pentru diferena mediilor celor dou populaii.

32

Soluie

1 2 x1 x 2 t 2; gl s x x1

(

2

)

sx s

1 x2

=s

2

(n1 1)s 12 + (n 2 1)s 22 = (n1 + n 2 2 )

1 1 + n1 n 2

Vom determina mediile i dispersiile de eantion: n cazul primului eantion vom avea:

2 + 5 + 5 + 3 + 4 + 7 + 4 + 2 + 5 + 3 40 = =4; 10 10 (2 4 )2 + ... + (3 4 )2 = 22 =2,44; 2 s1 = 9 9x1 = x2 =

n cazul celui de al doilea eantion vom avea:

2 + 4 + 5 + 3 + 1 + 2 + 3 + 4 24 = =3; 8 8 (2 3)2 + ... + (4 3)2 = 12 =1,71; 2 s2 = 7 7

Dispersia combinat va fi:

s

2

(n1 1)s12 + (n2 1)s22 = 9 2 ,44 + 7 1,71 = 34 =2,125; = (n1 + n2 2 ) 16 16=s 1 1 1 1 + =1,008. + =2,125 10 8 n1 n 2

sx

1 x2

Numrul gradelor de libertate este 16 astfel c n tabelul distribuiei Student vom cuta valoarea t0,025;16=2,11. Marginea erorii va fi t Obinem astfel :2 ,gl x1 x2

s

=2,121,008=2,14.

1-2(1-2,14;1+2,14) 1-2(-1,14;3,14).

2 2 Cazul populaiilor cu dispersii diferite ( 1 2 )

n acest caz vom avea:

1 2 x1 x 2 t 2; gl s x x1

(

2

)

sx

1 x2

=

2 2 s1 s 2 + n1 n 2

33

gl numr grade de libertate=

2 2 s1 s 2 + n n 2 1 2 1 2

2

1 s 1 s + n n1 1 1 n2 1 n2 2 2

2

.

Exemplul 5.1.3. Dac vom considera c cele dou populaii de la exemplul anterior au dispersii diferite atunci vom obine:

1 2 x1 x 2 t 2; gl s x x1

(

2

)

sx

1 x2

=

2 2 s1 s 2 2 ,44 1,71 + = =0,611. + 10 8 n1 n 2 2 2 s1 s 2 + n n 2 1 2 2

numr grade de libertate=

2 2 1 s1 1 s2 + n1 1 n1 n2 1 n2

2

=

0 ,21 =15. 0 ,007 + 0 ,007

Aadar numrul gradelor de libertate este 15 astfel c n tabelul distribuiei Student vom cuta valoarea t0,025;15=2,131. Marginea erorii va fi t2 ,gl x1 x2

s

=2,1310,67=1,43.

1-2(1-1,43;1+1,43) 1-2(-0,43;2,43).

Cazul eantioanelor perechiPrin eantioane perechi nelegem dou eantioane ce conin aceleai uniti statistice iar caracteristica aleas este observat n dou etape diferite. Un exemplu ar fi eantioanele ce conin performanele a dou echipe de muncitori msurate nainte i dup parcurgerea unui curs de calificare.

Exemplul 5.1.4. Datele de mai jos reprezint timpii realizai de o echip ce asambleaz manual anumite produse de artizanat nainte i dup parcurgerea unui stagiu de pregtire: Muncitor nainte de stagiu Dup stagiu 1 10 8 2 10 7 3 8 7 4 9 9 5 7 6 6 8 7 7 9 8 8 6 5

34

9 10

8 9

5 6

S se estimeze diferena dintre performanele muncitorilor nainte i dup parcurgerea stagiului de pregtire, cu un nivel de ncredere de 95%. n cazul eantioanelor perechi problema estimrii diferenei valorilor medii se pune puin altfel. n acest caz se va considera variabila d=x1 x2, relativ la care vom avea: d i i Valoarea medie: d = i , di = x1 x2 n2 Dispersia: sd

(d d ) = in 1

2

;2 sd ;

Abaterea medie ptratic s d = Eroarea standard s d =

sd n

.

Astfel n cazul eantioanelor de volum mare un interval de ncredere va avea forma: d d z 2 s d ,

(

)

iar n cazul eantioanelor de volum mic:

d (d t 2;(n1) gl s d )

n cazul exemplului nostru vom avea:

nainte de stagiu Dup stagiu 10 8 10 7 8 7 9 9 7 6 8 7 9 8 6 5 8 5 9 6d=2 sd

di 2 3 1 0 1 1 1 1 3 3

di = 2 + 3 + 1 + 0 + 1 + 1 + 1 + 1 + 3 + 3 =1,6;n

(di d ) = (2 1,6 )2 + ... + (3 1,6 )2 = 10 ,4 =1,15; =2

10

n1

9

9

2 s d = s d =1,075; s 1,075 =0,34. sd = d = n 10

35

Deoarece volumul eantioanelor este mic forma intervalului va fi:

d d t 2;(n 1) gl s d d (0 ,89;2 ,37 ) .

(

)

Vom cuta n tabelul distribuiei Student valoarea t0,025;9=2,262. Marginea erorii va fi: t 2;(n 1) gl s d =2,2620,34=0,711. Deoarece d > 0 putem concluziona c performanele muncitorilor s-au mbuntit dup parcurgerea cursului de pregtire.

5.2. Interval de ncredere pentru estimarea diferenei a dou proporiin foarte multe aplicaii statistice un interes deosebit l reprezint compararea a dou proporii. Considerm c din dou populaii s-au extras dou eantioane de volume n1 i respectiv n2. Presupunem totodat c proporiile la nivel de populaii sunt p1 respectiv p2. Fie p1 respectiv p 2 proporiile la nivel de eantion:

Observaie n general proporiile p1 i p2 ale populaiilor considerate nu sunt cunoscute. De aceea p p se nlocuiete cu estimatorul su punctual:1 2

sp

1 p2

=

p1 1 p1 p 1 p2 + 2 . n1 n2

(

)

(

)

Un interval de ncredere pentru diferena a dou proporii cu un coeficient de ncredere de 1 va fi de forma: p1 p2 p1 p 2 z 2 s p p .

(

1

2

)

Exemplul 5.2.1. La Universitatea A din 200 de studeni chestionai 180 au participat la examenul de licen. La Universitatea B din 150 de studeni chestionai 120 au participat la examenul de licen. S se determine un interval de ncredere pentru diferena proporiilor studenilor ce au participat la examenul de licen n cele dou universiti folosind un coeficient de ncredere de 95%. Soluiep1 p2 p1 p 2 z 2 s p

(

1 p2

)

Vom calcula mai nti proporiile la nivel de eantion:

180 = 0 ,90 ; 200 120 p2 = = 0 ,80 . 150p1 =

36

Calculm acum eroarea standard:

p1 p2 (0 ,1 0 ,076 ;0 ,1 + 0 ,076 ) p1 p2 (0 ,024 ;0 ,176 ) .

p1 1 p1 p 1 p2 0 ,9 0 ,1 0 ,8 0 ,2 + + 2 = =0,0388; 1 p2 200 150 n1 n2 1 - =0,95 z/2=1,96 z/2 s p p =0,076; sp=1 2

(

)

(

)

Putem trage concluzia c studenii din Universitatea A au participat ntr-o proporie mai mare la examenul de licen.

5.3. Interval de estimare pentru valoarea medianExist numeroase cazuri n practic n care datorit faptului c variaia valorilor fa de valoarea medie este foarte mare (valoare prea mare a coeficientului de variaie al lui Pearson), aceasta nu este reprezentativ n studiul populaiei considerate. n acest caz, aa cum am vzut n Capitolul 5, valoarea medie se nlocuiete cu valoarea median. Din aceast cauz a aprut firesc problema determinrii unor intervale de ncredere pentru estimarea valorii mediane. Considerm un eantion de volum n iar valorile variabilei n raport cu care acesta este studiat sunt (ordonate cresctor) x1, ..., xn. Un interval de ncredere pentru valoarea median a populaiei din care s-a extras eantionul va avea ca limite valorile a cror rang se calculeaz astfel:

n n z 2 + 1; 2 2 n n Rangul limitei superioare = + z 2 . 2 2Rangul limitei inferioare =

Observaie Dac volumul eantionului extras este mic (n< 30), atunci n locul statisticii z se va folosi statistica t astfel c rangurile celor dou valori limit vor fi:

n n t 2 ,( n 1 ) gl + 1; 2 2 n n Rangul limitei superioare = + t 2 ,( n 1 ) gl . 2 2Rangul limitei inferioare =

Exemplul 5.3.1. Tabelul urmtor conine observrile generate de greutatea (n kg.) a bagajelor a 35 de pasageri care folosesc serviciile unei companii aeriene. Greutatea bagajelor12 14 12 17 21 23 22 27 19 17 25 15 27 23 18 30 28 27 17 16 18 17 23 31 31

37

18 19

20 28

20 30

26 29

24 16

Vom determina un interval de ncredere pentru greutatea median a bagajelor tuturor pasagerilor companiei aeriene cu un coeficient de ncredere de 95%. Volumul eantionului este 35. Ordonnd datele cresctor vom obine c valoarea median la nivel de eantion este 21. Pe de alt parte cum 1 =0,95 obinem z/2=1,96. Astfel rangul limitei inferioare va fi superioare va fi

n z 2

2

n + 1 =12,718 iar cel al limitei 2

n + z 2

2

n =23,282. 2

Astfel greutatea median a bagajelor pasagerilor companiei aeriene va fi cuprins ntre valorile 12 i 24 adic ntre 18 i 25 kg.

Verificarea cunotinelorIntervale de ncredere pentru valoare medieCazul eantioanelor de volum mare (n30)1. Se consider un eantion de volum n=100. Se tie c valoarea medie de eantion este 30, iar abaterea medie ptratic a populaiei este 5. Se cere: a. eroarea standard a mediei; 2. eroarea standard a mediei n cazul n care volumul populaiei este N=1000; 3. un interval de ncredere pentru media populaiei cu un coeficient de ncredere de 0,95, att n cazul n care se tie volumul populaiei ct i n cazul n care volumul populaiei nu se cunoate. 2. Se consider un eantion de volum n=100. Se tie c valoarea medie de eantion este 80 iar abaterea medie ptratic de eantion este 10. Se cere: 1. estimatorul punctual al erorii standard a mediei; 2. un interval de ncredere pentru media populaiei cu un coeficient de ncredere de 0,95. 3. Un eantion de volum n=64 a furnizat o valoare medie de 25 cu o abatere medie ptratic de 4. Determinai un interval de ncredere pentru valoarea medie a populaiei cu nivel de ncredere de: 1. 99%; 2. 95%; 3. 90%. 4. Un eantion de volum n=50 a furnizat o medie de 35 cu o abatere medie de 10. 1. cu un nivel de ncredere de 95% determinai un interval de ncredere pentru valoarea medie a populaiei; 2. cu un nivel de ncredere de 95% determinai un interval de ncredere

38

pentru valoarea medie a populaiei n cazul n care rezultatele au fost obinute de pe un eantion de volum n=150. 3. ce efect are mrirea volumului eantionului asupra intervalului de ncredere. Explicai. 5. O populaie originar are abaterea medie ptratic =5. Cu un coeficient de ncredere de 95% determinai ce volum trebuie s aib un eantion extras din populaie pentru ca marginea erorii s fie de cel mult: 1. 3; 2. 5. 6. Preul mediu al unui apartament cu o camer este de 34500 euro cu o abatere medie de 2500 euro. Rezultatele au fost obinute n urma unui studiu efectuat pe 80 de agenii imobiliare. Cu un nivel de ncredere de 90% determinai un interval de ncredere pentru preul mediu a apartamentelor cu o camer de piaa considerat. 7. Repartiia dup vechime al unui eantion de 90 de angajai ai unei companii este urmtoarea:

Vechime (ani) Numr angajai 1 15 2 10 3 20 4 18 5 15 6 121. determinai vechimea medie i abaterea medie ptratic a vechimii; 2. determinai estimatorul punctual al erorii standard a mediei; 3. cu un coeficient de ncredere de 0,95 determinai un interval de ncredere pentru vechimea medie a angajailor; 4. ct trebuie s fie volumul eantionului pentru a obine o margine a erorii de cel mult 0,25? 8. Repartiia dup veniturile lunare (exprimate RON) a celor 90 de angajai din problema anterioar este urmtoarea:

Venitul lunar Numr angajai 300 500 20 500 700 25 700 900 18 900 1100 17 1100 1300 101. determinai estimatorul punctual al venitului mediu lunar al angajailor companiei; 2. determinai estimatorul punctual al erorii standard a mediei; 3. cu un coeficient de ncredere de 0,95 determinai un interval de ncredere pentru venitul mediu al angajailor companiei.

Cazul eantioanelor de volum mic (n< 30)9. Un eantion de volum n=25 a furnizat o medie de 20 cu o abatere medie de 3. 1. determinai eroarea standard a mediei; 2. cu un coeficient de ncredere de 0,99 (0,95; 0,90) determinai un39

interval de ncredere pentru media populaiei din care provine eantionul. 10. Datele urmtoare au fost extrase dintr-o populaie normal distribuit: 4, 8, 10, 5, 7, 12, 6, 5, 9. 1. determinai estimatorul punctual al mediei populaiei din care provine eantionul; 2. determinai estimatorul punctual al erorii standard a mediei; 3. cu un nivel de ncredere de 95% determinai un interval de ncredere pentru media populaiei din care provine eantionul. 11. Un test efectuat pe 16 motoare electrice a condus la o medie de 2120 rot/min cu o abatere medie de 100 rot/min. Cu un coeficient de semnificaie de 0,05 determinai un interval de ncredere pentru numrul mediu de rotaii/minut. 12. 10 candidaii pentru obinerea permisului de conducere au fost cronometrai la proba de poligon. Timpii (n minute) obinui de acetia au fost urmtorii: 10; 9; 9,5; 10; 11; 10,2; 9,5; 10; 10,8; 9. 1. determinai timpul mediu; 2. cu un nivel de ncredere de 90% determinai un interval de ncredere pentru timpul mediu.

Interval de ncredere pentru estimarea proporiei13. Un eantion de volum n=100 a furnizat o proporie p =0,35. Cu un coeficient de ncredere de 0,95 s se determine: 1. eroarea standard a proporiei; 2. un interval de ncredere pentru proporia populaiei din care provine eantionul; 3. Ce volum trebuie s aib eantionul pentru a obine o margine a erorii de cel mult 5%. 14. Un studiu efectuat pe un eantion de 250 de persoane a artat faptul c 100 au ochi albatrii. 1. determinai estimatorul punctual al proporiei populaiei; 2. determinai eroarea standard a proporiei; 3. cu un coeficient de ncredere de 0,95 determinai un interval de ncredere pentru proporia populaiei. 15. Un studiu efectuat pe 400 de clieni ai unei bnci a artat c 120 dintre acetia au contractat credite de consum. 1. determinai proporia celor ce au contractat credite de consum; 2. cu un coeficient de ncredere de 0,95 determinai un interval de ncredere pentru proporia populaiei; 3. ct de mare trebuie s fie eantionul selectat pentru ca marginea erorii s fie de cel mult 2%? 16. O companie de telefonie mobil comand un studiu pentru a msura satisfacia clienilor si relativ la ofertele de srbtori. Acetia se mpart n satisfcui i nesatisfcui. Ct de mare trebuie s fie un eantion selectat pentru a obine o margine a erorii de cel mult 2,3%? Determinai n acest caz un interval de ncredere pentru proporia clienilor satisfcui.

40

Interval de ncredere pentru diferena valorilor mediiCazul eantioanelor independente de volum mare17. Se consider dou populaii avnd abaterile medii ptratice 1=10, 2=11. Din cele dou populaii se extrage cte un eantion astfel: Populaia 1 Populaia 2 n1=100 n2=120

x1 =40

x 2 =30

1. determinai estimatorul punctual al diferenei mediilor celor dou populaii; 2. determinai eroarea standard a diferenei mediilor; 3. folosind nivele de ncredere de 90% respectiv 95% determinai intervalele de ncredere pentru diferena mediilor celor dou populaii. 18. Se consider dou eantioane independente extrase din dou populaii. Relativ la cele dou eantioane se cunosc urmtoarele date:

Eantion 1 Eantion 2 n1=75 n2=50

x1 =12,5s1=2,5

x2 =10s2=3

1. determinai estimatorul punctual al erorii standard a diferenei mediilor celor dou populaii din care provin cele dou eantioane; 2. cu un coeficient de ncredere de 0,95 determinai un interval de ncredere pentru diferena mediilor celor dou populaii. 19. Se studiaz diferena dintre preurile apartamentelor din dou zone diferite ale unei localiti. Pentru aceasta se extrage din fiecare zon cte un eantion. Rezultatele studiului efectuat pe cele dou eantioane au fost urmtoarele:

Zona 1 n1=60

Zona 2 n2=80

x1 =33720s1=2500

x 2 =32500s2=2000

1. estimai punctual diferena preurilor medii ale apartamentelor din cele dou zone; 2. cu un coeficient de ncredere de 0,95 determinai un interval de ncredere pentru diferena preurilor medii. 20. Se msoar timpul necesar parcurgerii a dou trasee de aceeai lungime de ctre mijloacele de transport n comun. Testul const n contabilizarea minutelor de ntrziere timp de 100 de zile. Rezultatele obinute au fost urmtoarele:

Minute0 1 2 3

Traseul 1 Traseul 2 (numr de zile) (numr de zile) 50 60 12 12 18 10 9 8

41

4

11

10

1. cu un coeficient de ncredere de 0,95 determinai cte un interval de ncredere pentru numrul mediu de minute de ntrziere pe fiecare traseu ; 2. cu un coeficient de ncredere de 0,95 determinai un interval de ncredere pentru diferena numrul mediu de minute ntrziere pe cele dou trasee.

Cazul eantioanelor independente de volum micSe presupune n continuare c populaiile n discuie au aceeai dispersie 21. Se consider dou populaii ce au aceeai dispersie. Din fiecare populaie se extrage cte un eantion n vederea studierii unei anumite caracteristici. Rezultatele studiului efectuat pe fiecare eantion au fost urmtoarele: Eantion 1 Eantion 2 n1=10 n2=15

x1 =25s1=3

x2 =20s2=4

1. determinai dispersia combinat; 2. cu un coeficient de ncredere de 0,95 determinai un interval de ncredere pentru diferena mediilor celor dou populaii. 22. Se studiaz diferena dintre timpii medii de rezolvare al unui test pentru dou grupe de studeni. Pentru aceasta din fiecare grup este extras cte un eantion. Rezultatele studiului pe cele dou eantioane au fost urmtoarele:

Eantion 1 Eantion 2 n1=12 n1=10 x1 =35 x1 =32 s1=5 s1=6Cu un coeficient de ncredere de 0,99 s se determine un interval de ncredere pentru diferena timpilor medii. 23. Managementul unei companii dorete s estimeze diferena dintre veniturile medii lunare (exprimate n RON) ale angajailor din departamentele de marketing respectiv producie. Din fiecare departament este extras cte un eantion, studiul acestora conducnd la urmtoarele rezultate:

Marketing Producie 1800 1800 2000 1800 1500 1500 1300 1500 1700 1600 1800 1500 1800 1300 2000 1800 1500 1600

42

1. estimai punctual veniturile medii lunare ale angajailor din cele dou departamente; 2. cu un coeficient de ncredere de 0,90 determinai un interval de ncredere pentru diferena veniturilor medii.

Cazul eantioanelor perechi24. Datele urmtoare provin din dou eantioane perechi extrase din dou populaii: Eantion 1 Eantion 2 10 8 12 12 9 8 10 9 10 10 12 10 11 8 12 10 14 12 10 9calculai diferenele dintre elementele perechi; determinai valoarea medie d ; determinai abaterea medie ptratic sd; cu un coeficient de ncredere de 0,95 determinai un interval de ncredere pentru diferena mediilor. 25. Se studiaz numrul mediu de defeciuni/lun al echipamentelor de mare sensibilitate folosite de o fabric, nainte i dup efectuarea unui service general. Pentru aceasta se iau la ntmplare 6 maini rezultatele fiind urmtoarele: 1. 2. 3. 4.

Maina nainte Dup 1 10 6 2 8 6 3 8 5 4 10 6 5 7 5 6 11 2Cu un coeficient de ncredere de 0,90 determinai un interval de ncredere pentru diferena numrului mediu de defeciuni.

Intervale de ncredere pentru estimarea diferenei a dou proporii26. Se consider dou populaii. Din cele dou populaii se extrage cte un eantion astfel: Populaia 1 Populaia 2 n1=100 n2=200

p1 =0,75

p 2 =0,80

43

1. determinai cu un nivel de ncredere de 95% cte un interval de ncredere pentru proporiile populaiilor din care au fost extrase cele dou eantioane; 2. determinai eroarea standard a diferenei proporiilor; 3. folosind nivele de ncredere de 90% respectiv 95% determinai intervalele de ncredere pentru diferena proporiilor celor dou populaii. 27. Din ce 300 de votani intervievai n circumscripia electoral A, 180 au declarat c au votat candidatul X. Din cei 250 de votani intervievai n circumscripia B, 150 au declarat c au votat cu candidatul X. 1. determinai intervale de ncredere pentru proporia votanilor din cele dou circumscripii care au votat cu candidatul X (1 =0,95); 2. determinai un interval de ncredere pentru diferena proporiilor electorilor din cele dou circumscripii care au votat cu candidatul X (1 =0,95) 28. Dou companii produc baterii de acelai tip. Din 400 de baterii testate la Compania A, 80 au fost defecte. Din cele 300 de baterii testate la Compania B, 45 s-au dovedit a fi defecte. Folosind un nivel de ncredere de 95% determinai un interval de ncredere pentru estimarea diferenei proporiilor bateriilor defecte de la cele dou companii.

Interval se ncredere pentru estimarea valorii mediane29. Pentru a verifica un nou tip de bec, din punct de vedere al duratei de folosire, este testat un eantion de 20 de becuri. Duratele de folosire (n zile) ce au fost observate sunt urmtoarele:65 58 58 68 64 73 76 75 67 76 75 59 76 65 64 74 74 76 77 81

S se determine un interval de ncredere pentru durata median de folosire a unui bec produs folosind un nivel de ncredere de 95%. 30. Se supune cercetrii statistice un eantion format din 30 de societi comerciale studiate n raport cu capitalul social i cifra de afaceri:

Capital social 8 9,6 10,1 8 2,1 4,6 2,8 1,5 1 2,1 2,9 4,5 5,5 4,8

Cifra de afaceri 2,3 10,7 7,6 11,5 2,3 11,2 0,1 5,7 5,3 4,4 0,8 0,7 0,3 5,3

Capital social 3,4 6,2 2 3,3 7,5 4,1 4,6 6,8 9,7 3,5 2 1,8 3,1 5,3

Cifra de afaceri 5,3 0,5 0,9 6,8 9,3 3,7 8 0,1 3,8 2,5 0,3 0,9 2,8 8,4

44

5,9

9,9

5,8

6,2

1. folosind un nivel de ncredere de 95% determinai cte un interval de ncredere pentru capitalul social mediu i cifra de afaceri medie. 2. folosind un nivel de ncredere de 95% determinai cte un interval de ncredere pentru capitalul social median i pentru cifra de afaceri median.

Modulul III Verificarea ipotezelor statisticeUnitatea 6: Verificarea ipotezelor asupra valorii medii i asupra proporiei Unitatea 7: Verificarea ipotezelor asupra diferenei a dou valori medii Unitatea 8: Verificarea ipotezelor asupra diferenei a dou proporii Unitatea 9: Teste de concordan. Testul 2 Unitatea 10: Analiza varianei. ANOVA

Scop i obiectiveScop Acest modul are ca scop creare de abiliti n verificarea ipotezelor statistice formulate asupra parametrilor unei populaii sau asupra unor caractersitici ale acesteia. Obiective specifice urmrite

nelegerea principiilor statisticii infereniale n contextul ipotezelor formulate asupra parametrilor unei populaii. Deprinderea formulrii corecte a ipotezelor statistice att n cazul testelor bilaterale ct i n cazul testelor unilaterale e. nelegerea noiunii de nivel de semnificaie i a noiunii de valoare critic. Deprinderea etapelor derulrii unui test de semnificaie. Deprinderea etapelor derulrii unui test de concordan. nelegerea conceptului de analiza a varianei.

Concepte de baz

Ipotez nul; ipotez alternativ; nivel de semnificaie; decizi;

45

Unitatea 6 Verificarea ipotezelor asupra valorii medii i asupra proporiei6.1. IntroducereVerificarea ipotezelor statistice reprezint cea de a doua mare parte a statisticii infereniale. Verificarea ipotezelor statistice se face prin intermediul unor teste care, pe baza informaiilor obinute la nivel de eantion, verific valabilitatea unor ipoteze formulate asupra populaiei. Dou tipuri de teste sunt utilizate n verificarea ipotezelor statistice i anume: 1. teste de semnificaie; 2. teste de concordan.

Testele de semnificaie au urmtoarele particulariti: 1. sunt folosite pentru date cantitative; 2. verific ipoteze formulate asupra parametrilor populaiei; 3. statisticile folosite n testare urmeaz distribuii cunoscute.Deoarece testele de semnificaie verific ipotezele formulate asupra parametrilor populaiei ele se mai numesc i teste parametrice. Se pune ntrebarea ce se ntmpl atunci cnd dorim s testm o anumit ipotez asupra populaiei dar care nu se refer la vreun parametru al acesteia sau atunci cnd datele cu care lucrm sunt calitative? n acest caz testele de semnificaie se nlocuiesc cu teste neparametrice. Un exemplu de test neparametric este testul de concordan. Vom ncepe prin a discuta testele de semnificaie.

6.2. Teste de semnificaieFie un parametru necunoscut al unei populaii. O ipotez formulat asupra acestui parametru se va numi ipotez nul Ho. Ho: =o O alt ipotez ce se formuleaz este ipoteza alternativ H1 ce poate avea urmtoarea form: H1: o test bilateral; H1: >o test unilateral la dreapta; H1: o H1: < o

46

2. Determinarea nivelului de semnificaie - probabilitatea comiterii unei erori prin respingerea ipotezei nule datorit erorii de eantionare, n cazul n care aceasta este de fapt adevrat; 3. Colectarea datelor la nivel de eantion, alegerea i calcularea statisticii test ce va fi folosit pentru a decide acceptarea sau respingerea ipotezei nule; 4. Determinarea valorilor critice ale statisticii; 5. Luarea deciziei. Figura 6.2.1. Zonele de respingere i de acceptare ale ipotezei nule Test bilateral

Zon de respingere Zon de acceptare

Zon de respingere

valoarea critic

valoarea critic

Test unilateral la dreapta

Zon de respingere Zon de acceptare

valoarea critic

47

Test unilateral la stnga

Zon de respingere Zon de acceptare

valoarea critic

6.2.1. Verificarea ipotezelor asupra valorii medii 1. Formularea ipotezelorTest bilateral Ho: =o H1: o Teste unilaterale Ho: =o Ho: =o H1: >o H1: < o

2. Determinarea nivelului de semnificaie 3. Colectarea datelor la nivel de eantion, alegerea i calcularea statisticii testLa nivel de eantion se vor calcula: media de eantion x , abaterea medie ptratic sx precum i eroarea standard a mediei x dac se cunoate dispersia populaiei respectiv s x dac nu se cunoate dispersia populaiei. Alegerea statisticii test se va face n funcie de volumul eantionului astfel: Eantion de volum mare n30 z=

x o

xt=

sau z=

x o ; sx

Eantioane de volum mic n< 30

x o . sx

4. Determinarea valorilor critice Test Bilateral Unilateral la dreapta Unilateral la stnga Ipoteza Ho H1 Valori critice z t2

=o =o =o

o >o < o

z

t

2 ;( n 1 ) gl

z z

t ;(n1) gl t ;(n1) gl

48

5. Luarea deciziein cazul testului bilateral dac valoarea calculat se afl ntre valorile critice ipoteza nul se accept. n caz contrar aceasta se respinge; n cazul testului unilateral la dreapta dac valoarea calculat este mai mic dect valoarea critic, ipoteza nul se accept. n caz contrar aceasta se respinge; n cazul testului unilateral la stnga dac valoarea calculat este mai mare dect valoarea critic, ipoteza nul se accept. n caz contrar aceasta se respinge;

Exemplul 6.2.1. Un productor de baterii ofer o garanie de 20 de zile. Un eantion de 100 de baterii a furnizat o medie de 19,5 zile cu o abatere medie de dou zile. Cu un nivel de semnificaie =0,05 verificai dac garania oferit este corect. Soluie 1. Ho: =20; H1: 20; 2. =0,05 3. La nivel de eantion avem n=100, x =19,5, sx=2. Deoarece volumul eantionului este mare statistica test ce se va alege este statistica z. Pe de alt parte cum dispersia populaiei nu se cunoate vom avea:z=

x o ; sx sx n=0,2;

sx =z=

4. Deoarece avem un test bilateral, valorile critice ale statisticii vor fi z 2 . Corespunztor unui nivel de semnificaie =0,05 valorile critice vor fi z 2 =1,96. 5. Se observ c valoarea calculat nu se afl ntre valorile critice ceea ce conduce la respingerea ipotezei nule. n concluzie termenul de garanie oferit de productor nu este corect. Ne punem ntrebarea: Este termenul de garanie oferit mai mare dect cel real? Pentru a rspunde la aceast ntrebare trebuie s reformulm ipotezele: 1. Ho: =20; H1: < 20; Etapele 2 i 3 rmn la fel. Se modific etapele 4 i 5. 4. Avem de a face acum cu un test unilateral la stnga n care valoarea critic este z . Corespunztor unui nivel de semnificaie =0,05 valoarea critic va fi z = - 1,645.

x o 19 ,5 20 = = - 2,5. 0 ,2 sx

49

5.

Se observ c valoarea calculat 2,5 este mai mic dect valoarea critic ceea ce conduce la respingerea ipotezei nule. Aadar garania oferit trebuie s fie mai mic de 20 de zile.

Exemplul 6.2.2. Se studiaz timpul de ateptare ntre dou autobuze. Un eantion de volum n=10 a oferit urmtorii timpi exprimai n minute: 2, 5, 5, 3, 4, 7, 4, 2, 5, 3; S se verifice ipoteza c timpul mediu de ateptare este de 3 minute cu =0,05. Soluie1. Ho: =3; H1: 3; 2. =0,05 3. La nivel de eantion avem n=10,

2 + 5 + 5 + 3 + 4 + 7 + 4 + 2 + 5 + 3 40 = =4; 10 10 (2 4 )2 + ... + (3 4 )2 = 22 =2,44; 2 sx = 9 9 sx= 2 ,44 =1,56; x= x o . sx sx n=0,49.

Deoarece volumul eantionului este mic statistica test ce se va alege este statistica t.

t=

sx =t=

x o 4 3 = = 2,0408. 0 ,49 sx

4. Deoarece avem un test bilateral, valorile critice ale statisticii vor fi t 2;(n 1)gl . Corespunztor unui nivel de semnificaie =0,05 valorile critice vor fi t0 ,025 ;9 =2,262. 5. Se observ c valoarea calculat se afl ntre valorile critice ceea ce conduce la imposibilitatea respingerii ipotezei nule. n consecin datele pe care le avem la dispoziie sunt insuficiente pentru a afirma c timpul mediu de ateptare nu este de 3 minute.

6.2.2. Verificarea ipotezelor asupra proporiei1. Formularea ipotezelorTest bilateral Ho: p=po H1: ppo Teste unilaterale Ho: p=po Ho: p=po H1: p> po H1: p< po

2. Determinarea nivelului de semnificaie 3. Colectarea datelor la nivel de eantion, alegerea i calcularea statisticii test50

La nivel de eantion se vor calcula: proporia de eantion p i eroarea standard a proporiei p =

po (1 po ) . n

Cnd se dorete estimarea proporiei la nivelul unei populaii se lucreaz n general cu eantioane de volum mare, astfel c statistica aleas va fi z: z=

p po

p

.

4. Determinarea valorilor critice Test Bilateral Unilateral la dreapta Unilateral la stnga 5. Luarea deciziein cazul testului bilateral dac valoarea calculat se afl ntre valorile critice ipoteza nul se accept. n caz contrar aceasta se respinge; n cazul testului unilateral la dreapta dac valoarea calculat este mai mic dect valoarea critic, ipoteza nul se accept. n caz contrar aceasta se respinge; n cazul testului unilateral la stnga dac valoarea calculat este mai mare dect valoarea critic, ipoteza nul se accept. n caz contrar aceasta se respinge;

Ipoteza Ho H1p=po p=po p=po ppo p> po p< po

Valori critice z

z z z

2

Exemplul 6.2.3. Se presupune c proporia populaiei cu studii superioare este 0,4. Din 900 de persoane chestionate 288 aveau studii superioare. Cu un nivel de semnificaie =0,05 testai ipoteza asupra proporiei persoanelor cu studii superioare. Soluie 1. Ho: p=0,4; H1: p0,4. 2. =0,05; 3. La nivel de eantion vom avea:

288 =0,32; 900 p (1 po ) 0 ,4(1 0 ,4 ) p= o = =0,0163; n 900 p po 0 ,32 0 ,4 z= = = - 4,9. 0 ,0163 p p=

51

4. Fiind vorba de un test bilateral valorile critice vor fi z 2 . Corespunztor unui nivel de semnificaie =0,05 valorile critice vor fi z 2 =1,96. 5. Cum valoarea calculat nu se afl ntre valorile critice vom respinge ipoteza nul. Aadar proporia populaiei cu studii superioare difer de 0,4. Este normal s ne punem ntrebarea dac nu cumva proporia populaiei este mai mic de 0,4. Pentru a rspunde la aceast ntrebare trebuie s reformulm ipotezele: Ho: p=0,4; H1: p< 0,4; Etapele 2 i 3 rmn la fel. Se modific etapele 4 i 5. 4. Avem de a face acum cu un test unilateral la stnga n care valoarea critic este z . Corespunztor unui nivel de semnificaie =0,05 valoarea critic va fi z = - 1,645. Se observ c valoarea calculat 4,9 este mai mic dect valoarea critic ceea ce conduce la respingerea ipotezei nule. Aadar proporia populaiei cu studii superioare este mai mic de 0,4. Cu alte cuvinte mai puin de 40% din populaie are studii superioare.

Unitatea 7 Verificarea ipotezelor asupra diferenei valorilor medii7.1. Cazul eantioanelor independente de volum mare (n130, n230)1. Formularea ipotezelor

Test bilateral Ho: 1-2=0 H1: 1-20

Teste unilaterale Ho: 1-2=0 Ho:1-2=0 H1: 1-2>0 H1: 1-20 1-20;4. Avem de a face n acest caz cu un test unilateral la dreapta, caz n care valoarea critic este z =1,645. 5. Se observ c valoarea calculat este mai mare dect valoarea critic ceea ce conduce la respingerea ipotezei nule. n concluzie media de vrst n primul compartiment al companiei este mai mare.

7.2.

Cazul eantioanelor independente de volum mic 2 2 (n1< 30, n2< 30, 1 = 2 = 2 )

1. Formularea ipotezelorTest bilateral Ho: 1-2=0 H1: 1-20 Teste unilaterale Ho: 1-2=0 Ho:1-2=0 H1: 1-2>0 H1: 1-20 1-20;Avem de a face n acest caz cu un test unilateral la dreapta caz n care valoarea critic este t0,05;23=1,714. Se observ c valoarea calculat este mai mare dect valoarea critic ceea ce conduce la respingerea ipotezei nule. n concluzie media primei populaii este mai mare dect media celei de-a doua.

7.3.

Cazul eantioanelor perechi

1. Formularea ipotezelorTest bilateral Ho: d=0 H1: d0 Teste unilaterale Ho: d=0 Ho: d=0 H1: d>0 H1: d0 d 0; 2. =0,05 3. d =

di 3 2 5 2 3

3+2+5+2+3 =3; 5 (3 3)2 + (2 3)2 + (5 3)2 + (2 3)2 + (3 3)2 =1,5; 2 sd = 4

2 s d = s d =1,22;

57

sd =

sd nt=

=0,54;

d d d 3 =5,55. = = sd s d 0 ,54

4. Avem un test unilateral la dreapta ceea ce nseamn c valoarea critic va fi t ;(n1) gl =t0,05;4=2,132. 5. Se observ c valoarea calculat depete valoarea critic ceea ce nseamn c vom respinge ipoteza nul. Aadar concluzionm c promoia a avut efectul dorit.

Unitatea 8 Verificarea ipotezelor asupra diferenei a dou proporii1. Formularea ipotezelorTest bilateral Ho: p1-p2=k H1: p1-p2k Teste unilaterale Ho: p1-p2=k Ho: p1-p2=k H1: p1-p2> k H1:p1-p2< k

2. Determinarea nivelului de semnificaie 3. Colectarea datelor la nivel de eantion, alegerea i calcularea statisticii test La nivel de eantion se vor calcula proporiile la nivel de eantion iar statistica test ce se va folosi este statistica z:z=

(p

1

p 2 ( p1 p 2 ) , sp p

)

unde

sp

1 p2

=

p1 1 p1 p 1 p2 + 2 . n1 n2

(

1

2

)

(

)

4. Determinarea valorilor critice Test Bilateral Unilateral la dreapta Unilateral la stnga 5. Luarea deciziein cazul testului bilateral dac valoarea calculat se afl ntre valorile critice ipoteza nul se accept. n caz contrar aceasta se respinge;

Ipoteza Hop1-p2=k p1-p2=k p1-p2=k

H1p1-p2k p1-p2>k p1-p2 0,05; 2. =0,05; 3. La nivel de eantioane vom avea:

sp

1 p2

=

z=

(p

1

p 2 ( p1 p 2 ) (0 ,90 0 ,80 ) 0 ,05 0 ,05 = = =1,288. sp p 0 ,0388 0 ,03881 2

p1 1 p1 p 1 p2 0 ,9 0 ,1 0 ,8 0 ,2 + + 2 = =0,0388. 200 150 n1 n2

(

180 = 0 ,90 ; 200 120 p2 = = 0 ,80 ; 150p1 =

)

(

)

)

4. Deoarece este vorba de un test unilateral la dreapta valoarea critic va fi z a crei valoare corespunztoare lui =0,05 este z =1,645. 5. Cum valoarea calculat a statisticii este mai mic dect valoarea critic nu putem respinge ipoteza nul. Aadar acceptm ipotez c diferena dintre cele dou proporii nu este mai mare de 5%. Cel mai adesea suntem interesai dac proporiile celor dou populaii difer semnificativ. n acest caz se vor schimba etapele 1 i 3 testul derulndu-se dup urmtoarele etape:

1. Formularea ipotezelorTest bilateral Ho: p1-p2=0 H1: p1-p20 Teste unilaterale Ho: p1-p2=0 Ho: p1-p2=0 H1: p1-p2> H1:p1-p2< 0

2. Determinarea nivelului de semnificaie 3. Colectarea datelor la nivel de eantion, alegerea i calcularea statisticii test La nivel de eantion se vor calcula proporiile la nivel de eantion iar statistica test ce se va folosi este statistica z:

59

z=

(p

1

p 2 ( p1 p 2 ) p1 p 2 = sp p sp p1 2 1 2

)

,

unde

sp

1 1 p 1 p + , n 1 p2 1 n2 n p + n2 p 2 p= 1 1 - proporia combinat n1 + n 2=

(

)

4. Determinarea valorilor critice Test Bilateral Unilateral la dreapta Unilateral la stnga 5. Luarea deciziein cazul testului bilateral dac valoarea calculat se afl ntre valorile critice ipoteza nul se accept. n caz contrar aceasta se respinge; n cazul testului unilateral la dreapta dac valoarea calculat este mai mic dect valoarea critic, ipoteza nul se accept. n caz contrar aceasta se respinge; n cazul testului unilateral la stnga dac valoarea calculat este mai mare dect valoarea critic, ipoteza nul se accept. n caz contrar aceasta se respinge;

Ipoteza Hop1-p2=0 p1-p2=0 p1-p2=0

H1p1-p20 p1-p2>0 p1-p2 0; 2. =0,05; 3. La nivel de eantioane vom avea:

180 = 0 ,90 ; 200 120 p2 = = 0 ,80 ; 150 n p + n 2 p 2 200 0 ,90 + 150 0 ,80 300 p= 1 1 = =0,8571; = n1 + n 2 200 + 150 350p1 =

60

sp

1 p2

=

1 1 1 1 p 1 p + = 0 ,8571(1 0 ,8571) + =0,0376; n 200 150 1 n2 p p2 0 ,10 z= 1 = =2,659. sp p 0 ,03761 2


Recommended