Post on 04-Feb-2020
transcript
Matematici speciale
Seminar Statistica
Mai 2018
ii
โStatistica este arta de a minti prin intermediul cifrelor.โ
Wilhelm Stekel
12Notiuni de statistica
Datele din dreapta arata tempera-turile de racire ale unei cesti de cafea,care tocmai a fost preparata. Temper-atura la care ajunge aparatul de cafeaeste 180 de grade Fahrenheit (aproxi-mativ 82โ๐ถ).
In anul 1992 o femeie a dat in judecata McDonaldโs pentru ca au servitcafeaua la temperatura 180โ๐น si aceasta i-a cauzat arsuri serioase in momentulin care a incercat sa o bea (vezi Liebeck vs. McDonaldโs ). Un expert adus dinpartea acuzarii a sustinut la proces ca lichidele care se afla la aceasta temper-atura pot cauza distrugerea totala a pielii umane in doua pana la sapte secunde.S-a stabilit ca daca ar fi fost servita la 155โ๐น (68โ๐ถ) s-ar fi racit la timp si arfi fost evitat tot incidentul. Femeia a primit in prima instanta o despagubire de
1
2.7 milioane de dolari. Ca urmare a acestui caz faimos multe restaurante servescacum cafeaua la o temperatura de aproximativ 155โ๐น . Cat de mult ar trebuisa astepte restaurantele din momentul in care cafeaua este turnata in ceascadin aparat si pana cand ea poate fi servita, pentru a se asigura ca nu este maifierbinte de 155โ๐น ?
โ Determinati ecuatia unui model de regresie exponentiala pentru a reprezentadatele
โ Reprezentati grafic curba obtinutaโ Decideti daca ecuatia obtinuta este buna pentru a reprezenta datele exis-
tente in tabelโ Interpolare: Cand ajunge temperatura cafelei la 106โ๐น ?โ Extrapolare: Care este temperatura prezisa, de modelul gasit, peste o ora?
2
Notiuni teoretice:
โ Statistica descriptiva: populatie statistica, esantion statistic, serie sta-tistica, frecventa abosluta, frecventa relativa, histograma, media ๏ฟฝ๏ฟฝ, mediana๐3, amplitudinea ๐ด, dispersia ๐2, deviatia standard ๐, moda (modulul) ๐๐,dispersia de selectie ๐ 2, deviatia standard de selectie ๐ , cuartilele ๐1, ๐2, ๐3,indicatorul de asimetrie ๐ ๐ (skewness), indicatorul de aplatizare ๐ (kurtosis)
Intervale de incredere
โ intervalele de incredere sunt folosite cand vrem sa estimam un parametru alunei populatii folosind un esantion. Parametrul poate fi estimat printr-o singuravaloare (estimare punctuala) dar de obicei e preferabil sa fie estimat printr-uninterval care va da unele indicii asupra gradului de incertitudine al estimarii.
โ notatia obisnuita pentru acest parametru este ๐. Deseori, acest parametrueste media populatiei ๐, care este estimata prin media esantionului ๏ฟฝ๏ฟฝ.
โ nivelul de incredere C al unui interval de incredere reprezinta probabilitateaca intervalul construit sa contina valoarea adevarata a parametrului.
โ acest nivel de incredere este ales a priori si valorile cele mai utilizate sunt0.90, 0.95, sau 0.99. Aceste nivele corespund procentajelor din aria curbei luiGauss, data de densitatea de probabilitate a unei variabile aleatoare normalstandard distribuita.
โ de exemplu, un interval de incredere cu un nivel de incredere ๐ถ = 95%acopera 95% din curba lui Gauss. Probabilitatea ca valoarea reala sa fie in afaraacestui interval este mai mica de 0.05. Pentru ca aceasta curba este simetricajumatate de arie se afla in partea din stanga a curbei si cealalta jumatate inpartea dreapta.
โ dupa cum arata diagrama de mai jos, pentru un interval de incredere cunivelul C, aria din fiecare extremitate a curbei este 1โ๐ถ
2 . Pentru un nivel deincredere 95%, aria din fiecare extremitate este 0.05/2 = 0.025.
Valoarea ๐ง*, care reprezinta punctul de pe curba lui Gauss pentru care prob-abilitatea de a observa o valoare mai mare ca ๐ง* este egala cu ๐, este denumitavaloarea critica superioara a distributiei normale standard.
3
De exemplu, pentru ๐ = 0.025, valoarea ๐ง* pentru care ๐ (๐ > ๐ง*) = 0.025,sau ๐ (๐ < ๐ง*) = 0.975, este egala cu 1.96 conform tabelului cu scorurile Z cititin sens invers.
โ pentru un interval de incredere cu nivelul de incredere C, valoarea lui ๐este (1 โ ๐ถ)/2.
Medie necunoscuta si deviatie standard cunoscuta
Teorema:Pentru o populatie cu media ๐ necunoscuta si deviatie standard ๐ cunos-
cuta, un interval de incredere pentru media populatiei, construit pe baza unuiesantion de volum ๐, este:
(๏ฟฝ๏ฟฝโ ๐ง*๐โ๐, ๏ฟฝ๏ฟฝ + ๐ง*
๐โ๐
)
unde ๐ง* este valoarea critica corespunzatoare lui1 + ๐ถ
2pentru distributia nor-
mala standard, adica ฮฆ(๐ง*) = 1+๐ถ2 .
Medie necunoscuta si deviatie standard necunoscuta
โ cand deviatia standard ๐ este necunoscuta este estimata de obicei prin ๐ numita eroarea standard /deviatia standard de selectie , unde:
๐ 2 =
๐โ๐=1
(๐ฅ๐ โ ๏ฟฝ๏ฟฝ)2
๐โ 1
si ๐ este volumul selectiei.Teorema:Pentru o populatie cu media necunoscuta ๐ si deviatia standard ๐ ne-
cunoscuta, un inteval de incredere pentru media populatiei, construit pe bazaunui esantion de volum ๐, este:
(๏ฟฝ๏ฟฝโ ๐ก*๐ โ๐, ๏ฟฝ๏ฟฝ + ๐ก*
๐ โ๐
)
unde ๐ก* este valoarea critica corespunzatoare lui1 โ ๐ถ
2pentru distributia ๐ก-
Student cu n-1 grade de libertate.โ Pasul final consta in interpretarea rezultatului: pe baza datelor avute
suntem ๐ถ% siguri ca adevarata medie a populatiei se afla intre valorile date deintervalul gasit
โ valorile critice ๐ง* si ๐ก* se pot gasi in tabelul urmator z-t-tableโ distributia ๐ก sau distributia Student este data de catre urmatoarea
densitate de probabilitate:
๐(๐ก) =ฮ(๐+1
2 )โ๐๐ฮ(๐
2 )
(1 +
๐ก2
๐
)โ๐+12
unde ๐ este numarul de grade de libertate si ฮ este functia lui Euler.
De retinut
4
Presupunem ca un student care masoara temperatura de fierbere a unuianumit lichid observa urmatoarele valori (exprimate in grade Celsius)102.5, 101.7, 103.1, 100.9, 100.5, si 102.2 pentru 6 esantioane diferite delichid. Pe baza acestor dare el calculeaza media ๏ฟฝ๏ฟฝ a esantionului ca fiind101.82. Daca stie ca deviatia standard a acestei proceduri este 1.2 grade,care este intervalul de incredere pentru media populatiei la un nivel deincredere de 95% ?
Cu alte cuvinte, studentul doreste sa estimeze adevarata valoare mediea temperaturii de fierbere a lichiduluui folosind rezultatele masuratorilorlui. Daca masuratorile urmeaza o distributie normala atunci esantionul
ca avea o distributie ๐(๐,๐2
๐). Deoarece volumul esantionului este 6,
deviatia standard a mediei esantionului este egala cu 1.2โ6
= 0.49.
Valoarea critica ๐ง* pentru un nivel de increder de 95% este 1.96, unde(1 โ ๐ถ)/2 = (1 โ 0.95)/2 = 0.025. Astfel un interval de incredere pentrumedia ๏ฟฝ๏ฟฝ la un nivel de incredere 95% este:
(101.82 โ 1.96 ยท 0.49, 101.82 + 1.96 ยท 0.49) = (100.86, 102.78)
Pe masura ce nivelul de incredere descreste, lungimea intervaluluidescreste. Sa presupunem ca studentul era interesat de obtinereaunui nivel de incredere de 90% pentru intervalul de incredere a tem-peraturii de fierbere. In acest caz, ๐ถ = 0.90, si (1 โ ๐ถ)/2 = 0.05.Valoarea critica ๐ง* pentru acest nivel este 1.645, deci un astfel deinterval ca fi:
(101.82 โ 1.645 ยท 0.49, 101.82 + 1.645 ยท 0.49) = (101.01, 102.63)
O crestere a volumului esantionului va determina o descrestere alungimii intervalului de incredere atunci cand pastram nivelul de in-credere cosntant. Marja de eroare ๐ a unui interval de incredere estedefinita ca fiind valoarea adunata sau scazuta la media esantionului,care determina lungimea intervalului: ๐ = ๐ง* ๐โ
๐.
Remarca:
Sa presupunem ca in exemplul de mai sus studentul doreste sa aibe omarja de eroare egala cu 0.5 grade la un nivel de incredere de 95%. Facandcalculele necesare se obtine ๐ = (1.96 ยท 1.2/0.5)2 = 22.09. Asadar, pentrua obtine un interval de incredere de 95%, pentru temperatura medie defierbere, cu lungimea de 1 grad, studentul ca avea de facut 23 masuratori.๏ฟฝ
Exemplu:
5
Testarea ipotezelor statistice
In procesul decizional managerii emit ipoteze care apoi pot fi testate cuintrumentele statisticii matematice. Un test statistic examineaza doua ipotezeopuse legate de o populatie statistica: ipoteza nula si ipoteza alternativa. Felulin care sunt construite depinde de ceea ce se incearca a se arata.
Ipoteza nula ๐ป0
โ ipoteza nula afirma ca un parametru al unei populatii statistice este egal cuo valoare fixa. Ipoteza nula este de obicei o afirmatie facuta de catre manageripornind de la cercetarile si cunostintele anterioare.
Ipoteza alternativa ๐ป๐
โ ipoteza alternativa afirma ca parametrul populatiei este diferit de cel pre-supus in ipoteza nula. Ipoteza alternativa este ceea ce s-ar putea sa crezi ca eadevarat sau speri sa se dovedeasca a fi adevarat.
Cele mai comune ipoteze sunt referitoare la media unei populatii statisticeTestarea unor astfel de ipoteze, a determina daca media ๐ a unei populatii
este egala cu o anumita valoare tinta ๐0, presupune urmatorii pasi:
โ pentru un volum mare ๐ al esan-tionului sau ๐ cunoscuta
ยท folosim testul z si calculam:
๐ง๐๐๐๐ =๏ฟฝ๏ฟฝโ ๐0
๐โ๐
โ pentru volumul ๐ < 30 al esan-tionului si ๐ necunoscuta
ยท folosim testul Student ๐ก si calcu-lam:
๐ก๐๐๐๐ =๏ฟฝ๏ฟฝโ ๐0
๐ โ๐
Two-tailed test:
๐ป0 : ๐ = ๐0
๐ป๐ : ๐ = ๐0
โ regiunea critica/ regiunea de respingere, cand respingem ๐ป0, este datade:
๐ง๐๐๐๐ < โ๐ง*๐ผ2sau ๐ง๐๐๐๐ > ๐ง*๐ผ
2๐ก๐๐๐๐ < โ๐ก*๐ผ
2 ,๐โ1 sau ๐ก๐๐๐๐ > ๐ก*๐ผ2 ,๐โ1
Upper-tailed test:
๐ป0 : ๐ = ๐0
๐ป๐ : ๐ > ๐0
โ regiunea critica/ regiunea de respingere, cand respingem ๐ป0, este datade:
6
๐ง๐๐๐๐ > ๐ง*๐ผ ๐ก๐๐๐๐ > ๐ก*๐ผ,๐โ1
Lower-tailed test:
๐ป0 : ๐ = ๐0
๐ป๐ : ๐ < ๐0
โ regiunea critica/ regiunea de respingere, cand respingem ๐ป0, este datade:
๐ง๐๐๐๐ < โ๐ง*๐ผ ๐ก๐๐๐๐ < โ๐ก*๐ผ,๐โ1
โ in toate aceste exemple ๐ผ este nivelul de semnificatie corespunzator unuinivel de incredere ๐ถ = 1 โ ๐ผ
โ valorile critice ๐ง* si ๐ก* pentru diferite intervale de incredere sunt afisatein z-t-table
Estimarea parametrilor prin metoda momentelor
Metoda momentelor este o metoda de estimare a parametrilor unei populatiistatistice. Metoda este bazata pe presupunerea ca momentele esantionului suntestimatori buni pentru momentele corespunzatoare ale populatiei.
โ pentru o populatie ๐ momentele ๐๐ de ordin ๐ (sau ๐๐) sunt definite ca:
๐๐ = ๐(๐๐) =
โงโชโชโชโชโชโชโจโชโชโชโชโชโชโฉ
โโซโโ
๐ฅ๐๐(๐ฅ)๐๐ฅ, daca ๐ este continua
โ๐โ๐ผ
๐ฅ๐๐ ๐๐, daca ๐ este discreta
โ momentele de ordin ๐ ale esantionului, notate ๐๐, pentru un esantion devolum ๐ sunt:
๐๐ =1
๐
๐โ๐=1
๐๐๐
Estimarea prin metoda momentelor pur si simplu presupune egale cele douatipuri de momente ๐๐ = ๐๐ si urmareste apoi aflarea parametrilor lispa.(distributiatrebuie sa aiba momente finite)
Metoda momentelor:
1. vrem sa estimam un parametru ๐
2. calculam momente de ordin mic ๐๐ ca functii de ๐
7
3. realizam un sistem de ecuatii pornind de la presupunerea ca momentelepopulatiei ๐๐ sunt egale cu cele ale esantionului ๐๐, si exprimam dinaceste ecuatii parametrul ca functii de momentele exantionului ๐๐.
Fie ๐1, ๐2, . . . ๐๐ un esantion dintr-o populatie care are o distributie bi-nomiala ๐ โผ ๐ต๐(๐0, ๐) cu parametrii ๐0 si ๐. Estimati acesti parametrifolosind metoda momentelor.
Solutie: Deoarece
๐(๐) = ๐0 ยท ๐ (vezi fisa variabile aleatoare discrete)
si๐ท2(๐) = ๐0๐(1 โ ๐)
obtinem:
๐2(๐) = ๐(๐2) = ๐ท2(๐) + ๐(๐)2 = ๐0๐(1 โ ๐) + ๐20๐
2,
putem scrie ๐0๐(1 โ ๐) = ๐2(๐) โ๐(๐)2.Egaland:
๐(๐) = ๐1
(=
๐1 + ๐2 + . . . + ๐๐
๐
)si
๐2(๐) = ๐2
(=
๐21 + ๐2
2 + . . . + ๐2๐
๐
)se poate observa ca:
1 โ ๐ =๐2 โ๐2
1
๐1
astfel:
๐ =๐1 + ๐2
1 โ๐2
๐1
poate fi folosit ca un estimator pentru parametrul ๐.In acelasi context:
๐0 =๐1
๐=
๐21
๐1 + ๐21 โ๐2
.
๏ฟฝ
Exemplu:
8
Analiza regresiva prin metoda celor mai mici patrate
โ in sectiunile anterioare am considerat experimente pentru care am observato singura cantitate (variabila) aleatoare, iar esantioanele respective au constatdin date reprezentate de numere reale ๐ฅ1, ๐ฅ2, . . . , ๐ฅ๐
โ in aceasta sectiune vom considera experimente ฤฑn care suntem interesati dedoua cantitati (variabile) aleatoare, deci esantioanele respective vor fi reprezen-tate de perechi de numere reale (๐ฅ1, ๐ฆ1), (๐ฅ2, ๐ฆ2), . . . , (๐ฅ๐, ๐ฆ๐)
โ in analiza regresiva una din cele doua variabile (spre exemplu ๐) esteprivita ca o variabila ce poate fi masurata (determinata) cu precizie, numitavariabila independenta si suntem interesati de modul cum cealalta variabila๐ (numita variabila dependenta) depinde de aceasta: spre exemplu sunteminteresati de modul de aportul de crestere ๐ al animalelor ฤฑn functie de cantitateazilnica de hrana ๐.
โ in general, intr-un anumit experiment alegem valorile ๐ฅ1, ๐ฅ2, . . . , ๐ฅ๐ apoiobservam valorile ๐ฆ1, ๐ฆ2, . . . , ๐ฆ๐ ale unei variabile aleatoare ๐ , obtinand astfelun esantion (๐ฅ1, ๐ฆ1), (๐ฅ2, ๐ฆ2), . . . , (๐ฅ๐, ๐ฆ๐)
Se pune problema gasirii unei curbe care sa aproximeze cat mai bine dateleobitnute experimental (norul de puncte)
โ aceasta aproximare se face de obicei impunand conditia ca suma patratelordistantelor de la puncte la curba sa fie minima (metoda celor mai mici patrate)
๐ธ =
๐โ๐=1
(๐ฆ๐ โ ๐(๐ฅ๐))2 = minim
unde ๐ este functia care da curba de regresie. In functie de forma norului sepoate alege una din urmatoarele functii de regresie:
9
Regresia liniara
โ estimam norul de puncte printr-o dreapta ๐ฆ = ๐(๐ฅ) = ๐ + ๐๐ฅโ impunand conditia data de metoda celor mai mici patrate se obtine sis-
temul: {๐ + ๐ ยท
โ๐๐=1 ๐ฅ๐
๐ =โ๐
๐=1 ๐ฆ๐
๐
๐ ยทโ๐
๐=1 ๐ฅ๐
๐ + ๐ ยทโ๐
๐=1 ๐ฅ2๐
๐ =โ๐
๐=1 ๐ฅ๐๐ฆ๐
๐
care are solutia:
๐ =๐โ
๐ฅ๐ฆ โโ
๐ฅ ยทโ
๐ฆ
๐โ
๐ฅ2 โ (โ
๐ฅ)2
si:
๐ =
โ๐๐=1 ๐ฆ๐๐
โ ๐
โ๐๐=1 ๐ฅ๐
๐= ๐ โ ๐๏ฟฝ๏ฟฝ.
Regresia parabolica
โ estimam norul de puncte printr-o parabola ๐ฆ = ๐(๐ฅ) = ๐ + ๐๐ฅ + ๐๐ฅ2
โ impunand conditia data de metoda celor mai mici patrate se obtine sis-temul: โงโชโจโชโฉ
๐ ยท ๐ + ๐ ยทโ
๐ฅ + ๐ ยทโ
๐ฅ2 =โ
๐ฆ
๐ ยทโ
๐ฅ + ๐ ยทโ
๐ฅ2 + ๐ ยทโ
๐ฅ3 =โ
๐ฅ๐ฆ
๐ ยทโ
๐ฅ2 + ๐ ยทโ
๐ฅ3 + ๐ ยทโ
๐ฅ4 =โ
๐ฅ2๐ฆ
Regresia hiperabolica
โ estimam norul de puncte printr-o hiperbola ๐ฆ = ๐(๐ฅ) = ๐ + ๐๐ฅ
โ impunand conditia data de metoda celor mai mici patrate se obtine sis-temul: {
๐ ยท ๐ + ๐ ยทโ
1๐ฅ =
โ๐ฆ
๐ ยทโ
1๐ฅ + ๐ ยท
โ1๐ฅ2 =
โ ๐ฆ๐ฅ
Regresia exponentiala
โ estimam norul de puncte printr curba ๐ฆ = ๐(๐ฅ) = ๐ ยท ๐๐ฅโ se logaritmeaza relatia si obtinem:
ln ๐ฆ = ln ๐ + ln ๐ ยท ๐ฅ
care are forma unui model de regresie liniara pentru datele (๐ฅ๐, ln ๐ฆ๐), ๐ = 1, ๐deci ๐ si ๐ se determina din:
ln ๐ =๐โ
๐ฅ ln ๐ฆ โโ
๐ฅ ยทโ
ln ๐ฆ
๐โ
๐ฅ2 โ (โ
๐ฅ)2
si:
ln ๐ =
โ๐๐=1 ln ๐ฆ๐๐
โ ln ๐ ยทโ๐
๐=1 ๐ฅ๐
๐.
prin intermediul formulelor ๐ = ๐ln ๐ si ๐ = ๐ln ๐
10
Probleme rezolvate
Problema 1. Calculati cuartilele ๐1, ๐2, ๐3 pentru urmatoarea seriestatistica simpla
๐ : 1, 2, 5, 7, 11, 21, 22, 23, 29
si abaterea cuartilica.
Solutie: Facem mai ฤฑntai observatia ca mediana ๐๐ coincide cu cuartila ๐2.Deoarece seria statistica data are un numar impar de termeni (9 mai exact),
vom folosi formula corespunzatoare pentru a determina cuartila ๐2 si avem
๐ฅ 9+12
= ๐ฅ5 = 11 โ ๐๐ = ๐2 = 11.
Mai departe pentru a determina prima cuartila tinem cont de seria statisticasimpla
1, 2, 5, 7, 11
care are tot un numar impar de termeni si obtinem
๐ฅ 5+12
= ๐ฅ3 = 5 โ ๐1 = 5.
Analog procedam pentru a treia cuartila tinand cont de seria statisticasimpla
11, 21, 22, 23, 29
care are tot un numar impar de termeni si rezulta
๐ฅ 5+12
= ๐ฅ3 = 22 โ ๐3 = 22.
Atunci rezulta ca abaterea cuartilica este
๐ = ๐3 โ๐1 = 22 โ 5 = 17.
Problema 2. Fie seria statistica
๐ : 1, 5, 4, 20, 3, 16.
Determinati:a) amplitudinea absoluta ๐ด.b) abaterea medie patratica ๏ฟฝ๏ฟฝ (๐).c) dispersia ๐2 (๐).d) deviatia standard ๐ (๐).e) coeficientul de variatie ๐๐ฃ(๐).
Solutie: a) Amplitudinea absoluta ๐ด este
๐ด = ๐max โ๐min = 20 โ 1 = 19.
11
b) Abaterea medie patratica ๏ฟฝ๏ฟฝ (๐) se obtine astfel
๐ (๐) =|1 โ ๐ฅ| + |5 โ ๐ฅ| + |4 โ ๐ฅ| + |20 โ ๐ฅ| + |3 โ ๐ฅ| + |16 โ ๐ฅ|
6,
unde media ๐ฅ este
๐ฅ =1 + 5 + 4 + 20 + 3 + 16
6= 8, 16.
Atunci rezulta๏ฟฝ๏ฟฝ (๐) โ 6, 55.
c) Dispersia este
๐2 (๐) =1
6
6โ๐=1
(๐ฅ๐ โ ๐ฅ)2
=
=1
6
(7, 162 + 3, 162 + 4, 162 + 11, 842 + 5, 162 + 7, 842
)= 51, 138 โ 51.
d) deviatia standard rezulta imediat de mai sus
๐ (๐) =โ๐2(๐) =
โ51 = 7, 14 โ 7.
e) Din cele de mai sus, rezulta coeficientul de variatie
๐๐ฃ(๐) =๐ (๐)
๐ฅยท 100 = 85, 78.
Problema 3. Pe o perioada de mai multi ani, un profesor a ฤฑnregistratrezultatele elevilor si a obtinut ca media ๐ a acestor rezultate este 72 siabaterea standard ๐ = 12. Clasa de 36 de elevi pe care-i ฤฑnvata ฤฑn prezentare o medie ๐ฅ = 75, 2, iar profesorul afirma ca ea este superioara celorde pana acum. Intrebarea care se pune este daca media clasei ๐ฅ este unargument suficient pentru a sustine afirmatia profesorului la un nivelulde semnificatie dat ๐ผ = 0, 05 (95% sigur).
Solutie: Etapa 1: Formularea ipotezei nule ๐ป0
๐ป0 : ๐ฅ = ๐ = 72 โ clasa nu este superioara.
Etapa 2: Formularea ipotezei alternative ๐ป๐
๐ป๐ : ๐ฅ = ๐ > 72 โ clasa este superioara.
Etapa 3: Metodologia de verificare a ipotezelora) Cand ฤฑn ipoteza nula media populatiei si deviatia standard sunt cunos-
cute, atunci folosim scorul standard ๐ง ca si test statistic.b) Nivelul de semnificatie este dat si este ๐ผ = 0, 05.
c) In baza teoremei limita centrala distributia mediilor esantioanelor esteaproape normala, deci prin urmare distributia normala va fi folosita pentru
12
determinarea regiunii critice. Regiunea critica este egala cu multimea valorilorscorului standard ๐ง care determina respingerea ipotezei nule si este situata laextremitatea dreapta a distributiei normale. Regiunea critica este la dreaptadeoarece valori mari ale mediei esantionului sustin ipoteza alternativa ฤฑn timpce valori apropiate valorii 72 sustin ipoteza nula.
Valoarea critica ce desparte zona valorilor โnu este superiorโde zona valorilorโeste superiorโeste determinata de probabilitatea ๐ผ = 0, 05 de a comite o eroarede tip ๐ผ (eroarea de tip ๐ผ apare cand ipoteza nula este adevarata si tot ea esterespinsa).
Etapa 4: Determinarea valorii testului statisticValoarea testului statistic este data de formula
๐ง๐๐๐๐ =๐ฅโ ๐๐โ๐
=75, 2 โ 72
12โ36
= 1, 6.
Etapa 5: Luarea unei decizii si interpretarea eiDaca comparam valoarea gasita cu valoarea critica observam ca:
1, 6 < 1, 65
Conform celor stabilite in sectiunea ipotezelor statistice respingem ipoteza ๐ป0
daca:๐ง๐๐๐๐ > ๐ง*๐ผ
Decizia: nu putem respinge ipoteza nula !In final, tragem concluzia ca probele nu sunt suficiente pentru a sustine ca
actuala clasa este superioara celor anterioare.
Problema 4. Noua dintre studentii unei facultati cu profil sportiv au fostselectati pentru a da un test de alergare pe distanta mare. Masuratorilepentru acest grup au condus la un timp mediu de 12, 87 minute cu oabatere standard ๐ = 1, 3. Sa se aproximeze, cu o probabilitate de 90%,timpul mediu pe care studentii intregii facultati il vor inregistra pe aceadistanta .
Solutie: Deoarece nu se cunoaste dispersia populatiei iar esantionul are volu-mul mai mic dacat 30, intervalul de ฤฑncredere este dat de formula(
๐ฅโ ๐ โ๐๐ก๐โ1,๐ผ2
, ๐ฅ +๐ โ๐๐ก๐โ1,๐ผ2
),
unde ๐ฅ = 12, 87 ; ๐ = 1, 3 ; ๐ = 9 ; ๐ผ = 0, 10 ; iar ๐ก๐โ1,๐ผ2este valoarea critica a
repartitiei Student (statisticianul William Sealy Gosset folosea acest pseudonim
in articolele sale ) cu ๐โ1 grade de libertate corespunzatoare valorii๐ผ
2=
1 โ ๐ถ
2care ฤฑn cazul nostru este ๐ก9โ1, 0.05 = ๐ก8, 0,05 = 1, 860 conform tabelului z-t-table
Obtinem intervalul(12.064, 13.676)
In concluzie suntem 90% siguri ca timpul mediu inregistrat de un studentpe acea distanta va fi in acest interval !
13
Probleme propuse
Problema 1. Fiind date seriile statistice simple
๐ : 1, 5, 7, 8, 10,
๐ : 1, 6, 100, 135
determinati mediana ฤฑn ambele cazuri.
Problema 2. Intr-o colectivitate s-au ales date statistice numerice obtinandu-se
๐ : 4, 1, 1, 5, 6, 3, 2, 1,
๐ : 100, 90, 40, 80, 70, 50, 100, 70.
Aflati dupa care din variabilele de mai sus, colectivitatea este mai omogena.
Problema 3. Diagrama Herzsprung-Russell arata dependenta dintre magnitu-dinile absolute si temperaturile efective de la suprafata stelelor:
Pentru un grup de stele din sirul principal al diagramei astronomii au inregistratcu ajutorul telescopului Keck urmatoarele date:
(+5, 5000โ๐พ), (+10, 3000โ๐พ), (0, 10000โ๐พ), (โ5, 25000โ๐พ), (+6, 7500โ๐พ)
Cautati un model de regresie adecvat pentru aceste date.
14
Problema 4. Directorul de operatiuni al unei uzine ar dori sa estimeze timpulmediu de care are nevoie un muncitor pentru a asambla o noua componentaelectronica. Presupunem ca deviatia standard a timpului de asamblare este de3.6 minute.
a) Dupa cronometrarea a 120 de muncitori, managerul observa ca timpul lormediu de asamblare a componentei este de 16.2 minute. Construiti un intervalde incredre cu un nivel de incredere de 95% pentru timpul mediu de asamblarea componentei.
b) Cati muncitori ar trebui sa fie implicati in studiul managerului pentru aobtine timpul mediu real de asamblare cu o eroare de ยฑ15 seconde si un nivelde incredere de 95% ?
Problema 5. Pentru a asigura folosirea eficienta a unui server, este necesaraestimarea numarului mediu de useri simultani. Conform datelor disponibile me-dia si deviatia standard a numarului de utilizatori simultani, inregistrati in 100momente de timp aleator alese, este de 37.7, respectiv 9.2.
Construiti un interval de incredere, cu un nivel de incredere de 90%, pentrumedia utilizatorilor concurenti.
Problema 6. Fie ๐1, ๐2, ..., ๐๐ variabile aleatoare normal distribuite cu media๐ si dispersia ๐2. Care sunt estimarile date de metoda momentelor pentru media๐ si dispersia ๐2?
Problema 7. Un grup de consumatori, preocupati de procentajul mediu degrasime al unui anumit steakburger trimite la un laborator independent un esan-tion de 12 steakburgeri pentru analize. Procentajul de grasime gasit in fiecaresteakburger este dat mai jos:
21 18 19 16 18 24 22 19 24 14 18 15
Producatorul afirma ca procentajul mediu de grasime al unui steakburger esteaproximativ 20%. Presupunand ca procentajul de grasime este normal distribuitcu o deviatie standard de 3, testati ipoteza producatorului, la un nivel de sem-nificatie ๐ผ = 0.05.
Problema 8. Pe parcursul unei anumite saptamani, 13 copii s-au nascut la omaternitate. O parte a procedurii standard e reprezentata de masurarea lungimiiacestora. Mai jos aveti o lista a lungimilor masurate, exprimate in centimetri:
49 50 45 51 47 49 48 54 53 55 45 50 48
Presupunand ca lungimile la nastere ale bebelusilor sunt normal distribuite, tes-tati, la un nivel de semnificatie de 5%, ipoteza ca media lungimii la nastere aunui bebelus este de 50 cm.
Problema 9. ๐1, ๐2, . . . ๐๐ reprezinta o selectie dintr-o populatie ๐ cu dis-tributie exponentiala, adica cu densitatea de repartitie:
๐(๐ฅ) =
{๐๐โ๐๐ฅ, if ๐ฅ โฅ 0,
0, otherwise
Estimati parametrul ๐ folosind metoda momentelor.
15
Problema 10. ๐1, ๐2, . . . ๐๐ reprezinta o selectie dintr-o populatie ๐ cu odistributie Poisson, adica cu densitatea de repartitie:
๐ (๐ = ๐) =
{๐โ๐ ๐๐
๐! , if ๐ = 0, 1, . . .
0, otherwise
Estimati parametrul ๐ folosind metoda momentelor.
16