3.Estimarea Statistica - Intervale de Incredere

Post on 20-Oct-2015

142 views 10 download

transcript

STATISTICA STATISTICA INFERENŢIALĂINFERENŢIALĂ

Tipuri de distributiiTipuri de distributii

Tipuri de distributii Tipuri de distributii (I)(I)

Tipuri de distributii Tipuri de distributii (II)(II)

Distributia normala (Gauss Distributia normala (Gauss Laplace)Laplace)

Distributia normalaDistributia normala

Curba normală (Curba normală (clopotul lui clopotul lui Gauss. Gauss. ))

22

2)(

2

1)(

x

exf

Aria de sub curba normală Aria de sub curba normală văzută ca probabilitate văzută ca probabilitate Considerăm că valorile de sub curba normală sunt rezultatul unei ipotetice extrageri aleatoare

ProbabilitateProbabilitate

Frecvenţa relativă a apariţiei unui Frecvenţa relativă a apariţiei unui eveniment=PROBABILITATEeveniment=PROBABILITATE

HGB g/dL FrecventaFrecvenţa cumulată

Frecvenţa relativă

12 3 3 0,05

13,3 2 5 0,03

13,5 5 10 0,08

13,6 2 12 0,03

13,7 2 14 0,03

13,8 7 21 0,12

14,1 2 23 0,03

14,5 5 28 0,08

14,6 8 36 0,13

14,7 7 43 0,12

14,8 3 46 0,05

15 2 48 0,03

15,2 5 53 0,08

15,3 3 56 0,05

15,4 2 58 0,03

15,7 1 59 0,02

16,4 1 60 0,02

Aria de sub curba normală Aria de sub curba normală văzută ca probabilitate văzută ca probabilitate

Utilizând simbolul p (de la „probabilitate”), spunem că :

Distribuţia mediei de Distribuţia mediei de eşantionareeşantionare

unde:μ este media populaţiei, mi sunt mediile fiecărui eşantion constituit, k este numărul eşantioanelor.

POPULAŢIE

eşantion keşantion 3eşantion 2eşantion 1

Populaţia EşantioaneDistribuţia mediei de

eşantionare

1 1,2,3 M1=2.00

2 1,2,4 M2=2.33

3 3,4,1 M3=2.67

4 2,3,4 M4=3.00

μ=2.5σ=1.29

Toate eşantioanele posibile pentru N=3

Σ=10.00m=10/4=2.5

Pentru exemplificare, se presupune o „populaţie” constituită din valorile 1,2,3,4

media mediilor eşantioanelor extrase (denumită medie de eşantionare) este identică cu media populaţiei (în cazul dat: m=μ=2.5).

Împrăştierea distribuţiei de Împrăştierea distribuţiei de eşantionare eşantionare

(eroarea standard a mediei)(eroarea standard a mediei)

nM

EROARE STANDARD A MEDIEIEROARE STANDARD A MEDIEI

Nsm

abaterea standard a distribuţiei de eşantionare este o fracţiune din abaterea standard a populaţiei, fiind dependentă de mărimea eşantionului

Unde:

- sm este eroarea standard a mediei de eşantionare,

- este abaterea standard a populaţiei

- N este volumul eşantionului

Prin creşterea volumului eşantionului, media eşantionului se apropie tot mai mult de media populaţiei

Teorema limitei Teorema limitei centralecentrale

CCât de mare trebuie să fie un ât de mare trebuie să fie un eşantion pentru a putea fi eşantion pentru a putea fi considerat „suficient de considerat „suficient de

mare”mare”??

Estimarea intervalului de Estimarea intervalului de încredere pentru media încredere pentru media populaţieipopulaţiei

Estimarea mediei şi Estimarea mediei şi dispersiei populaţieidispersiei populaţiei

Curba normaCurba normalălă - - proprietateproprietate

n96.1m

n96.1m

m

95.0aria

Areun număr bine definit de

valori pe un interval simetric

în jurul mediei.

ESTIMAREA se bazează pe

această proprietate

Intervalul de încredere pentru Intervalul de încredere pentru medie cu probabilitatea de medie cu probabilitatea de 95%95%

n

sm

n

sm 96.1,96.1

n96.1m

n96.1m

m

95.0aria

limita inferioară

limita superioară

z=1.96 se numeşte z critic deoarece reprezintă un prag limită, de o parte şi de alta a mediei

Exemplu: Se consideră populaţia valorilor

1,2,3,4,5,6,7,8,9,10, pentru care se calculează =5.5 şi =3,0276.

Din această populaţie se extrag cinci eşantioane aleatoare (pentru uşurinţa calculelor, s-a ales pentru fiecare eşantion N=3).

Mediile şi abaterile standard pentru cele cinci eşantioane selectate au valorile:

m1=5.00 m2=4.5 m3=4.0 m4=2.5 m5=5.5

s1=5.65 s2=4.94 s3=4.24 s4=2.12 s5=6.36

1,2,3,4,5,6,7,8,9,10, 1,2,3,4,5,6,7,8,9,10, =5.5 şi =5.5 şi =3,0276. =3,0276. se extrag cinci eşantioane aleatoare (pentru uşurinţa se extrag cinci eşantioane aleatoare (pentru uşurinţa calculelor, s-a ales pentru fiecare eşantion N=3). calculelor, s-a ales pentru fiecare eşantion N=3).

Mediile şi abaterile standard pentru cele cinci eşantioane Mediile şi abaterile standard pentru cele cinci eşantioane selectate au valorile:selectate au valorile:

375.54

54321

mmmmm

împrăştierea distribuţiei de eşantionare este, mai mică decât împrăştierea variabilei la nivelul întregii populaţii, deoarece o parte a împrăştierii generale se concentrează, şi se „pierde”, în media fiecărui eşantion extras

0,95741110

0276,3

NSm

Estimarea parametrilorEstimarea parametrilor

Necesitatea estimăriiNecesitatea estimării

Intervale de încredere şi Intervale de încredere şi limite de încredere limite de încredere

Intervalul de încredere are 2 limite:

limita inferioară θi

limita superioară θs .

Intervale de încredere Intervale de încredere

Estimarea medieiEstimarea mediei

Intervalul ( x − ∂, x + ∂ ) acoperă parametrul media x (media) cu o probabilitate dată P

P(x − ∂ < m < x + ∂) =1−

1- este nivelul de încredere

prag de semnificaţie.

Interval de incredere pentru medie

Nivele de încredereNivele de încredere

1. 1-0,05=0,95 (95%)

2. 1-0,01=0,99 (99%)

3. 1-0,001=0,999 (99,9%)

Prag de semnificatie

Determinarea intervalului Determinarea intervalului de încrederede încredere

Etape:1. Stabilirea eşantionului2. Determinarea volumului eşantionului (n)3. Determinarea mediei eşantionului (m)4. Determinarea dispersiei eşantionului (s)5. Determinarea erorii standard a mediei6. Determinarea argumentului α z

7. Determinarea intervalului de încredere

n

ssm

zsmzsmm mm ;

Intervalul de încredere al mediei când Intervalul de încredere al mediei când

se cunoaşte dispersia populaţiei (se cunoaşte dispersia populaţiei (22))

nux

nux

=0,05 sau =5% u=1,96

=0,01 sau =1% u=2,58

=0,001 sau =0,1% u=3,29

n este volumul selecţiei extrase

X este media selecţiei extrase

2 este dat şi este dispersia populaţiei

Intervalul de încredere al mediei Intervalul de încredere al mediei când nu se cunoaşte dispersiacând nu se cunoaşte dispersia

I. N>120

n

Sux

n

Sux

reprezintă eroarea standard a mediei n

S

II. N<120

n

Stx

n

Stx 1n,1n,

unde t,n-1 se citeşte din tabelul cu distribuţia "t" la

nivelul şi n-1 grade de libertate

Exemple.Exemple.

Fie dată o populaţie cu repartiţie normală având media şi dispersia 2=1296. S-a extras o selecţie de volum n=9 pe baza căreia s-a calculat =195.

Să se calculeze intervalul de încredere ale mediei a

populaţiei.

x

Rezolvare. nux

nux

129

1296

n

Pentru diferite nivele de încredere se obţine:

=0,05 171,48218,52 (p= 95%)

=0,01 64,04225,96 (p= 99%)

=0,001 155,52234,48 (p= 99,9%)

Exemple.Exemple.

Se consideră repartiţia procentuală de grăsime a laptelui la rasa Roşia. Pentru o selecţie de n=93 s-a obţinut media X=3,95 şi S2=0,07.

Să se estimeze procentul mediu de grăsime a laptelui de vacă la această rasă de vacă.

Rezolvare. n<120

n

Stx

n

Stx 1n,1n, t0,05;93-1= t0,05,92=1,986

t0,01;92=2,631;t0,001;92=3,402

Se estimează cu o probabilitate de 95 % că 3,9053,995

Se estimează cu o probabilitate de 99 % că 3,894,01

Se estimează cu o probabilitate de 99,9 % că 3,87 4,03

Propunem spre rezolvare următoarea Propunem spre rezolvare următoarea problemă:problemă:

Pentru un lot format din 50 de vaci din rasa Bălţata româneasca

s-au obţinut următoarele valori pentru producţia de lapte:

7 27 23 7 16

18 10 9 16 11

11 6 29 12 15

19 8 26 22 17

29 29 7 27 14

29 19 23 16 24

28 24 11 21 8

19 13 25 7 18

Considerând ca acest caracter are o repartiţie normala, sa se estimeze cu probabilitatea de 95%, 99% şi 99,9% intervalul de încredere al parametrului "producţia medie zilnica de lapte" la vacile din aceasta rasa.

Este necesar să se Este necesar să se calculezecalculeze

Exprimarea corectă este Exprimarea corectă este următoarea:următoarea:

Interpretarea intervalului Interpretarea intervalului de încrederede încredere

Determinarea volumului n al Determinarea volumului n al eşantionulueşantionuluii

n

szm

n

szm

ervalint

n

sz 22

2

s

zn

Exemplu.

Să se afle numărul de observaţii ce trebuie efectuate pentru a estima talia medie a populaţiei bărbaţilor adulte dacă se ştie că S2=9 cm2 şi se cere o precizie =1 cm, care să fie asigurată cu probabilitatea 1-= 0.95

=0.05S=3 cmz=1,96 35574,35

1

396,1

2

n

z=1,96

pentru n=34z0,05;34=2,033 37197,37

1

3033.2

2

n

Sunt necesare 37 de observaţii pentru estimarea taliei Sunt necesare 37 de observaţii pentru estimarea taliei medii cu precizia de 1 cm.medii cu precizia de 1 cm.