+ All Categories
Home > Documents > 47586359 Probabilitati Si Statistic A a

47586359 Probabilitati Si Statistic A a

Date post: 07-Apr-2018
Category:
Upload: serj88
View: 244 times
Download: 3 times
Share this document with a friend

of 50

Transcript
  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    1/50

    Curs de Probabilitati si StatisticaSectia: Informatica anul II

    Lect.dr. Raluca Vernic

    June 1, 2006

    1

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    2/50

    PROBABILITATI

    1 Introducere

    1.1 Scurt istoric

    Aparuta din practica jocurilor de noroc Problemele cavalerului De Mere Dezvoltare vertiginoasa: Pascal, Bernoulli, Moivre, Laplace, Cebisev, Leapunov,

    Markov, Kolmogorov etc.

    Aplicatii in foarte multe domenii

    1.2 Obiectul de studiu al teoriei probabilitatilor

    Denitii:

    - Modelul matematic - descrie un fenomen, proces, experiment, eveniment sau obiectcu ajutorul notiunilor si formulelor matematice, in scopul cercetarii lor.

    - Experiment aleator - rezultatele sale nu pot anticipate cu certitudine si poseda pro-prietatea regularitatii statistice. Toate rezultatele posibile ale unui experimentse numesc cazuri posibile si se noteaza :

    - Teoria probabilitatilor - studiaza modelele matematice ale experimentelor (fenomenelor)aleatoare.

    1.3 Evenimente aleatoare

    Denitie. Se numeste eveniment aleator (sau pe scurt eveniment) atasat unuiexperiment orice situatie care se poate realiza in decursul experimentului. Se noteazacu A;B;:::

    Fiecarui eveniment ii corespunde o multime de cazuri favorabile, care este osubmultime a multimii cazurilor posibile.

    Tipuri de evenimente aleatoare. Evenimentele care au un singur caz favorabilse numesc evenimente elementare, celelalte evenimente compuse.Cazuri particulare de evenimente:- evenimentul sigur, care se realizeaz~a prin oricare dintre probe, notat cudeoarece ii corespunde multimea tuturor cazurilor posibile;- evenimentul imposibil, care nu se poate realiza in nici o prob~a. El nu are niciun caz favorabil si se noteaz~a cu ; (multimea vid~a).

    2

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    3/50

    Operatii cu evenimente aleatoare.- Reuniunea evenimentelor. Se numeste reuniunea a dou~a evenimente A siB evenimentul care se realizeaza atunci cand se realizeaz~a cel putin unul dintreevenimentele A si B; se noteaza A

    [B.

    - Intersectia evenimentelor. Se numeste intersectia a dou~a evenimente A si Bevenimentul care se realizeaza atunci cand se realizeaz~a simultan evenimentele A siB; se noteaza A \ B.- Diferenta evenimentelor. Se numeste diferenta a dou~a evenimente A si Bevenimentul care se realizeaz~a atunci cand se realizeaz~a A, dar nu se realizeaz~a B;se noteaz~a A B.

    Relatii intre evenimente aleatoare.- Evenimentul cotrar lui A, sau non A; este evenimentul care se realizeaz~a atuncisi numai atunci cand nu se realizeaz~a A. Se noteaz~a cu A.- Echivalenta evenimentelor. Dou~a evenimente sunt echivalente dac~a se real-izeaz~a simultan. Aceasta revine la egalitatea multimilor de cazuri favorabile carecorespund evenimentelor; se noteaz~a A = B.- Implicatia evenimentelor. Se spune c~a evenimentul A implic~a evenimentulB, dac~a realizarea lui A atrage dup~a sine si realizarea lui B; se noteaz~a A B.Aceasta inseamn~a c~a multimea cazurilor favorabile lui A este inclus~a in multimeacazurilor favorabile lui B.- Evenimente incompatibile. Evenimentele A si B sunt incompatibile dac~anu se pot realiza simultan in nici o efectuare a experientei. Aceasta se poate scrieA \ B = ;:- Evenimente compatibile. Evenimentele A si B sunt compatibile dac~a se

    pot realiza simultan, deci dac~a au cel putin un caz favorabil comun. Se noteaz~aA \ B 6= ;:

    Dualitate de limbaj: evenimente-multimi. Deoarece orice eveniment legatde un experiment cu un num~ar nit de cazuri posibile poate interpretat ca osubmultime a multimii , avem urm~atoarea dualitate de limbaj:

    Limbajul evenimentelor Limbajul multimilor- Eveniment - Submultime a lui- Eveniment sigur - Multimea (total~a)- Eveniment imposibil - Multimea vid~a, ;- A implic~a B A B- A sau B A [ B- A si B A \ B- non A (evenimentul contrar lui A) A- A; B incompatibile A \ B = ;- Eveniment elementar ! 2

    Exemple: aruncarea unui zar; aruncarea unei monede; aruncarea unei monede

    3

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    4/50

    de doua ori; aruncarea unei monede pana la aparitia stemei; masurarea inaltimiielevilor dintr-o scoala.

    1.4 Corp borelian de evenimente aleatoareDenitii:

    - Spatiu masurabil discret (corp/camp borelian de evenimente discret) - perechea( ; F) ; unde este o multime discreta, iar F= P( ) este multimea tuturorsubmultimilor lui .

    - Corp borelian (-algebra). Fie o multime oarecare si F P( ) : Atunci Festecorp borelian peste daca: (1) 2 F; (2) 8A 2 F ) A 2 F; (3) 8 (An)n F )

    SnAn 2 F:

    - Spatiu masurabil (corp/camp borelian de evenimente) - perechea ( ; F) ; undeeste o multime oarecare si Feste un corp borelian pe .

    Exemple:- Cel mai \sarac" corp borelian: F= f;; g- Cel mai \bogat" corp borelian: F= P( )- Corpul borelian al numerelor reale, BR, este corpul borelian generat de multimea M =f(a; 1) ja 2 Rg :- Corpul borelian pe Rn, BRn, este corpul borelian generat de multimea

    M = (a1; b1) ::: (an; bn) ai; bi 2 R; i = 1; n :

    4

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    5/50

    2 Probabilitatea

    Fie ( ; F) spatiu masurabil.

    2.1 Probabilitatea in sens larg

    Denitie. Aplicatia P : F ! R este o probabilitate in sens larg dac~a vericaaxiomele:A1) P(A) 0; 8A 2 F,A2) P( ) = 1,A3) 8A; B 2 F; A \ B 6= ;; atunci P (A [ B) = P(A) + P (B) :

    Proprietati: 8A; B 2 F;1) P

    A

    = 1 P(A) ;

    2) P(

    ;) = 0;

    3) 0 P(A) 1;4) A B ) P (A) P(B) ;5) P(A B) = P(A) P(A \ B) ;6) P(A [ B) = P(A) + P(B) P (A \ B) ;7) P(A [ B) P(A) + P(B) :

    2.2 Denitia axiomatica a probabilitatii (A.N. Kolmogorov, 1930)

    Denitie. Aplicatia P : F ! R este o probabilitate (in sens restrans) dac~averica axiomele (A1), (A2) de mai sus, plus

    A3) 8 (An)n F; Ai \ Aj 6= ;; 8i 6= j; atunci PSn

    An

    =P

    nP (An) : (axioma

    aditivitatii complete)

    Obs. Probabilitatea in sens restrans ):

    probabilitatea in sens larg.

    Denitie. Tripletul ( ; F; P) se numeste spatiu de probabilitate. Alte proprietati:

    8) 8 (An)n F; PSn

    An

    Pn

    P (An) ;

    9) Inegalitatea lui Boole. Fie I multime cel mult numarabila si (Ai)i2I F.Atunci P

    Ti2I

    Ai

    1 P

    i2I

    P(Ai) :

    10) Proprietatea de continuitate. Fie (An)n Fsir ascendent (descendent) demultimi, adica An An+1; 8n (An An+1). Atunci P

    Sn

    An

    = lim

    n!1P (An)

    P

    Tn

    An

    = lim

    n!1P(An)

    :

    5

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    6/50

    2.3 Denitia clasica a probabilitatii (sec. XVI)

    Fie ( ; F) cu = f!1;:::;!ng si F= P( ) (spatiu masurabil discret). Presupunemca evenimentele elementare sunt echiprobabile, adica P(!1) = ::: = P(!n). Rezulta

    P(!i) = 1=n; iar pentru orice eveniment A 2 F;P (A) =

    card (A)

    card ( )=

    nr. cazuri favorabile lui A

    nr. cazuri posibile:

    Aceasta este denitia clasica a probabilitatii, care este un caz particular al denitieiaxiomatice.

    2.4 Denitia geometrica a probabilitatii

    Fie ( ; F) unde 2 BRn de masura Lebesgue nita (mes < 1), iar F = B ( ) =fB \ jB 2 BRn g :

    Denim probabilitatea geometrica pe acest spatiu ca P(A) =mes (A)

    mes ( ):

    Cazuri particulare: n = 1 ) mes =lungimea; n = 2 ) mes =aria; n = 3 )mes =volumul.

    6

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    7/50

    3 Scheme clasice de probabilitate si probabilitateaconditionata

    3.1 Schema binomiala (a bilei revenite) Schema generala. In urma efectu~arii unui experiment poate s~a se produc~a eveni-

    mentul A cu probabilitatea p, sau evenimentul A cu probabilitatea q = 1 p. Serepet~a experimentul de n ori, in conditii identice. Probabilitatea P(n; k) ca in celen experimente s~a se realizeze evenimentul A de exact k ori este

    P(n; k) = Cknpkqnk;

    adic~a tocmai coecientul lui xk din dezvoltarea binomului (px + q)n.

    Caz particular. Fie o urn~a in care avem a bile albe si b bile negre. Efectu~am nextrageri, punand dup~a ecare extragere bila extras~a inapoi in urn~a. Probabilitatea

    ca la o extragere s~a obtinem o bil~a alb~a este p =a

    a + b, iar probabilitatea ca din n

    extractii s~a obtinem k bile albe este P(n; k). De aceea schema se mai numeste sischema bilei revenite.

    3.2 Generalizare: schema multinomiala (cu mai multe stari)

    Schema generala. In urma efectu~arii unui experiment poate ap~area unul si numaiunul dintre evenimentele A1;:::;Am, care formeaz~a un sistem complet de evenimente.

    Fie pj = P(Aj) ; j = 1; m, atunci

    mPj=1pj = 1.

    Se repet~a experimentul de n ori, in conditii identice. Probabilitatea P(n; k1;:::;km)ca in cele n experimente evenimentul Aj s~a apar~a de kj ori, j = 1; m, este

    P(n; k1;:::;km) =n!

    k1! ::: km!pk11 ::: pkmm :

    Caz particular. O urna in care avem bile de mai multe culori.

    3.3 Schema lui Poisson

    Schema generala. Se executa n experimente independente. In urma experimen-tului de rang j, poate s~a apar~a evenimentul Aj cu probabilitatea pj sau Aj cuprobabilitatea qj = 1 pj; j = 1; n. Probabilitatea Pk, s~a se realizeze k dintre celen evenimente (Aj)j=1;n ; este coecientul lui x

    k din polinomul

    P(x) = (p1x + q1) ::: (pnx + qn) :

    7

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    8/50

    Caz particular. Schema lui Poisson poate obtinuta considerand un sir de n urnecu bile de dou~a culori (albe si negre), cu compozitii diferite. Se extrage pe rand cateo bil~a din ecare urn~a. Atunci probabilitatea s~a obtinem k bile albe este Pk.

    Particularizarea la schema binomiala. Schema binomiala se obtine ca un caz par-ticular al schemei lui Poisson cand p1 = ::: = pn:

    3.4 Schema hipergeometrica (a bilei nerevenite)

    Prezentarea schemei. Dintr-o urn~a cu a bile albe si b bile negre (a + b = N)se extrag n bile, n N, f~ar~a a pune bila extras~a inapoi in urn~a. Probabilitatea,P(; a; b), ca dintre bilele extrase s~a e albe si negre, + = n, este

    P (; a; b) =Ca C

    b

    C+a+b

    :

    3.5 Probabilitatea conditionata

    Fie ( ; F; P) un spatiu de probabilitate si A; B 2 Fcu P(B) > 0:

    Denitie. Probabilitatea evenimentului A conditionata de realizarea evenimentuluiB este

    PB (A) = P(A jB ) = P (A \ B)P(B)

    :

    Formula de inmultire a probabilitatilor. Fie A1;:::;An 2 F astfel incatP(A1 \ ::: \ An) > 0. Atunci

    P

    n\

    i=1

    Ai

    != P(A1) P(A2 jA1 ) ::: P

    An

    n1\

    i=1

    Ai

    !:

    Formula probabilitatii totale (FPT). Fie B; A1;:::;An;::: 2 Fastfel incat

    8>:1) B

    SnAn

    2) Ai \ Aj = ;; 8i 6= j3) P (Ai > 0) ; 8i : Atunci P(B) =

    Xn P (B jAn ) P(An) :

    Formula lui Bayes. In conditiile (1)-(3) de la FPT,

    P(Aj jB ) = P(B jAj ) P(Aj)P(B)

    :

    8

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    9/50

    3.6 Evenimente independente. Denitii:

    -Evenimentele A; B 2 Fsunt independente daca P(A \ B) = P(A) P(B) :

    - Evenimentele A1;:::;An 2 Fsunt independente doua cate doua daca P(Ai \ Aj) =P(Ai) P(Aj) ; 8i 6= j:- Evenimentele A1;:::;An 2 Fsunt independente in totalitate daca 8k = 1; n; 8I =

    fi1;:::;ikg 1; n; atunci P

    kTj=1

    Aij

    !=

    kQj=1

    P

    Aij

    :

    Proprietate. A1;:::;An independente in totalitate):

    independente doua cate doua.

    9

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    10/50

    4 Variabile aleatoare

    4.1 Imaginea inversa a unei functii

    Denitie. Fie X : ! si A : Denim X1 (A) = f! 2 jX(!) 2 Ag : Proprietati.8>>>>>>>:

    1) X1

    A

    = X1 (A):

    2) X1T

    i

    Ai

    =T

    i

    X1 (Ai) si X1

    Si

    Ai

    =S

    i

    X1 (Ai) :

    3) Daca G este un corp borelian peste , atunci X1 (G) este corp borelian peste .4) X1 (B (M)) = B (X1 (M)) ; 8 M P () :

    4.2 Variabile aleatoare Denitii:- Fie ( ; F) si (; G) doua spatii masurabile. Atunci X : ! este o functiemasurabila daca 8A 2 G; X1 (A) 2 F:- Daca = R si G = BR; atunci functia masurabila X : ! R se numeste variabilaaleatoare (v.a.).- Daca = Rn si F= BRn; atunci o functie masurabila pe acest spatiu se numesteboreliana (Borel masurabila).

    Teorema. X : ! R este variabila aleatoare d.s.n.d. pentru 8a 2 R are loc unadintre urmatoarele conditii:

    1) f! 2 jX(!) < ag 2 F 3) f! 2 jX(!) > a g 2 F2) f! 2 jX(!) ag 2 F 4) f! 2 jX(!) ag 2 F:

    Proprietate. Daca X : ! R este variabila aleatoare si ' : R ! R estemasurabila Borel, atunci ' (X) este o variabila aleatoare.Daca X1;:::;Xn : ! R sunt variabile aleatoare si ' : Rn ! R este masurabilaBorel, atunci ' (X1;:::;Xn) este o variabila aleatoare.

    Consecinta. Daca X; Y : ! R sunt variabile aleatoare si c 2 R, atunci functiileurmatoare sunt tot variabile aleatoare: c + X;cX;

    jX

    j; X2;

    1

    X

    pentru X

    6= 0; X

    Y;XY;

    X

    Ypentru Y 6= 0; min(X; Y) ; max(X; Y) :

    4.3 Variabile aleatoare de tip discret

    Denitii:- V.a. X : ! R se numeste simpla daca ia un numar nit de valori nite.- V.a. X : ! R se numeste discreta daca multimea valorilor sale este discreta.

    10

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    11/50

    Tabel de distributie. O v.a. discreta se poate reprezenta printr-un tabel dedistributie astfel:

    X x1 x2 ::: xn :::p1 p2 ::: pn :::

    ; unde x1; x2::: sunt toate valorile pe care la ia v.a.,

    iar pinot:= P(f! 2 jX(!) = xi g) = P(X = xi) ; i = 1; 2;:::; deci 0 pi 1: Se

    remarca faptul caPi1

    pi = 1:

    Exemple de v.a.:

    1. V.a. indicator IA a unui eveniment A 2 Fse deneste ca IA (!) =

    1; ! 2 A0; ! =2 A .

    Deci IA 0 1

    q= 1 p p = P (A) :2. V.a. Bernoulli: X

    0 aq p

    ; unde a 2 R; p + q = 1 si 0 p 1:

    3. V.a. Binomiala: X

    0 ::: k ::: n

    ::: Cknpkqnk :::

    ; unde n 2 N; p + q = 1 si

    0 p 1. Se noteaza X Bin (n; p) :4. V.a. asociata schemei lui Poisson.

    5. V.a. Poisson: X

    0 1 ::: n :::

    ::: en

    n!

    :::

    !; unde > 0. Se noteaza X

    P() :6. V.a. Hipergeometrica - se asociaza schemei hipergeometrice.

    7. V.a. Geometrica: X

    0 1 ::: n :::

    p pq ::: pq n :::

    ; unde p + q= 1 si 0 p 1.

    Independenta. V.a. X; Y sunt independente d.s.n.d.P (X = x \ Y = y) = P(X = x) P(Y = y) ; 8x;y:

    Operatii cu variabile aleatoare. Fie X x1 x2 ::: xn :::

    p1 p2 ::: pn ::: si a 2

    R:

    1. Adunarea: a + X =

    a + x1 a + x2 ::: a + xn :::

    p1 p2 ::: pn :::

    2. Inmultirea: aX =

    ax1 ax2 ::: axn :::p1 p2 ::: pn :::

    3. Ridicarea la putere: Xn =

    xn1 x

    n2 ::: x

    nn :::

    p1 p2 ::: pn :::

    :

    11

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    12/50

    5 Functii de repartitie

    Fie ( ; F; P) un spatiu de probabilitate si v.a. X : ! R.

    Denitie. FX : R ! R se numeste functie de repartitie (f.r.) asociata v.a. Xdaca FX (x) = P (X < x)

    not:= P (X1 (1; x)) :

    Exemplu: f.r. asociata v.a. discrete, X

    x1 x2 ::: xn :::p1 p2 ::: pn :::

    ; este

    FX (x) =

    8>>>>>>>:

    0; x x1p1; x1 < x x2::::

    p1 + ::: +pn; xn < x xn+1:::

    :

    Proprietati caracteristice. F.r. F a unei v.a. are urmatoarele proprietati:1) 8a < b 2 R; F(a) F(b)2) 8a 2 R; F (a 0) = F (a) (continua la stanga)3) F (1) = 0; F(+1) = 1:

    Teorema de existenta. Fie F : R ! R avand proprietatile (1)-(3) de mai sus.Atunci exista un spatiu de probabilitate ( ; F; P) si o v.a. X : ! R astfel incatF = FX:

    Teorema. O f.r. are numai discontinuitati de speta I, iar multimea lor este cel

    mult numarabila.

    Alte proprietati: formule de legatura intre probabilitate si f.r.(1) P(X a) = 1 FX (a)(2) P(X = a) = FX (a + 0) FX (a 0) = FX (a + 0) FX (a) (saltul functiei)(3) P(a X < b) = FX (b) FX (a)(4) P(a X b) = FX (b + 0) FX (a)(5) P(a < X b) = FX (b + 0) FX (a + 0)(6) P(a < X < b) = FX (b) FX (a + 0) :

    6 V.a. de tip continuu Tipuri de functii de repartitie

    - F.r. de tip discret - corespunde v.a. de tip discret- F.r. de tip absolut continuu - ii corespunde v.a. continua- F.r. de tip singular - ii corespunde v.a. singulara.

    12

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    13/50

    Denitii:- O f.r. F este de tip absolut continuu daca 9f : R! R masurabila Borel astfelincat F(x) =

    Rx

    1f(u) du: Atunci f se numeste densitate de repartitie.

    - O v.a. este de tip continuu daca functia sa de repartitie este de tip absolutcontinuu.- O f.r. continua, care nu este absolut continua, este de tip singular. Multimeapunctelor sale de crestere este de masura Lebesgue nula.

    Teorema (Lebesgue). Orice f.r. F se poate descompune in mod unic sub formaF (x) = p1Fd (x) +p2Fc (x) +p3Fs (x) ;

    unde p1 + p2 + p3 = 1, iar Fd este o f.r. discreta, Fc este o f.r. absolut continua siFs este o f.r. singulara.

    Proprietati (d.r.)1) 8x; f(x) 02)R11

    f(u) du = 13) 8x punct de continuitate al lui f; f(x) = F0 (x) :4) P(a X < b) = Rb

    af(u) du; P(X b) = R1

    bf(u) du:

    Exemplu de f.r. continua, care nu este absolut continua (Cantor).

    6.1 Cele mai importante modele probabiliste de tip absolut con-tinuu

    6.1.1 Repartitia Uniforma

    Denitie. X U[a; b] , f(x) =8 0. Atunci sirul de v.a.

    X1 + ::: + Xn nap

    nconverge slab catre o

    v.a. repartizata normal standard.

    Obs. Cu notatia Sn = X1 + ::: + Xn, TLC se mai scrie:Sn ESnpDSn

    converge slab catre

    o v.a. repartizata normal standard.

    Consecinta (TLC in forma Moivre-Laplace). Fie (Xn)n sir de v.a. indep.,identic repartizate Bernoulli(p) ; p

    2(0; 1) : Atunci

    P

    X1 + ::: + Xn npp

    np (1 p) < x!

    !n!1

    (x) ; 8x 2 R:

    13.3 Aplicatii ale TLC

    Problema. Fie (Xn)n sir de v.a. indep., identic repartizate. Sa se determineprobabilitatea ca Sn = X1 + ::: + Xn 2 [; ] :Rezolvare.

    P( Sn ) = P

    ESnpDSn

    Sn ESnpDSn

    ESnpDSn

    n mare

    ESnpDSn

    ESnpDSn

    :

    Aplicatie (regula celor 3 sigma in forma TLC). In conditiile de mai sus, avem

    PjSn ESnj 3

    pDSn

    = P

    3 Sn ESnp

    DSn 3

    (3) (3) = 2 (3) 1 = 0:997 > 89

    ;

    23

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    24/50

    unde ultima valoare s-a obtinut la inegalitatea lui Cebisev.

    Utilitatea mediei arimetice: estimarea numarului minim de observatii necesarpentru a obtine o eroare foarte mica cu o probabilitate foarte mare

    Fie X1;:::;Xn rezultatele a n observatii independente asupra v.a. X de medie anecunoscuta. Estimam a prin X =

    1

    n

    nPi=1

    Xi. Ne intereseaza care ar numarul minim

    de observatii necesar pentru a obtine o precizie foarte buna (altfel spus, o eroarefoarte mica), cu o probabilitate foarte mare. Pentru simplicare, e DX = 2 = 1:Alegem eroarea " = 0:1; iar probabilitatea minima egala cu 0:99: Deci, vrem ca

    P

    X a < 0:1 0:99:- Rezolvarea problemei cu TLC:

    P

    X a < 0:1 = PSnn a < 0:1 = PSn nan < 0:1 == P

    Sn ESnp

    DSn

    < 0:1pn

    2 0:1pn 1:

    Punem conditia ca

    2

    0:1p

    n 1 0:99 ) n 676:

    - Rezolvarea problemei cu inegalitatea lui Cebisev:

    P

    X a < 0:1 1 D X0:12 ;deci punem conditia

    1 DX

    0:12 0:99 ) 1

    n0:01 0:01 ) n 104:

    Concluzie. Inegalitatea lui Cebisev este mai \grosiera" decat TLC, care da rezul-tate mai exacte.

    24

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    25/50

    14 Repartitii clasice derivate din repartitia normala

    14.1 Repartitia 2

    Denitie. X 2 (n) , f(x) = 12n=2 (n=2)

    xn=21ex=2; x > 0:

    Proprietati.1) EX = n; DX = 2n;

    2) Daca X1;:::;Xn sunt v.a.i.i.r. N(0; 1), atuncinP

    i=1

    X2i 2 (n) ;3) Daca X 2 (n) indep. de Y 2 (m) ; atunci X+ Y 2 (n + m) :

    14.2 Repartitia Student (t)

    Denitie. Daca X; X1;:::;Xn sunt v.a.i.i.r. N(0; 1), atunci v.a. Tn = Xr1n

    nPi=1

    X2i

    Student (n) :

    Proprietate. Tn are d.r.

    f(x) =1pn

    n+12

    n2

    1 + x2n

    n+12

    ; x 2 R:

    Caz particular. T1

    Cauchy; cu d.r. f(x) =1

    (1 + x2)

    :

    14.3 Repartitia F

    Denitie. Daca X1;:::;Xm; Y1;:::;Yn sunt v.a.i.i.r. N(0; 1), atunci v.a. Fm;n =1

    m

    mPi=1

    X2i

    1

    n

    nPi=1

    Y2i

    F(m; n) :

    Proprietate. Tn are d.r.

    f(x) =m

    n

    m=2 m+n2

    m2

    n2

    xm=21 1 + mn

    xm+n

    2

    ; x > 0:

    25

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    26/50

    14.4 Repartitia normala multidimensionala

    14.4.1 Repartitia normala bidimensionala

    Denitie. Vectorul aleator (X; Y)

    N(m1; m2;

    2

    1

    ; 21

    ; ) ; m1; m22R; 1; 2 >

    0; jj < 1; daca are d.r.

    f(x; y) =1

    212p

    1 2 exp(

    12 (1 2)

    "x m1

    1

    2+

    y m2

    2

    2

    2(x m1) (y m2)12

    :

    Proprietati.1) Repartitiile marginale sunt X N(m1; 21) ; Y N(m2; 22) :2) este coecientul de corelatie dintre X si Y.

    14.4.2 Repartitia normala multidimensionala

    Fie X = (X1;:::;Xn)0 o v.a. n-dimensionala.

    Denitie. S.n. matrice de covarianta v.a. X; matricea cov (X) = (cov (Xi; Xj))i;j=1;n : Denitie. V.a. X urmeaza o repartitie normala standard n-dimensionala,

    X Nn (0; In), unde 0 este vectorul alcatuit din n de 0, iar In este matricea unitaten-dimensionala, daca are d.r.

    f(x1;:::;xn) =

    1

    (2)n=2 exp(12

    nXk=1

    x2

    k)

    :

    Proprietati.1) Repartitiile marginale sunt Xk N(0; 1) ; k = 1;:::;n: In plus, X1;:::;Xn suntindependente.2) cov (X) = In:3) F.c. a vectorului X este

    'X

    (t1;:::;tn)def:= E

    e

    inP

    k=1

    tkXk

    != e

    12

    nPk=1

    t2k

    :

    Denitie. V.a. X urmeaza o repartitie normala n-dimensionala, X Nn (m; ),unde m = (m1;:::;mn)

    0 si este o matrice n-dimensionala simetrica, pozitiv denita,daca are d.r.

    f(x) =1

    (2)n=2p

    detexp

    1

    2(x m)0 1 (x m)

    ;

    unde am notat x = (x1;:::;xn)0 :

    26

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    27/50

    Proprietati.1) Descompunand = AA0; A matrice nesingulara n n, atunci A1 (X m) Nn (0; In) :2) cov (X) = :3) F.c. a vectorului X este, pentru t = (t1;:::;tn)0,

    'X

    (t) = exp

    it0m1

    2t0t

    :

    4) Aplicand o transformare liniara unei v.a. normale multidimensionale se obtinetot o v.a. normala.5) Suma a doua v.a. independente, normal repartizate de aceeasi dimensiune, estetot o v.a. normala pentru care se aduna parametrii corespunzatori.6) Orice combinatie liniara a componentelor unei v.a. normale multidimensionaleeste repartizata normal unidimensional.7) Daca X Nn (m; ) cu matrice diagonala, atunci componentele lui X sunt v.a.independente si Xk N(mk; kk) ; k = 1; n:8) Repartitiile marginale ale v.a. X Nn (m; ) sunt tot de tip normal.

    27

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    28/50

    STATISTICA DESCRIPTIVA

    15 Introducere

    15.1 Scurt istoric

    Primele notiuni de statistica le gasim la inceputul erei noastre, cu ocazia numarariidiferitelor obiecte, in legatura cu impozitele si necesitatile razboaielor. Dar abia in secolulal XVIII-lea a inceput statistica sa se dezvolte ca o stiinta de sine statatoare, folosind ladescrierea diferitelor trasaturi care caracterizeaza statul. Mult timp statistica s-a ocupatnumai de acest domeniu, ind denumita si aritmetica politica. Termenul de statistica afost introdus in Germania, ca urmare a lucrarilor lui Gottfried Achenwall (1719-1772).

    Statistica matematica moderna a luat nastere in secolul al XIXlea, din imbinareaa doua orientari: aritmetica politica si calculul probabilitatilor.Unul dintre principalii

    artizani ai acestei unicari este in mod incontestabil mate- maticianul si zicianul belgianLambert Adolphe Quetelet (1796-1874).

    In prima jumatate a secolului al XX-lea, statistica se remarca indeosebi prin dez-voltarea unor metode din ce in ce mai numeroase si prin aplicarea acestor metode insectoare tot mai variate, cum ar : stiintele politice si sociale, biologie (apare biometria),psihologie (psihometria), agronomie (dezvoltarea planurilor de experimente), economie(econometria), industrie (prin contolul de calitate), problemele de gestiune (prin cercetarileoperationale) etc.

    Cea de-a doua jumatate a secolului al XX-lea este marcata in special de dezvoltareainformaticii. Aceasta a permis nu numai efectuarea mult mai rapida a calculelor, dar

    si utilizarea unor metode statistice care, desi destul de vechi, nu putusera aplicate^inpractica din cauza volumului de calcule necesitat. Amintim in acest sens metodele de

    analiza statistica multidimensionala. Pe de alta parte, calculatorul a inuentat predareastatisticii, prin aparitia unor programe statistice specializate.

    15.2 Denitie. Terminologie

    Termenul statistica este derivat din substantivul latin status (stare).Ca stiinta generala, statistica reprezinta multimea procedeelor prin care se studiaza

    proprietati, caracteristici ale unor populatii numeroase. Acest studiu este bazat pe datenumerice observate asupra populatiei respective.

    Statistica matematica realizeaza acelasi obiectiv, folosind insa instrumentul matematicin analiza si interpretare. Mai pe larg, avem urmatoarea denitie:

    Def. Statistica matematica este o ramura a matematicii care se ocupa cu studiereamodelelor matematice ce vizeaza gruparea, analiza si interpretarea datelor referitoare laanumite fenomene aleatoare, precum si cu realizarea de previziuni privind producerea lorviitoare.

    28

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    29/50

    Pe de alta parte, termenul statistica mai este folosit si pentru a desemna un parametru(precum media), calculat pe baza datelor numerice, ca valoare a unei functii de acestedate. Utilizat la plural, termenul statistici se refera la multimea datelor numerice culeseasupra unui grup oarecare de indivizi. Se vorbeste astfel despre statistici demograce(natalitate, mortalitate etc.), statistici ale productiei agricole sau industriale (cantitatiproduse, preturi de vanzare etc.), statistici ale somajului etc.

    15.3 Etapele unui studiu statistic

    Orice studiu statistic poate descompus in doua etape principale: etapa de colectare side organizare a datelor si etapa de analiza si interpretare a lor.

    Colectarea datelor se poate realiza e prin observarea directa a fenomenelor de interes,asa cum se produc ele in mod natural, e prin experimentare, adica provocand in modcontrolat aparitia anumitor fenomene.

    Statistica se descompune la randul sau in doua ramuri: statistica descriptiva si inferentastatistica.

    Statistica descriptiva este etapa deductiva a studiului statistic. Ea se ocupa cu orga-nizarea datelor observate sub o forma cat mai accesibila si mai clara, de exemplugruparea lor in tabele si reprezentarea graca.

    Inferenta statistica este etapa inductiva, care permite extinderea sau ge- neralizarea inanumite conditii a concluziilor obtinute de statistica descriptiva. Spre exemplu,observarea sau experimentarea se pot efectua doar asupra unei fractiuni din indi-

    vizii studiati. Concluziile relative la aceasta fractiune, denumita esantion, trebuiescextinse pe cat posibil la ansamblul indivizilor, care formeaza populatia. Aceastafaza inductiva presupune, desigur, anumite riscuri de eroare, care pot masuratecu ajutorul teoriei probabilitatilor.

    Etapele unui studiu statistic nu sunt independente una de cealalta. Datorita conditiilorrestrictive care pot aparea la inferenta statistica, observarea si experimentarea trebuiescorganizate astfel incat sa raspunda cat mai bine acestor conditii.

    29

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    30/50

    16 Populatie si caracteristici. Esantion

    16.1 Denitii si clasicari

    Pentru inceput, vom introduce notiunile (termenii) de baza care se vor regasi in toateetapele unui studiu statistic.

    Def. Se numeste populatie (colectivitate) statistica orice multime nevida de elementesupusa studiului in legatura cu un anumit fenomen. Elementele sale se mai numesc indivizisau unitati statistice.

    Populatia statistica o vom nota cu , iar elementele sale cu !1; !2;:::

    Obs. 1 Din punct de vedere matematic, populatia este modelata prin intermediulnotiunii de multime.

    Def. Caracteristica statistica reprezinta insusirea, proprietatea sau trasatura comuna

    tuturor indivizilor unei populatii, si care sta la baza studiului acelei populatii. Se noteazacu litere mari, X;Y;... si se mai numeste variabila statistica sau variabila aleatoare.

    Exemple

    a) Pentru populatia alcatuita din studentii unei facultati, se pot studia caracteristiciprecum: sex, varsta, stare civila, notele la examene, media, etc.

    b) Daca populatia este reprezentata de un anumit bun realizat in serie, atunci caracter-isticile pot : calitatea (control de calitate), dimensiunea, pretul, etc.

    c) In cazul in care populatia este constituita din bunurile desfacute pe piata de o rma,

    caracteristicile considerate vor : sortimentele desfacute, cantitatea din ecare tipde bun, pretul la desfacere, etc.

    d) Populatia dintr-o anumita zona geograca poate studiata din punct de vedere al:sex, varsta, numar de ani de scolarizare, stare civila, grupa socio-profesionala, starede sanatate, culoare ochi, culoare par, etc.

    Obs. 2 Pentru ecare populatie se poate lua in studiu un numar mai mare sau maimic de caracteristici, in functie de cerintele analizei. Numarul caracteristicilor poate limitat din considerente de ecienta si de rationalitate.

    Caracteristicile determina descompunerea populatiei in grupe omogene, care pot

    studiate separat. Fiecare caracteristica are mai multe forme de manifestare numite simodalitati sau valori, care trebuie sa satisfaca urmatoarele principii:

    - principiul completitudinii: ecare individ al populatiei apartine unei clase denita deuna dintre modalitati;

    - principiul unicitatii: un individ apartine unei singure clase;

    30

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    31/50

    - principiul organizarii ierarhice a claselor: clasele pot unicate prin marirea graduluide generalitate al modalitatilor.

    Vom nota modalitatile cu litere mici: x;y;:::

    Obs. 3 Din cele spuse mai sus rezulta ca variabila statistica poate modelata matem-atic prin intermediul notiunii de functie, avand ca domeniu de denitie multimea , iarca domeniu de valori o multime nevida de orice natura (numerica sau nu).

    Clasicarea caracteristicilor se poate face dupa mai multe criterii. Prezentamdoua criterii:

    a) Clasicare dupa forma de prezentare:

    - caracteristici cantitative: valorile lor sunt exprimate numeric. Exemple: nota, varsta,greutatea, numarul de aruncari ale unei monede pana la prima aparitie a stemei,

    etc.- caracteristici calitative: valorile lor nu se exprima numeric. Exemple: culoare ochi,

    profesie, sex.

    Obs. 4 O caracteristica de un tip se poate transforma intr-o caracteristica de celalalttip. Cea mai frecventa transformare este din tipul calitativ in cel cantitativ, prin nu-merotarea modalitatilor. Spre exemplu, putem codica sexul astfel: 1-masculin, 2-feminin.Invers, pentru a trece de la tipul cantitativ la cel calitativ, se pot deni grupe tipice devalori pentru caracteristica studiata.

    b) Clasicare dupa numarul modalitatilor:

    - caracteristici discrete: iau o multime cel mult numarabila de valori. Exemple: sex,nota.

    - caracteristici de tip continuu: iau valori intr-un interval; pot doar de tip cantitativ.Exemplu: dimensiunile unei piese.

    Def. O submultime nita 1 se numeste esantion sau selectie. Cardinalul saupoarta numele de volum de selectie. In general, esantionul este alcatuit din acei indiviziai populatiei pentru care s-a observat efectiv valoarea caracteristicii studiate.

    16.2 Elemente de teoria scalariiAsa cum s-a vazut mai sus, caracteristicile pot masurate in mai multe moduri. Existapatru tipuri principale de scala: scala nominala, scala ordinala, scala de interval si cea deraport.

    31

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    32/50

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    33/50

    Exemple. Temperatura exprimata in grade Kelvin, lungimea, greutatea, volumul etc.(Chapter head:)Tabele de distributie. Gruparea datelorAvand in vedere observatia 4 din sectiunea anterioara, in cele ce urmeaza vom consid-

    era numai caracteristici statistice cantitative.

    16.3 Serii statistice (date brute)

    Forma cea mai simpla de prezentare a datelor statistice provenind dintr-o singura vari-abila statistica este prin enumerarea observatiilor efectuate asupra variabilei: x1; x2;:::;xn.Aceasta enumerare se numeste serie statistica sau esantion, n ind volumul sau. Unelevalori ale esantionului se pot repeta.

    Daca datele din esantion se ordoneaza crescator, rezulta un sir variational, x(1); x(2);:::;x(n);unde

    1) fx1; x2;:::;xng = x(1); x(2);:::;x(n)2) x(1) x(2) ::: x(n) :Exemplu. S-a masurat inaltimea (in cm) a 20 de copii dintr-o scoala, obtinandu-se

    urmatoarea serie statistica:

    133 136 120 138 133 131 127 141 127 143130 131 125 144 128 134 135 137 133 129

    Sirul variational corespunzator este:

    120 125 127 127 128 129 130 131 131 133

    133 133 134 135 136 137 138 141 143 144

    Obs. 1 Deoarece numarul datelor dintr-o serie statistica poate foarte mare (deordinul miilor), aceasta devine greu de prelucrat si de studiat. Ca urmare, datele seprezinta si sub forma de tabele de distributie.

    17 Tabele de distributie. Tipuri de frecvente

    17.1 Tabel de distributie a frecventelor absolute

    Acest tip de tabel se obtine dintr-o serie statistica astfel: daca (x1;:::;xn) este un esantionde volum n de observatii facute asupra variabilei statistice X, atunci:

    1. Se formeaza sirul variational: x(1); x(2);:::;x(n):

    2. Pe o coloana (linie) se trec doar valorile distincte din sirul variational, e elex0(1); x

    0(2);:::;x

    0(k); k n.

    33

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    34/50

    3. Pe a doua coloana (linie), in dreptul ecarei valori, se trece numarul sau de aparitiidin esantionul initial: n1;:::;nk. Acest numar de aparitii al unei valori observate x

    0(i)

    se numeste frecventa absoluta, notata ni.

    Tabelul astfel obtinut se numeste tabel de distributie a frecventelor absolute sau distributieempirica (statistica, observata) sau seria statistica a frecventelor absolute.

    Este usor de observat ca, daca avem in total k valori distincte in sirul variational,frecventele absolute verica relatia

    n1 + ::: + nk = n: (1)

    17.2 Tabel de distributie a frecventelor relative

    Frecventele se pot exprima si in valori relative la numarul total de observatii. Acestefrecvente se numesc relative si sunt denite prin

    fn

    X = x0(i)

    = n0i =nin

    :

    Uneori se exprima in procente, sub forma 100nin

    %. Tabelul corespunzator se numeste al

    frecventelor relative sau seria statistica a frecventelor relative.Relatia (1) devine in acest caz

    n01 + ::: + n0k = 1:

    Obs. 2 Cand n este foarte mare, fn X = x0(i) = n0i PX = x

    0

    (i), adica probabili-

    tatea ca variabila statistica X rezultata in urma observatiilor sa ia a i-a valoare distinctadin sirul variational.

    17.3 Frecvente cumulate crescator si descrescator

    In scopul reprezentarii cat mai compacte, inclusiv in forma graca, a datelor statistice, instatistica sunt utilizate frecventele cumulate. Acestea se obtin prin adunarea din aproapein aproape a frecventelor absolute sau relative.

    Def. Se numeste frecventa absoluta cumulata crescator (descrescator) corespunzatoare

    unei valori x, suma frecventelor absolute ale tuturor valorilor variabilei mai mici sau egalecu x (mai mari sau egale cu x), anume

    Xyx

    ny

    Xyx

    ny

    !:

    Def. Se numeste frecventa relativa cumulata crescator (descrescator) corespunzatoareunei valori x a variabilei, suma frecventelor relative ale tuturor valorilor variabilei mai

    34

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    35/50

    mici sau egale cu x (mai mari sau egale cu x), anume

    Xy

    x

    n0y

    Xy

    x

    n0y

    !:

    Obs. 3 Se observa usor ca frecventa relativa cumulata este raportul dintre frecventaabsoluta cumulata si volumul populatiei.

    Exemplu. Reluand datele de mai sus (inaltimile celor 20 de copii), avem urmatorultabel cu frecventele absolute, relative si cumulate:

    Inaltimea

    Frecv.

    abs.

    Frecv.

    relat.

    Frec. abs.

    cumul.

    cresc.

    Frec. abs.

    cumul.

    descresc.

    Frec. rel.

    cumul.

    cresc.

    Frecv rel.

    cumul.

    descresc.

    120 1 0.05 1 20 0.05 1125 1 0.05 2 19 0.1 0.95

    127 2 0.1 4 18 0.2 0.9128 1 0.05 5 16 0.25 0.8129 1 0.05 6 15 0.3 0.75130 1 0.05 7 14 0.35 0.7131 2 0.1 9 13 0.45 0.65133 3 0.15 12 11 0.6 0.55134 1 0.05 13 8 0.65 0.4135 1 0.05 14 7 0.7 0.35136 1 0.05 15 6 0.75 0.3137 1 0.05 16 5 0.8 0.25138 1 0.05 17 4 0.85 0.2

    141 1 0.05 18 3 0.9 0.15143 1 0.05 19 2 0.95 0.1144 1 0.05 20 1 1 0.05

    17.4 Tabele de distributie grupate

    Pentru un volum n foarte mare de date distincte, se recomanda gruparea lor in clase(intervale de valori), sub forma:

    Intervalul Frecv. abs. Frecv. relat.[y1; y2)

    [y2; y3):::[ys; ys+1)

    n1

    n2:::ns

    n01

    n02

    :::n0sP

    n 1

    Valoarea centrala (mijlocul) unei clase este, pentru clasa [yi; yi+1);

    ci =yi + yi+1

    2:

    35

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    36/50

    Exemplu. Sa grupam datele de mai sus in intervale de lungime 5:

    Intervalul Frecv. abs. Frecv. relat.[120; 125)

    [125; 130)[130; 135)[135; 140)[140; 145)

    1

    5743

    0:05

    0:250:350:20:15P

    20 1

    17.5 Tabele de distributie pentru doua caracteristici

    Daca analiza statistica se face dupa doua caracteristici, rezultatele obtinute se trec intr-otabela cu doua intrari.

    Exemplu. Clasicarea a 1500 de persoane dupa culoarea ochilor si a parului:

    Culoare parCuloare ochi

    negri caprui verzi albastri

    Pnegrucastaniublond

    145 285 30 1162 431 87 6733 36 185 128

    471647382P

    240 752 302 206 1500

    Din acest tip de tabel sunt usor de obtinut tabelele de distributie ale ecarei caracter-isticii in parte, denumite si distributii marginale. Pe exemplul numeric, avem:

    Culoare par Frecv. abs.negrucastaniublond

    471647382P

    1500

    Culoare ochi Frecv. abs.negricapruiverzialbastri

    240752302206P

    1500

    36

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    37/50

    18 Reprezentari grace

    18.1 Diagramele frecventelor necumulate

    Se pleaca de la seria frecventelor absolute sau relative si se pot trasa trei tipuri de di-agrame: diagrama cu bastonase, histograma (diagrama cu dreptunghiuri) si poligonulfrecventelor. Pentru toate cele trei tipuri de diagrame, pe axa OX se trec valorile ob-servate, iar daca se lucreaza cu date grupate, se trec limitele intervalelor sau centrelelor.

    18.1.1 Diagrama cu bastonase

    Acest tip de grac este foarte bun pentru datele negrupate. Astfel, pentru ecare val-oare observata distincta se traseaza un segment vertical de lungime egala cu frecventacorespunzatoare valorii respective.

    18.1.2 Histograma

    Se aplica pentru datele grupate in intervale. Este alcatuita din dreptunghiuri avand cabaza intervalele de valori, iar aria lor este proportionala cu frecventele. In functie delungimea intervalelor, avem doua cazuri:

    1. Histograme pentru intervale de lungimi egale, caz in care inaltimea ecarui drep-tunghi coincide cu frecventa intervalului care sta la baza sa.

    2. Histograme pentru intervale de lungimi inegale; in acest caz, pentru calculareainaltimii dreptunghiurilor se aplica urmatorul algoritm:

    - pe o coloana separata se trec lungimile tuturor intervalelor;

    - se alege o lungime standard (cea care apare mai frecvent sau care este mai mica);

    - pentru un interval oarecare, daca lungimea sa este egala cu ( lungimea stan-dard), atunci inaltimea dreptunghiului corespunzator va

    1

    frecventa corespunzatoare acelui interval

    .

    Exemplul 1. Consideram datele anterioare (inaltimile celor 20 de copii) grupate inclase de lungime 5. Histograma este cea din g. 1.

    Exemplul 2. Consideram masele a 35 de obiecte, masurate^in kg. Datele sunt grupateca in tabelul de mai jos, iar in g. 2 este trasata histograma corespunzatoare.

    Masa Frecventa Lungime interval Inaltime dreptunghi[6; 9)[9; 12)[12; 18)[18; 21)[21; 30)

    46

    103

    12

    3 standard3 standard6 2 standard3 standard9 3 standard

    46

    10=2 = 53

    12=3 = 4

    37

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    38/50

    18.1.3 Poligonul frecventelor

    Se obtine unind prin linii (frante) extremitatile superioare ale bastonaselor din diagramacu bastonase sau mijloacele extremitatilor superioare ale dreptunghiurilor din histograma.

    18.2 Diagramele frecventelor cumulate

    Frecventele cumulate se reprezinta ca mai inainte, dar numai prin histograme sau prin

    poligoanele frecventelor.

    18.3 Diagrame circulare ("pie" sau "placinta")

    Ariile sectoarelor de cerc dintr-o asemenea diagrama sunt proportionale cu frecventele.

    Exemplu. Consideram vanzarile de benzina de la patru benzinarii, notate A, B, C,D.

    Benzi-

    narie

    Vanzari

    (sute litri)

    Unghiul

    sectorului

    A 90 360

    90=280 = 115:7

    B 140 360 140=280 = 180C 30 360 30=280 = 38:6D 20 360 20=280 = 25:7P

    280

    38

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    39/50

    Aceste diagrame se pot utiliza pentru a compara doua sau mai multe seturi de datesimilare. Spre exemplu, daca se reprezinta structura culturilor agricole pentru un terenintr-o diagrama circulara, putem compara diagramele a doua zone diferite.

    39

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    40/50

    19 Valori caracteristice

    19.1 Parametri de pozitie

    Parametrii de pozitie sunt valori de referinta la care se raporteaza toate valorile unuiesantion. In cele ce urmeaza vom prezenta principalii asemenea parametri, anume media,mediana si moda (modul).

    19.1.1 Media (de selectie), x

    Este vorba despre media aritmetica obisnuita. Calculul sau depinde insa de modul degrupare al datelor. Astfel, cu notatiile din sectiunile anterioare, avem:

    - pentru un esantion (date brute) x1; x2;:::;xn, media este

    x =1

    n

    n

    Xi=1

    xi ;

    - pentru datele dintr-un tabel de distributie a frecventelor absolute sau relative, mediase calculeaza prin

    x =1

    n

    kXi=1

    x0(i)ni =kX

    i=1

    x0(i)n0i ;

    - pentru datele grupate in intervale,

    x =1

    n

    k

    Xi=1

    cini :

    Reamintim si denitia mediei ponderate a esantionului x1; x2;:::;xn, cu ponderile fi >0; i = 1; n;

    xf =

    nPi=1

    fixi

    nPi=1

    fi

    :

    Interpretare. x este valoarea in jurul careia se grupeaza valorile caracte-risticii studiate.

    Proprietate.

    a) Media verica relatiax(1) x x(n):

    b) Daca valorile xi din esantionul initial sunt transformate in yi = a+bxi; atunci y = a+bx:c) Daca se combina (concateneaza, comaseaza) doua esantioane de volume m, n si de mediix, respectiv y, atunci media esantionului rezultat este

    z =mx + ny

    m + n:

    40

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    41/50

    19.1.2 Mediana

    Medianaeste acea valoare care are proprietatea ca jumatate dintre observatiile din esantionsunt mai mici sau egale cu ea, cealalta jumatate dintre observatii ind mai mari sau egale

    decat ea. Cu alte cuvinte, mediana este acea valoare numerica ce imparte sirul variationalcorespunzator esantionului dat in doua parti egale. Calculul sau se face tot in functie demodul de grupare al datelor:- pentru un esantion x1; x2;:::;xn, mediana se calculeaza astfel:

    1. se ordoneaza crescator esantionul;

    2. daca n este impar, atunci mediana este observatia de rangn + 1

    2, iar daca n este

    par, mediana este

    xn2

    + xn2+1

    =2:

    Exemplu. Pentru esantionul 7; 7; 2; 3; 4, mediana este 4, iar pentru 36; 41; 27; 32, este(32 + 36) =2 = 34:

    - pentru datele dintr-un tabel de distributie: presupunem ca se cunoaste n, deci putemaa frecventele absolute (inclusiv pe baza frecventelor relative). Mediana rezulta astfel:

    1. se calculeaza frecventele absolute cumulate crescator;

    2. se calculeaza (n + 1) =2;

    3. se determina prima linie din tabel pentru care frecventa absoluta cumulata crescatoreste (n + 1) =2; valoarea similara de pe linia precedenta ind < (n + 1) =2. Val-oarea caracteristicii corespunzatoare acestei linii este mediana.

    O alta metoda care se poate aplica in acest caz, daca n nu este prea mare, consta inscrierea valorilor caracteristicii in ordine crescatoare (sirul variational) pana la cea de-a(n + 1) =2 -a valoare, care va chiar mediana.

    - pentru datele grupate in intervale, aarea medianei se face astfel:

    1. se traseaza grac curba frecventelor absolute cumulate crescator;

    2. pentru y = (n + 1) =2; se aa prin interpolare x-ul corespunzator de pe curbatrasata. Acesta este mediana cautata.

    Proprietate. Fie 2n

    x0(1); x0(2);:::;x

    0(k)

    o. Atunci

    min

    kX

    i=1

    x0(i)

    ni

    !=

    kXi=1

    x0(i) mediana

    ni:

    41

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    42/50

    19.1.3 Moda (modul)

    Moda (modul) este valoarea din esantion careia ii corespunde cea mai mare frecventaabsoluta (relativa).

    - pentru un esantion (date brute) x1; x2;:::;xn, se construieste un tabel de distributie sise procedeaza ca mai jos;

    - pentru datele dintr-un tabel de distributie a frecventelor absolute sau relative, se de-termina nx = max

    yny; x ind chiar moda;

    - pentru datele grupate in intervale, se parcurg pasii:

    1. se traseaza histograma;

    2. se alege cel mai inalt dreptunghi din histograma;

    3. cu notatiile din gura, moda = a + d1d1 + d2

    c:

    19.1.4 Cuartile si percentile

    Se numesc cuartile cele trei valori care^impart sirul variational

    ^in patru parti egale. Cele99 de valori care impart sirul variational intr-o 100 de parti egale se numesc percentile.

    Astfel, considerand n elemente aranjate crescator, avem:

    Cuartila inferioara Q1 valoarea a14

    (n + 1)-aMediana Q2 valoarea a

    12

    (n + 1)-aCuartila superioara Q3 valoarea a

    34

    (n + 1)-aA 10-a percentila P10 valoarea a

    10100

    (n + 1)-aA 90-a percentila P90 valoarea a

    90100

    (n + 1)-a

    etc:

    42

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    43/50

    Denim si distanta intercuartile = Q3Q1, iar semi-distanta intercuartile= (Q3 Q1) =2:Avantajul acestor distante este acela ca ele depind exclusiv numai de valorile din mijloculsirului variational, neind afectate de valorile extreme.

    Aarea cuartilelor si percentilelor se face similar cu aarea medianei.

    Exemplu. Sa se ae cuartilele Q1; Q3 si semi-distanta intercuartilelor pentru urmatorulesantion:

    3; 2; 3; 9; 6; 6; 12; 11; 8; 2; 3; 5; 7; 5; 4; 4; 5; 12; 9

    Solutie. Avem 19 numere, pe care le ordonam crescator:

    2; 2; 3; 3; 3; 4; 4; 5; 5; 5; 6; 6; 7; 8; 9; 9; 11; 12; 12

    Cuartila inferioara este valoarea a 5-a, deci Q1 = 3: Cuartila superioara este valoarea

    a 15-a, deci Q3 = 9: Rezulta ca semi-distanta intercuartilelor =(Q3 Q1) =2 = 3:

    19.2 Parametri de imprastiere

    Acesti parametri masoara gradul de imprastiere al valorilor observate fata de parametrulde pozitie dat.

    19.2.1 Amplitudinea

    Amplitudinea absoluta este diferenta dintre valoarea cea mai mare si valoarea cea maimica din esantion, deci

    A = xmax xmin = x(n) x(1):

    Amplitudinea relativa este raportul dintre amplitudinea absoluta si medie, anume A=x:Amplitudinea nu se deneste pentru datele grupate in intervale.

    Obs. Spre deosebire de amplitudinea absoluta, amplitudinea relativa poate utilizatapentru compararea gradului de imprastiere a doua esantioane diferite, chiar si atunci candvalorile acestora au unitati de masura diferite.

    19.2.2 Abateri medii

    Acestea pot de mai multe tipuri, in functie de valoarea de referinta:

    - abaterea medie liniara absoluta fata de medie este, pentru esantionul x1;:::;xn;

    1

    n

    nXi=1

    jxi xj ;

    43

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    44/50

    - abaterea medie liniara absoluta fata de mediana este

    1

    n

    n

    Xi=1

    jxi medianaj ;

    - abaterea medie liniara absoluta fata de moda este

    1

    n

    nXi=1

    jxi modaj :

    19.2.3 Dispersia si abaterea medie patratica

    Dispersia unui esantion se noteaza cu s2 (uneori cu 2) si se calculeaza astfel:

    - pentru un esantion (date brute) x1; x2;:::;xn,

    s2 =1

    n

    nXi=1

    (xi x)2 ;

    - pentru datele dintr-un tabel de distributie a frecventelor absolute sau relative,

    s2 =1

    n

    kXi=1

    x0(i) x

    2ni =

    kXi=1

    x0(i) x

    2n0i ;

    - pentru datele grupate in intervale,

    s2 =1

    n

    kXi=1

    (ci x)2 ni :

    Interpretare. Dispersia masoara gradul de imprastiere al valorilor observate in jurulmediei. Cu cat dispersia este mai mare, cu atat imprastierea valorilor din esantion fatade medie este mai mare, si reciproc.

    Abaterea medie patratica se deneste ca ind radical din dispersie, deci

    s =

    ps2

    :Interpretare. Abaterea medie patratica este o masura foarte utila a gradului de

    imprastiere. Pentru cele mai multe distributii, majoritatea observatiilor se situeaza inintervalul (x 3s; x + 3s) (regula celor "3").

    Proprietati.

    a) Daca x1 = x2 = ::: = xn atunci s2 = 0:

    44

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    45/50

    b) O formula alternativa pentru calculul dispersiei este

    s2 = x2 (x)2 :

    c) Daca valorile xi din esantionul initial sunt transformate in yi = a + bxi; atunci

    s2y = b2s2x:

    d) Considerand functia

    f(a) =1

    n

    nXi=1

    (xi a)2 ;

    atunci

    mina2R

    f(a) = f(x) = s2:

    e) Daca se combina doua esantioane de volume n, m, de medii x0, respectiv x00, si dedispersii s21, respectiv s

    22, atunci media esantionului rezultat o notam cu x (formula

    sa este data la media de selectie), iar dispersia este

    s2 =ns21 + ms

    22

    n + m+

    n (x0 x)2 + m (x00 x)2n + m

    :

    Primul termen al sumei reprezinta dispersia in interiorul "grupelor" (esantioanelor),iar al doilea termen reprezinta dispersia dintre "grupe" (esantioane).

    45

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    46/50

    20 Aplicatii

    1. Se considera punctajele obtinute de 101 elevi la un test:

    47 62 61 60 39 34 37 46 81 72 74 62 65 53 47 52 38 25 42 40 70 63 62 83 19 26 5949 53 52 88 91 51 52 24 80 69 59 32 33 27 18 22 73 59 36 34 31 21 63 72 54 18 7144 71 43 44 18 93 12 15 60 71 82 13 61 64 25 63 82 71 11 58 64 39 16 23 10 92 8375 36 74 43 29 85 65 42 57 70 63 54 55 49 81 47 72 65 63 60

    a) Sa se construiasca un tabel de distributie continand frecvente absolute, relative,absolute cumulate crescator si descrescator, datele grupandu-se in intervalele [10,19];[20,29]; [30,39]; ...; [90,99].

    b) Sa se traseze histograma corespunzatoare.

    c) Sa se determine media, mediana, moda si dispersia.

    2. Se dau urmatoarele date, reprezentand distributia a 20 de rme dupa cifra de afaceri(intr-o unitate monetara corespunzatoare):

    Cifra de afaceri Numar de rme

    [10,20) 1[20,30) 3[30,40) 6[40,50) 8[50,60) 2

    P20

    a) Sa se completeze tabelul cu frecventele relative, frecventele relative cumulatecrescator si cele cumulate descrescator.

    b) Sa se traseze histograma corespunzatoare.

    c) Sa se determine media, mediana, moda si dispersia.

    d) Presupunem ca se regrupeaza datele astfel incat intervalele cifrelor de afaceridevin: [10,30); [30,40); [40,60). Sa se scrie noul tabel al frecventelor absolute si sase traseze histograma corespunzatoare.

    3. Intr-un studiu menit sa determine efectul fumatului asupra metabolismului fenacetinei,s-a administrat fenacetina la doua grupuri de persoane: primul alcatuit din 12

    fumatori si al doilea grup alcatuit din 14 nefumatori. Dupa 2 ore, s-a masuratnivelul fenacetinei din plasma la toate persoanele. Acesta este trecut in tabelulde mai jos, alaturi de varsta si statutul de fumator (+ pentru fumator, - pentrunefumator) al ecarui participant la studiu.

    a) Sa se calculeze media, mediana si moda fenacetinei pentru ecare grup de per-soane. Sugereaza aceste valori ceva despre forma distributiei frecventelor din ecaregrup?

    46

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    47/50

    b) Sa se calculeze dispersia, abaterea medie patratica si amplitudinea absoluta afenacetinei pentru ecare grup.

    c) Sa se construiasca tabelul frecventelor absolute ale fenacetinei pentru ecare grup^in parte, grupand datele

    ^in intervale cat mai convenabile. Sa se traseze histograma.Care este forma ecarei distributii?

    d) Ce sugereaza rezultatele acestui studiu statistic in legatura cu efectul calitativ alfumatului asupra concentratiei de fenacetina?

    e) Este valoarea medie a fenacetinei o masura exacta a valorii centrale din grupulfumatorilor? De ce?

    f) Presupunem ca este cunoscut faptul ca metabolismul fenacetinei creste cu varsta.Cum afecteaza acest factor concluzia punctului (d)?

    Participant Varsta Fumator/Nefumator Nivel fenacetina1 25 - 0.452 22 + 0.033 38 { 0.754 45 - 1.405 25 + 0.016 28 + 0.017 28 - 1.288 38 + 0.029 48 - 1.83

    10 32 + 0.6111 32 + 0.52

    12 35 - 1.6913 32 - 1.9114 69 - 2.1515 72 - 2.3016 43 + 1.1217 58 - 2.4818 49 - 2.7519 55 + 1.0120 42 - 2.8121 25 + 1.5222 26 + 2.5523 55 - 3.2824 65 - 3.5525 28 + 0.0126 71 + 3.80

    4. 100 de persone au fost rugate sa noteze cate programe TV au urmarit in timpulunei saptamani. Sa se reprezinte datele din tabel sub forma de histograma.

    47

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    48/50

    Nr. de programe [0,10) [10, 18) [18,30) [30,35) [35,45) [45,50) [50,60)Nr. de telespectatori 3 16 36 21 12 9 3

    5. In tabelul de mai jos sunt trecute vanzarile din anul 1978 pentru cinci companii care

    alcatuiesc un consortiu.Companie A B C D E

    Vanzari (in mii de $) 55 130 20 35 60

    a) Sa se reprezinte aceste date printr-o diagrama circulara de raza 5 cm.

    b) In anul 1979, vanzarile totale au crescut cu 20%, iar aceasta crestere s-a mentinutsi in anul 1980. Daca s-ar trasa diagrame circulare pentru a compara vanzarile totalepentru ecare dintre anii 1979 si 1980 cu vanzarile totale din 1978, care ar razaecareia dintre cele doua diagrame?

    c) Daca vanzarile companiei E ar in anul 1980 de 60000$, care ar unghiul

    sectorului corespunzator?

    6. S-a efectuat un sondaj printre gospodinele casnice, pentru a stabili c at au cheltuitacestea pe diverse produse. Doamna X a raspuns conform tabelului urmator:

    Produs A B CDna X 1.50$ 3.50$ 3.00$

    a) Sa se reprezinte datele printr-o diagrama circulara de raza 4 cm.

    b) S-a efectuat o comparatie cu diagrama circulara care ilustreaza raspunsuriledoamnei Y. Aceasta este de raza 5 cm, sectorul corespunzator cheltuielilor cu pro-dusul A are un unghi de 72, iar cheltuielile cu produsul B se ridica la valoarea

    de 4$. Aati cat a cheltuit doamna Y cu produsul C si trasati diagrama circularacorespunzatoare cheltuielilor sale.

    7. Vericarea ansamblarii a 34 de avioane a condus la depistarea unor nituri lipsa,datele ind cele din tabelul de mai jos.

    Nituri

    lipsa[0,2] [3,5] [6,8] [9,11] [12,14] [15,17] [18,20] [21,23]

    Frecv.

    abs.4 9 11 6 2 1 0 1

    Sa se reprezinte diagrama frecventelor cumulate crescator. Pe baza curbei obtinute,sa se estimeze mediana si cuartilele distributiei.

    8. Daca se considera esantionul (x1;:::;xn), sa se demonstreze formula

    s2 =1

    n

    nXi=1

    x2i (x)2 :

    In Anglia s-a efectuat un sondaj de opinie printre adolescentele sub 20 de ani, unadintre intrebari ind "Care este varsta ideala pentru o fata, pentru a avea primul

    48

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    49/50

    copil?". Din raspunsurile primite de la un esantion de 165 de fete din zona de norda Angliei, a rezultat o medie de 23.4 ani si o abatere medie patratica de 1.6 ani.Pe total, intregul esantion (nord si sud) a furnizat o medie de 24.8 ani si o abateremedie patratica de 2.2 ani. Daca ecare fata a fost intrebata o singura data, careeste media si abaterea medie patratica a esantionului alcatuit din cele 219 fete dinzona sudica?

    9. O statie meteorologica a inregistrat numarul de ore de stralucirea soarelui zilnic,timp de 80 de zile. Rezultatele sunt cele din tabel.

    Nr. ore

    lumina0 (0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,12] peste 12

    Nr. zile 10 2 6 17 22 11 5 3 2 2 0

    a) Sa se determine care esta clasa modala.

    b) Sa se construiasca diagrama frecventelor cumulate crescator. Pe baza curbeiobtinute, sa se estimeze: mediana, distanta intercuartile si proportia zilelor in cares-au inregistrat mai mult de 3 1

    2ore de stralucirea soarelui.

    10. Tabelul de mai jos contine durata a 60 de drumuri efectuate pe aceeasi ruta de uncamion, variatiile ind cauzate de trac.

    Durata

    in ore[5.6;5.8) [5.8;6) [6;6.2) [6.2;6.4) [6.4;6.6) [6.6;6.8)

    Nr. drumuri 2 7 16 21 12 2

    a) Sa se estimeze media si abaterea medie patratica a duratelor.

    b) Considerandu-se duratele altor 40 de drumuri, s-au calculat o medie de 6h 24min.si o abatere medie patratica de 18min. Sa se detremine media si abaterea mediepatratica pentru toate cele 100 de durate la un loc.

    11. Tabela urmatoare contine productia de lapte dintr-o zi, in litri, de la 131 de vacidintr-o ferma.

    Litri [5,10] [11,16] [17,22] [23,28] [29,34] [35,40]Frecventa 15 28 37 26 18 7

    a) Determinati clasa modala si estimati moda.

    b) Estimati, prin calcule, productia medie de lapte.

    c) Construiti diagrama frecventelor cumulate crescator si, pe baza ei, estimati semi-distanta intercuartile.

    d) Calculati media si dispersia distributiei.

    12. Intr-o anumita ramura industriala, repartizarea angajatilor pe clase de varsta estecea din tabel (in mii de persoane).

    49

  • 8/3/2019 47586359 Probabilitati Si Statistic A a

    50/50

    Varsta Nr. in mii Varsta Nr. in mii

    [15,19] 66 [40,44] 37[20,24] 65 [45,49] 35[25,29] 56 [50,54] 30

    [30,34] 50 [55,59] 24[35,39] 42 [60,64] 22

    a) Calculati media, mediana, dispersia si abaterea medie patratica a varstei anagajatilor.

    b) Estimati proportia angajatilor a caror varsta este cuprinsa intre medie abatereamedie patratica.

    BIBLIOGRAFIE

    1. Dumitrescu, M. (1989)- Curs de statistica matematica. Universitatea din Bucuresti.

    2. Feller, W. (1966)- Introduction to probability theory and its applications. Willey,New York.

    3. Leahu, A. (2000)- Probabilitati. \Ovidius" University Press.

    4. Mihoc, Gh si Craiu, V. (1976{1979)- Tratat de statistica matematica. Vol. I-IV.Ed. Academiei.

    5. Vernic, R. (2003) - Statistica. Editura Adco, Constanta.


Recommended