Post on 02-Nov-2021
transcript
βStiinta se cladeste cu fapte, asa cum o casa se construieste cu pietre.Dar o colectie de fapte nu e stiinta, la fel cum un morman de pietrenu e o casa.β
Henri Poincare
9Variabile aleatoare continue
Sistemul Elo de calculare a ratingului
In jocurile cu suma nula, de exemplu sah, poker, fotbal, apare nevoia dea cuantifica performanta, de a masura nivelul relativ al abilitatilor jucato-rilor/echipelor. Din aceasta cauza s-a ajuns la ideea unui sistem de coeficientipentru a putea realiza o ierarhizare mondiala sau pentru a putea indica nivelulrelativ de performanta atins.
In sah, maestrul Arpad Elo, in dorinta de a realiza un astfel de sistem, apornit de la urmatoarele presupuneri
1. Performanta este o variabila aleatoare2. Performanta medie a unui jucator se modifica greu3. Rezultatul anticipat in fiecare joc are o distributie normala
1
Prin urmare, acesta a propus prin anii β60 un sistem care se baza pe odistributie normala a rezultatelor anticipate. Ulterior federatia americana desah (USCF) si cea internationala (FIDE) au argumentat ca datele culese dinistoria jocului sugereaza ca performanta in sah este mai bine modelata de odistributie logistica.
Sistemul propus a primit numele de sistem Elo si in prezent asigura creareade ierarhii in: sah, baschet, fotbal, fotbal american, chiar si e-sports. In par-ticular in sah, puterea unui jucator este estimata pe o scara de la 1200 (noviciisunt sub 1200) pana la un maxim, atins de actualul campion mondial MagnusCarlsen, de 2882. Ca un punct de referinta, cel mai bun jucator roman al ul-timelor decenii Liviu-Dieter Nisipeanu a atins un nivel maxim al coeficientuluiElo de 2707. Celebrul soft Chessmaster, in cea mai buna versiune a sa, a ajunsla un coeficient Elo de aproximativ 2718. Cele mai cunoscute softuri de sah alemomentului au ajuns la ratinguri de peste 3000. De exemplu, Stockfish 12 areun rating estimat de aproximativ 3500. O crestere a calitatii jocului poate fiobtinuta si prin cresterea puterii de calcul. In anii 2000 supercomputerul Hydraparea de neinvins, chiar daca nu dispunea de cel mai bun soft de sah.
Creativitatea umana este insa greu de cuantificat. In anul 2001, intr-o seriede meciuri memorabile, psihiatrul american (!!) Ernest Pecci a anihilat unuldintre cele mai bune softuri ale acelor vremuri. Cheia succesului: in spateleoricarui soft se afla mintea omului, care este predispusa la generarea unor tiparece pot fi speculate. In acelasi timp, programele de tipul AlphaZero, care au labaza inteligenta artificiala, sunt greu de incadrat cu ajutorul coeficientului Elo,atat din cauza modului in care gandesc jocul (analizeaza mai putine variante, instilul caracteristic omului) cat si datorita conditiilor in care se realizeaza testareaacestora.
Presupunerea fundamentala a sistemului Elo este ca fiecare jucator are unnivel al jocului necunoscut, dar care poate fi estimat printr-un rating π . Acestrating se modifica de la meci la meci si dupa un numar suficient de mare dejocuri va converge la nivelul adevarat al jucatorului. Intr-un meci intre doiadversari, π΄ contra lui π΅, avand nivelul π π΄ si π π΅ estimat prin ratingul lor,rezultatul preconizat al jocului va fi
πΈπ΄π΅ =1
1 + 10β(π π΄βπ π΅)/400(1)
Valoarea π = 400 este scara logistica corespunzatoare lumii sahului, in altesporturi fiind adecvate alte valori. Functia logistica va transforma orice diferentade ratinguri π π΄ βπ π΅ intr-o valoare din intervalul [0, 1]. De amintit ca in sah ovictorie valoreaza 1 punct, o remiza 0.5 puncte iar infrangerea 0 puncte. Prinurmare, scorul preconizat πΈπ΄π΅ trebuie interpretat in modul urmator: valoareaobtinuta reprezinta probabilitatea de a castiga plus jumatate din probabilitateade a realiza o remiza. Din aceasta cauza πΈπ΄π΅ = 0.75 poate insemna ca π΄ are75% sanse sa castige si 0% sanse sa obtina o remiza sau 50% sanse sa castige si50% sanse sa obtina o remiza.
In figura de pe pagina urmatoare, pentru diverse valori ale lui π , sunt esti-mate sansele de castig in functie de diferenta de valoare dintre jucatori, folosindfunctia logistica corespunzatoare.
2
Dupa terminarea unui turneu ratingul unui jucator se modifica conform for-mulei
π πππ’ = π πππ + πΎ Β· (π β ππππ‘ππππππ‘) (2)
unde π πππ este ratingul dinaintea inceperii turneului, π πππ’ este noul rating,π este scorul inregistrat si ππππ‘ππππππ‘ este scorul preconizat inaintea turneului.Scorul anticipat se calculeaza folosind ratingul jucatorului dinaintea turneului siratingurile adversarilor. Acest scor se calculeaza adunand valorile rezultatelorπΈπ΄π΅π anticipate impotriva fiecarui adversar π΅π, conform formulei (1).
Pentru constanta πΎ se considera ca pentru jucatori cu ratingul peste 2400(marii maestri) o valoare buna este πΎ = 16. Pentru cei cu rating intre 2100 si2400 se alege standard valoarea πΎ = 24 iar pentru ratinguri mai mici πΎ = 32.Ideea de baza este ca jocul marilor maestri este stabil si forma lor sportiva nusufera multe fluctuatii intr-un timp scurt. In prezent, unele federatii preferaalegerea unei valori πΎ care sa depinda de numarul de meciuri jucate intr-unturneu sau de numarul de jocuri pe baza caruia s-a estimat ratingul anterior.
Sistemul Elo prezinta si unele defecte. Printre altele s-a remarcat o inflatie aratingurilor la nivelul superior. In anii β70 unul sau doi jucatori aveau un ratingmai mare de 2700, insa in prezent sunt 38 de jucatori cu un astfel de ratingconform clasamentului actual al FIDE. Aceasta inseamna ca un rating de 2700in anul 2021 nu este la fel de impresionant precum ar fi fost in anul 1980.
Sistemul utilizat in sah ofera un avantaj nedorit jucatorilor care doresc sa-sicreasca in mod artificial ratingul, pentru a putea participa la turneele puternice.Acestia pot alege sa participe la multe turnee mai putin renumite, unde vorintalni adversari mai slab cotati, impotriva carora sunt favoriti. In acest fel sepoate obtine o creste artificiala, cu cateva zeci de puncte, a ratingului.
In ultima perioada au aparut sisteme de rating superioare dar si mai sofisti-cate, cum ar fi sistemul TrueSkill dezvoltat de Microsoft, sistemul Glicko dez-voltat de statisticianul Mark Glickman sau sistemul Chessmetrics. Oricat deprecise ar fi aceste sisteme toate se bazeaza pe acelasi principiu: evalueaza abili-tatile relativ la o populatie (de exemplu jucatorii de sah ai federatiei de careapartine respectivul jucator). In consecinta, sunt greu de comparat jucatoriifara experienta internationala, care au jucat doar la nivel national.
In profida acestor limitari, aceasta abordare matematica pentru masurareaperformantei este mai buna decat cea bazata pe opinie. βToate modelele suntgresite, unele sunt folositoareβ spunea marele statistician George Box.
3
Variabile aleatoare continue
O variabila aleatoare continua poate avea ca valori orice numar dintr-uninterval dat, de exemplu: variabila aleatoare π care masoara timpul necesarpentru a realiza ceva. Daca pentru variabilele aleatoare discrete verbul era βanumaraβ, acum acesta devine βa masuraβ.
β π este o variabila aleatoare continua daca exista o functie π(π₯), numitadensitate de probabilitate, astfel ca pentru orice ββ β€ π β€ π β€ β
π (π < π < π) =
πβ«π
π(π₯)ππ₯
β densitatea de probabilitate satisface proprietatile definitorii
ββ«ββ
π(π₯)ππ₯ = 1 si π(π₯) β₯ 0
β functia de repartitie definita prin πΉ (π₯) := π (π β€ π₯) poate substituirolul densitatii de probabilitate in calculul probabilitatilor
π (π < π β€ π) = πΉ (π) β πΉ (π)
β pentru o variabila aleatoare continua π, cand πΉ va fi continua, vom avearelatiile
π (π β€ π < π) = π (π β€ π β€ π) = π (π < π < π) = π (π < π β€ π) = πΉ (π) β πΉ (π)
In general avemβ πΉ β²(π₯) = π(π₯) (unde derivata exista)
β πΉ (π₯) =
π₯β«ββ
π(π‘)ππ‘
β πΉ (π₯1) β€ πΉ (π₯2) daca π₯1 < π₯2
β limπ₯ββ
πΉ (π₯) = 1 si limπ₯βββ
πΉ (π₯) = 0
β de remarcat faptul ca π (π = π) = 0 pentru orice constanta π β R, spredeosebire de cazul discret
β valoarea medie π(π) si dispersia π·2(π) unei variabile aleatoare continuecu densitatea de probabilitate π(π₯) se calculeaza prin:
π(π) =
β« β
ββπ₯π(π₯) ππ₯,
4
π·2(π) =
β« β
ββ(π₯βπ(π))2π(π₯) ππ₯.
β momentele de ordin π notate prin ππ sunt
ππ(π) =
β« β
ββπ₯ππ(π₯) ππ₯
iar momentele centrate de ordin π
ππ(π) =
β« β
ββ(π₯βπ(π))ππ(π₯) ππ₯
β se pastreaza proprietatile valorii medii sau ale dispersiei din cazul discretiar covarianta si coeficientul de corelatie se definesc la fel
Variabile aleatoare continue clasice
β cele mai utilizate distributii ale unei variabile aleatoare continue suntprezentate pe scurt in cele ce urmeaza
1. Variabile aleatoare uniforme
β daca π are densitatea de probabilitate
π(π₯) =
{1
πβπ , daca π₯ β [π, π]
0, in rest
spunem ca π are distributia uniform continua si scriem π βΌ π(π, π).
β π se numeste parametru de localizare iar πβ π de scara
β se verifica prin calcul ca π(π) = π+π2 si π·2(π) = (πβπ)2
12
Aplicatii=β utila in simularea variabilelor aleatoare, discutie in seminariile viitoare=β daca numaru π nu era suficient de misterios, aflati ca cifrele sale sunt
distribuite uniform=β timpul de asteptare dupa un autobuz, intr-o statie, este distribuit
uniform
2. Variabile aleatoare normal distribuite
β daca π are densitatea de probabilitate
π(π₯) =1β
2ππ2πβ
(π₯βπ)2
2π2
spunem ca π are distributia normala si scriem π βΌ π(π,π2).
5
β functia de repartitie πΉπ(π₯) este exprimata prin intermediul functiei derepartitie Ξ¦ corespunzatoare unei distributii standard normale
β pentru o astfel de variabila avem π(π) = π si π·2(π) = π2.
3. Variabile aleatoare normale standard distribuite
β o variabila cu distributia normala standard π este o variabila normal dis-tribuita corespunzatoare valorilor π = 0 si π = 1, π βΌ π(0, 1).
β functia ei de repartitie merita o notatie distincta
Ξ¦(π₯) =1β2π
β« π₯
ββπβ
π‘2
2 ππ‘
si are valorile intr-un tabel al scorurilor π§.β in manevrarea variabilelor aleatoare normal distribuite folosim frecvent
urmatorul argument de standardizareβ pentru o variabila π βΌ π(π,π2) calculam probabilitatile in felul urmator
π (π₯1 β€ π β€ π₯2) = π
(π₯1 βπ
πβ€ π β€ π₯2 βπ
π
)= Ξ¦
(π₯2 βπ
π
)βΞ¦
(π₯1 βπ
π
)
unde π :=π βπ
πeste o variabila aleatoare cu distributia normala standard
iar valorile Ξ¦
(π₯2 βπ
π
), Ξ¦
(π₯1 βπ
π
)se citesc din tabelul scorurilor π§.
β de fapt, identitatile de mai sus afirma ca valorile functiei de repartitie aleunei variabile aleatoare normal distribuite
π βΌ π(π,π2)
se calculeaza prin
πΉπ(π₯) = Ξ¦
(π₯βπ
π
)
Aplicatii=β inaltimea sau greutatea indivizilor sunt considerate a fi normal dis-
tribuite=β IQ-ul populatiei este considerat a fi normal distribuit=β tensiunea arteriala corespunzatoare unei populatii este normal dis-
tribuita=β erorile de masurare sunt in general normal distribuite
6
4. Variabile aleatoare exponential distribuite
β daca π are densitatea de probabilitate
π(π₯) =
{ππβππ₯, pentru π₯ β₯ 0
0, in rest
spunem ca π are distributia exponentiala si scriem π βΌ πΈπ₯π(π).
β functia de repartitie este
πΉ (π₯) =
{1 β πβππ₯, pentru π₯ β₯ 0
0, in rest
β prin calcul se verifica π(π) = 1π si π·2(π) = 1
π2
Aplicatii
=β timpul necesar dezintegrarii unei particule radioactive, sau timpulscurs intre doua clickuri ale unui contor Geiger
=β timpul scurs pana la urmatorul tau apel telefonic urmeaza o distributieexponentiala
=β cat timp ii ia unui functionar bancar sa serveasca un client ? putemestima folosind o distributie exponentiala
5. Variabile aleatoare logistic distribuite
β daca π are densitatea de probabilitate
π(π₯) =πβ(π₯βπ)/π
π (1 + πβ(π₯βπ)/π
)2spunem ca π are distributia logistica si scriem π βΌ πΏππππ π‘ππ(π, π ).
7
β π β R se numeste locatie iar π > 0 se numeste scaraβ functia de repartitie este functia logistica
πΉ (π₯) =1
1 + πβ(π₯βπ)/π
β media unei astfel de variabile este π(π) = π iar varianta π·2(π) = π 2π2
3
Aplicatii=β in hidrologie modeleaza debitul raurilor in decursul unei luni/an=β in sah e utilizata pentru calculul ratingului sahistilor=β spre deosebire de variabilele normal distribuite, are avantajul ca valorile
functiei de repartitie pot fi calculate analitic nu doar aproximate prin metodenumerice
6. Variabile aleatoare Erlang si gamma
β daca π are densitatea de probabilitate
π(π₯) =
{ππ π₯π β1πβππ₯
Ξ(π ) , pentru π₯ > 0
0, in rest
spunem ca π are distributia gamma si scriem π βΌ Ξ(π , π).
8
β parametrul π > 0 se numeste rata iar π > 0 se numeste forma (shape)β pentru π intreg se obtine distributia Erlangβ functia de repartitie este functia gamma incompleta regularizata
πΉ (π₯) =πΎ(π , ππ₯)
Ξ(π )
unde
πΎ(π , π₯) =
β« π₯
0
π‘π β1πβπ‘ ππ‘
este functia gamma incompleta inferioaraβ prin calcul se verifica π(π) = π
π si π·2(π) = π π2
Aplicatii=β in comunicatiile wireless, distributia gamma este folosita pentru a
modela fadingul propagarii multicale=β in exprimarea genetica bacteriala (fluxul de informatie de la acizii
nucleici la proteine), numarul de proteine intr-o populatie de celule de obiceiurmeaza o distibutie gamma, unde parametrii rata (r) si forma (s) sunt, respec-tiv, numarul mediu de citolize per ciclu celular si numarul mediu de moleculede proteina produse de un singur ARN mesager in timpul vietii sale
7. Variabile aleatoare beta
β este o variabila care are o distributie flexibila si valori nenule restrictionatela un interval [0, 1], fiind utila in multe modele probabiliste.
β proportia de radiatie solara absorbita de un material sau proportia (dintimpul maxim) necesara realizarii unei sarcini sunt exemple de variabile continuecu valori in intervalul [0, 1]
β daca π are densitatea de probabilitate
π(π₯) =
{Ξ(π+π)Ξ(π)Ξ(π)π₯
πβ1(1 β π₯)πβ1, pentru π₯ β [0, 1]
0, in rest
spunem ca π are distributia beta si scriem π βΌ π½(π, π).
9
β functia de repartitie este functia beta incompleta regularizata
πΌπ₯(π, π) =π½(π, π, π₯)
π½(π, π)
unde
π½(π, π, π₯) =
β« π₯
0
π‘πβ1(1 β π‘)πβ1 ππ‘
este functia beta incompletaβ prin calcul se verifica π(π) = π
π+π si π·2(π) = ππ(π+π)2(π+π+1)
Aplicatii=β distributia beta poate fi folosita pentru a modela evenimente care sunt
restrictionate sa aiba loc intr-un interval definit de o valoare minima si unamaxima
Aproximari normale ale variabilelor discrete
β teorema limita centrala are un rol practic deosebit in teoria probabilitatilorpermitand aproximarea unor variabile discrete prin intermediul uneia normaldistribuita
β daca π este o variabila aleatoare cu distributie binomiala π βΌ π΅π(π, π) si πeste suficient de mare, atunci π poate fi aproximata printr-o variabila aleatoarenormal distribuita π βΌ π(ππ, ππ(1 β π))
β de obicei se aplica si corectiile de continuitate pentru a imbunatati esti-marea
π (π = π) β π
(π β 1
2< π < π +
1
2
)intrucat aici π este discreta are sens sa calculam probabilitatea evenimentuluiπ = π, in plus avem
π (π β€ π) = π (π < π + 1) β π
(π < π +
1
2
)
π (π β₯ π) = π (π > π β 1) β π
(π > π β 1
2
)π (π1 β€ π β€ π2) β π
(π1 β
1
2< π < π2 +
1
2
)β daca π este o variabila aleatoare cu distributie Poisson de parametru π si
π este mare, atunci π poate fi aproximata printr-o variabila aleatoare normaldistribuita π βΌ π(π, π)
=β se pot aplica aceleasi corectii de continuitate=β pentru a putea exploata aceasta aproximare normala, in ambele cazuri,
va fi nevoie de argumentul de standardizare descris in sectiunea dedicata varia-bilelor normal standard distribuite
10
Probleme rezolvate
Problema 1
Suprarezervarea locurilor pentru zborurile intercontinentale este o prac-tica comuna in cadrul companiilor aeriene, vezi cazul United Airlines.Aeronave care sunt capabile sa transporte 300 de pasageri accepta panala 320 de rezervari. Daca 10% dintre pasagerii care au o re- zervare nu seimbarca in cele din urma in avion, care este probabilitatea ca cel putinun pasager, care are bilet de avion, sa sfarseasca fara un loc in avion ?Care este probabilitatea ca intre 25 si 45 de pasageri cu loc rezervat sanu se prezinte la poarta de imbarcare ?
Solutie: Inainte de toate trebuie sa recunoastem ca este vorba despre unexperiment binomial. Sunt π = 320 de repetari: un pasager cu o rezervare facutaincearca sa se imbarce in avion la fiecare asa-zisa repetare. Numim βsuccessβsituatia in care un pasager care are o rezervare nu reuseste sa se imbarce pentruzborul sau. Probabilitatea unui succes este π = 0.10
Notam prin urmare cu π variabila aleatoare care numara pasagerii cu re-zervare care nu reusesc sa se imbarce in avion. π este o variabila aleatoarediscreta cu distributie binomiala π βΌ π΅π(320, 0.10) si va trebui sa calculamπ (π β€ 19) si π (25 β€ π β€ 45).
Putem face asta folosind distributia binomiala dar va conduce la o muncade chinez batran, de exemplu
π (π β€ 19) =
19βπ=1
πΆπ320(0.10)π(0.90)320βπ
O idee mai buna este sa aproximam variabila discreta π printr-una continua πcare este normal distribuita
π βΌ π(ππ, ππ(1 β π)) = π(32, 28.8)
conform teoremei limita centrala.Folosim apoi corectiile de continuitate:
π (π1 β€ π β€ π2) β π
(π1 β
1
2< π < π2 +
1
2
)si
π (π β€ π) β π
(π < π +
1
2
)Deci
π (25 β€ π β€ 45) β π
(25 β 1
2< π < 45 +
1
2
)si
π (π β€ 19) β π
(π < 19 +
1
2
)11
Avem nevoie si de o reducere a lui π la o variabila aleatoare cu distributia
standard normala prin tranformareaπ βπ
π= π. Au loc relatiile
π (π₯1 β€ π β€ π₯2) = π
(π₯1 βπ
πβ€ π β€ π₯2 βπ
π
)= Ξ¦
(π₯2 βπ
π
)βΞ¦
(π₯1 βπ
π
)pentru π βΌ π(0, 1).
π (24.5 < π < 45.5) = π
(24.5 β 32
5.36β€ π β€ 45.5 β 32
5.36
)= Ξ¦ (2.51) β Ξ¦ (β1.39)
= 0.9940 β 0.0823 = 0.92 = 92%
si
π
(π < 19 +
1
2
)= π
(π β€ 19.5 β 32
5.36
)= Ξ¦ (β2.33) = 0.0102 = 1%
Mai sus am citit scorurile π§ din tabelul scorurilor z.
Problema 2
Variabila aleatoare π are densitatea de probabilitate
π(π₯) =
{12 , if β 1 < π₯ < 1
0, otherwise
a) Aflati functia de repartitie πΉb) Aflati densitatile de probabilitate corespunzatoare variabilelor π = ππ
si π = 2π2 + 1.
Solutie: a) Functia π este o densitate de probabilitate deoarece satisfaceproprietatile definitorii
ββ«ββ
π (π₯) ππ₯ =
1β«β1
1
2ππ₯ =
π₯
2|1β1= 1
si are doar valori pozitive. Prin definitie functia de repartitie va fi
πΉπ (π₯) =
π₯β«ββ
π (π‘) ππ‘ =
β§βͺβͺβͺβ¨βͺβͺβͺβ©0, π₯ < β1
π₯+12 , β1 β€ π₯ < 1
1, 1 β€ π₯
,
deoarece
π₯ < β1 β πΉ (π₯) =
π₯β«ββ
0 ππ‘ = 0,
π₯ β [β1, 1) β πΉ (π₯) =
β1β«ββ
0 ππ‘ +
π₯β«β1
1
2ππ‘ =
π₯
2+
1
2=
π₯ + 1
2,
12
1 β€ π₯ β πΉ (π₯) =
β1β«ββ
0 ππ‘ +
1β«β1
1
2ππ‘ +
ββ«1
0 ππ‘ = 1.
b) Pentru inceput sa aflam functia de repartitie πΊ (π₯) corespunzatoare luiπ . Intrucat π > 0 pentru orice π₯ β€ 0, obtinem πΊ (π₯) = π (π β€ π₯) = 0. Dacaπ₯ > 0 atunci
πΊ (π₯) = π (π β€ π₯) = π(ππ β€ π₯
)= π (π β€ lnπ₯) = πΉ (lnπ₯)
Asamblate impreuna
πΊ (π₯) =
β§βͺβ¨βͺβ©0, lnπ₯ < β1 si π₯ β€ 01+ln π₯
2 , β1 β€ lnπ₯ < 1
1, 1 β€ lnπ₯
=
β§βͺβ¨βͺβ©0, π₯ β
(ββ, 1
π
)1+ln π₯
2 , π₯ β[1π , π
)1, π₯ β [π,β)
Densitatea de probabilitate corespunzatoare va fi
π(π₯) = πΊβ²(π₯) =
{12π₯ , π₯ β
(1π , π
)0, altfel
Deoarece π este nenul doar pe intervalul (β1, 1), π = 2π2 + 1 va fi nenulape intervalul (1, 3). Pentru π₯ β (1, 3), functia de repartitie π» (π₯) a lui π va fi
π» (π₯) = π (π β€ π₯) = π(2π2 + 1 β€ π₯
)= π
(π2 β€ π₯β 1
2
)=
= π
[ββ
π₯β 1
2β€ π β€
βπ₯β 1
2
]= πΉ
[βπ₯β 1
2
]β πΉ
[ββ
π₯β 1
2
]
=1
2
[1 +
βπ₯β 1
2
]β 1
2
[1 β
βπ₯β 1
2
]=
βπ₯β 1
2.
Densitatea de probabilitate, obtinuta prin β (π₯) = π» β² (π₯), e data de
β (π₯) =
{1
2β2π₯β2
, π₯ β (1, 3)
0, altfel
Problema 3
Densitatea de probabilitate corespunzatoare unei variabile aleatoare con-tinue π este data prin
π (π₯) =
β§β¨β©1
2cosπ₯, π₯ β
(βπ
2,π
2
)0, altfel
a) Calculati valoarea medie si dispersia lui π.
b) Aflati functia de repartitie si calculati probabilitatea π(π
4< π <
π
3
).
13
Solutie: a) Valoarea medie
π (π) =
+ββ«ββ
π₯ Β· π (π₯) ππ₯ =1
2
π2β«
βπ2
π₯ cosπ₯β β f este impara
ππ₯interval
=simetric
0,
iar dispersia
π·2 (π) =
+ββ«ββ
[π₯β πΈ (π)]2π (π₯) ππ₯ =
π2β«
βπ2
(π₯β 0)2π (π₯) ππ₯ =
=1
2
π2β«
βπ2
π₯2 cosπ₯β β f e para
ππ₯interval
=simetric
2 Β· 1
2
π2β«
0
π₯2 cosπ₯ππ₯,
prin urmare
π·2 (π) =π2
4β 2.
b) Functia de repartitie este definita prin
πΉ (π₯) =
π₯β«ββ
π (π‘) ππ‘.
Astfel, pentru π₯ < βπ
2=β πΉ (π₯) =
π₯β«ββ
0 ππ‘ = 0.
Pentru π₯ β[βπ
2,π
2
)se obtine
πΉ (π₯) =
π₯β«ββ
π (π‘) ππ‘ =
βπ2β«
ββ
0 ππ‘ +
π₯β«βπ
2
1
2cos π‘ ππ‘ =
1
2+
1
2sinπ₯.
iar daca π₯ β₯ π
2avem
πΉ (π₯) =
π₯β«ββ
π (π‘) ππ‘ =
βπ2β«
ββ
0 ππ‘ +
π2β«
βπ2
1
2cos π‘ ππ‘ +
π₯β«π2
0 ππ‘ = 1.
deci
πΉ (π₯) =
β§βͺβͺβͺβ¨βͺβͺβͺβ©0, π₯ β€ βπ
21
2+
1
2sinπ₯, π₯ β
(βπ
2,π
2
)1, π₯ β₯ π
2
.
Pentru o variabila aleatoare continua putem folosi densitatea de probabilitatesau functia de repartitie pentru a calcula probabilitati
π(π
4< π <
π
3
)=
π3β«
π4
π (π₯) ππ₯ =
π3β«
π4
1
2cosπ₯ ππ₯ = πΉ
(π3
)β πΉ
(π4
)=
β3 β
β2
4.
14
Problema 4
Lipsa memoriei unei variabile exponential distribuiteFie π timpul scurs intre detectarea particulelor cu un contor Geiger si sapresupunem ca π are o distributie exponentiala cu π(π) = 1.4 minute.Aflati probabilitatea de a detecta o particula in primele 30 de secundede la pornirea contorului. Sa presupunem ca am asteptat 3 minute farasa fi detectat o particula. Care este probabilitatea sa detectam apoi oparticula in urmatoarele inca 30 de secunde ?
Solutie: Pentru o variabila cu distributia exponentiala π βΌ πΈπ₯π(π) stim caπ(π) = 1
π . Prin urmare π = 11.4 si apoi probabilitatea de a detecta particula
in primele 30 de secunde va fi estimata prin
π (π < 0.5) =
β« 0.5
ββπ(π₯) ππ₯ =
β« 0.5
0
ππβππ₯ ππ₯ = 1 β πβ0.51.4 β 30%
unde am folosit minutul ca unitate de masura si formula densitatii de proba-bilitate pentru variabilele exponential distribuite. Vom folosi pentru compararevaloarea exacta 1 β πβ
0.51.4 si nu cea aproximativa, afectata de erorile de aproxi-
mare.Daca nu vom detecta nicio particula timp de trei minute, senzatia generala
este ca probabilitatea de detectare ar trebui sa fie mai mare in cele 30 de secundescurse dupa aceste trei minute. Insa vom demonstra matematica contrariu.Probabilitatea ceruta se exprima matematic prin π (π < 3.5|π > 3) =? Adicatimpul scurs sa fie mai mic decat 3min 30 sec daca stim ca e sigur mai maredecat 3min. Conform formulei probabilitatilor conditionate
π (π < 3.5 | π > 3) =π (3 < π < 3.5)
π (π > 3)
caci consideram cele doua evenimente π > 3 si π < 3.5 iar intersectia lor seexprima prin evenimentul 3 < π < 3.5. Folosind densitatea de probabilitate adistributiei exponentiale gasim
π (3 < π < 3.5) =
β« 3.5
3
1
1.4πβ
π₯1.4 ππ₯ = βπβ
3.51.4 + πβ
31.4
si
π (π > 3) =
β« 3.5
3
1
1.4πβ
π₯1.4 ππ₯ = πβ
31.4
In consecinta
π (π < 3.5 | π > 3) =βπβ
3.51.4 + πβ
31.4
πβ3
1.4
= 1 β πβ0.51.4 = π (π < 0.5)
Aceasta lipsa de memorie reprezinta o proprietate specifica variabilelor expo-nential distribuite, fiind singurele variabile aleatoare continue cu aceasta pro-prietate, si poate fi exprimata general prin relatia
π (π < π‘1 + π‘2 | π > π‘1) = π (π < π‘2).
15
Problema 5
Cand se defecteaza proiectorul?Timpul pana la defectarea unui proiector (in ore) este modelat printr-o variabila aleatoare Weibull de parametrii π½ = 1
2 si πΏ = 5000 de ore.Determinati timpul mediu pana la defectare si estimati probabilitatea caacesta sa functioneze cel putin 12000 de ore, fara sa se defecteze.
Solutie: O distributie Weibull este utilizata pentru o modelare satisfacatoarea fiabilitatii unui produs. O variabila aleatoare cu o distributie Weibull aredensitatea de probabilitate
π(π₯) =
{π½πΏ
(π₯πΏ
)π½β1πβ( π₯
πΏ )π½
, pentru π₯ > 0
0, in rest
Parametrii π½ si πΏ ai distributiei furnizeaza o mare flexibilitate in modelareasistemelor a caror deterioare creste in timp (uzura rulmentilor), descreste intimp (unii semiconductori), sau ramane constanta in timp (avarii cauzate desocuri externe). Cateva posibile comportari ale lui π(π₯) sunt afisate mai jos.
Fie π variabila aleatoare care masoara timpul pana la defectarea proiectoru-lui. Valoarea medie a variabilei π este
π(π) =
β« β
ββπ₯π(π₯) ππ₯ =
β« β
0
π₯ Β· 1
10000
( π₯
5000
) 12β1
πβ( π₯5000 )
12ππ₯
intai facem schimbarea de variabila π¦ =(
π₯5000
) 12 si aplicand a doua metoda de
schimbare a variablei obtinem ππ₯ = 10000π¦ ππ¦ apoi
π(π) = 5000
β« β
0
π¦2πβπ¦ ππ¦ = 5000 Β· Ξ(3) = 10000 (ore)
Probabilitatea cautata se estimeaza folosind aceeasi schimbare de variabila
π (π β₯ 12000) =
β« β
12000
1
10000
( π₯
5000
) 12β1
πβ( π₯5000 )
12ππ₯
=
β« β
β2.4
πβπ¦ ππ¦ = πββ2.4 β 0.21 = 21%
16
Probleme propuse
B. Tehnica de calcul
Problema B.1. Un radar masoara vitezele masinilor pe o autostrada. Vitezelesunt normal distribuite cu media de 90 km/ora si deviatia standard 10 km/ora.Care este probabilitatea ca o masina aleasa aleator sa circule cu o viteza maimare de 100 km/ora?
Problema B.2. Consideram functia
π(π) =
{π cos2 π, daca π β (βπ
2 ,π2 )
0, in rest
i) Aflati π astfel ca π sa fie densitatea de probabilitate a unei variabile aleatoarecontinue π
ii) Determinati valoarea medie π(π) si dispersia π·2(π) acestei variabilealeatoare
iii) Aflati functia de repartitie πΉ (π₯) si calculati probabilitatea π (β1 < π < 1)
Problema B.3. Densitatea de probabilitate pentru amplitudinea ruliului uneinave are urmatoarea forma, conform legii lui Rayleigh
π(π₯) =π₯
π2πβ
π₯2
2π2 , π₯ β₯ 0
Daca nava ar transporta oi, am dori ca acestea sa calatoreasca in conditiilipsite de stres, vezi in link la ce situatii se poate ajunge. Aflati probabilitatea caamplitudinea miscarii sa depaseasca o valoarea critica π0. Determinati valoareaasteptata a amplitudinii πΈ(π), deviatia standard π(π) si momentul centrat π3.
Problema B.4. Intrarea la Universitatea Politehnica University se realizeazain urma unui test de selectie. Punctajele sunt normal distribuite cu o mediede 500 si o deviatia standard de 100. Popescu vrea sa fie admis la aceastauniversitate si el stie sa trebuie sa obtina un punctaj mai bun decat cel putin70% dintre contracandidatii sai. Popescu da testul si obtine 585 puncte. Va fiadmis la universitate cu acest punctaj ?
Problema B.5. Functia de repartitie corespunzatoare unei variabile aleatoarecontinue π este
πΉ (π₯) =
β§βͺβ¨βͺβ©0 π₯ < β5(π₯+5)2
144 β5 β€ π₯ < 7
1, π₯ β₯ 7
Aflati media, dispersia, deviatia standard si momentul de ordin 3 al lui π.Aflati apoi mediile π(π3) si π(ππ + 1).
17
Problema B.6. O persoana arunca de 1000 ori o moneda. Aflati probabilitateaca numarul de βstemeβ obtinute sa fie intre 475 si 525, inclusiv.
Problema B.7. Biletele pentru festivalul βUntoldβ sunt vandute online potrivitunei distributii Poisson cu o medie de 25 pe zi. Care este probabilitatea ca:
a) mai mult de 20 de bilete sa fie vandute intr-o zi ?
b) intre 20 si 30 de bilete sa fie vandute intr-o zi ?
Problema B.8. Un club de fotbal asigura transportul cu autobuzul al fanilorsai. Un autobuz soseste intr-o anumita statie la fiecare 15 minute intre ora4 si 12 p.m. in ziua meciului. Fanii sosesc in statie in momente de timpaleatoare. Timpul petrecut de catre un fan in asteptarea autobuzului este o vari-abila aleatoare uniform distribuita cu valori de la 0 la 15 minute. Care estetimpul mediu de asteptare ? Care este probabilitatea ca un fan sa astepte maimult de 12 minute ? Care este probabilitatea ca un fan sa fie nevoit sa astepteintre 5 si 10 minute ?
Problema B.9. Timpul maxim disponibil pentru a realiza o sarcina intr-unproiect este de 2.5 zile. Presupunem ca timpul necesar realizarii sarcinii, caproportie din timpul maxim, este o variabila aleatoare beta cu π = 2 si π = 3.
Cat se estimeaza ca va dura realizarea sarcinii? (Valoarea asteptata)Care este probabilitatea ca realizarea sarcinii sa dureze mai mult de doua
zile?
18
Bibliografie
[1] R. Yates and D. Goodman. Probability and Stochastic processes,Wiley&Sons, 2005.
[2] D. Montgomery and G. Runger. Applied Statistics and Probability forEngineers, Wiley, 2014.
[3] R. Negrea. Curs Matematici Speciale, 2021.
[4] C. Hedrea. Notite seminar Matematici Speciale, 2021.