+ All Categories
Home > Documents > Colectarea Si Prelucrarea Datelor in Transporturi

Colectarea Si Prelucrarea Datelor in Transporturi

Date post: 14-Dec-2015
Category:
Upload: anda-miclaus
View: 15 times
Download: 0 times
Share this document with a friend
Description:
transporturi, prelucarare date in transporturi
69
1 1. PRELIMINARII PROBABILITĂȚI. VARIABILE ALEATOARE Definiția clasică a probabilității Probabilitatea a fost privită, fie dintr-un punct de vedere „psihologic” ca măsurând gradul de siguranță al observatorului, relative la producerea sau neproducerea unui fenomen , fie “statistic” ca frecvență de apariție a unui fenomen într-un număr mare de experimente independente. Din punct de vedere clasic, definiția care s-a dovedit cea mai eficientă în calcule, a fost aceea care a plecat de la conceptul de egală posibilitate. Acest lucru înseamnă că numărul de posibilități într-un experiment este finit și toate posibilitățile au aceeași șansă. Probabilitatea unui eveniment care constă din mai multe astfel de posibilități este raportul dintre numărul cazurilor favorabile și numărul cazurilor posibile. Utilizarea acestei definiții presupune că într-un fel sau altul putem număra stările posibile și pe cele favorabile. Exemplu Se aruncă un zar de două ori. Să se determine probabilitățile evenimentelor: Suma fețelor celor două zaruri este 6. Ambele zaruri au fața cu același număr. Soluție Cazurile posibile în cele două situații sunt: 6 , 6 ,..., 2 , 1 , 1 , 1 , în număr de 36.
Transcript

1

1. PRELIMINARII

PROBABILITĂȚI. VARIABILE

ALEATOARE

Definiția clasică a probabilității

Probabilitatea a fost privită, fie dintr-un punct de vedere „psihologic”

ca măsurând gradul de siguranță al observatorului, relative la producerea sau

neproducerea unui fenomen , fie “statistic” ca frecvență de apariție a unui

fenomen într-un număr mare de experimente independente.

Din punct de vedere clasic, definiția care s-a dovedit cea mai eficientă

în calcule, a fost aceea care a plecat de la conceptul de egală posibilitate.

Acest lucru înseamnă că numărul de posibilități într-un experiment este finit

și toate posibilitățile au aceeași șansă.

Probabilitatea unui eveniment care constă din mai multe astfel de

posibilități este raportul dintre numărul cazurilor favorabile și numărul

cazurilor posibile. Utilizarea acestei definiții presupune că într-un fel sau

altul putem număra stările posibile și pe cele favorabile.

Exemplu

Se aruncă un zar de două ori. Să se determine probabilitățile

evenimentelor:

Suma fețelor celor două zaruri este 6.

Ambele zaruri au fața cu același număr.

Soluție

Cazurile posibile în cele două situații sunt: 6,6,...,2,1,1,1 , în număr

de 36.

2

Cazurile favorabile sunt: 1,5,2,4,3,3,4,2,5,1 , deci 5.

atunci 36

5

..

..

posibilecazurinr

favorabilecazurinrp

.

Cazurile favorabile sunt: 6,6,5,5,4,4,3,3,2,2,1,1 ,deci 6

atunci 6

1

36

6p .

Definiția axiomatică a probabilității

În general evenimentele se exprimă prin propoziții. Propozițiile,

obținute prin operațiile logicii matematice ,, ,între propoziții care

exprimă evenimente ; exprimă la rândul lor alte evenimente.

Probabilitatea este definită pe o mulțime de evenimente care o dată

cu evenimentele A și B conține și evenimentele următoare exprimate prin

operațiile logice "","",""

ABA și B

ABA sau B

A - non A , EP .

E - evenimentul sigur (cert)

- evenimentul imposibil.

De asemenea presupunem că au loc următoarele relații:

Comutativitatea ;; ABBAABBA

Asociativitatea ;; CBACBACBACBA

Distributivitatea

CABACBACABACBA ; ;

Absorția ;; AABAAABA

3

Legile lui de Morgan ;; BABABABA

Evenimentele cert și imposibil se caracterizează prin:

;;

;

EAEAAE

AAA

Evenimentul non A sau contrar lui A are proprietățile:

.; EAAAA

Definiție: O mulțime de evenimente cu proprietățile de mai sus se

numește câmp de evenimente sau algebră de evenimente sau algebră Boole.

Relațiile de mai sus nu sunt independente , deci nu formează un set

minimal de axiome pentru algebrele Boole. Pe de altă parte ele implică alte

relații importante , cum ar fi .AA Următoarea teoremă descrie asemenea

câmpuri de evenimente prin submulțimi.

Teorema lui Stone:

Fie M o mulțime de evenimente cu proprietățile de mai sus. Atunci

există o mulțime E și o submulțime EP ce verifică la proprietățile:

i E, ;

ii BABA, ;

iii BABA \, ;

și o bijecție EP: astfel ca:

a BABA ;

b BABA ; ; EE .

c AA .

Teorema arată în esență că orice câmp de evenimente poate fi

reprezentat prin submulțimi ale aceleași mulțimi E . Operației "" între

4

evenimente îi corespunde "" mulțimilor , operației "" îi corespunde ""

mulțimilor, iar negației "" îi corespunde complementara, evenimentul sigur

sau cert E corespunde mulțimii totale E , iar evenimentul imposibil

corespunde mulțimii vide .

Definiție: O mulțime EP cu proprietățile iii , și iii din

teorema lui Stone se numește clan,algebră de evenimente sau câmp de

evenimente. Uneori se mai numește și algebră de mulțimi.

Propoziție: Fie EP un câmp de evenimente:

a Dacă nAAA ,...,, 21 atunci

n

i

iA1

și

n

i

iA1

;

b Dacă A atunci A .

Definiția axiomatică a probabilității:

Fie EP un câmp de evenimente. Se numește probabilitate pe ,

o funcție Rp : ce satisface la proprietățile:

i AAp ,1,0 ;

ii BpApBAp dacă BA ;

iii 0p , 1Ep .

Tripletul pE ,, îl vom numi câmp de probabilitate.

Teoremă: Fie pE ,, un câmp de probabilitate. Atunci:

1 ;,1 AApAp

2 Dacă nAAA ,...,, 21 și ji AA pentru njiji ,...,2,1,,

atunci

n

i

i

n

i

i ApAp11

;

5

3 BApBpApBAp , BA, ;

4 BpApBA .

VARIABILE ALEATOARE

Definiție: O funcție REf : se numește variabilă aleatoare (pe

scurt v.a.) , dacă pentru orice interval deschis Rba , , avem

baf ,1 . O funcție CEf : se numește variabilă aleatoare dacă

fRe și fIm sunt variabile aleatoare reale.

Variabilele aleatoare care iau un număr finit de valori se numesc

variabile aleatoare simple.

Fie nvvv ,...,, 21 valorile distincte ale lui f și fie ii vfA 1 . În aceste

condiții variabila aleatoare se scrie:

nn Axdacăv

Axdacăv

Axdacăv

xf

,,

........................

,,

,,

22

11

.

Fiecărei variabile aleatoare f îi vom asocia o diagramă , notată tot cu

f :

n

n

pppp

vvvvf

...

...:

321

321, numită distribuția sau

repartiția variabilei aleatoare.

6

Valorile nvvv ,..,, 21 sunt în general distincte , iar evenimentele jA ,

nj ,1 , formează o partiție a lui E , dacă ji AA , sunt disjuncte pentru ji

și EAn

i

i

1

. Este clar atunci că 1...21 nppp .

Pentru o variabilă aleatoare simplă definim:

Definiție:

i valoarea medie a lui f: i

n

i

ii

n

i

i vfpvpvfM 11

;

ii momentul de ordinul k: k

i

n

i

k

ikk fMpvfmfM 1

;

iii momentul centrat de ordinul k:

k

i

n

i

k

ik fMfMpfMvf 1

;

iv dispersia:

ffMfMpfMvffD ii 2

222 ;

v funcția caracteristică: CRfc : sau

;,:1

n

j

j

tiv

fcf pettfCR j

vi funcția de repartiție: RRF : ,

tfptxfXxptF .

Vom nota în general cu bfa evenimentul

bxfaXxbaf ,1, iar probabilitatea acestuia cu bfap

.

7

Teoremă (proprietățile valorii medii)

Fie pX ,, un câmp de probabilitate finit și ,...,, 21 fff variabile

aleatoare pe X. Atunci:

.1 Dacă ;. CfMctCf

.2 Dacă ;. fMfMct

.3 2121 fMfMffM și de aici

nn fMfMfMfffM ...... 2121 și

gbMfaMbgafM ;

0 fMfM ; ba, constante ;

.4 Dacă 1f și 2f sunt independente atunci 2121 fMfMffM

;

.5 Dacă 00 fMf ;

.6 Dacă gMfMgf ;

.7 ffM max .

Teoremă (proprietățile dispersiei)

.1 Cf a.p.t.(constant) 0 fD ;

.2 fDafaD 2 ,a fiind o constantă;

.3 Dacă 1f , 2f sunt independente 2121 fDfDffD .

Definiție: Dacă f este o v.a. atunci expresia

fD

fMf se numește

deviația standard a lui f.

Definiție: Fie pX ,, un câmp de probabilitate. O funcție

RXf : se numește variabilă aleatoare , dacă pentru Rc , mulțimea

cf este un eveniment din . Adesea vom nota mulțimea de

mai sus prin cf sau cf ,1 .

8

Propoziție: RXf : este o v.a. este îndeplinită una din

condițiile:

a cfRc ;

b cfRc ;

c cfRc ;

d cfRc ;

e fRc .

Teoremă:

Dacă f și g sunt v.a. atunci și g

fgfgf ,, sunt v.a. .

Fie nipentruEvf ii ,1,,, . Atunci valoarea medie a lui f

se definește prin:

i

ii EpvfM .

Vom nota această expresie prin X

dpf

sau

X

dpf

.

Avem proprietățile mediei:

.1 Dacă cfdpcfX

;

.2 XXX

gdpfdpdpgf ;

.3 dpfdpfn

i X

i

X

n

i

i

11

;

.4 Dacă 1f și 2f sunt independente atunci

XXX

dpfdpfdpff 2121 ;

.5 Dacă 00 X

fdpf ;

9

.6 XX

gdpfdpgf ;

.7 ffdpX

max .

Momentul de ordinul k se definește ca pentru v.a. simple

X

kk

kk dpffMfmfM .

Momentul centrat de ordinul k :

dpfMffMfMfX

kk

k .

Dispersia se definește de asemenea ca pentru v.a. simple:

22

22fMfMdpfMffMfMfD

X

.

Unei v.a. generale nu-i putem atașa distribuția sau repartiția ca în cazul

v.a. simple , ele luând în general o infinitate de valori. În cazul particular

când mulțimea valorilor v.a. este numărabilă ,...,...,, 21 nvvv iar evenimentele

ii vfE au probabilitățile ip , putem spune că f are repartiția sau

distribuția:

,121

21

.......

......:

ii

i

n

n

p

v

ppp

vvvf .

În acest caz i

i

i

X

pvfdpfM

1

, iar i

i

i pfMvfD

1

2.

Funcția de repartiție. Densitatea de probabilitate

Fie RXf : o v.a. definită pe spațiul probabilizat X . Asociem lui

f , o funcție RRF : , definită prin formula tfptF . Funcția F

10

nu mai apare ca depinzând explicit de X . Ea conține informații

“probabilistice”despre f , independent de natura elementelor din X . Este

posibil ca aceeași funcție F să corespundă la v.a. diferite, definite pe același

spațiu X sau pe spații diferite.

Definiție: Funcția RRF : , cu tfptF , f fiind o v.a. se

numește funcția de repartiție a acestei v.a. .

Definiție: Fie o variabilă aleatoare f cu funcția de repartiție F . O

funcție ,0: R , integrabilă cu probabilitatea că :

dxxtF

t

, se numește densitatea de

repartiție a v.a. f .

Teoremă: Funcția de repartiție are următoarele proprietăți:

.1 F este monoton crescătoare;

.2 0lim

tFFt

; 1lim

tFFt

;

.3 F este continuă la stânga;

.4 aFbFbfap ;

.5 Reciproc dacă o funcție RRF : are proprietățile de mai sus ,

atunci un câmp de probabilitate pX ,, și o v.a. pe X , care are pe F ca

funcție de repartiție.

Teoremă: Densitate de probabilitate a unei v.a. are proprietățile:

.1 0t ;

11

.2 1

dtt ;

.3 dxxbtap

b

a

;

.4 Reciproc dacă o funcție integrabilă RR : are proprietățile

.3.1 , atunci un câmp de probabilitate pX ,, și o v.a. pe X , care

admite pe ca densitate de probabilitate

Avem că:

dxxxxxdFfM

; dxxxxdFxfM kk

k

.

dxxfMxxdFfMxfkk

k

;

dxxfMxxdFfMxfD

22

.

LEGI CLASICE DE

PROBABILITATE

În cele ce urmează vom studia câteva legi frecvent întâlnite în aplicații.

Când discutăm o asemenea lege , subînțelegem că un câmp de probabilitate

pX ,, și o v.a. RXf : , care are ca funcție de repartiție pe F și ca

densitate de probabilitate pe .

12

1) REPATIȚIA BINOMIALĂ

Fie v.a. simplă

011100 ......

......10:

qpCqpCqpCqpC

nkf

nn

n

knkk

n

n

n

n

n

,

unde 1,0p , 1 qp , Nn . O asemenea v.a. se numește

binomială.

Funcția caracteristică este :

nitknkn

k

k

n

itk

f qpeqpCet

0

, 12 i .

De aici se obține:

a ;1

01

0

1, nppieqpenii

fM t

itnit

f

b ;01 22,,

22 npqpni

fM f

c .2

2 npqfMfMfD

13

2) REPARTIȚIA POISSON

Spunem că f este o v.a. de tip Poisson dacă ia valori întregi pozitive și

ek

kfpk

!, unde 0 . Repartiția unei astfel de variabile aleatoare

este:

,...2,1,0

2

!...

!...

!2!1

......210:

n

nn

en

n

en

eee

nf .

- se numește parametrul variabilei aleatoare.

Funcția caracteristică este

1

00 !!

itit ee

n

k

kitn

k

kitk

f eeek

ee

keet

.

Prin urmare:

a 01 ,

fi

fM ;

b 2,,

22 01

fi

fM ;

c 2

2 fMfMfD .

3) REPARTIȚIA NORMALĂ

Spunem că o v.a. f admite o repartiție normală de parametrii m și ,

dacă densitatea ei de probabilitate este:

14

2

2

2

2

1

mx

ex

.

V.a. cu repartiția normală , de valoare medie m și dispersie 2 - o vom

numi de tipul ,mN . Legea normală a apărut în legătură cu teoria erorilor

de măsurare.

4) REPARTIȚIA EXPONENȚIALĂ NEGATIVĂ

Se numește astfel o v.a. cu densitatea de probabilitate:

0,

0,0

xe

xx

x , unde 0 .

Plecând de la definiție obținem:

5) REPARTIȚIA GAMMA

Se numește astfel o repartiție cu densitatea de probabilitate:

0,

1

1

0,0

1xex

x

xx

, unde 0;1 .

15

Cel mai frecvent se utilizează cazul m 1;1 , când avem:

0,1

0,0

11,1 xexm

x

xx xmm .

Funcția gamma se definește prin:

0

1dttex xt , pentru 0x .

Următoarele proprietăți se cunosc de la cursul de analiză matematică:

xxx 1 ;

2

1.

Funcția caracteristică se calculează astfel :

1

0

11...

1

1

tidxexet

x

itx

f .

Caracteristicile numerice sunt:

a 01

1 ,

fi

fM ;

b 2101 2,,

22 fi

fM ;

c 122

2 fMfMfD .

În cazul 1 , 1 m , se obține m

f mtt

1 , valoarea medie

m ,

dispersia m .

16

2. NOȚIUNI DE STATISTICĂ

MATEMATICĂ ȘI

PROBABILITĂȚI UTILIZATE

ÎN TRAFICUL RUTIER

Evaluările de perspectivă efectuate pentru caracterizarea traficului

rutier sunt de cele mai multe ori bazate pe prognoze și estimări. În aceste

condiții se pune problema obținerii datelor de pornire (intrare în algoritm)

care să ofere credibilitate maximă și să fie suficient de representative pentru

fenomenul de trafic analizat.

În ce măsură datele pe care le utilizăm sunt de “încredere”? La această

întrebare se poate răspunde numai apelând la instumentul statistic de analiză

, capabil să asigure extrapolarea unor observații punctuale la întreg

fenomenul sau la evenimentul analizat. Astfel evaluarea statistică , rezultat al

investigării stării de trafic la un moment dat , sau într-un interval de timp

determinat , constitue un instrument necesar și de neeludat în dezvoltarea

prognozelor și estimărilor.

Necesitatea de a obține valori credibile și în același timp representative

pentru starea traficului la un moment dat , a impus acest instrument de lucru.

Este importantă caracterizarea statistică a traficului , pentru a obține datele de

pornire pertinente , care să asigure o dezvoltare credibilă a studiilor sau

programelor destinate modelării fluxurilor de vehicule sau ierarhizării

acceselor într-o intersecție dată.

În acest sens , datele obținute prin observații (sondaj) sau prin colectare

automată trebuie supuse unui proces de prelucrare statistică , care are în

vedere atât identificarea unor tendințe probabile a șirurilor de valori , cât și

gruparea lor funcție de tendințele probabile demonstrate prin criterii

matematice stabile.

17

2.1.1. INDICATORI STATISTICI

Șirurile de date obținute în urma monitorizării traficului constitue

eșantioane ce cuprind valori înregistrate în intervale de timp impuse .

Prelucrarea statistică a acestor eșantioane de valori constă în identificarea

tendințelor principale de evoluție a fenomenelor observate (monitorizate).

Sunt evidențiate trei importante categorii de parametrii statistici , care

pot fi utilizați în evaluarea datelor de trafic, astfel:

(a) parametrii de grupare (denumiți și de tendință) care exprimă

tendința șirului de a coverge crescător sau descrescător spre o

anumită valoare, inclusă în șirul de date.

(b) parametrii de împrăștiere (denumiți și de dispersie) care arată

proprietatea naturală a șirului de date de a se distribui în mod

aleatoriu sau predilect în intervalul în care șirul ia valori.

(c) parametrii speciali destinați caracterizării coplexe a șirului de date ,

în scopul identificării tendințelor de probabilitate a șirului.

Eșantionul de date rezultat în urma monitorizării indicatorilor de trafic

formează un șir de valori caracterizat prin:

- valoarea minimă "" minx care reprezintă cea mai mică înregistrare

numerică a șirului de date.

- valoarea maximă "" maxx care reprezintă înregistrarea cu valoarea

cea mai mare din șirul de date format de eșantion.

- lungimea șirului de date ""n reprezintă numărul de date din

eșantion.

- domeniul de valori al eșantionului limitat superior și inferior de

maxx , respective de minx .

Parametrii de grupare sau de tendință sunt urmărtorii:

18

- media de sondaj ""m a șirului de date , care reprezintă valoarea

ponderată a datelor din șir . Sunt definite matematic și au utilitate în

evaluările de trafic rutier, următoarele medii statistice:

- media aritmetică de sondaj este un indicator de poziție , care oferă o

informare globală privind valoarea cea mai credibilă a șirului de date , spre

care tind crescător sau descrescător celelalte date din șir și se determină cu

relația:

n

i

ixn

m1

1, (1)

unde n - este numărul de date din eșantion supus prelucrării statistice,

ix -valoare a șirului de date din eșantion, ni ,1 .

Media aritmetică de sondaj reprezintă valoarea cea mai utilizată în

evaluările specifice traficului rutier și permite evidențierea caracteristicei

predominante de raportare a indicatorilor de trafic analizați.Acest indicator

are proprietatea că suma algebrică a abaterilor diferitelor valori de la medie

este nulă.

- media geometrică – reprezintă un indicator caracteristic seriilor de

numere positive și permite evaluarea șirului de date în raport cu

produsul acestora , conform relației:

n

n

i

i

nn

i

i xxg

1

1

1

. (2)

- media armonică – reprezintă inversul mediei artitmetice de sondaj

și arată caracterul de variațiea al valorilor inverse din șir , fiind dată de:

n

i ix

nh

1

1 . (3)

19

- media de așteptare – reprezintă valoarea combinată a parametrului

evaluat statistic de un indicator ce definește puterea valorii medii. Se

determină cu relația:

n

i

i

n

i

ii

p

k

kx

m

1

1 . (4)

În cazul evaluărilor de trafic rutier , media de așteptare poate reprezenta

rezultatul evaluării simultane a:

- timpilor de sosire într-un punct de traseu cu viteza înregistrată de

fiecare vehicul.

- durata parcursului și viteza medie înregistrată.

- durata staționărilor și numărul de vehicule staționate într-un areal

determinat.

Acest indicator se exprimă în unități de măsură specifice variabile,

factorul de așteptare având o contribuție materializată în cuantificarea

valorii variabile.

- Mediana de sondaj a șirului de date eM este considerată ca fiind

valoarea față de care frecvența valorilor mai mici decât aceasta , este egală cu

frecvența valorilor mai mari decât aceasta. Practic mediana de sondaj divide

șirul inițial în două subșiruri care conțin același număr de date . Pentru

determinarea medianei de sondaj , valorile se distribuie în ordine crescătoare

sau descrescătoare . Mediana de sondaj este un indicator al șirului ordonat de

valori . Se determină cu relații distincte , funcție de caracterul șirului (par sau

impar) astfel:

- pentru n număr impar: 2

1 ne xM , (5)

20

- pentru n număr par:

122

2

1nne xxM . (6)

-Modul de sondaj oM al șirului de date , exprimă legătura statistică a

tendinței de grupare ,existentă între media de sondaj și mediană , exprimată

prin relația:

mMmM eo 3 . (7)

-Valoarea centrală cx împarte domeniul în care șirul de date ia valori,

în două zone egale , în care însă frecvența de repartiție a valorilor nu este

aceeași. Se determină cu relația:

minmax2

1xxxc . (8)

Referitor la parametrii tendinței de grupare, analiza comparată a

acestora oferă o imagine de ansamblu privind caracterul simetric al repartiției

dispunerii datelor din șir , constituind din acest punct de vedere un instrument

valoros în evaluarea legii de distribuție probabile ce guvernează fenomenul

analizat.

Parametrii tendinței de împrăștiere sunt în măsură să arate modul în

care valorile din eșantion sunt distribuite în întreg domeniul corespunzător

șirului. În mod curent , acești indicatori arată poziția datelor din eșantion, față

de valoarea mediei aritmetice de sondaj. Principalii parametrii statistici ai

ascestei tendințe sunt:

- Abaterea medie pătratică de sondaj se determină cu relația:

n

i

i mxn 1

21 . (9)

21

Dacă se consideră un șir din n valori (fig.2.1) , a căror dispunere într-un

sistem de coordonate indică un nivel de împrăștiere aleatoriu, abaterea medie

patratică (sau deviația standard) oferă o imagine orientativă a “degenerării

grupării”datelor.

În practica curentă statistică , deviația standard arată cu nivel de

încredere ridicat , în ce măsură datele din eșantion sunt “credibile”,adică pot

fi luate în considerare la evaluarea fenomenelor observate.

Astfel, estimări statistice arată în ce măsură datele din eșantion se

încadrează în interval caracteristice din domeniul de valori , acoperite de

secvența (tab.2.1).

Tabelul 2.1.

Cuantumul procentual al valorilor din șir acoperite prin dispersie.

Nr.crt. Interval k Procent din gradul de

acoperire al șirului

1. 68.27%

2. 1.645 90%

3. 1.960 95%

4. 2 95.450%

5. 2.576 99%

6. 3 99.7300%

7. 3.2906 99.9%

8. 4 99.993666%

9. 5 99.99994267%

10. 6 99.9999998027%

11. 7 99.9999999997440%

Dispersia șirului de date D sau dispersia de sondaj se determină cu

relația:

22

n

i

i mxn

D1

21. (10)

Dispersia de sondaj poate fi utilizată și ca estimare a dispersiei din

populația originară , considerându-se în acest caz relația:

n

i

i mxn

D1

2

1

1. (11)

În mod analog , se definește și abaterea medie pătratică,

corespunzătoare estimației din populația originară cu relația:

n

i

i mxn 1

2

1

1 . (12)

Amplitudinea șirului de date A este dată de diferența dintre valoarea

cea mai mare maxx și valoarea cea mai mică minx din șirul de date:

minmax xxA . (13)

PARAMETRII SPECIALI oferă informații suplimentare privind

tendința de încadrare a observației ectuate în legi de distribuție discrete sau

continue. Totodată arată în ce măsură sunt fezabile abordări privind

caracterul aleatoriu sau predictibil al fenomenului analizat. Această grupă de

parametrii stabilește conexiuni între cele două grupe statistice și permite

analiza concomitentă a influenței parametrilor din grupele de indicatori

detaliați anterior.

Acești parametri permit estimarea cu un grad mai bun de aproximare a

prognozei de trafic (distribuția fluxului de autovehicule).

Momentul de ordin r rM reprezintă o modalitate de caracterizare (în

anumite condiții) a distribuției variabilei aleatoare evaluate statistic. Se

determină cu relația:

23

n

i

r

ir xn

M1

1. (14)

Coeficientul de variație al șirului de sondaj vC , face legătura între cei

doi indicatori de bază ce exprimă tendințele opuse ale șirurilor de valori

(convergența crescătoare-descrescătoare spre valoarea medie și dispersia în

întreg domeniul în care șirul ia valori). Se determină cu relația:

m

Cv

. (15)

Raportat la teoria traficului rutier , acest indicator este utilizat la

determinarea “zgomotului” parametrilor dinamici ai autovehiculului singular.

Abaterea medie absolută mA a șirului de date este determinată cu

relația:

n

i

iim mxkn

A1

1, (16)

unde ik -este frcvența absolută a valorii ix în intervalele de observare.

Abaterea normată iz este un indicator de observare punctuală a unor

intervale din eșantion. Se determină cu relația:

mxz i

i

. (17)

Coeficientul de asimetrie 1 , definește tendința de asimetrie a

dispunerii valorilor în interval, prin evaluarea gradului de înclinare a pantei

curbei densității de probabilitate în vecinătatea modului de sondaj . Se

determină cu relația:

24

32

2

3

31

, (18)

unde 3 - reprezintă momentul centrat de ordinul trei, determinat cu

relația:

n

i

ii mxnn 1

3

3

1 . (19)

Coeficientul de boltire 2 se obține prin particularizarea relației

coeficientului de asimetrie:

32

2

42

, (20)

4 -fiind momentul centrat de ordinul patru.

APLICAȚIA 1.

Se consideră datele obținute în urma efectuării unui sodaj de trafic pe

o arteră principală de intrare – ieșire într-un oraș, în aceeași perioadă a

zilei, dar în zile diferite și luni calendaristice dintr-un an prezentate în

tabelul 2.2.

Se solicită evaluarea statistică a eșantionului de date pentru analiza

caracteristicii vitezei de deplasare în zona de observare.

25

Tabelul 2.2. Eșantion valori viteze în trafic

Nr.obs. Vit hkm/ Nr.obs. Vit hkm/ Nr.obs. Vit hkm/

1. 49 11. 59 21. 17

2. 48 12. 47 22. 70

3. 22 13. 41 23. 53

4. 30 14. 59 24. 55

5. 28 15. 41 25. 54

6. 44 16. 42 26. 49

7. 48 17. 45 27. 44

8. 43 18. 46 28. 48

9. 45 19. 66 29. 44

10. 88 20. 72 30. 43

Algoritm de rezolvare

O primă remarcă referitoare la șirul de date este aceea că reprezintă

rezultatul unei observări discrete. În consecință nu există o localizare în timp

a valorilor măsurate și conform enunțului, nu se face referire la identificarea

continuității momentului înregistrării vitezelor . Asfel în vederea prelucrării

statistice a datelor este necesară o ordonare crescătoare a valorilor din șir ,

obținându-se un nou șir de valori care are o proprietate distinctă: valorile au

pierdut semnificația momentului înregistrării în timp , dar sunt ordonate după

un criteriu statistic (tab.2.3.).

Tabelul 2.3. Șirul ordonat de valori.

Nr.crt. Vit hkm/ Nr.crt. Vit hkm/ Nr.crt. Vit hkm/

1. 17 11. 44 21. 49

2. 22 12. 44 22. 53

3. 28 13. 45 23. 54

4. 30 14. 45 24. 55

5. 41 15. 46 25. 59

6. 41 16. 47 26. 59

7. 42 17. 48 27. 66

8. 43 18. 48 28. 70

26

9. 43 19. 48 29. 72

10. 44 20. 49 30. 88

Calcul mediei statistice de sondaj nu necesită această ordonare a

valorilor. De altfel, cu excepția medianei de sondaj , nici ceilalți indicatori

statistici nu ar necesita operația efectuată . Totuși , în virtutea celor enunțate

anterior , operația nu aduce prejudicii evaluării setului de date și

proprietăților șirului inițial. Grafic , cele două șiruri de valori sunt prezentate

în fig.2.2.

Indicatorii statistici calculați se prezintă împreună cu observațiile

aferente înlocuirii numerice necesare , în talelul 2.4.

Tabelul 2.4. Indicatorii statistici calculați

Indicatorul U.M. Valoare Observații

Media de sondaj km/h 48.000 Se aplică relația (1)

Media geometrică km/h 45.757 Se aplică relația (2).

Media armonică h/km 0.021 Se aplică relația (3).

27

Mediana de sondaj km/h 46.500 Se aplică (5)

Modul de sondaj km/h 43.500 Se aplică relația (7).

Valoarea centrală km/h 52.50 Se aplică relația (8).

Abaterea medie km/h 14.088 Se aplică relația (9).

pătratică

Dispersia 22 / hkm 198.467 Se aplică relația (10).

Amplitudinea șirului km/h 71.000 Se aplică relația (13).

Coeficientul de 0.293 Se aplică relația (15).

variație

Momentele centrate 48.000 ; 510403.1

de ordinul 1 și 3

Se aplică (18); (19) și (20).

Analiza indicatorilor statistici oferă o serie de informații utile privind

particularitățile fenomenului observat . Compararea valorilor obținute după

anumite criterii oferă posibilitatea orientării etapelor următoare de prelucrare

matematică în vederea determinării legii de variație a observării și

caracterizării ( în acest caz : tendința de distribuție a vitezei pe artera de drum

monitorizată ) tendințelor specifice șirului de valori.

O primă cocluzie ce reiese din compararea rezultatelor este că

indicatorii tendinței de grupare sunt mai apropiați de media geometrică decât

de cea aritmetică , fapt ce denotă că fenomenul observat nu are caracterul de

normalitate ce indică un trafic fluent și stabil.

De asemenea există o suspiciune că sondajul de trafic nu este suficient

pentru a caracteriza regimul de viteză . Dacă analizăm valorile indicatorilor

tendinței de grupare , abaterea maximă față de media de sondaj este de 4,5 și

aceasta este simetrică atât superior cât și inferior (fig.2.3.).

28

Raportat însă la media geometrică , abaterea maximă este doar de 2,25

(exceptând valoarea centrală care arată o deviere 7,25). Totuși în valori

absolute abaterile sunt compatibile atât în cazul comparării cu media

aritmetică cât și pentru media geometrică.

Constatarea este un argument al faptului că datele de trafic înregistrate

sunt credibile și pot constitui referința privind caracteristicile de viteză.

De asemenea se poate afirma că sondajul efectuat a surprins momente

caracteristice din repartiția regimului de viteze (fig.2.4.).

O evaluare comparată a mediei de sondaj și a abaterii medii pătratice

arată faptul că față de șirul ordonat de valori , gruparea datelor este suficient

de bună (deci concludența eșantionului poate fi acceptabilă), deoarece

intervalul: media de sondaj abaterea medie pătratică cuprinde aproape în

totalitate șirul ordonat de valori (fig.2.5.).

2.1.2. GRUPAREA DATELOR STATISTICE ȘI FRECVENȚE

CARACTERISTICE

Indicatorii statistici nu oferă în totalitate informații privind evaluarea

eșantionului rezultat în urma observării de trafic. Determinările bazate pe

observații discrete , permit efectuarea unor asocieri , care nu alterează setul

de valori sau interpretarea rezultatelor. Identificarea unei normalități a

distribuției valorilor , este necesară pentru a putea fi intrepretate seturi mari

de date.

În acest scop , datele sunt grupate , în așa numitele clase de valori.

Caracteristic acestor grupări este tendința tuturor valorilor din interiorul unei

clase de a coverge spre o valoare centrală din interiorul intervalului de clasă.

În cele mai multe cazuri, statistica de trafic, face raportarea directă la variația

orară sau în intervale de timp mai mici de ordinul a 10, 15, sau 30 de minute.

Acest gen de reprezentare a variațiilor de trafic rutier sunt cele mai

commune și predomină în toate activitățile ce sunt destinate modelării

fluxurilor rutiere sau în vederea optimizării aceeselor în intersecții

semaforizate. Spre exemplificare să considerăm rezultatul unei monitorizări

29

de viteze pe o arteră urbană (fig.2.6.). Datele furnizate prin intermediul

observării radar sunt prezentate în Anexa 1.

Sunt însă situații în care pentru o evaluare corectă și în scopul obținerii

unor date primare cât mai credibile , necesare modelărilor de trafic , acest gen

de evaluare statistică nu este cel mai potrivit și dă naștere la erori de proiect

care au repercusiuni asupra acțiunilor de normalizare a traficului.

Desigur , a se lucra direct pe setul de date colectate în urma observării-

monitorizării de trafic este facil și mai rapid, eliminându-se însă astfel o

importantă etapă din “ pregătirea statistică” a eșantionului: gruparea lor

funcție de tendințe și valori de referință. Aceasta poate aduce prejudicii

privind identificarea corectă a valorilor ce indică reala tendință privind

variația parametrului (sau parametrilor) de trafic analizat.

Îndeosebi când eșantioanele de date provin din observații discrete , ce

au fost efectuate în perioade de timp dispersate de-a lungul unui an

calendaristic , sau în cazul necesității identificării tendințelor de

macrofluctuație a traficului, gruparea în clase de distribuție a șirurilor de

valori , constitue o etapă obligatorie în evaluarea eșantioanelor de date.

Aceste tendințe constitue și un bun indicator privind legea de distribuție

probabilă, care modelează cât mai fidel evoluția parametrilor măsurați.

Particularitatea este din plin exploatată în cazul determinărilor efectuate

pentru un anumit regim stabil de trafic (pentru care, se spune că artera de

circulație prezintă o tendință de încărcare normală).

Ordonarea și gruparea datelor , se face prin distribuirea acestora în

clase de valori, care cuprind toate rezultatele observației sau măsurătorilor

efectuate, ce se încadrează într-un interval de mărime impus și corelat cu

volumul de date disponibil.

Numărul k de clase în care se grupează valorile supuse unei prelucrări

statistice se determină funcție de mărimea n a eșantionului. Relația

recomandată pentru determinarea numărului de clase este:

30

nk lg322,31 . (21)

Din valoarea calculată cu relația (21), se extrage partea întreagă, fără a

se efectua rotunjiri inferior sau superior , indiferent de tendința părții

zecimale.

Pentru un număr redus de date (sub 25 de valori), gruparea în clase este

puțin semnificativă, suplimentul de informație obținut fiind neconcludent.

În cazul în care setul de valori este relativ ridicat (>100), este

recomandată pentru determinarea numărului de clase relația:

51

2

1 175,04 nk . (22)

Shapiro-Wald, recomandă în cazul eșantioanelor statistice de volum

mare, relația:

5

2

nk . (23)

Valori orientative ale numărului de clase, determinat funcție de

dimensiunea n a eșantionului prelucrat, pentru seturi de date de volum

distinct, se prezintă în tabelul 2.5.

Tabelul 2.5. Valori pentru numărul de clase determinate funcție

de mărimea eșantionului

Mărimea eșantionului

150N 150N 150N

(Shapiro-Wald)

k 1k 2k

Nr.Valori Nr.clase Nr.Val. Nr.clase Nr.Val. Nr.clase

31

<32 5 <150 27 <200 30

32-47 6 150 28 200 40

48-76 7 200 31 250 50

77-150 8 250 34 300 60

>255 9 400 41 350 70

>511 10 500 45 450 90

Valorile din tabel trebuie acceptate în contextul tehnicii de stabilire a

numărului de clase, menționate anterior.

Alegerea uneia din cele trei valori recomandate pentru numărul claselor

de grupare , se face funcție de dimensiunea N a eșantionului .

Uzual ,sunt agreate valorile k și 1k , valorile 2k fiind mai rar utilizate în

determinările de trafic, lipsind observațiile macro ce pot constitui argument al

unui management global de trafic rutier.

Gruparea valorilor în clase de repartiție necesită stabilirea unor

intervale restrictive, în care datele din eșantion vor fi încadrate.

Intervalele astfel determinate exprimă o tendință a valorilor de a

coverge local , spre valoarea centrală a fiecărei clase.

Gruparea valorilor în clase de repartiție necesită stabilirea unor

intervale restrictive în care datele din eșantion vor fi încadrate . Intervalele

astfel determinate exprimă o tendință a valorilor de a coverge local crescător

sau descrescător , spre valoarea centrală a fiecărei clase.

Amplitudinea a (distanța intervalului de clasă), ce caracterizează

intervalul unei clase , se determină cu relația:

k

xxa minmax , (25)

32

unde : maxx - este valoarea cea mai mare din șirul ordonat de date;

minx - valoarea cea mai mică din șirul de date.

Intervalul unei clase va fi deci mărginit de două valori: limita

inferioară și superioară, care se determină cu relații de forma:

,

;

inf

1

supinf

jall

ll

jj

sul

jj

(26)

unde kj ,...,1 reprezintă ordinul clasei.

Valoarea centrală j

cl a clasei de repartiție de ordin j se determină cu

relația:

aja

ll jj

c 12

inf . (27)

Se face specificarea că limita inferioară a primului interval este identică

cu valoarea minimă din șir, iar limita superioară a ultimului interval este

valoarea maximă din șirul ordonat de valori.

Dezvoltarea acestei grupări în clase de repartiție , permite identificarea

valorilor de referință față de care se va interpreta șirul de date conținut în

eșantion . Asfel devin mai puțin importante valorile efective (conținute în

eșantion) , cât tendința pe care acestea o exprimă, în raport cu grupările

realizate pe criterii statistice. Tendința, este evaluată față de valorile centrale

ale fiecărui intrerval, fapt ce dă noi valențe analizei datelor din eșantion,

constituind o primă abordare probabilistică a observațiilor efectuate. Din

acest punct de vedere se poate spune că devin mai puțin importante datele

efective , crescând semnificația intervalelor în care acestea se grupează,

precum și valoareacentrală a acestor intervale (fig.2.7.).

Efectiv, gruparea în clase de repartiție arată câte din valorile

eșantionului (observațiilor) se încadrează în fiecare din aceste intervale

predefinite.

33

În cazul obsevațiilor de trafic prezentată în graficul din fig.2.6.,

gruparera în clase de repartiție arată o distribuție de valori conform

reprezentării grafice din fig.2.8.

După cum se poate observa din graficul menționat, se constată că există

deja o ordonare logică a datelor și sunt create premizele formulării unor

aprecieri preliminarii, argumente de valorile conținute în fiecare interval de

grupare.

Modul de variație a unui fenomen analizat prin evaluări statistice este

dat de indicatorul fecvență de repartiție. Sunt două tipuri de frecvențe care

oferă informații distincte privind comportarea șirului de date :

- frecvența de repartiție a datelor (valori aleatorii);

- frecvența cumulată de repartiție a datelor.

Numărul de date jn de date conținute într-o clasă, reprezintă frecvența

de apariție în clase a valorilor.

jj nf . (28)

Raportul dintre numărul de date conținut în clasă și numărul total al

datelor din eșantion reprezintă frecvența relativă. Se determină cu relația:

.n

ff

j

r j (29)

În statistică se utilizează frecvent și noțiunea de frecvență relativă

procentuală, care se determină cu relația:

100n

ff

j

prj % . (30)

Referitor la frecvențele de grupare în clase, proprietatea acestora de a

reprezenta toate datele din șir permite dezvoltarea relațiilor de evaluare-

verificare globală, relații care constitue în același timp pentru utilizator o

modalitate de verificare a corectitudinii calculelor efectuate, astfel:

34

%100

;1

;

1

1

1

n

j

pr

n

j

r

n

j

j

j

j

f

f

nf

(31)

Frecvevența cumulată reprezintă un indicator ce permite evaluarea

repartiției de valori, în contextul global, al întregului set de date dispuse în

interval.

Ca și în cazul frecvențelor de repartiție în clase se disting următoarele

frecvențe cumulate caracteristice:

-frecvența cumulată absolută, determinată cu relația:

;,...,1;1

krffcr

q

qq

(32)

-frecvența cumulată relativă, determinată după criteriu similar, cu

deosebirea că raportarea se face la numărul total de valori din șir, prin relația:

;,...,1;1

1

krfN

fcr

q

qq

(33)

-frecvența cumulată procentuală, exprimare mai aproape de domeniu

statistic decât cel al probabilităților, este dată de relația:

.,...,1;%1001

1

krfn

fcr

q

qq

(34)

Comparat, cele două tipuri caracteristice de exprimare a frecvenței de

apariție în clase a valorilor din eșantionul de date sunt reprezentate grafic în

fig.2.9.

35

După cum se poate observa indiferent de modalitatea de exprimare

cantitativă (numeric în valori absolute , procentual sau în valori relative),

repartițiile sunt identice ca evoluție pentru fiecare frecvență caracteristică

(absolută și cumulată).

APICAȚIA 2.

În cazul monitirizării de trafic reprezentată grafic în figura 2.7. să se

efectueze gruparea în clase și să se determine frecvențele caracteristice

pentru grupul de parametrii înregistrați:viteza de trafic, caracteristica de

lungime a :”țintei radar” și intervalul de succesiune. Șirul de date

înregistrate de către radar (cele 150 de valori), însoțite de elementele de

identificare a înregistrării (variabila de timp și caracteristica de lungime a

vehiculului), sunt redate integral în Anexa 1, acest șir fiind utilizat și pentru

aplicația 1.

Astfel , pot fi formulate aprecieri privind distribuția câmpului de viteze

, corelat cu condițiile de trafic din teren: de regulă vitezele de deplasare

cuprinse în intervalul 35-45 km/h au cea mai mare pondere și peste 60% din

totalul înregistrărilor, corespunzând domeniului de viteze admis în ciclul de

deplasare urban.

Există însă și valori extreme cauzate de :

- valorile inferioare sunt caracteristice reducerii vitezei de deplasare

în apropierea de semafor;

- valorile superioare sunt specifice tendinței de trecere în perioada de

final a unui verde-galben la semaforul situate în apropierea punctului de

observare.

Este deci important în analiza câmpului de variație a mărimilor

înregistrate, corelarea datelor prelucrate statistic cu condițiile efective de

trafic din teren , aceasta permițând formularea unor aprecieri pertinente, ce

asigură decizii corecte în optimizarea sau organizarea circulației vehiculelor.

Valorile calculate se prezintă în tabelul 2.6.

36

Tabelul 2.6. Valori calculate (Aplicația 2)

Indicatorul/parametrul Simbol Valoare Obs.

Număr de clase k 8,00 Valoare obținută prin

rotunjire

Media de sondaj m 39,24 km/h

Deviația standard 12,56 km/h

Ampltudine clase a 10,00 km/h

Nr. de ord. Valoare Frec. de Frec. Frec.

clase centrală apariție cumulată relativă

1K 15 9 9 0.06000

2K 25 23 32 0.15333

3K 35 45 77 0.30000

4K 45 43 120 0.28667

5K 55 21 141 0.14000

6K 65 7 148 0.04667

7K 75 1 149 0.00667

8K 85 1 150 0.00667

În tabelul menționat s-a considerat ca fiind importanți în ghidarea

mersului rezolvării aplicației, doar pașii de referință parcurși, astfel:

- determinarea numărului de clase k ;

- media statistică de sondaj, pentru a se putea observa poziția

intervalelor cu reprezentare majoră de valori față de acest indicator

al tendinței de grupare;

- deviația standard, la care se constată o valoare apropiată de cea

calculată pentru amplitudinea intervalelor de grupare , constatare

importantă din punct de vedere al concludenței șirului de date

analizat și al observării effectuate.

37

2.2. NOȚIUNI DE PROBABILITATE

O tendință firească în modelarea și optimizarea sistemelor de trafic o

reprezintă dezvoltarea unor modele (considerate cele mai probabile) care să

reproducă cu maximă fidelitate derularea fluxurilor de vehicule. Și cu atât

mai mult cu cât se pune în discuție identificarea celor mai probabile

evenimente în derularea traficului, este necesar să se apeleze la instrumente

specifice estimației.

Sensibilitatea acestui instrument matematic utilizat în scopul

optimizării mișcării fluxurilor de vehicule, este cu atât mai mare cu cât

nivelul de trafic este mai ridicat și mai puțin previzibil. Desigur nu vom putea

spune cu siguranță că printr-un anumit segment de drum vor trece exact un

anumit număr de vehicule, la o anumită oră și într-o anumită zi din

săptămână. Dar, instrumentul probabilistic de estimare ne va permite să

prognozăm cu suficientă fidelitate limitele fluxului de vehicule, raportat la

condițiile de trafic existente sau impuse în modelele dezvoltate.

Sunt câțiva termini specifici teoriei probabilităților care trebuie

explicitați pentru o mai bună înțelegere a noțiunilor tratate în continuare.

- Populație: totalitatea indivizilor (subiecților) care sunt luați în

considerare și au în comun o caracteristică, proprietate comună.

- Eșantion: extrageri din populație (pe criterii în general aleatorii)

destinate să furnizeze informații asupra populației, constituind

astfel suportul deciziei referitoare la populație sau procesul generat

de populație.

- Probă : cantitate prelevată printr-o singură extragere dintr-un

eșantion.

- Valoare observată: măsura unei caracteristici determinate ca

rezultat al observării sau încercării (testării).

- Valoare estimată: valoarea unei caracteristici obținută în urma

estimării unui fenomen (proces) studiat.

- Variabilă aleatoare: variabilă care poate lua orice valoare dintr-un

ansamblu (mulțime) determinat de valori și căreia îi este asociată o

distribuție de probabilitate.

38

- Repartiția de probabilitate: funcție care determină probabilitatea ca

o v.a. să ia o valoare oarecare sau să aparțină unei mulțimi de valori

dintr-un domeniu de referință considerat.

- Disponibilitate: însușirea unui sistem sau a unui proces de a fi apt

pentru îndeplinirea funcției specificate la un moment dat sau într-un

interval de timp impus.

Teoria probabilităților ia în considerare evenimentul, acesta

reprezentând rezultatul unei experiențe, derulate în variabile condiții. În

general, mediul probabilistic lucrează cu câmpuri de evenimente , adică cu

mulțimi de rezultate individualizate prin valori efective și care pot fi evaluate

singular sau în grup funcție de natura efectivă a analizei.

2.2.1. Legi de distribuție pentru variabile aleatoare de tip discret

Legile de distribuție pentru variabilele aleatoare de tip discret sunt bine

reprezentate în analiza și prognoza traficului rutier, îndeosebi pentru

prelucrarea datelor rezultate din observații, rezultate fie în urma unor

măsurători izolate, fie în urma unor colectări neomogene de date, ce constitue

totuși materialul aflat la dispoziție pentru efectuarea evaluărilor.

De regulă, se ia în considerare la dezvoltarea modelelor de probabilitate

prin legi de distribuție discrete , probabilitatea de producere a unor

evenimente, care nu au o distribuție și o continuitate în timp determinată.

Astfel, orice fenomen a cărui legitate de variație în timp poate fi discutată în

baza a diverse aspecte determinative, poate fi analizat prin intermediul legilor

de repartiție specifice v.a. discrete.

Distribuția binomială: reprezintă din punct de vedere al traficului rutier

un instrument de lucru cu resurse generoase, care permite evaluarea (de tip

probabilistic) de producere a unor fenomene independente , care nu au o

legitate demonstrată de derulare în timp, specific traficului rutier: lungimea

plutonului de vehicule în așteptare la un semfor, numărul de vehicule care

trec printr-o intersecție pe durata de verde în condițiile plutonului neomogen,

numărul de vehicule ce depășțesc pe un sector de drum viteza legală de

39

deplasare, probabilitatea selectării unei rute de deplasare pentru un nod de

artere de trafic, etc.

Conexă problemelor statistice, distribuția binomială permite evaluarea

posibilității de producere a unui fenomen selectat dintr-un câmp de

evenimente probabile, asociind acestei probabilități o șansă de success sau

insucces.

Indicatorii caracteristici repartiției binomiale sunt :

- probabilitatea de succes a evenimentului, dată de relația:

kNkk

N FFCNkP

1, , (35)

în care : !!

!

kNk

NC k

N

(36)

N – reprezintă numărul total de probe ( elemente ale mulțimii

observațiilor);

k – numărul evenimentelor favorabile;

F- funcția empirică care declanșează evenimentul, poate să fie o

funcție cunoscută sau o funcție al cărui rezultat se determină pe cale

experimentală.

Nu sunt puține cazuri în care valoarea acestei funcții este impusă ca o

probabilitate (rată) de succes a unui eveniment considerat a avea șanse de

apariție.

Indicatorii caracteristici ai acestei repartiții sunt:

- numărul mediu al evenimentelor probababile, se determină cu

relația:

NFm , (37)

- modulul de sondaj al repaetiției este dat de relația:

40

FNMo 1 , (38)

- abaterea medie pătratică specifică repartiției este de forma:

FFN 1 , (39)

- momentul probabilității de distribuție, reprezintă un indicator ce

permite evaluarea așteptării (probabilității) de succes a distribuției propuse,

reprezentând o modalitate de cuantificare temporală a v.a. discrete, fiind dat

de relația:

NteFFtM 1 , (40)

în care t- reprezintă variabila de timp asociată probabilității funcției

generatoare.

Practic, repartiția (distribuția) binomială dezvoltă pe baza unui algoritm

de probabilitate, frecvențe specifice ce exprimă rata de succes a unui

eveniment. Acest fapt este evidențiat îndeosebi prin intermediul

reprezentărilor grafice, specifice indicatorului de probabilitate (fig.2.10).

Derivat din statistica matematică în general este reprezentată și

frecvența cumulată a probabilității de succes a evenimentelor k. Aceasta

permite o identificare graduată a posibilelor valori accesibile, prin calculele

efectuate.

APLICAȚIA 3.

Se consideră un eșantion format din 17 autovehicule ce urmează să

teacă printr-o intersecție semaforizată. Să se determine care este

probabilitatea de trecere prin intersecție a 0,2,5,7,9,11,15 și 17 autovehicule,

41

cunoscând că funcția ce guvernează această probabilitate poate lua valori:

8

5;

2

1;

8

3;

8

1și

8

7.

Comentariu și rezolvare. În enunțul Aplicației 3, s-a utilizat noțiunea

de funcție de probabilitate , care în fapt reprezintă funcția empirică care poate

guverna rata de succes a evenimentelor (posibilitatea de trecere prin

intersecție a numărului de autovehicule considerat).

Explicit se pune problema densității de probabilitate a ratei de succes a

evenimentului:

prin intersecție trec , 0,2,…17 autovehicule dacă funcția empirică ce

declanșează evenimentul este:8

7,..,

8

1. Se menționează că valorile acestei

funcții sunt cuprinse în intervalul 1,0 .

Rezolvarea aplicației se rezumă la aplicarea strictă a relațiilor: (35)-

(40), valorile obținute fiind prezentate în tabelul 2.7.

Tabelul 2.7. Indicatorii de repartiție calculați

Funcția de probabilitate empirică generatoare F

Indicatorul 8

1

8

3

2

1

8

5

8

7

Media vehiculelor veh 2,125 6,375 8,5 10,5 14,875

Modul statistic veh 2,25 6,75 9 11,25 15,75

În Anexa 2 se prezintă tabelar valorile calculate pentru densitatea de

probabilitate precum și cele corespunzătoare funcției cumulative a ratei de

succes a evenimentelor.

Graficul de variație al indicatorului densitate de probabilitate pentru

datele aplicației se prezintă în fig.2.11., în formă compusă (3D), pentru

întregul set de parametrii considerați.

42

APLICAȚIA 4.

Se consideră un nod divisor de trafic (fig.2.12), în care se efectuează o

observație discretă și prin care într-un interval caracteristic, sosesc în pluton

20 de autovehicule. Admițând valorile funcției empirice acceptate pentru

prognoza încărcării arterelor divizoare de trafic marcate în figura

menționată , să se determine probabilitatea de succes a unui număr de

treceri pe arterele I,II,III și IV, astfel: artera I – 8 vehicule, artera II – 5

vehicule, artera III – 3 vehicule și artera IV – 4 vehicule.Pentru

probabilitățile determinate să se calculeze valorile medii și modulul de

sondaj caracteristic.

Comentariu și rezolvare

Aplicând relațiile (35) și (36), se determină probabilitatea de trecere,

valorile calculate fiind prezentate în tabelul 2.8. În mod similar se determină

valorile mediei și momentului de sondaj cu relațiile (37) și (38).

Din analiza datelor obținute, se constată că estimarea are o rată de

succes (deci credibilitate) destul de bună, având în vedere faptul că

diferențele înregistrate în valorile mediei și modulului sunt relative mici, sub

1%.

Rezultatele obținute pot fi extrapolate în scopul efectuării unor evaluări

globale de tipul: probabilitatea încărcării fiecărei artere la un număr de 1000

vehicule sosite în punctul divizor, probabilitatea ca pe una din artere să treacă

un număr de N de vehicule,etc.

Tabelul 2.8. Date inițiale și valori calculate (Aplicația 4)

Sensul de k F P obsveh

M

/

3

obsveh

Mo

/

310

MoM

deplasare

I 8 0.28 0.092367957 5.88 5.60 3108.2

II 5 0.22 0.192298636 4.62 4.40 3102

III 3 0.37 0.022402648 7.77 7.40 3107.3

IV 4 0.13 0.149064845 2.73 2.60 3103.1

43

Toate aceste estimări sunt în măsură să completeze informațiile de

trafic în vederea realizării programelor de estimare propuse.

Repartiția Poisson, este un caz limită al repartiției binomiale, aplicată

în general eșantioanelor formate dintr-un număr mare de observații, atunci

când probabilitatea de succes a unui eveniment este foarte redusă . În

domeniul traficului rutier, această lege de distribuție este utilizată pentru

prognoza accidentelor de trafic sau în cazul prognozei ratei de încălcare a

normelor de conducere preventivă, fiind luate în considerare evenimente de

tipul:

- trecerea pe coloarea roșie a semaforului;

- întoarcerea pe sectoare de drum cu restricție în acest sens;

- forțarea trecerii la nivel peste calea ferată,etc.

În cazul distribuției Poisson, valoarea caracteristică o reprezintă

incidența medie a evenimentului care are o rată constantă de producere

independentă, dată de relația:

max

0

1 k

k

knkN

, (41)

unde:

k- reprezintă numărul de repetări ale evenimentului;

kn - numărul de probe în care s-a repetat evenimentul;

N- numărul total de evenimente analizate.

Densitatea de probabilitate în apariția evenimentului exprimă șansa

incidenței într-un interval de timp caracteristic sau raportat la un eșantion

reprezentativ și este dată de relația:

e

kkf

k

!. (42)

44

Mediana statistică specifică distribuției Poisson se determină uzual cu

o relație de aproximare de forma :

02,0

3

1Me . (43)

Probabilitataea de producere a evenimentului sau funcția care

declanșează evenimentul are de regulă valori mici, deci șansa de apariție este

rară, valorile uzuale ale acestei fiind mai mici de 0,1.

Momentul generator al funcției este de forma:

1, teetP . (44)

Din analiza relațiilor de definire a acestei repartiții se poate constata că

reprezintă un caz particular al repartiției binomiale, având la origine

dezvoltarea distribuției Gamma generalizate.

APLICAȚIA 5.

Pentru o intersecție semaforizată, monitorizată video în perioada unei

săptămâni de funcționare (180000 autovehicule), s-au înregistrat prin

tehnica observării de sondaj, trecerile pe culoarea roșie a semaforului.

Cunoscând numărul de autovehicule care au trecut în această perioadă prin

intersecție (180000), precum și rezultatul sondajului privind numărul de

astfel de infracțiuni comise, să se determine probabilitatea de producere a

0,..6 evenimente de acest tip.

45

Tabelul 2.9. Rezolvarea observațiilor pentru: trecerea pe culoarea roșie

a semaforul.

Numărul de evenimente

k 0 1 2 3 4 5 6

Nivelul de repetare

kn 106 162 58 21 0 2 1

Comentariu și rezolvare

În traficul rutier urban se întâlnesc frecvent situații în care voluntar sau

involuntar conducătorii auto trec pe culoarea roșie a semaforului. Deși acest

tip de evenimente rutiere are o rată redusă, totuși nu se exclude posibilitatea

apariției acestei infracțiuni. În consecință, trebuie analizat și acest fenomen

iar funcție de rezultatul analizei se pot aplica măsuri care să ducă la

diminuarea acestui fenomen.

Am luat în considerare în acest exemplu un parametru kn în măsură să

exemplifice amploarea fenomenului analizat : de câte ori pe durate de

observare egale se produc 0,1,2,..6 treceri pe culoarea roșie.

Este important după cum vom observa în urma aplicării algoritmului de

calcul nivelul de incidență al repetabilității trecerilor și astfel se vor putea

formula aprecieri privind riscul apariției fiecărei clase k de fenomene

observate.

Se determină utilizând datele din tabel valoarea parametrului

caracteristic .

Aplicând relația (41), se obține înlocuirea numerică și valoarea

calculată alăturată:

83022,016...162110601202158162106

1

46

Cunoscând numărul total al observațiilor și valoarea parametrului

caracteristic, se determină valorea indicatorului densitate de probabilitate a

apariției evenimentului cu relația (42) , rezultând valorile din tabelul alăturat:

Tabelul 2.10.

Valorile calculate ale indicatorilor de distribuție pentru

repartiția Poisson

k ,kf ,kP

0 0. 43594789 0.435947891

1 0. 36193813 0. 797886020

2 0.15024641 0. 948132435

3 0. 04157982 0. 989712256

4 8.63023023 310 0.998342486

5 1.43301962 310 0. 999775506

6 1. 98289925 410 0. 999973796

După aceasta sunt permisive formulări ale unor propuneri de măsuri

pentru descurajarea evenimentului, prin metode specifice.

Am dori totuși să nu se creeze o impresie totalitară conform căreia tot

ce trece pe culoarea roșie este o infracțiune voită . Sunt cazuri ce iau

amploare, legate de derularea traficului în condiții de congestie, când

"" presiunea plutonului de vehicule din spate este insistentă sau când oprirea

bruscă, la apariția culorii galbene (trecerea spre roșu) poate cauza tamponării

în lanț.În această situație intervine și problema indeciziei la alternanța

galben- roșu care continuă să creeze numeroase discuții contradictorii privind

obiectivitatea sancționării acestui tip de contravenție.

O altă problemă o constitue faptul că o perioadă scurtă de verde creează

un discomfort (stress) conducătorului auto, proporțional cu frecvența opririlor

în vederea apropierii de intersecție, fără ca aceasta să fie depășită, ceea ce

determină tendința de “forțare a trecerii”. Grafic, cei doi parametrii

caracteristici au variația prezentată în figura 2.13.

47

Concluzie : din analiza rezultatelor obținute, se constată că

probabilitatea de apariție a patru sau mai mult de patru treceri pe culoarea

roșie a semaforului este extrem de rară și poate fi cazul unor evenimente stict

accidentale, ceea ce nu caracterizeză traficul prin zona de semaforizare

propusă.

Dacă însă analizăm incidența ca cel puțin un vehicul, sau două vehicule

să treacă pe culoarea roșie, atunci ținând cont de nivelul ridicat de

probabilitate 0,36 și riscul pe care-l reprezintă acest eveniment pentru

derularea în siguranță a traficului, este cazul să se analizeze eventual calitatea

semaforizării.

APLICAȚIA 6.

Se consideră observarea cu echipament radar a regimului de viteză pe

o arteră urbană. Considerând rezultatele înregistrate, grupate în intervale de

viteze comform tabelului alăturat, să se determine probabilitatea ca viteza

legală admisă să fie depășită cu:10,20, 30, 40 și 50 de km/h.

Tabelul 2.11. Repartiția statistică avitezelor observate.

Interval de 20 30 40 50 60 70 80 90

viteze - - - - - - - -

hkm/ 20 30 40 50 60 70 80 90 100

Nr.

vehicule 2 39 32 41 77 37 14 1 2

încadrate

Comentariu și rezolvare

Depășirea vitezei legale admise constitue o practică cu grave consecințe

asupra siguranței traficului. Fenomenul a luat amploare și este favorizat în

bună măsură de câteva aspecte ce vizează: performanțele dinamice ale

autovehiculelor, psihologia conducătorilor auto (direct legată de grupa de

vârstă), modalitatea de organizare- sistematizare a arterelor de trafic, etc.

Exemplul analizat constitue din acest punct de vedere un rezultat tipic

al înregistrărilor de trafic.

48

În scopul rezolvării acestei aplicații, se impune în prealabil reducerea ei

la o problemă de tip probabilistic. În acest scop, vom considera o ierarhizare

a evenimentelor k funcție de gradul de risc pe care-l reprezintă. Astfel,

deplasarea sub limita de viteză admisă va fi considerat eveniment de rang 0,

iar depășirea acesteia cu intervale de câte 10 km/h vor constitui evenimente

de rang 1, 6. Efectuând calculele, se obțin datele de trafic prezentate în

tabelul alăturat:

Tabelul 2.12.

Interval de viteze

hkm/ 50 50-60 60-70 70-80 80-90 90-100

k 0 1 2 3 4 5

Nr.vehicule

încadrate 94 77 37 14 1 2

kN

Utilizând noul tablou de date rezultate în urma reordonării acestora

pentru a răspunde cerinței statistice și de probabilitate, se determină cu relația

(41) valoarea parametrului caracteristic :

92,1 .

Se calculează valorile indicatorilor de distribuție, rezultatele obținute

fiind prezentate în tabelul 2.13.

Tabelul 2.13. Valori analitice

k ,kf ,kP

0 0.147 0.147

1 0.281 0.428

2 0.27 0.698

3 0.173 0.871

4 0.083 0.954

5 0.032 0.986

49

Grafic, variația indicatorilor prezentați în tabelul 2.13., este redată în

figura 2.14.

Concluzie : Din analiza graficelor de variație se constată următoarele:

- incidența depășirii vitezei maxime admise este destul de ridicată, fapt

ce își gășeste o serie de cauze legate de regimul sancționării contravenției

referitoare la viteză (aplicarea de amenzi și puncte de sancționare se face

numai dacă viteza a fost depășită cu minim 10 km/h, deci se circulă la limita

legalității) dar și permisivitatea condițiilor de trafic;

- analiza nu a acoperit complet câmpul probabil de viteze ce pot fi

întâlnite pe sectorul de drum monitorizat, astfel că probabilitatea de a se

înregistra și viteze mai mari 100km/h nu este de neglijat având o rată de

succes de peste 1,4%.

- ponderea relativ ridicată a vitezelor mari, indică un sector de drum cu

o permisivitate mărită și datele trebuie corelate cu evenimentele de trafic

înregistrate în zona de observare, în scopul creșterii siguranței țn trafic.

APLICAȚIA 7.

La monitorizarea unui lot de 150 de vehicule pe durata parcurgerii a

50.000 km, privind înregistrarea unor evenimente de trafic (accidente), s-au

obținut următoarele date pentru 8 momente de monitorizare (evenimente

înregistrate în fiecare moment de observare): 1,4,16,24, 0, 1,2,5. Să se

determine probabilitatea de apariție a accidentelor și să se generalizeze

modelul evenimentelor probabile.

Comentariu și rezolvare:

Aplicația propusă analizează incidența producerii accidentelor de trafic,

pe sectoare de drum, supuse monitorizării fie în urma efectuării unor lucrări

de sistematizare – reabilitare, fie prin prisma avertizărilor venite din partea

poliției rutiere. În general se derulează observații care constau în epuizarea

unui parcurs suficient de mare ca să ofere informații relevante din punct de

vedere al datelor de trafic. Practica curentă nu solicită în mod expres

observarea continuă, fiind agreate tehnici de sondare, în intervale discrete de

50

observare. Astfel, rezultatele înregistrate permit dezvoltarea unor funcții

predictive care să ofere estimări credibile a ratei de producere a accidentelor

de trafic, specifică arealului monitorizat.

Pentru exemplul considerat, valoarea parametrului caracteristic se

determină utilizând relația (41), pentru care înlocuirea numerică ne dă:

625,652124016418

1 .

Densitatea de probabilitate sau rata de producere a evenimentului va fi

determinată cu relația (42), rezultând astfel valori prezentate în fig.2.15.

Din analiza graficului de variație a densității de probabilitate de

producere a evenimentului, se constată că față de valoarea ponderată de 6,625

accidente, cele 150 de autovehicule monitorizate au produs cu o șansă de

probabilitate mai ridicată un accident, astfel că într-un număr redus de cazuri,

lotul de 150 de autovehicule va produce un număr de 4 sau 5 accidente.

Desigur, aici nu analizăm cauzele implicării în accidente ( măsură în

care conducătorul auto a fost autor sau victimă a unei situații de trafic

conflictuale), faptul consumat însă rămâne consemnat ca eveniment de trafic,

cu toate consecințele ce decurg din aceasta: costuri dirtecte, costuri sociale și

perturbări în derularea fluentă a circulației rutiere.

Statistica analizată și concretizată prin repartiția de probabilitate are

însă efect direct din punct de vedere al ingineriei traficului rutier asupra

măsurilor permisive și necesare privind marcarea și semnalizarea

corespunzătoare a tronsonului de drum, astfel ca asemenea evenimente să nu

cunoască o incidență atât de ridicată.

2.2.2. Legi de distribuție pentru variabile aleatoare de tip continuu

Legile de distribuție specifice v.a. continue, sunt destinate modelării

proceselor, în scopul evidențierii modului de variație în timp a fenomenelor

observate. Estimări, prognoze privind dinamica unor evenimente pot fi

formulate cu ajutorul acestui instrument matematic care stă la baza și analiza

unor fenomene de trafic.

51

Semnificative în modelarea fenomenelor de trafic rutier sunt

următoarele tipuri de distribuții:

- Distribuția exponențială;

- Distibuția normală cu varianta derivată din aceasta de tip log-

normală;

- Distribuția Gamma;

- Distribuția wiebull.

Este de semnalat că aceste modele de distribuții sunt completate de

ansamblul repartițiilor probabilistice fundamentale, între care repartiția

Gamma are un rol esențial.

Distribuția exponențială, este un instrument matematic frecvent

utilizat în analiza fenomenelor de trafic rutier, caracterizând cu suficientă

relevanță o serie de situații cum sunt:

- fenomenele de așteptare;

- lungimea plutoanelor de vehicule;

- fenomene de variație în timp a traficului;

- evidențierea proceselor specifice determinării capacității de

circulație a arterelor rutiere.

Constitue instrumentul prin intermediul căruia sunt descrise

fenomenele evolutive între evenimente independente continue și cu rată

constantă, reprezentând o formă de explicitare a proceselor stohastice de tip

Poisson.

Parametrul caracteristic al distribuției este inversul mediei de sondaj,

notat cu , care exprimă în esență rata constantă specifică (de succes), în

derularea evenimentelor.

Indicatorii caracteristici ai distribuției exponențiale sunt:

-densitatea de probabilitate a evenimentelor dată de relația:

0,0

0,,

x

xexf

x , (45)

52

unde reprezintă rata de succes a evenimentului.

-distribuția cumulativă, dată de relația:

0,0

0,1,

x

xexF

x

. (46)

-indicatorul media distribuției:

1m . (47)

-mediana distribuției:

2lnMe . (48)

-momentul generator al funcției MF , dat de relația ce conține explicit

variabila de timp:

1

1,

t

tMF , (49)

unde t este variabila de timp generatoare de funcție.

Densitatea de probabilitate a timpului de funcționare, reprezintă

indicatorul probabilistic cu relevanță deosebită din punct de vedere al

exemplificării distribuției exponențiale, întrucât pune în evidență factorul ,

rata de succes a evenimentului și oferă informații consistente privind variația

fenomenelor (fig.2.16).

APLICAȚIA 8.

Se consideră observarea de trafic referitoare la incidența virajului la

dreapta într-o intersecție cu fluxul principal de vehicule pe direcția înainte

53

(fig.2.17). Considerând datele medii de trafic prezentate în (fig.2.16), să se

determine valoarea densității de probabilitate a virajului la dreapta în

ipoteza că prin intersecție trec 1000,2000,…,20000 de autovehicule.

Comentariu și algoritm de rezolvare: Într-o primă etapă de abordare se

impune evaluarea problemei din punct de vedere al datelor inițiale

disponibile. Se constată astfel din fig.2.17., că numărul de vehicule ce intră în

intersecție în intervalul de observare este de 95 (80+15), din care doar 15 vor

efectua virajul la dreapta. Astfel, valoarea parametrului , determinat din

relația (47) va fi:

vehm

%158,095

151 .

Este preferabil ca pașii următori de rezolvare a aplicației să se facă

utilizând mediul de operare Excell, MathCAD sau MATLAB, ce ar ușura

mult sarcina de calcul, având în vedere gradul de dificultate ridicat al

operațiilor necesare. În acest scop se iterează în prima fază variabila de timp.

Utilizând relația (45) se calculează valoarea indicatorului densitate de

probabilitate, rezultatele obținute fiind prezentate grafic în fig.2.18.

100011000: ix ; 20,...,1i .

O particularitate esențială rezidă din evaluarea exponențială a

distribuției virajului la dreapta : la creșterea valorilor de trafic pe artera

principală, ponderea celor care virează scade exponențial astfel încărcarea

suplimentară rămâne pe artera de bază și constitue factor de risc pentru

condițiile de trafic, în timp ce artera secundară va păstra un flux relativ

constant.

Este cazul arterelor ce alimentează zone rezidențiale de cartier sau al

unor artere ce constitue intrări în spații private ( unități economice, ansamblu

de locuințe, parcări private, spații cu caracter social, etc).

54

APLICAȚIA 9.

Cunoscând că pentru un tronson de drum rapid, rata accidentelor este

de 0,025 evenimente la 100 de vehicule, să se determine valorile

indicatorilor: densitate de probabilitate, valoarea medie accidente, valoarea

mediană și funcția cumulativă de distribuție a accidentelor, valori

corespunzătoare unui trafic de 10.000 vehicule.

Comentariu și algoritm de rezolvare: Din enunțul aplicației poate fi

identificat parametrul rată de succes a evenimentelor , care însă trebuie

exprimat în unități convenționale de forma : accidente/veh.:

vehaccidente /105,2100

025,0 5 .

În continuare, aplicând relațiile de calcul (45) – (48), se obțin valorile

indicatorilor ceruți de enunțul aplicației și care sunt prezentați sintetic , cu

referiri la relațiile utilizate în tabelul 2.15.

Tabelul 2.15. Valorile indicatorilor caracteristici calculați

Indicatorul U.M. Valoarea Obs.

calculată

Rata accidentelor acc/veh 5105,2 Rel. (47)

Densitatea de probabilit acc/veh 510947,1 Rel. (45)

Valoarea medie accident veh/evenim. 40000 Rel. (47)

Valoarea mediană caract.veh/evenim. 27773 Rel. (48)

Funcția cumulativă de - 0,221 Rel. (46)

distribuție

55

Interpretarea rezultatelor: valorile calculate arată următoarele aspecte

de trafic:

- la fiecare 40000 de vehicule ce rulează pe sectorul de drum, există

probabilitatea producerii unui eveniment de trafic;

- deoarece valoarea mediană este mult coborâtă sub valoarea mediei,

estimarea poate să fie insuficientă și în domeniul de valori : 27773

– flux de 40000 de vehicule există riscul de producere a

accidentelor de trafic;

- valoarea funcției cumulative de distribuție arată totuși că sectorul de

drum este cu risc scăzut ( în condițiile în care acest indicator poate

lua valori în intervalul 1,0 .

Distribuția normală, reprezintă un instrument matematic cu o largă

aplicabilitate în estimările și evaluările de trafic rutier. Este utilizată

îndeosebi pentru determinarea condițiilor de trafic specifice unui anumit

segment orar, corelat cu stabilitatea derulării fluxului de autovehicule.

Distribuția poartă denumirea de Gauss-Laplace în memoria marilor

matematicieni clasici ce au dezvoltat teoria și au demonstrat aplicatibilitatea

acesteia pentru determinarea erorilor de măsurare. În exprimarea uzuală mai

poate fi întâlnită sub denumirea de clopotul lui Gauss, datorită formei

caracteristice a variației densității de probabilitate.

Reprezintă cea mai uzuală modalitate de reprezentare cantitativă a unei

multitudini de fenomene naturale, în care se încadrează și cele de trafic rutier.

Este caracterizată prin doi parametri statistici determinați pentru

această disatribuție:

- parametrul de localizare: și care reprezintă din punct de vedere

statistic media de sondaj, asociată fenomenului analizat;

- parametrul de sacră (de scalare): , care este din punct de vedere

statistic abaterea medie pătratică (deviația standard) a șirului de

date asociat fenomenului analizat.

56

Caracteristic acestei repartiții este indicatorul densitate de probabilitate

a evenimentului, xf ,, care se determină cu relația:

2

2

2

2

1,,

x

exf . (50)

Pentru definirea funcției cumulative de distribuție a evenimentelor

probabile, se utilizează expresia integralei Laplace, care permite normarea

funcțiilor caracteristice pentru distribuția normală:

duex

ux

2

2

2

1

. (51)

Distribuția cumulativă specifică repartiției normale se determină cu

ajutorul integralei Laplace, utilizând relația:

mttF . (52)

Momentul generator al funcției se determină cu relația:

2

22tmt

etM

. (53)

Din punct de vedere al aplicațiilor destinate analizei traficului rutier, o

importanță deosebită o reprezintă indicatorul: densitate de probabilitate a

ratei de succes a evenimentelor. Aceasta permite identificarea caracteristicilor

traficului rutier derulat în intervale de timp din punct de vedere al încărcării

arterelor, permițând estimarea privind: derularea unui trafic constant sau

fluctuant , funcție de încadrarea în rata de normalitate (fig.2.19).

Corespunzător indicatorului densitate de probabilitate , distribuția

cumulativă a ratei de succes a evenimentelor de probabilitate normală sunt

prezentate în fig.2.20.

57

APLICAȚIA 9.

Se consideră observarea de trafic, derulată cu contoare automate,prin

care s-au înregistrat volumele de vehicule care trec în intervale de timp

normate, pe o arteră de trafic. În urma înregistrărilor s-a solicitat

determinarea caracterului încărcării arterei rutiure monitorizate, privind

consistența traficului și identificarea perioadelor cu un trafic caracteristic,

atât pentru totalul vehiculelor înregistrate cât și pentru pincipala categorie

de participanți la trafic pe artera respectivă (autoturisme). Datele de trafic

înregistrate sunt prezentate în tabelul 2.16.

Tabelul 2.16. Observare automată de trafic în două zile

consecutive.

Ora

Ziua I 7 – 8 – 9 – 10 – 11 – 12 – 13 – 14 – 15 – 16 – 17 – 18

8 9 10 11 12 13 14 15 16 17 18 19

Veh.total 634 816 778 820 880 918 858 848 939 956 1078 977

din care

turisme 556 712 694 706 766 751 721 701 785 948 873 854

Ziua II

Veh.total687 761 798 855 842 860 882 836 943 1018 1025 975

din care

turisme585 650 720 755 702 748 749 693 821 917 936 894

Comentariu și algoritm de rezolvare: Problema prelucrării datelor de

trafic nu este simplă şi gradul de complexitate nu este determinat de volumul

datelor de trafic prelucrate. Desigur, cu cât volumul de date este mai mare, cu

58

atât sarcina operatorului (statisticianului) este mai amplă. Sunt însă o serie de

algoritmi care de altfel stau la baza unor programe soft de prelucrare a datelor

de trafic și care vin în ajutorul operatorilor, contribuind la reducerea

semnificativă de efort uman și timpul alocat acestor activități.

În consecință, pentu exemplificarea repartiției normale vom lua în

cosiderare setul de date ordonat statistic, pregătit pentru determinarea

indicatorilor primari.

După cum se poate constata din figura 2.21., datele de trafic înregistrate

prezintă fluctuații orare, atât pentru valorile totale de trafic cât și în ceea ce

privește participantul major la trafic.

Conform enunțului aplicației, în prima fază se impune ordonarea

crescătoare a șirului de valori, această organizare a șirului de date nu va

afecta cocludența rezultatelor obținute, deoarece, în acest caz, variabila de

timp analizată o reprezintă volumele orare de trafic și nu momentul din zi la

care s-a efectuat înregistrarea.

Aplicând relațiile statistice cunoscute, se determină valoarea celor doi

parametrii caracteristici ai repartiției normale: media de sondaj și abaterea

medie pătratică, pentu cele două seturi de date selectate: valori totale trafic și

participația automobilelor la trafic. Cu aceste date statistice, se calculează

valoarea indicatorilor: densitate de distribuție și distribuția cumulativă,

rezultatele obținute fiind prezentate grafic în figurile 2.22. și 2.23.

După cum se poate observa, valoarea maximă a densității de

probabilitate a volumelor de vehicule, corespunde mediei statistice de sondaj,

a cărei valoare calculată a fost de 874,33 veh/h. În cazul autoturismelor,

centrarea spre valoarea medie este mai pronunțată, fapt argumentat și de

apropierea maximului densității de probabilitate de media statistică de sondaj

(759,875 veh/h). Aceste constatări arată cu prisosință ( precum și graficul de

variație al indicatorului) că încărcarea arterei de trafic urmează o lege de

distribuție normală, ce poate avea următoarele consecințe din punct de vedere

al traficului derulat:

- componența traficului este relativ constantă pe parcursul

săptămânii;

- artera de circulație este utilizată (încărcată) uniform și predictibil;

- sectorul de drum este permisiv unor planuri de optimizare privind

creșterea fluenței traficului.

59

Distribuția log-normală

Este derivată din legea de distribuție normală și permite modelarea cu

mai multă fidelitate a derulării fluxurilor de vehicule pe arterele rutiere, unde

se pot identifica cu frecvență mai redusă situațiile în care se identifică trafic

staționar, de rată normală.

În general, particularitatea constă în modul de exprimare a valorii

exponențialei, în condițiile în care parametrii caracteristici sunt aceeași ca și

în cazul distribuției normale.

Densitatea de probabilitate a evenimentelor se determină cu relația:

2

2

2

ln

2

1,,

mx

ex

mxf

. (54)

Media de repartiție log-normală, se detrmină cu relația:

2

2

em , (55)

unde - reprezintă media statistică parametrică rezultată din

prelucrarea datelor din eșantion.

Mediana repartiției este de forma:

eMe . (56)

Modul de repartiție fiind în acest caz:

2 eMo . (57)

Distribuția cumulativă, derivă și în acest caz din laplacianul corectat

cu modul de variație al variabilei de timp:

60

mttF

ln. (58)

Spre deosebire de cazul distribuției normale, pentru distribuția log-

normală se pot identifica variații ale indicatorului densitate de probabilitate

care apropie interpretarea indicatorilor de alte distribuții probabile (fig.2.24.).

Distribuția cumulativă, însumează rata evenimentelor probabile și

permite identificarea modului de adiție în termeni de probabilitate,

contribuind la identificarea gradului de succes (de realizare) a fenomenului

analizat (fig.2.25).

Practic, acest indicator este mai des utilizat în cuantificarea efectului

distribuției log-normale asupra volumelor de trafic, sau a evenimentelor

probabile. În cazul analizei traficului derulat pe artere divizoare sau în cazul

identificării probabilității de trecere la semafor, această lege de distibuție

poate oferi un suport eficient, cu condiția aplicării în cazul unui trafic de rată

variabilă a densității de vehicule.

Distibuția Gamma – generalizată

Reprezintă o distribuție specifică variabilelor aleatoare continue, cu

aplicabilitate semnificativă în dezvoltarea aplicațiilor referitoare la teoria

așteptării, sau în cazul analizei proceselor, dezvoltate pe criterii statistice.

Este caracterizată de prezența a doi parametrii ce definesc această distribuție:

- parametrul de formă care permite identificarea variației

indicatorilor de probabilitate caracteristici și valorile acestui parametru pot

duce la asocierea acestei distribuții cu cea exponențială, sau Weibull sau în

unele cazuri ( mai rar) distibuția normală.

- parametrul de scară, ce determină domeniul de valori a

indicatorilor identificați; în mod curent valoarea acestui parametru duce la

apropierea distribuției de cea exponențială.

61

Este generată prin intermediul funcției Gamma, caracterizată de

relația:

dtetx tx

0

1. (59)

Funcția prezintă câteva caracteristici ce sunt valorificate în dezvoltarea

distribuției de tip Gamma.

due

nnnnn

u

2

2

1

;10

;12...21!1

. (60)

Densitatea de probabilitate pentru această această distribuție se

determină cu relația (fig.2.26):

xexxf 1,, , 0x . (61)

Distribuția cumulativă este dată de relația (fig.2.27) :

dxxfxF

x

0

,,,, . (62)

Distribuția Weibull

Este considerată ca fiind cuprinzătoare din punct de vedere al

fenomenelor observate, aceasta “simulând” cu aceeași precizie de

determinare , evenimente ce urmează o distribuție de tip exponențial sau

normal. Este în general mai puțin aplicată pentru analizele dezvoltate în

62

domeniul traficului rutier unde se pornește în general de la premiza “intuirii”

unei distibuții a evenimentelor probabile în baza datelor statistice colectate.

Specifică distribuțiilor de tip continuu este particularizarea prin

prezența a trei parametrii caracteristici:

- k - parametrul de formă, număr real pozitiv, care identifică modul

de variație a indicatorilor caracteristici;

- -parametrul de scară ce identifică domeniul în care indicatorii

caracteristici iau valori, fiind de asemenea un număr real pozitiv;

- -parametrul originii de timp, acesta fiind luat în considerare ca și

variabilă îndeosebi în cazul analizelor statistice de tip demografic,

sau în cazul raportării analizelor la populația originală ce face

obiectul evaluării de probabilitate.

În cele mai frecvente analize de tip Weibull, se apreciază valoarea

parametrului originii de timp ca fiind nulă, caz în care se ia în considerație

distribuția:Weibull biparametrică.

Indicatorul densitate de probabilitate a evenimentelor posibile se

determină cu relația:

0,0

0,,,,

1

t

tetk

ktf

ktk

. (63)

În cazul distribuției biparametrice, relația caracteristică pentru

determinarea densității de probabilitate a evenimentelor este de forma:

0,0

0,,,

1

t

tetk

ktf

ktk

. (64)

63

Funcția cumulativă caracteristică distribuției Weibull biparametrice

este de forma:

kt

etF

1 . (65)

Reprezentarea grafică a variației indicatorului caracteristic permite

evidențierea afirmațiilor anterioare privind capacitatea de „ simulare” a

distribuțiilor de tip normal și exponențial (fig.2.28).

APLICAȚIA 10.

Se consideră sondajul de trafic privind distribuția numărului de

vehicule în așteptare la semafor, pe durata unei zile. Cunoscând valorile

medii orale detaliate pentru perioada de funcționare a semaforului, să se

determine legea de distribuție probabilă pentru încadrarea de probabilitate a

fenomenului analizat (tab.2.17).

Tabelul 2.17. Nr. mediu de vehicule în așteptate la fiecare ciclu T de

semaforizare

Interval orar h 6,00 7,00 8,00 9, 00 10,00 11,00 12,00 13,00

7,00 8,00 9,00 10,00 11,00 12,00 13,00 14,00

Nr.mediu Veh/T 1 2 7 8 8 5 4 6

Interval orar h 14,00 15,00 16,00 17,00 18,00 19,00 20,00 21,00

15,00 16,00 17,00 18,00 19,00 20,00 21,00 22,00

Nr.mediu Veh/T 4 3 2 4 1 3 1 1

64

Comentariu și algoritm

Pentru rezolvarea aplicației este necesară o analiză prealabilă a datelor

existente în concordanță cu formularea cerinței de rezolvare. În acest caz,

pentru evidențierea încadrării în repartiția Weibull, este necesară

determinarea valorii parametrilor caracteristici: parametrul de formă și

Parametrul de scară. Deci se poate considera că aplicația face referire la

“feed-back-ul” determinării de tip Weibull.

De asemenea, considerând că fenomenul se încadrează în grupa

distribuțiilor continue de probabilitate, apare necesitatea stabilirii unei forme

de exprimare unitară, coerentă a variabilei de timp. Alegând ca unitate de

exprimare a timpului minutele, rezultă că observațiile au fost defalcate în

intervale de 60 de minute și în consecință durata totală de observare a fost de

960 minute. Cu aceste specificări tabelul 2.17. va fi de forma (v. Tab.2.18):

Tabelul 2.18. Nr. mediu de vehicule în așteptare la fiecare ciclu T de

semaforizare, detaliat pe durata de observare

60 – 120 – 180 – 240 – 300 – 360 – 420 –

Interval orar h 0 – 60

120 180 240 300 360 420 480

Nr. mediu Veh/T 1 2 7 8 8 5 4 6

480 – 540 – 600 – 660 – 720 – 780 – 840 – 900 –

Interrval orar h

540 600 660 720 780 840 900 960

Nr. mediu Veh/T 4 3 2 4 1 3 1 1

Se constată ca și în cazul legii de distribuție Weibull, este foarte

important a se determina parametrii caracteristici ,k și . În acest scop

literatura de specialitate pune dispoziție câteva metode din care amintim:

metoda analitică (numerică), metoda grafo- analitică și metoda grafo-

analitică modificată.

Metoda analitică este bazată pe estimarea și verificarea celor trei

parametrii, utilizând în acest scop un algoritm destul de laborios care necesită

65

în cele mai multe dintre cazuri calculatoare numerice pentru evaluarea

indicatorilor caracteristici.

Tehnica analitică de determinare a coeficienților și estimare a

indicatorilor este utilizată în două variante: determinarea punctuală și

determinarea prin intervale de încredere.

Evaluarea indicatorilor pe cale analitică impune respectarea unui

algoritm de determinare atât acestora cât și a parametrilor caracteristici.

Metoda grafo-analitică se bazează pe utilizarea rețelelor de

probabilitate de tip Weibull, fiind utilizate următoarele situații:

- există un număr relativ mic de date observate;

- repartiția este necunoscută, cazul unor fenomene nou studiate;

- necesitatea efectuării unor prime evaluări estimative cu caracter

informativ în vederea prelucrării ulterioare, riguroase prin metoda

analitică;

- situațiile care necesită o testare rapidă, în vederea verificării

conformității cu prescripțiile impuse prin programul de dirijare a

circulației sau în scopul obținerii unor viziuni de ansamblu asupra

rezultatelor sau de optimizare a semaforizării.

În elaborarea metodei grafo – analitice se are în vedere echivalența

ecuațiilor:

kt

etR

;

lnln1

lnln

kt

tR; (66)

CXY .

După cum rezultă din echivalențele (66), între termenii tRlnln și

kt ln se stabilește o corelație de tip liniar. Practica utilizării metodei

apelează la funcția de defectare tF , distribuția cumulativă a evenimentelor

probabile, astfel încât în toate dezvoltările aplicative din domeniu, vom regăsi

acest indicator. Se trasează dreapta Weibull funcție de tF și kt

(fig.2.29).

O metodologie de rezolvare a aplicațiilor referitoare la repartiția

Weibull, respectă următorul algoritm:

- calculul valorilor funcției tF ;

66

- trasarea graficului funcției tF funcție de kt , considerându-se

că 0 și se obține curba l;

- pe aceeași diagramă se trasează trei drepte echidistante paralele la

axa parametrului t-k, care vor intersecta curba l în trei puncte

natate A,B și C;

- se determină valorile abscisei celor trei puncte A,B,C: CBA ttt ,, ;

- cu aceste valori se recalculează parametrul , avându-se în

vedere că linia curbă l se va transforma cu noul parametru într-o

dreaptă de tip Weibull.Se va avea în vedere că verifică ecuația:

CBA

BCA

ttt

tttk

2

2

. (67)

- determinarea parametrului se face astfel: utilizând următorul

raționament: pentru 0Y se obține kt , deci valoarea este

valoarea citită în punctul de intersecție al dreptei Weibull cu axa t -

k;

- determinarea parametrului se face ținând cont de faptul că

acesta reprezintă chiar panta dreptei Weibull:

0 tg . (68)

Practic se procedează astfel: din punctul de intersecție al dreptei

Weibull cu orizontala se ridică abscisa pe scara OX , se dă o variație de o

unitate pe axa X , după care se coboară până la intersectarea dreptei Weibull,

pe orizontală citindu-se tocmai valoarea coeficientului .

Deoarece dezvoltarea matematică a algoritmului este suficient de

laborioasă, se propune rezolvarea aplicației (urmând pașii explicitați) în

mediul MathLAB, în vederea determinării valorilor parametrilor

caracteristici.

Algoritmul dezvoltat permite vizualizarea graduată a rezolvării

aplicației, constituind un real suport în predicția distribuției de vehicule ce

sosesc într-o intersecție. Utilizând interfața de operare , se introduc datele

inițiale și se lansează comenzile de execuție pentru determinarea parametrilor

caracteristici (fig.2.30).

67

După cum se poate observa din fig.2.30 , calculul parametrilor

caracteristici ai repartiției oferă rezultate cu cinci zecimale, considerate

suficiente pentru relevanța aplicabilității la un larg spectru de aplicații.

Pașii de rezolvare a aplicației constau în:

- stabilirea numărului de intervale de discretizare a domeniului de

timp, funcție de intervalul caracteristic;

- introducerea datelor inițiale în format impus, conform cerințelor

aplicației;

- lansarea comenzii de trasare grafică a variației indicatorului tR ,

funcția de distribuție a evenimentului favorabil (fig.2.31)

- lansarea comenzii de calcul a parametrilor caracteristici: parametrul de

formă notat în program cu beta și parametrul de scară (în aplicație notat cu

lambda);

- reprezentarea grafică a distribuției Weibulltrasată cu datele de

program calculate (fig.2.32).

Aplicația permite vizualizarea în prealabil a parametrului caracteristic

ce face corelarea între metoda grafo – analitică și metoda pur matematică de

calcul (parametrul calculat este indicat în fig.2.30 cu a).

Suplimentar , această aplicație permite identificarea nivelului de

relevanță al încadrării distribuției de date în modelul Weibull. În acest sens

este utilizat testul Hi pătrat , test care face corelația între rezultatele

experimentale și cele calculate. În fereastra de operare a aplicației, câmpul

destinat acestei etape de rezolvare este notat cu C.

Testul oferă atât informația analitică, cât și informația grafică, rezultată

din trasarea pe același grafic a funcției tR calculată și determinată analitic

(fig.2.33).

După cum se poate constata din rezultatul obținut în urma aplicării

testului de concludență, distribuția timpilor de așteptare la semafor, corelat cu

numărul de vehicule în așteptare , poate fi analizată cu ajutorul repartiției

Weibull. Valoarea Hi pătrat obținută indică o abatere de 1,8680% (sub 2%),

valoare acceptabilă în condițiile unei analize de trafic.

Se recomandă algoritmii Weibull în analizele de trafic deoarece în mod

automat, funcție de valorile de calcul obținute se poate face trecerea spre alte

legi de distribuție anlizate anterior: distribuția exponențială, distribuția

normală și distribuția log-normală. În acest mod, se asigură trecerea de la

68

modelele generalizate (Weibull) la modelele particulare care sunt întâlnite

fecvent în modelările de trafic.

Rezultatele obținute pentru aplicația 10 se prezintă sintetic în tabelul

2.19.

Tabelul 2.19. Centralizatorul valorilor calculate pentru

Aplicația 10.

Indicatorul Lambda Parametrul Parametrul Testul

de formă de scară Hi pătrat

Simbol %

U.M. - Veh/h Veh/h %

Valoare 2106932,4 2,1485 1,8756 1,8669

69

COLECTAREA ȘI PRELUCRAREA

DATELOR ÎN TRANSPORTURI


Recommended