+ All Categories
Home > Documents > Curs 2 statistica.ppt

Curs 2 statistica.ppt

Date post: 09-Feb-2018
Category:
Upload: goia-nicu
View: 217 times
Download: 0 times
Share this document with a friend
38
STATISTICĂ CURS 2 Conf.univ.dr. Mihai SACALĂ [email protected]
Transcript
Page 1: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 1/38

STATISTICĂ CURS 2

Conf.univ.dr. Mihai SACALĂ 

[email protected]

Page 2: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 2/38

2

Etapele cercetării statistice  Procesul cunoaşterii statistice presupune organizarea şi parcurgerea unor etape distincte

şi succesive care includ operaţiile de observare sau culegere a datelor, de sistematizare şi  prelucrare, de analiză şi interpretare a rezultatelor.

Etapele cercetării statistice sunt:

 observarea  statistică - etapă în care se culeg date de la

unităţile  colectivităţii  studiate, pentru toate caracteristicileurmărite;

  prelucrarea  statistică - etapă  în care datele culese suntsistematizate şi sunt calculaţi  indicatorii statistici primari şi derivaţi,  absoluţi  şi  sintetici ce caracterizează  fenomenul

studiat; analiza  şi  interpretarea rezultatelor  - etapă în care sunt

verificate ipotezele, formulate concluziile şi  fundamentateprocesele decizionale.

Page 3: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 3/38

3

Principiile clasificării şi grupării 

Sistematizarea datelor se realizează prin clasificare (variabilenenumerice) şi grupare (variabile numerice)

Sistematizarea presupune împărţirea datelor în grupe omogene,după unul sau mai multe criterii .

Criteriul de grupare este dat de variabila statistică 

Grupările sunt simple sau combinate în funcţie de numărulcriteriilor utilizate

Gruparea datelor trebuie să se facă după principiile: omogenităţii 

unicităţii 

universalităţii  Grupele constituite trebuie să fie deci exhaustive şi mutual

exclusive.

Rezultatul grupării datelor îl reprezintă seria de distribuţie defrecvenţe.

Page 4: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 4/38

4

Sistematizarea datelor nenumerice  Clasificarea  presupune împărţirea unităţilor în categoriile variabilei nenumerice

considerate.

  Prin numărarea unităţilor statistice ce se încadrează în fiecare clasă se stabileşte

frecvenţa clasei

  Frecvenţa fiecărei clase, astfel determinată, se numeşte f recvenţă absolută, notată 

in

,r i

  ,1

, unde r  reprezintă numărul de clase, iar

i

inn

1  

  Se poate calcula şi frecvenţa relativă a clasei ( *i

n ), care indică proporţia din

numărul total de unităţi, care se încadrează în fiecare clasă:  

n

n

n

nn

  i

i

i

i

1

*

, unde1

1

*

i

in , iar n reprezintă volumul total al eşantionului. 

Exprimată în procente, frecvenţa relativă a grupei i este:100100

1

%*

n

n

n

nn i

i

i

ii  

Page 5: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 5/38

5

Sistematizarea datelor nenumerice

Dacă variabila este măsurată pe scala nominală ordinea claselor o alege cercetătorul. 

Sistematizarea datelor privind muzeele, în anul 2007  , în România, în funcţie de tipul acestora, a

dus la următoarele rezultate: 

Tipul muzeului

Numărul muzeelor 

(la sfârşitul anului) 

(   in )

Ponderea muzeelor

(*%in )

Ştiinţele naturii  44 6,6

Istoria tehnicii şi

ştiinţei 21 3,1

Istorie 117 17,5

Etnografie 115 17,2Istoria culturii 152 22,8

Artă  149 22,3

Mixte 70 10,5

Total 668 100Sursa: Anuarul Statistic al României, 2008.

Page 6: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 6/38

6

Reprezentarea grafică a seriilor de distribuţie de

frecvenţe pentru variabile nenumerice 

Diagrama prin coloane (în cazul frecvenţelor absolute)

0

20

40

60

80

100

120

140

160

Ştiinţele

naturii

Istoria

tehnicii şi

ştiinţei

Istorie Etnografie Istor ia

culturii

 Artă   Mixte

tipul de muzeu

   N  r .  m  u  z  e  e   (   f  r  e  c  v  e

  n   t  e  a   b  s  o   l  u   t  e   )

 Distribuţia muzeelor după tipul lor 

Page 7: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 7/38

7

Reprezentarea grafică a seriilor de distribuţiede frecvenţe pentru variabile nenumerice 

Graficul „pie chart” (în cazul frecvenţelor relative). 

7% 3%

18%

17%

23%

22%

10%

Ştiinţele naturii Istoria tehnicii şi ştiinţei Istorie Etnografie Istoria culturi i  Artă Mixte

 Structura muzeelor după tipul lor

Page 8: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 8/38

8

Sistematizarea datelor numerice 

Gruparea reprezintă  sistematizarea datelordupă  o variabilă  numerică  (discretă  saucontinuă). 

A. Dacă variabila este discretă şi cu un număr redus de valori distincte  (max. 10)sistematizarea datelor se face prin grupareape variante, obţinându-se o serie de

distribuţie de frecvenţe pe variante.  Frecvenţa  grupelor se stabileşte  prin

numărarea unităţilor care iau aceeaşi valoare.

Page 9: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 9/38

9

Sistematizarea datelor numerice

Gruparea a 50 de manageri ai unor firme de IT, în funcţie de numărul de deplasări în

 străinătate, în interes de serviciu, în luna mai 2007, se prezintă astfel: 

Număr deplasări  Număr manageri 

0 3

1 16

2 19

3 7

4 4

5 1

Total 50

O serie de distribuţie de frecvenţe pentru o variabilă discretă poate fi prezentată şi suburmătoarea formă: 

 

  

 

  ... n  nn

  ... x  x x X 

21

21:

.

Page 10: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 10/38

10

Sistematizarea datelor numerice

Reprezentarea grafică a unei serii de distribuţie de frecvenţe alcătuită după o variabilă numerică

discretă cu număr redus de valori distincte este poligonul frecvenţelor: 

0

123456789

10111213141516

17181920

0 1 2 3 4 5

Nr. deplasari

  n  r .  m  a  n  a  g  e  r   i

 Distribuţia managerilor în funcţie de numărul de deplasări (poligonul frecvenţelor)

Page 11: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 11/38

11

Sistematizarea datelor numerice

B.  Dacă  variabila numerică  este  discretă  şi  are un număr mare de valori distincte  sau este continuă  sistematizareapresupune gruparea pe intervale de variaţie 

Se obţine o serie de distribuţie de frecvenţe pe intervale.

Intervalul de variaţie reprezintă un şir de valori ale variabileistudiate delimitat prin limita inferioară şi limita superioară. 

Intervalele de variaţie pot fi de mărime egală sau neegală.

Pentru gruparea pe intervale de variaţie se recomandăutilizarea unui număr moderat de grupe (5-10 grupe).

Numărul intervalelor depinde de numărul unităţilor statistice. 

Un număr mare de date necesită un număr mai mare de intervale degrupare. Ca un principiu general, o distribuţie de frecvenţe trebuie săcuprindă cel puţin 5 intervale de grupare, dar nu mai mult de 15.

Page 12: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 12/38

12

Alcătuirea intervalelor de variaţie 

A. Determinarea numărului de intervale 

Pentru alegerea numărului de intervale (r ) se poate utiliza şi relaţia: 

nr  10log322,31 ,

unde n reprezintă volumul colectivităţii.

B. Stabilirea mărimii intervalului (h ) de variaţie 

-  se recomandă utilizarea intervalelor de mărime egală 

 x x

 Ah

  minmax  

-  mărimea intervalului se recomandă a se rotunji la o valoare convenabilă.

Prin sistematizarea datelor pe intervale de gru pare se pierde din exactitatea informaţiei,dar se câştigă pe linia condensării datelor şi descoperirii trăsăturilor esenţiale.

În prelucrările ulterioare, când  trebuie  să ataşăm fiecărei unităţi statistice  o valoareconcretă şi această valoare va fi, sub anumite presupuneri, centrul intervalului de grupare.

Page 13: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 13/38

13

Alcătuirea intervalelor de variaţie 

C. Sabilirea intervalelor

Punctul de plecare în alcătuirea intervalelor de grupare se alege, convenabil, 0sau un număr întreg mai mic sau egal decât  xmin.

Limitele intervalelor de grupare trebuie stabilite cu acurateţe, respectând

 precizia datelor (cu acelaşi număr de zecimale, dacă valorile sunt de această

manieră). 

Se stabilesc intervalele de grupare pornind de la  xmin  (sau de la o valoare puţinmai mică): 

 xmin    xmin+h

 xmin+h    xmin+2h.....................................................

 xmin + (r —  1 )h    xmin + r   h

Frecvenţa fiecărui interval in (numită frecvenţă absolută)  se obţine prin

numărarea unităţilor care se încadrează în fiecare grupă Dacă există grupe cu frecvenţă nulă, ori multe grupe cu o singură observaţie,

 poate fi necesară revizuirea mărimii intervalelor sau a numărului de intervale. 

Page 14: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 14/38

14

Exemplu

Tabelul statistic ce se obţine prin gruparea datelor pe intervale de variaţie este: 

Intervale de variaţie a vechimii în activitate  

(ani)

Număr salariaţi 

in  

0-5 5

5-10 8

10-15 17

15-20 20

20-25 14

25-30 10

30 şi peste  6TOTAL 80

 Notă: limita superioară este inclusă în interval  

Page 15: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 15/38

15

Seria de distribuţie de frecvenţe pe intervale 

În cazul seriilor de distribuţie de frecvenţe pe intervale se mai determină: 

1. Centrul de interval  =  valoarea situată la jumătatea distanţei dintre limitele intervalului şi esteconsiderat reprezentativ pentru datele din interiorul intervalului:

2inf 

i

ii

h x x    sau

2

supinf    ii

i

 x x x

, r i   ,1 .

2. Frecvenţa absolută cumulată crescător a unei grupe  ( F ci) = numărul unităţilor statistice care au

valoarea variabilei mai mică sau egală cu limita superioar ă a intervalului

i

k ci   n F 

1.

3. Frecvenţa relativă cumulată crescător a unei grupe (*

ci F  ) = procentul unităţilor statistice care au

valoarea variabilei mai mică sau egală cu limita superioară a grupei: 

i

k ci  n F 

1

**

.

4. Frecvenţe absolute şi relative cumulate descrescător  = numărul  sau procentul  unităţilorstatistice care au valoarea variabilei mai mare sau egală cu limita inferioară a intervalului

ik 

k di  n F  ,

ik 

k di   n F   **

.

Page 16: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 16/38

16

Seria de distribuţie de frecvenţe pe intervale 

Frecvenţele absolute, relative şi cumulate oferă o imagine de ansamblu asupratendinţei de distribuţie a valorilor în colectivitate, asupra normalităţii, simetriei oriasimetriei repartiţiei de frecvenţe. 

Intervale devariaţie

a vechimii înactivitate

(ani)

Număr

salariaţi 

in  

Pondereasalariaţilor 

*%in  

Centrulde

interval

i x 

ci F    di F    *ci F   

*di F   

0-5 5 6,25 2,5 5 80 6,25 1005-10 8 10 7,5 13 75 16,25 93,75

10-15 17 21,25 12,5 30 67 37,5 83,75

15-20 20 25 17,5 50 50 62,5 62,520-25 14 17,5 22,5 64 30 80 37,525-30 10 12,5 27,5 74 16 92,5 2030-35 6 7,5 32,5 80 6 100 7,5

TOTAL 80 100 - - - - -

 Notă: limita superioară este inclusă în interval 

Page 17: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 17/38

17

Reprezentarea grafică a seriilor de distribuţie defrecvenţe pe intervale 

O serie de distribuţie de frecvenţe pe intervale de variaţie sereprezintă grafic cu ajutorul histogramei şi a poligonuluifrecvenţelor.

Datele cantitative se pot reprezenta grafic utilizând histograma

frecvenţelor absolute sau relative, construită într-un sistem decoordonate rectangulare.

Pe abscisă sunt reprezentate intervalele de variaţie, iar peordonată sunt reprezentate frecvenţele.

Histograma se construieşte prin ridicarea unor dreptunghiuri,

fiecare dreptunghi fiind de lăţime egală cu mărimea intervaluluide grupare şi de înălţime egală cu frecvenţa intervalului 

Page 18: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 18/38

18

Histograma

0

2

4

6

8

10

12

14

  10 20 30 40 50 60 70 80 90

Intervale

     F    r    e    c    v

    e    n     t    e

0

5

10

15

20

25

30

35

1 4 7 10 13 16 19 22 25 28 31 34 3 7 40 43 46

Intervale

      F     r     e     c     v

     e     n      t     e

 set mic de date set mare de date

Page 19: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 19/38

19

Distribuţia normală 

Distribuţia normală, perfect simetrică, în forma clopotului luiGauss-Laplace este foarte rar întâlnită în practică, fiind de fapto distribuţie teoretică de referinţă în analiza statistică.

Page 20: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 20/38

20

Distribuţii asimetrice 

În cele mai multe cazuri, distribuţiile de frecvenţe empirice au

tendinţă de normalitate, dar un anumit grad de asimetrie 

Page 21: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 21/38

21

Distribuţia în formă de J 

Distribuţia în formă de J este o distribuţie profund asimetrică, în care frecvenţa maximă se întâlneşte în primul ori în ultimulinterval, pentru ca apoi frecvenţele să descrească spre zero 

Page 22: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 22/38

22

Distribuţia în formă de U 

Distribuţia în formă de U este o distribuţie cu frecvenţemaxime în ambele intervale extreme de variaţie şi cu frecvenţăminimă în jurul intervalului central 

Este firesc, aşadar, ca analiza statistică să înceapă cu vizualizarea, pe calegrafică, a tendinţei de distribuţie a valorilor  în colectivitatea cercetată. 

Page 23: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 23/38

23

În cazul  seriilor de distribuţie de frecvenţe pe intervale se mai

determină: 

1. Centrul de interval = valoarea situată la jumătatea distanţei dintrelimitele intervalului şi este considerat reprezentativ pentru datele dininteriorul intervalului:

2inf 

iii

h x x    

2

supinf    ii

i

 x x x

, r i   ,1 .

2.  Frecvenţa absolută cumulată crescător a unei grupe  (F ci ) =

numărul unităţilor statistice care au valoarea variabilei mai mică sauegală cu limita superioară a intervalului

i

k ci  n F 

1.

Page 24: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 24/38

24

3.  Frecvenţa relativă cumulată crescător a unei grupe  (*

ci F  ) = procentul

unităţilor statistice care au valoarea variabilei mai mică sau egală cu limita superioarăa grupei:

i

k  k c i

n F 

1

**

.

4.  Frecvenţe absolute şi relative cumulate descrescător = numărul sauprocentul unităţilor statistice care au valoarea variabilei mai mare sau egală culimita inferioară a intervalului 

ik 

k di n F ,

ik 

k di n F  **

.

Page 25: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 25/38

25

Exemplu

Frecvenţele absolute, relative şi cumulate oferă o imagine de ansamblu asupratendinţei de distribuţie a valorilor în colectivitate, asupra normalităţii, simetriei ori

asimetriei repartiţiei de frecvenţe. 

Intervale de

variaţie

a vechimii înactivitate

(ani)

Număr

salariaţi 

in 

Ponderea

salariaţilor *%i

n  

Centrul

de

interval

i x 

ci F    di F    *ci F   

*di F   

0-5 5 6,25 2,5 5 80 6,25 100

5-10 8 10 7,5 13 75 16,25 93,75

10-15 17 21,25 12,5 30 67 37,5 83,75

15-20 20 25 17,5 50 50 62,5 62,5

20-25 14 17,5 22,5 64 30 80 37,5

25-30 10 12,5 27,5 74 16 92,5 20

30-35 6 7,5 32,5 80 6 100 7,5

TOTAL 80 100 - - - - -

 Notă: limita superioară este inclusă în interval 

Page 26: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 26/38

26

Exemplu

distributia salariatilor in functie de vechimea in activitate

5

8

17

20

14

10

6

0

5

10

15

20

25

2,5 7,5 12,5 17,5 22,5 27,5 32,5

nr.ani

  n  r .  s   l  a  r   i  a   t   i

Page 27: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 27/38

27

Exemplu

poligonul frecventelor 

0

5

10

15

20

25

-2,5 2,5 7,5 12,5 17,5 22,5 27,5 32,5 37,5

nr.ani

  n  r .  s   l  a  r   i  a   t   i

Page 28: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 28/38

28

Curbele cumulative ale frecvenţelor 

curbele cumulative ale frecventelor

0

10

20

30

40

50

60

70

80

90

0 5 10 15 20 25 30 35

Fci

Fdi

Page 29: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 29/38

29

Măsuri statistice descriptive pentru date univariate 

Pentru o variabilă numerică, folosind indicatorii statistici,

putem analiza trei proprietăţi majore: 

1. Tendinţa centrală 

2. Variabilitatea 

3. Forma distribuţiei 

Precizări • Dacă indicatorii statistici descriptivi sunt calculaţi pentru o colectivitate

generală se numesc parametri şi se notează, de regulă, cu litere greceşti .

• Indicatorii descriptivi determinaţi pentru un eşantion se numesc estimatori şi

se notează, de regulă, cu litere romane.• În cercetarea statistică, folosim, în general, eşantioane şi folosim indicatorii

descriptivi în scopul estimării parametrilor  colectivităţii generale.

• Vor fi explicaţi, în continuare, indicatorii statistici descriptivi ce caracterizeazăeşantioanele, precizând simbolurile şi formulele utilizate în determinareaaceloraşi indicatori pentru colectivitatea generală.

Page 30: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 30/38

30

Măsurarea tendinţei centrale 

Indicatorii tendinţei centrale = indicatori sintetici  cuajutorul cărora urmărim să exprimăm printr-o singură valoare ceea este tipic , esenţial , stabil  într-o serie de date numerice.

Deoarece nivelurile individuale, înregistrate pentru fiecare unitate statistică înparte, se manifestă sub influenţa factorilor esenţiali (sistematici) şi neesenţiali(întâmplători), în procesul de prelucrare a datelor se impune eliminareainfluenţelor întâmplătoare şi exprimarea, într-o singură valoare numerică, aaspectelor tipice, reprezentative pentru seria de date.

Indicatorii tendinţei se clasifică, în funcţie de modulde determinare, în:

- indicatori medii de calcul: 

media aritmetică, media armonică, media pătratică, media geometrică

- indicatori medii de poziţie:

modul, mediana

Page 31: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 31/38

31

Măsurarea tendinţei centrale 

Indicatorii fundamentali ai tendinţei centrale sunt:

1. media aritmetică ( ) 

2. mediana (Me)

3. modul (Mo)

Aceşti indicatori au o putere cu atât mai mare de caracterizare a tendinţeicentrale cu cât se determină pe baza unor date mai omogene.

1. Media aritmetică (average, mean, în engl.) 

- este indicatorul cel mai utilizat pentru caracterizarea

tendinţei centrale a datelor numerice - reprezintă valoarea care, înlocuind toţi termenii unei serii,nu modifică suma acestora

- se calculează ca suma valorilor raportată la numărul lor. 

 x

Page 32: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 32/38

32

Media aritmetică 

Formula de calcul a mediei este:

- pentru eşantion  - estimator

- pentru colectivitatea generală – parametru

- Dacă datele au fost sistematizate într-o serie de distribuţie de frecvenţe, în carevalorile/centrele intervalelor de variaţie apar cu frecvenţele ,

se determină media ca medie aritmetică ponderată:

n

 x

 x

n

i

i   1

 N 

 x

 N 

i

i 1

 

i

i

i

ii

n

n x

 x

1

1

r i xi   ,1,     in

Page 33: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 33/38

33

Media aritmetică 

Exemplu

Vechimea în muncă a fost înregistrată pentru cinci salariaţi ai unei firme şianume: 7, 5, 6, 7 şi 8 ani. Vechimea medie este: 

6,65

33

5

87657x  

 ani.

M edia aritmetică pune în balanţă toate valorile individuale: 

5 6 7 8

 x =6 6 ani

Page 34: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 34/38

34

Media aritmetică 

Media aritmetică este afectată de orice valoare sau valori extreme.

Exemplu

Datele pentru vechimea în muncă a 10 salariaţi sunt: 5, 4, 5, 5, 6, 6, 4 şi 20,atunci vechimea medie este:

ani6,610

204...45x  

0  5  10  15 

= 6,6 ani 20 

ani1,59

46...45x  

x

Page 35: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 35/38

35

Exemplu

Se cunoaşte distribuţia de frecvenţe a 50 de firme referitor la procentul din venituricheltuit cu cercetarea-dezvoltarea:

Grupa

Intervalul de variatie pentru

procentul din venituri

cheltuit cu cercetarea-dezvoltarea 

Nr firme

in  

Centrul de interval

i x   ii  n x    Fci

1 sub 6,25 4 5,70 22,8 4

2 6,25 - 7,35 12 6,80 81,6 16

3 7,35 - 8,45 14 7,90 110,6 30

4 8,45 - 9,55 7 9,00 63 37

5 9,55 - 10,65 7 10,10 70,7 44

6 10,65 - 11,75 3 11,20 33,6 47

7 11,75 - 12,85 0 12,30 0 47

8 12,85 şi peste  3 13,40 40,2 50

Total 50 - 422,5

Page 36: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 36/38

36

ExempluSe observă că pentru primul, respectiv ultimul interval de variaţie nu s-au precizatambele limite, ceea ce ar putea sugera că seria de date negrupate conţine valoriextreme.

Pentru a putea calcula media şi aceasta să fie neafectată de aceste valori seprocedează la fixarea limitelor inferioară, respectiv superioară pentru acesteintervale.

Limitele se determină astfel încât toate intervalele să aibă aceeaşi mărime, adică

1,10.astfel intervalele devin:5,15-6,25, respectiv 12,85-13,95.

Media va fi:.45,8

50

5,422

1

1

i

i

i

ii

n

n x

 x

 

Rezultatul arată că procentul mediu cheltuit pentru reclamă şi publicitate de o firmădin cele 50 luate în studiu este 8,45. 

După cum se observă, unele firme cheltuie un procent mai mic pentru cercetare-dezvoltare (sub 6,25), iar altele alocă un procent mai mare. Procentul alocat diferăde la o firmă la alta sub acţiunea factorilor sistematici, dar şi întâmplători, careinfluenţează într-un sens sau în altul. Dacă toţi factorii ce influenţează  procentulalocat ar acţiona în mod egal şi constant asupra tuturor firmelor, atunci sumaalocată de o firmă pentru cercetare-dezvoltare ar fi de 8,45% din venituri.

Page 37: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 37/38

37

Media aritmetică 

Particularităţi în calculul mediei 

1.  Dacă toate nivelurile variabilei sunt egale (cu o constantă) atuncimedia este egală cu constanta, adică: 

dacă  x 1 = x 2 = ... = x n = a, atunci  x = a.

2.  Media poate fi sau nu egală cu o valoare individuală înregistrată şiare unitatea de măsură a variabilei studiate. 

3.  Media se poate determina şi dacă se cunoaşte doar suma valorilorşi numărul de unităţi din colectivitate (dacă se cunosc veniturile

totale ale unei familii şi numărul de persoane se poate calculavenitul mediu pe o persoană din familie).

4.  Media se situează întotdeauna între valoarea minimă ( x min) şivaloarea maximă ( x max ) a variabilei

Page 38: Curs 2 statistica.ppt

7/22/2019 Curs 2 statistica.ppt

http://slidepdf.com/reader/full/curs-2-statisticappt 38/38

38

Media aritmetică 

5. Media poate fi determinată şi prin utilizarea frecvenţelor relative:

100

1

*%

i

ii n x

 x .

6. Dacă o serie statistică este alcătuită din m  serii componente, pentru care s-au

calculat mediile parţiale  m,1,    j x  j , atunci media întregii serii poate fi calculată

ca o medie aritmetică ponderată din mediile parţiale 

m

  j

  j

m

  j

  j  j

n

n x

 x

1

1

 

unde   jn  reprezintă volumul seriei componente j  m,1 j .


Recommended