7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 1/40
Statistică
Lect. univ. dr. Claudiu HERŢELIU
http://www.hertz.ase.ro
Duminica, 15 februarie 2009
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 2/40
Finalitate
Probă de verificare – Test 1: Vineri 20 martie 2009 (50% din nota finală);
– Test 2: Duminică 5 aprilie 2009 (50% din nota finală);
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 3/40
Bibliografie
Orice manual/ tratat recomandat la secţiunea Bibliografie de pe site
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 4/40
Istoria statisticii în România
În România, nu se poate vorbi despre o statistică organzată înainte desecolele XVIII-XIX.
În aprilie 1859, Al. I. Cuza aprobă înfiinţarea unui birou de statistică înŢara Românească, sub conducerea lui Dionisie Pop Mar ţian.
În luna iulie a aceluiaşi an, a Direcţiei de Statistică din Moldova, subconducerea lui Ion Ionescu de la Brad.
La 4 august 1859, cele două direcţii se reunesc sub denumireaOficiului Statistic pentru Principatele Unite având la conducere peDionisie Pop Mar ţian.
Pe scheletul acelei instituţii s-a constituit şi consolidat Instituţia
Statisticii Publice ce avea să poarte numele de Institutul Central deStatistică, Direcţia Centrală de Statistică, Comisia Naţională pentruStatistică sau Institutul Naţional de Statistică şi Studii Economice.
În prezent denumirea este: Institutul Naţional de Statistică (http://www.insse.ro ).
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 5/40
Ce este statistica?
Conform DEX, Statistica are următoareleaccepţiuni:
– Evidenţă numerică, situaţie cifrică referitoare ladiverse fenomene, numărotoare;
– Culegere prelucrare şi valorificare a unor datelegate de fenomene generale;
– Ştiinţă care culege, sintetizează, descrie şi
interpretează date referitoare la fenomenegenerale.
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 6/40
Etapele cercetării statistice
1. Observarea statistică a fenomenuluistudiat
2. Prelucrarea şi modelarea datelorculese
3. Analiza şi interpretarea datelorculese
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 7/40
Elemente fundamentale
Obiectul de studiu al Statisticii îl reprezintă analizadatelor ce descriu comportamentul fenomenuluistudiat
Fenomenele studiate trebuie să fie bine localizate înspaţiu şi timp
Datele ce descriu fenomenul pot fi cantitative sau
calitative Rezultatele trebuie ancorate (validate) într-un
sistem teoretic
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 8/40
Tipuri de metode statistice
Statistica descriptivă / analiza primar ă a
datelor statistice (clasificări, reprezentări
grafice, tendinţa centrală, analizadispersională)
Statistica inferenţială (extinderea
rezultatelor obţinute prin cercetări par ţiale,verificarea ipotezelor statistice, elemente deprognoză)
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 9/40
Noţiunile de bază a statisticii (1)
Unitatea statistică reprezintă elementul debază supus analizei statistice. Există unităţisimple (de ex.: persoane, obiecte etc.) şiunităţi complexe (de ex.: gospodăria).
Populaţia statistică este compusă dintr-omulţime finită de unităţi statistice.
Variabila (caracteristica) statistică este oaplicaţie definită pe populaţia studiată şi cuvalori într-o anumită mulţime.
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 10/40
Noţiunile de bază a statisticii (2)
Parametrul statistic este o ilustrare (deobicei cantitativă) a stării variabile statistice
Estimatorul este o funcţie statistică utilizată pentru aproximarea unui parametrunecunoscut la nivelul unei populaţii statistice
Eşantionul statistic o mulţime dedimensiuni reduse a unităţilor statistice dintr-o populaţie
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 11/40
Tipuri de variabile statistice
În funcţie de natura mulţimii în care ia valori funcţiadefinită pe populaţia studiată există:
Variabile numerice (cantitative) şi nenumerice
(calitative)
Variabile discrete (mulţimea este una numărabilă)sau continue
Variabile binare/ alternative (mulţime cu două elemente) şi variabile cu mulţimi asociate compusedin mai mult de două elemente
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 12/40
Teoria scalării
Variabilele statistice pot fi măsurate pe patruscale de măsurare:
Scala nominală Scala ordinală
Scala de interval
Scala de raport
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 13/40
Metode de observare statistică
În funcţie de periodicitate avem: observări curente şiperiodice
În funcţie de volumul unităţilor statistice observateavem: cercet
ări exhaustive (de tip recens
ământ)
şi
cercetări selective (sondaje sau anchete statistice) În funcţie de modalitatea de declanşare a
evenimentului avem: observări clasice şi observăriprovocate (proiectarea experimentelor)
În funcţie de modul de administrare: observăridirecte şi observări indirecte (din surse publicateanterior: anuare, buletine, rapoarte etc.)
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 14/40
Prelucrarea primar ă a datelor
statistice
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 15/40
De ce prelucrare primar ă?
din considerente practice (prezentaresintetică, publicare, diseminare etc.)
pentru a studia pe baza graficelor ulterioare forma funcţiilor de repartiţie
pentru a “cur ăţa” datele de valorile
aberante sau de “non-r ăspunsuri”
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 16/40
Gruparea statistică
grupări simple – pe variante
după o variabilă calitativă – după o variabilă binar ă – după o variabilă polihotomică
după o variabilă cantitativă – după o variabilă binar ă – după o variabilă discretă cu un număr rezonabil de variante.
– după un criteriu geografic – după criteriul cronologic
grupări combinate
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 17/40
Gruparea pe variante (1)
După o variabilă calitativă binar ă
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 18/40
Gruparea pe variante (2)
După o variabilă calitativă polihotomică
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 19/40
Gruparea pe variante (3)
După o variabilă cantitativă binar ă
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 20/40
Gruparea pe variante (4)
După o variabilă cantitativă discretă
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 21/40
Grupare după un criteriu geografic
Sursa de date:
Anuarul statistic 2006,
pag. 24
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 22/40
Grupare după criteriul cronologic
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 23/40
Grupări combinate (1)
Tabele de contingenţă (bidimensionale)
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 24/40
Grupări combinate (2)
Tabele cu mai mult de două dimensiuni
Sursa de date:
Anuarul statistic 2006,
pag. 56
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 25/40
Elemente necesare unui tabel statistic
Titlu sugestiv şi concis (cu precizarealocalizării în timp şi spaţiu)
Unităţi de măsur ă Sursa de date
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 26/40
Tipuri de reprezentări grafice a datelorprelucrate primar (1)
MBAC
10,00
9,75
9,50
9,25
9,00
8,75
8,50
8,25
8,00
7,75
7,50
7,25
7,00
6,75
6,50
6,25
6,00
5,75
5,50
1400
1200
1000
800
600
400
200
0
Std. Dev = ,80
Mean = 8,78
N = 8831,00
Histograma pentru o variabilă cantitativă continuă
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 27/40
Tipuri de reprezentări grafice a datelorprelucrate primar (2)
Sursa de date:
Anuarul statistic 2006,
pag. 39
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 28/40
Tipuri de reprezentări grafice a datelorprelucrate primar (3)
ARAD
CARAS- SEVERIN
BIHOR
HUNEDOARA
ALBA
CLUJ
GORJ
MEHEDINTI
DOLJ
VALCEA
TELEORMAN
ARGES
DAMBOVITA
GIURGIU
SIBIU
BRASOV
PRAHOVA
BUCURESTI
COVASNA
BUZAU
CALARASI
IALOMITA
BRAILA
CONSTANTA
TULCEA
GALATI
VRANCEA
BACAU
VASLUI
IASI
NEAMT
HARGHITA
BOTOSANI
SUCEAVABISTRITA-
NASAUD
MARAMURES
MURES
SATU MARE
SALAJ
TIMIS
2005 sub 1%
1-3%
3-5%
5-10%
10% si peste
OLT
Sursa de date: Prelucr ări ale
informaţ iilor bazei de date a
admiterii ASE şi a informaţ iilor
referitoare la examenele deBacalaureat
Figura 1.3.2. Zonele de provenienţă (ca procent din total absolvenţ i)a candidaţ ilor la concursul de admitere al ASE
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 29/40
Mărimi relative (MR)
Clasificare:
Mărimi relative de structur ă (MRS)
Mărimi relative de dinamică (MRD) Mărimi relative de coordonare (MRC)
Mărimi relative de intensitate (MRI)
Mărimi relative ale planului (MRP)
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 30/40
Reprezentarea grafică a MRS (1)
Diagrama prin cerc (plăcinta – “pie chart”)
Gradul de mulţumire a studenţilor ASE faţă de modul de desf ăşurare a practicii
20,8%42,9%
24,0%
11,0%
1,3%
Foarte multumit
Multumit
NemultumitFoarte nemultumit
Non-raspunsuri Sursa de date: Ancheta I,chestionarul F1 – întrebarea 4
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 31/40
Reprezentarea grafică a MRS (2)
Diagrama prin dreptunghi
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 32/40
Indicatorii tendinţei centrale
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 33/40
Caracteristici ale indicatorului tendinţeicentrale ideal (Yule 1945)
Să fie definit în mod obiectiv
Să depindă de toate valorile individuale
Să aibă o semnificaţie concretă (uşor de înţeles chiar şi de către nespecialişti)
Să fie simplu şi rapid de calculat
Să fie puţin sensibil la fluctuaţiile de selecţie Să se preteze la calcule algebrice
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 34/40
Tipuri de indicatori ai tendinţei centrale
Mediile – Media aritmetică
caz particular (media variabilei de tip binar) – Media pătratică
– Media geometrică – Media armonică – Media cronologică (se va discuta despre ea la capitolul Serii
cronologice)
Indicatorii medii de poziţie – Mediana – Valoarea modală
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 35/40
Media aritmetică
Se poate calcula doar pentru variabilecantitative
Se mai numeşte momentul de ordin 1 – pentru un şir simplu de valori
– Pentru o serie de frecvenţe sau de date grupatepe intervale de grupare
n
x x
i∑=
∑
∑=
i
ii
n
n x x
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 36/40
Media variabilei de tip binar
Distribuţia după culoarea ochilor unei populaţii de100 de persoane este:
Observaţie: orice variabilă se poate “binariza”
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 37/40
Media pătratică
Se mai numeşte momentul de ordin 2
– pentru un şir simplu de valori
–
Pentru o serie de frecvenţe sau de date grupatepe intervale de grupare
∑
∑=
i
ii
pn
n x x
2
n
x x
i
p
∑=
2
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 38/40
Media armonică
Se mai numeşte momentul de ordin -1
– pentru un şir simplu de valori
–
Pentru o serie de frecvenţe sau de date grupatepe intervale de grupare
∑
∑=
i
i
i
h
n
x
n x
1
∑=
i
h
x
n x
1
7/26/2019 curs statistica 1
http://slidepdf.com/reader/full/curs-statistica-1 39/40
Media geometrică
Se foloseşte pentru calculul unor medii în cazul mărimilorrelative de dinamică – pentru un şir simplu de valori
– Pentru o serie de frecvenţe sau de date grupate pe intervale degrupare
Observaţie: MRD trebuie să fie exprimate sub formă de indici (nuritmuri) şi coeficienţi (nu procente)
nig x x ∏=
∑= ∏i i
n n
ig x x