+ All Categories
Home > Documents > Curs Prelucrarea Statistic A

Curs Prelucrarea Statistic A

Date post: 07-Apr-2018
Category:
Upload: bianca-duminica
View: 231 times
Download: 0 times
Share this document with a friend

of 25

Transcript
  • 8/3/2019 Curs Prelucrarea Statistic A

    1/25

    1.2. PRELUCRAREA INFORMAIEI STATISTICE

    Informaiile referitoare la unitile colectivitii statistice, rezultate n urma procesului deobservare, se supun ulterior procesului de prelucrare pentru a se obine indicatori statistici generalizatori,

    capabili s ofereo imagine corect i sintetic asupra fenomenului social sau economic investigat.Prelucrarea informaiei cuprinde dou etape principale:centralizarea i gruparea datelor individuale i prezentarea acestora sub form de tabele,

    grafice sau serii statistice;calculul indicatorilor statistici derivai.1.2.1. CENTRALIZAREA PRIMARI GRUPAREA DATELOR

    Centralizarea primar i gruparea datelor urmrete, de fapt, cunoaterea dimensiunii colectivitiistudiate, att din punct de vedere al numrului totalde uniti componente ct i al structurii colectivitiistatistice i valorii (nivelului) caracteristicii studiate, n cazul n care aceasta se preteaz a fi nsumat i

    dac nsumarea are sens.Centralizarea datelor poate fi simpl sau pe grupe. Centralizarea simpl are aplicabilitate restrns i este recomandat n situaiile n care ntre

    unitile colectivitii nu apar deosebiri eseniale n privina nivelului de dezvoltare. Centralizarea pe grupe este predominant i const n separarea colectivitii studiate n grupe

    relativ omogene (gruparea datelor), urmat de nsumarea unitilor i a nivelurilor caracteristicilor peaceste grupe. Se obin astfel totaluri pariale (pe grupe) care, ulterior, vor permite stabilirea niveluluitotalizator pe ntreaga colectivitate. nsumnd totalurile pe grupe se obin totalurile de la centralizareasimpl.

    De regul, centralizarea i gruparea datelor se efectueaz concomitent.Exemplu: Presupunem c se urmrete cunoaterea efectivului salariailor cu contract de

    munc, pe perioad nedeterminat, la nivelul administraiei locale a municipiului Bucureti.

    n acest scop, se vor solicita informaii tuturor unitilor subordonate, acestea fiindcentralizate pentru a se obine efectivul total. Dac se urmrete cunoaterea suplimentar i adistribuiei personalului n funcie de nivelul de instruire, informaiile vor fi grupate nconformitate cu tabelul de mai jos:

    Primria Municipiului BucuretiSITUAIA

    personalului cu contract pe perioad nedeterminat,la data de 1 iulie 2003, dup nivelul de instruire

    Nr.

    crt.

    Denumirea

    unitii

    Efectivul personalului (persoane)

    Total

    din care:

    Cu studiielementare Cu studiimedii Cu studiisuperioare

    123...

    ABC..Z

    .....

    .

    .....

    .

    .....

    .

    ...

    .

    ..

    Total Tg T1 T2 T3

  • 8/3/2019 Curs Prelucrarea Statistic A

    2/25

    Tg1se poate obine prin centralizarea simpl (nsumnd cifrele din coloana 1) sau prin nsumarea

    totalurilor pe grupe:Tg = T1 + T2 + T3

    Gruparea datelor poate fi operat innd seama de diverse criterii:a) n funcie de numrul caracteristicilorcare stau la baza gruprii, acestea pot fi:

    grupri simple (dup o singur caracteristic);grupri combinate (dup dou sau mai multe caracteristici).Exemplu:grupare simpl:repartiia personalului dup nivelul de instruire (tabelul anterior);grupare combinat:repartiia personalului dup nivelul de instruirei vechimea n funcie.n cazul gruprii combinate, informaiile privind repartiia personalului pe cele trei nivele de

    instruire se structureaz i pe grupe de vechime, considerate funcionale.b) n funcie de coninutul caracteristicilorde grupare deosebim:grupri dup caracteristici de timp (gruparea populaiei unei localiti dup anul naterii);grupri dup caracteristici de spaiu (gruparea populaiei Romniei pe judee);grupri dup caracteristici atributive (gruparea populaiei dup nivelul de instruire).c) n funcie de variaia caracteristicii putem identifica:

    gruparea pe variante ale caracteristicii are utilizare mai restrns. Variabila are, de regul,caracter discret, variantele individuale fiind identificate prin valori precise (dimensiuneafamiliei sau gospodriei dup numrul de membri);

    grupare pe intervale de variaie se ntlnete mai des n statistic. Variabila are, de regul,caracter de variabil de tip continuu (neexcluzndu-se posibilitatea gruprii pe intervale devariaie i a variabilelor de tip discret), i este specific ndeosebi colectivitilor statistice dedimensiuni mari (gruparea gospodriilor dintr-o localitate dup consumul de energie electric).

    a) n funcie de mrimea intervalelor de variaie putem ntlni:grupare cu intervale de variaie inegalegrupare cu intervale egale pentru variaia nivelului caracteristicii.Utilizarea intervalelor inegale se justific numai atunci cnd acestea semnific i tipuri deosebite

    din punct de vedere calitativ. n cele mai multe cazuri, innd seama i de avantajele semnificative oferite

    de prelucrarea datelor, se utilizeaz gruparea pe intervale egale de variaie.Intervalele de variaie pot fi:deschise, cnd nu se precizeaz una din limitele intervalului (de regul, prezente n cazul

    primului i ultimului interval); nchise, cnd se precizeaz limita inferioar i superioar a fiecrui interval.n cazul intervalelor nchise, limita superioar a unui interval se regsete, de regul, ca limit

    inferioar a intervalului urmtor. Pentru a nu crea confuzii, se va preciza ntotdeauna care dintre limite(inferioar sau superioar) este cuprins n interval.

    n concluzie, gruparea unitilor colectivitii n funcie de variaia caracteristicii numerice trebuies in seama de mrimea amplitudinii variaiei i de numrul unitilor observate, de natura fenomenului,de tipurile calitative identificate i, nu n ultimul rnd, de necesitatea abordrii cu mult obiectivitate aanalizei fenomenelor i proceselor social-economice investigate.

    n lipsa altor motivaii obiective, mrimea intervalului de variaie, pentru structurareacolectivitii studiate pe subgrupe calitativ-omogene, poate fi sta bilit, n ipoteza repartiiei normale aunitilor colectivitii, folosind relaia lui Sturges:

    nh

    xxlog322,31

    minmax

    +

    = n care: (1.2.1.1.)

    h = mrimea intervalului de variaie;xmax = nivelul maxim al caracteristicii studiate;xmin = nivelul minim al caracteristicii;

  • 8/3/2019 Curs Prelucrarea Statistic A

    3/25

    n = numrul unitilor colectivitii (volumul colectivitii studiate).Departe de a fi o operaie de rutin, gruparea statistic necesit mult experien i discernmnt,

    presupune analiza calitativ a fenomenelor studiate. Problema esenial n stabilirea grupelor vizeazdeopotriv identificarea caracteristicilor eseniale, funcie de care vom delimita grupele omogene, ct iintervalele de variaie corespunztoare cerinei asigurrii obiectivitii concluziilor desprinse din analiz.

    Gruparea corect a unitilor colectivitii statistice este un prim pas n identificarea

    interdependenei dintre fenomene i a factorilor cu influen semnificativ n evoluia acestora.Informaiile obinute n urma observrii statistice se prezint sub form de tabele statistice simple

    sau combinatei servesc determinrii unor indicatori derivai (mrimi relative, mrimi medii, indicatoriai variaiei etc.) absolut necesari analizei statistice.

    1.2.2. MRIMI RELATIVE. GRAFICA STATISTIC

    Trim ntr-o lume a interdependenelor. Globalizarea economiei este un concept care are o bazobiectiv. Simim permanent nevoia de a ne compara performanele, n timp sau cu realizrile altora.Statistica, tiin social ce abordeaz fenomenele social-economice din punct de vedere cantitativ,este n msur s rspund cel mai bine acestor nevoi ale cunoaterii. n acest scop au fost elaboratemetode de prelucrare a informaiei capabile s permit identificarea factorilor eseniali n determinarea

    evoluiei social-economice i stabilirea, cu obiectivitate, a locului unei anumite colectiviti n ansamblulsocietii. Compararea, metod prin care se realizeaz o parte din obiectivele amintite anterior, separticularizeaz n ansamblul metodelor de prelucrare a informaiei prin calculul indicatorilor relativi.

    Indicatorii relativi reprezint raportul a doi indicatori statistici. Deci indicatorud)l relativexprim proporia unui indicator primar raportat la un alt indicator considerat baz de raportare (baz decomparaie). Indicatorii relativi vor servi scopului pentru care au fost determinai numai n msura n care ntre termenii comparai exist o coresponden logic de coninut, de condiionare saucauzalitate, asigurndu-se comparabilitatea datelor.

    Indicatorii relativi se exprim n uniti de msur concrete, aa cum rezult din calcul (numerentregi i zecimale), n procente, promile sau procentimile, depinznd de specificul fenomenelor ce facobiectul analizei.

    n funcie de coninut i scopul pentru care sunt folosite, mrimile (indicatorii) relative cunosc

    urmtoarele accepiuni:a) mrimi relative pentru cuantificarea obiectivelor i a gradului de realizare a acestora;b) mrimi relative de structur;c) mrimi relative de intensitate;d) mrimi relative ale dinamicii;e) mrimi relative de coordonare.

    a) Mrimile relative utilizate pentru cuantificarea obiectivelor (sarcini propuse prin plan)compar nivelul propus (planificat) al unui indicator, pentru o perioad imediat urmtoare, cu nivelulaceluiai indicator n perioada precedent (baz de raportare) i se exprim de obicei n procente.

    Exemplu: Primria localitii Z i-a propus s continue n anul 2003 lucrrile demodernizare a reelei de drumuri comunale, angajnd acoperirea cu mixturi asfaltice a uneisuprafee de 100.000 m2. n anul 2002, n aceeai localitate, au fost modernizate, prin acelai

    procedeu, drumuri comunale n suprafa de 80.000 m2

    .Rezult:

    %125100000.80

    000.100100

    Q

    QI

    o

    plo/pl === (1.2.2.1.)

    n care:Ipl/o= mrimea relativ a obiectivului planificat;Qpl= volumul planificat (propus) al activitii;Qo= volumul aceleiai activiti n anul precedent.

  • 8/3/2019 Curs Prelucrarea Statistic A

    4/25

    Rezult c primria localitii Z i-a propus ca obiectiv pentru anul 2003, acoperirea cu mixturiasfaltice a unei suprafee cu 25% mai mare dect n anul precedent.

    S considerm c, n realitate, n anul 2003, au fost acoperite cu mixturi asfaltice drumuricomunale n suprafa de 84.000 m2. n baza acestei informaii putem stabili gradul de realizare aobiectivului planificat:

    %84100000.100000.841001

    /1 === QQIpl

    pl (1.2.2.2.)

    n care:I1/pl= mrimea relativ a ndeplinirii obiectivului planificat;Q1= volumul activitii realizate;Qpl= volumul planificat (propus) al activitii.Rezult c obiectivul planificat nu a fost realizat efectiv dect ntr-o proporie de 84%, deci cu un

    minus relativ de 16%.n calculul celor dou mrimi relative conexe intervine un element comun, volumul planificat

    (propus) al activitii. Produsul celor dou mrimi relative conduce la o alt mrime relativ carecaracterizeaz, de fapt, dinamica activitii n anul curent fa de anul precedent:

    QQ

    QQ

    QQII

    plo

    pl

    plopl

    0

    11

    /1/== (1.2.2.3.)

    b) Indicatorii relativi de structur au drept scop caracterizarea raportului de mrime dintregrupele funcionale i ansamblul colectivitii. Se pot determina numai n situaia n care colectivitateastatistic a fost separat pe grupe, n funcie de una sau mai multe caracteristici de grupare. Numite npractic i greuti specificesau ponderi, mrimile relative de structur compar volumul unei grupecu volumul colectivitii din care face parte i se exprim, de regul, n procente.

    Este uor de intuit faptul c putem determina mrimi relative de structur numai n situaia n carecolectivitatea general a fost separat n cel puin dou grupe funcionale.

    nsumnd toate mrimile relative de structur ce pot fi calculate se va obine nivelul 1 sau 100(cnd sunt calculate n procente) n virtutea observaiei c ntregul este suma prilor componente.

    Exemplu:Personalul primriei municipiului Z este format din 120 angajai cu contract pe perioadnedeterminat, din care 30 de salariai cu studii elementare, 40 salariai cu studii medii i restul de 50 desalariai cu studii superioare.

    Se urmrete stabilirea ponderii personalului cu studii elementare, medii i superioare n totalulpersonalului. Se impune deci determinarea unor mrimi relative de structur, astfel:

    %0,25100120

    30100 ===

    NNg

    t

    e

    e

    %33,33100120

    40100 ===

    NNg

    t

    m

    m

    %67,41100120

    50100 === NNg t

    ss

    n care:Ne = efectivul personalului cu studii elementare;Nm = efectivul personalului cu studii medii;Ns = efectivul personalului cu studii superioare;Nt = efectivul total al personalului.

  • 8/3/2019 Curs Prelucrarea Statistic A

    5/25

    ggg sme ,, = ponderea personalului cu studii elementare, medii i superioare n totalulpersonalului primriei.

    c) Mrimile relative de intensitate sunt utilizate n analiz n scopul msurrii intensitii cucare se manifest diversele fenomene social-economice, a densitii, frecvenei de apariie sau gradului derspndire a evenimentelor subscrise unor entiti ntre care exist legturi de intercondiionare.

    Mrimile relative de intensitate se exprim n uniti concrete de msur, ntruct cele douelemente care se compar au coninut distinct, spre deosebire de celelalte mrimi relative care,calculndu-se din indicatori cu aceleai coninut, se exprim prin intermediul unor valori abstracte.

    n cele mai multe cazuri, mrimile relative de intensitate pot fi interpretate ca valori medii,determinate la nivelul ntregii colectiviti statistice sau la nivelul unor subcolectiviti.

    Mrimile relative de intensitate au cea mai larg rspndire n statistic, abordnd o gam variatde aspecte din realitatea social-economic (producia diverselor produse pe un locuitor, productivitateamuncii, cursul de schimb valutar, indicatorii eficienei folosirii activelor fixe, nzestrarea tehnic a munciii, nu n ultimul rnd, indicatorii utilizai n analiza intensitii fenomenelor demografice).

    d) Mrimile relative ale dinamicii caracterizeaz evoluia n timp a fenomenelor social-economice. Sunt cunoscute i sub denumirea de ritmuri de cretere (indici de dinamic) i se determinca raport ntre nivelul fenomenului n perioada curent i nivelul aceluiai fenomen ntr-o perioad

    anterioar, numit perioad (moment) de referin. Datele ce descriu evoluia n timp a unui fenomenformeaz o serie dinamic (cronologic).Avnd n vedere baza de comparare (numitorul raportului) mrimile relative ale dinamicii pot fi:mrimi relative ale dinamicii cu baz fix;mrimi relative ale dinamicii cu baz mobil(n lan).n cazul mrimilor cu baz fix, de regul se compar nivelul indicatorului, specific fiecrei

    perioade, cu nivelul din primul an al perioadei.Corespunztor pentru calculul mrimilor relative cu baz mobil (n lan), se raporteaz nivelul

    indicatorului, din fiecare perioad, la nivelul aceluiai indicator, din anul precedent.Exemplu:n perioada 2000-2003, n localitatea A, consumul casnic de ap potabil a evoluat astfel:

    Anul calendaristic Consum casnic de ap potabil (mii m3)2000200120022003

    1800182018401900

    Considernd c n perioada analizat efectivul populaiei localitii nu s-a modificat semnificativ,pentru caracterizarea dinamicii consumului de ap potabil se pot determina:

    Mrimi relative ale dinamicii (%)Cu baz fix:

    %1001001800

    18002000/2000

    ==I

    %1,10110018001820

    2000/2001==I

    %2,1021001800

    18402000/2002

    ==I

    %6,1051001800

    19002000/2003

    ==I

    Cu baz mobil (n lan):

  • 8/3/2019 Curs Prelucrarea Statistic A

    6/25

    %1,1011001800

    18202000/2001

    ==I

    %1,1011001820

    18402001/2002

    ==I

    %3,1031001840

    1900

    2002/2003

    ==

    I

    Se poate constata faptul c produsul indicilor cu baz mobil este identic cu indicele cu baz fixal ultimului an din serie (cu exprimarea indicilor n cifre absolute).

    e) Mrimile relative de coordonarese determin n scopul caracterizrii raportului de mrimedintre dou grupe ale aceleiai colectiviti statistice sau dintre fenomene de acelai fel situate n spaiidiferite.

    Astfel, raportul dintre efectivul populaiei de sex masculin i cel al populaiei de sex feminin(raport de masculinitate) este de fapt o mrime relativ de coordonare, ntruct, efectivul total alpopulaiei este format din cele dou subcolectiviti:

    100=PP

    rF

    M

    m (1.2.2.4.)

    n care:rm = raportul de masculinitate;PM = efectivul persoanelor de sex masculin;PF= efectivul populaiei de sex feminin.Tot mrime relativ de coordonare este i raportul dintre consumul de carne pe locuitor n dou

    judee sau raportul care descrie producia unor produse pe locuitor n cadrul a dou ri.Mrimile relative de coordonare ce servesc la comparaiile ntre regiuni ale rii sau ntre diferite

    ri se numesc i indici teritoriali. nainte de a fi determinai trebuie s ne asigurm decompatibilitatea metodologiei de culegere i prelucrare a datelor statistice.

    ** *

    Mrimile relative au o larg rspndire n cadrul metodelor de prelucrare a informaiei statistice.Utilitatea lor n analiza statistic este condiionat de respectarea cerinelor privind comparabilitatea,pentru a se putea evita concluziile eronate.

    1.2.3. INDICATORII TENDINEI CENTRALE

    Spre deosebire de fenomenele naturii, supuse legilor fizicii (deterministe), fenomenele social-economice evolueaz n conformitate cu legitile statistice, au caracter aleatoriu i, ca urmare, pot fidescrise prin intermediul conceptelor teoriei probabilitilor. n acelai timp, fenomenele social-economice au caracter de mas, ceea ce este esenial i stabil putnd fi cunoscut numai prin analiza unuinumr mare de cazuri individuale (legea numerelor mari).

    Sintetizarea elementelor de stabilitate, cunoaterea esenei fenomenelor, a laturii calitative a

    acestora, a ceea ce este obiectiv, comun i stabil n modul de manifestare a fenomenelor i proceselorsocial-economice se realizeaz, ntr-o msur hotrtoare, prin intermediul indicatorilor tendinei centrale:indicatorii medii i indicatorii de poziie.

    1.2.3.1. Indicatorii medii

    Media statistic sintetizeaz ntr-un singur nivel reprezentativ tot ceea ce este tipic, esenial,comun i obiectiv n ansamblul de evenimente individuale, ce definesc coninutul unui anumit fenomensocial-economic supus analizei statistice. Media se exprim n uniti concrete de mrime, identice cu cele

  • 8/3/2019 Curs Prelucrarea Statistic A

    7/25

    n care se exprim caracteristica al crei nivel mediu urmrim s l determinm. Cu toate acestea ea arecaracter abstract, numai ntmpltor nivelul mediu poate s coincid cu una din variantele caracteristicii.

    Caracterul abstract al mediei nu exclude coninutul real al acesteia, asigurat ndeosebi prinrespectarea principiilor reprezentativitii, al omogenitii colectivitii statistice investigate, chiar dacuneori suntem obligai la prelucrri suplimentare, de structurare n subcolectiviti relativ omogene, acolectivitii generale.

    n funcie de natura fenomenului cercetat, de modul n care informaiile necesare sunt disponibile,nivelul mediu al caracteristicii se determin ca medie aritmetic, armonic, ptratic sau geometric etc.innd seama de forma de repartizare a frecvenelor, media se calculeaz ca medie simpl sauponderat. Mediile simple se calculeaz atunci cnd numrul variantelor caracteristicii coincide cunumrul unitilor colectivitii, deci fiecare variant are apariie singular, sau cnd frecvena de apariiea tuturor variantelor este identic.

    n situaia cnd ntlnim frecvene de apariie diferite pentru diversele niveluri individuale alecaracteristicii, nivelul mediu se determin ca medie ponderat.

    Media aritmetic

    Este cea mai utilizat n practica statisticii. S considerm nivelurile individuale ale caracteristicii

    X, nregistrate n procesul observrii, ca fiind: x1, x2, ., xn. Nivelul totalizat al caracteristicii se obineprin nsumare, obinndu-se

    =

    n

    1iix .

    Nivelul mediu al caracteristicii se obine prin mprirea nivelului totalizat la numrul unitilorcolectivitii:

    nx

    n

    1iix

    ==

    Exemplu:Consumul lunar de energie electric (kw/h) al unei familii, n cursul semestrului Ial anului 2004, a variat astfel:

    Luna ianuarie februarie martie aprilie mai iunieConsum de energie electric (xi) 98 92 86 78 82 70

    Consumul mediu lunar de energie electric se obine astfel:

    h/kw33,846

    506

    6

    708278869298x ==

    +++++=

    Se recomand ca pentru calculul mediei, valorile individuale s fie ordonate dup mrime,evident media nemodificndu-i coninutul sau nivelul:

    h/kw33,846

    506

    6

    989286788270x ==

    +++++=

    n acelai fel se putea calcula consumul mediu lunar dac am fi cunoscut direct consumul total deenergie electric pe semestrul I:

    h/kw33,846

    506

    x == Rezult c media aritmetic simplse recomand a fi utilizat n dou situaii:cnd numrul nivelurilor individuale ale caracteristicii este identic cu numrul unitilor

    colectivitii;cnd se cunoate nivelul totalizat al caracteristicii ( xi) i volumul colectivitii (n).

    Media aritmetic ponderat

  • 8/3/2019 Curs Prelucrarea Statistic A

    8/25

    Situaiile n care apelm la media aritmetic simpl sunt relativ rare n practic. n majoritateacazurilor, colectivitatea statistic de dimensiuni mari, face ca aceleai niveluri individuale alecaracteristicii s se nregistreze simultan la dou sau mai multe uniti ale colectivitii. Tot dimensiuneacolectivitii impune, de multe ori, s apelm la gruparea variantelor pe anumite intervale, egale sauinegale, funcie de specificul i coninutul real al fenomenului studiat. n ambele situaii se va determinamedia aritmetic ponderat, ca indicator al centrului de grupare (tendina central).

    Relaia de calcul pentru media aritmetic ponderat este:

    =

    =

    =

    K

    jj

    K

    jjj

    n

    nxx

    1

    1 n care

    xj = nivelurile individuale ale caracteristicii (variantele caracteristicii)nj= frecvena de apariie a diverselor variante ale caracteristicii.

    Exemplu:Pentru exemplificarea modului de calcul al mediei aritmetice ponderate s considerm c n

    cadrul unui oficiu de impozite i taxe, n cele 65 zile lucrtoare ale trimestrului III s-au ncasat zilnic

    sume cuprinse ntre 20 i 34 milioane lei, aa cum rezult din tabelul de mai jos.

    Suma

    ncasrilor(mil. lei)

    (xj)

    Nr. de zile n care s-au

    nregistrat ncasri la niveluldatelor din coloana anterioar

    (nj)

    Produsul dintre valorile

    individuale i frecvenacorespunztoare

    (xj nj)

    20 2 4021 2 4222 3 6623 4 9224 4 9625 5 12526 8 2280 1 2

    27 12 32428 8 22429 6 17430 4 12031 3 9332 2 6433 1 3334 1 34

    Total 65 zile 1755

    Pe baza datelor se poate calcula:

    2765

    1755

    112.....................322

    134133232...........322221220x ==

    +++++++++++

    = mil. lei

    Putem afirma c, n medie, n fiecare zi a trimestrului III s-au ncasat 27 milioane lei.Datele prezentate anterior pot fi grupate pe intervale de variaie, tabelul devenind mai inteligibil,

    ocupnd un spaiu mai redus i fcnd posibil o reducere a calculelor necesare. Gruparea pe intervale seutilizeaz mai ales cnd dimensiunea colectivitii statistice este foarte mare. Media rezultat n urma

  • 8/3/2019 Curs Prelucrarea Statistic A

    9/25

    gruprii informaiilor pe intervale poate s coincid numai ntmpltor cu media calculat pe baza datelornegrupate, apropierea mai mare sau mai mic dintre cele dou medii depinznd de repartiia, mai mult saumai puin uniform, a frecvenelor n cadrul fiecrui interval.

    Rezult deci, c media calculat pentru o serie de intervale trebuie considerat ca o estimaie amediei reale.

    S grupm informaiile referitoare la ncasrile zilnice n cadrul a cinci intervale de grupare, egale

    ca mrime, conform tabelului urmtor.

    ncasrizilnice

    (mil. lei)

    Nr. de zile cu ncasrila nivelul intervalului

    de grupare

    (nj)

    Mijlocul

    intervalului

    (xj)

    Produsul dintre

    mijlocul intervaluluil

    i frecvenacorespunztoare

    (xj* nj)

    20 23* 7 21,5 150,523 26 13 24,5 318,526 29 28 27,5 770,029 32 13 30,5 396,532 35 4 33,5 134,0Total 65 - 1769,5

    * limita inferioar este inclus n interval

    Atunci

    22,2765

    5,1769

    41328137

    45,33135,30285,27135,2475,21x ==

    ++++++++

    = mil. lei

    Evident c nu putem opera, n calculul mediei, cu intervale de valori ci cu niveluri precise alecaracteristicii. Ca urmare se accept presupunerea c nivelul corespunztor mijlocului intervaluluicaracterizeaz ntreg intervalul, presupunere corect n cazul n care valorile se distribuie uniform nlimitele fiecrui interval. Mijlocul intervalului (centrul intervalului) se determin ca medie aritmetic

    simpl a limitelor intervalului

    +

    2maxjminj xx .

    n cazul nostru, media calculat din seria pe intervale estimeaz corect media obinut folosinddatele negrupate (27,22 27), putnd fi asimilat unei operaii de rotunjire spre cifre ntregi. De altfel,este evident faptul c diferena (+ 0,22 mil. lei) reprezint sub 1% din valoarea real a mediei, procent pedeplin acceptabil n analiz. Valoarea strict real a mediei este cea obinut prin calculul folosind datelenegrupate pe intervale.

    Media aritmetic, simpl sau ponderat, se bucur de o serie de proprieti care pot fi utilizate fien scopul verificrii exactitii calculului, fie pentru simplificarea operaiilor de calcul:

    1. Media este cuprins n intervalul delimitat de nivelul minim i nivelul maxim al caracteristicii:xmin

  • 8/3/2019 Curs Prelucrarea Statistic A

    10/25

    axa

    nnx

    j

    jj =

    , pentru seria de frecven

    4. Dac valorile se micoreaz (sau se mresc) de un numr de ori (h ori), atunci i media se vamicora (sau se va mri) de h ori.

    hx

    nh1

    nh x

    xi

    i

    == , pentru seria simpl

    h

    xh

    n

    nx

    j

    j

    j

    =

    , pentru seria de frecven

    5. Dac frecvenele unei serii se modific n acelai sens i n aceeai proporie cu o anumitconstant c, media nu se modific:

    x

    c

    1c

    1

    c

    c

    n

    nx

    n

    nx

    n

    nx

    j

    jj

    j

    jj

    j

    j

    j

    ===

    Aceast proprietate ne ajut s calculm media cu ajutorul frecvenelor relative, obinute din

    raportul:

    =n

    nf

    j

    j

    j, deci raportnd frecvenele absolute alefiecrei variante a caracteristicii la totalul

    frecvenelor (suma frecvenelor).Frecvenele relative sunt de fapt mrimi relative de structur, indicnd greutatea specific

    determinat prin raportarea volumului fiecrei grupe (interval de grupare) la volumul ntregii colectiviti.Relaia de calcul pentru media aritmetic, cu utilizarea frecvenelor relative este:

    = fx jjx n care: =

    n

    nf

    j

    j

    j

    Este evident faptul c 11 ==K

    jjf , ntruct ntotdeauna suma prilorva echivala cu ntregul.

    n exemplul anterior, vom determina media aritmetic pe baza frecvenelor relative. Datelenecesare calculului sunt prezentate n tabelul urmtor:

    ncasrizilnice

    (mil. lei)

    Nr. de zile cu

    ncasri lanivelul

    intervalului de

    grupare (nj)

    Mijlocul

    intervalului

    (xj)

    Frecvenarelativ (fj)

    Produsul dintre

    mijlocul

    intervalului ifrecvena relativ

    (xj* fj)

    20 23* 7 21,5 0,108 2,322023 26 13 24,5 0,200 4,9000

    26 29 28 27,5 0,431 11,852529 32 13 30,5 0,200 6,100032 35 4 33,5 0,061 2,0435Total 65 - 1,000 27,2180

    * limita inferioar este inclus n interval

    Nivelul mediu zilnic al ncasrilor este tot de 27,22 mil. lei (aproximativ 27 mil. lei).Proprietilor mediei aritmetice prezentate anterior li se poate aduga alte cteva consideraii:

  • 8/3/2019 Curs Prelucrarea Statistic A

    11/25

    definiia dat mediei aritmetice este adevrat numai dac se opereaz cu valori individualenumerice. Pentru o serie cu valori nenumerice sau cu valori msurabile pe o scal calitativ, nuse poate determina media aritmetic;

    mrimea mediei aritmetice este unic; o anumit serie nu posed mai multe medii aritmetice;mrimea medie poate s coincid sau nu cu un nivel individual din seria pentru care se

    calculeaz;

    nainte de calculul mediei aritmetice se recomand s se elimine valorile ab erante, adic acelevalori care se detaeaz mult fa de nivelurile rezonabile ale seriei statistice1

    Folosind proprietile de micorare a valorilor individuale cu un anumit numr (a) i de un anumitnumr de ori (h), se poate efectua calculul simplificat al mediei aritmetice.

    .

    Calculul mediei aritmetice ntr-o serie de frecven cu intervale egale poate fi mult simplificatapelnd la proprietile mediei precizate la punctele 3 i 4. Variantele caracteristicii vor fi micorate:

    prin scderea unei constante a din fiecare termen al seriei;prin micorarea de h ori a fiecrui termen.n urma celor dou operaiuni de micorare a termenilor i media se va micora de h ori i cu

    dimensiunea constantei a. Revenirea la media corect necesit amplificarea mediei determinate princalcul simplificat cu constanta h i adugarea la aceast valoare a constantei a, adic:

    ahh

    a

    xn

    nx

    j

    j

    j

    +

    =

    Constantele a i h se stabilesc n aa fel nct s se obin maxim de randament n calcul.Dac seria de variaie are intervale egale, se recomand s se considere drept constant a

    centrul intervalului cu frecvena cea mai mare i care deine, de regul, poziia central n serie, iar dreptconstant h, mrimea intervalului.

    Respectnd aceste recomandri, calculul expresieih

    axj , devine o operaiune de rutin: n

    dreptul intervalului ce a furnizat constanta a se va nscrie cifra 0, intervalele anterioare primind

    consecutiv cifrele 1, -2, -3 .a.m.d., iar intervaleleurmtoare, cifrele 1, 2, 3 .a.m.d. Noile variante reduse vor fi nmulite cu frecvenele reale, suma produselor astfel obinuteurmnd a fi mprit la totalul unitilor colectivitii. Media micorat va fi multiplicat, aa cum s -aprecizat, cu constanta h i i se va aduga constanta a pentru a afla valoarea real a mediei.

    Ilustrm calculul simplificat al mediei folosind datele din exemplul anterior:

    ncasrizilnice

    (mil. lei)

    Centrul

    intervalului

    (xj)

    Nr. de zile cu ncasri lanivelul intervalului de

    grupare (nj)h

    axj n

    xj

    j

    h

    a

    20 23* 21,5 7 -2 -1423 26 24,5 13 -1 -1326 29 27,5 28 0 0

    29 32 30,5 13 1 13* limita inferioar este inclus n intervala = 27,5 (mijlocul intervalului cu frecvena cea mai mare)h = 3

    1S considerm seria: 2, 4, 5, 7, 9, 100. Este evident faptul c valoarea 100 este aberant, detandu-se din zonavalorilor normale ale caracteristicii. Ca urmare, va fi eliminat din calcul.

  • 8/3/2019 Curs Prelucrarea Statistic A

    12/25

    22,275,27365

    6x =+

    = mil. lei

    S verificm dac valorileh

    axj sunt corect determinate prin operaia de rutin adoptat,

    efectund calculele pentru intervalul 29 32:

    133

    35,275,30

    3h5,30xj ==

    ==

    Menionm faptul c originea variaiei a fost stabilit astfel nct s se obin situaia cea maifavorabil calculului, dar opiunea putea fi orientat spre oricare dintre intervale. Imperativ este alocareanivelului 0 n dreptul intervalului ales drept origine a variaiei.

    Media caracteristicii alternative

    ntlnim n viaa social i n economie situaii n care putem s ne exprimm asupra poziiei uneicaracteristici exclusiv n dou modaliti: bun -ru; corespunztor necorespunztor etc. Caracteristicileaparinnd unei asemenea clase se numesc caracteristici alternative.

    Pentru a putea determina nivelul mediu al caracteristicii alternative s-a convenit asupra adoptriiunei soluii de compromis: se vor nota cu cifra 1 acele uniti ale colectivitii care rspund ntrebriimijlocite de scopul calculului nivelului mediu i cu cifra 0 n cazul nonrspunsului.

    Exemplu:Presupunem c se efectueaz un control de calitate pentru un lot de piese fabricate.Piesele controlate vor fi ncadrate n categoria corespunztor sau rebut, funcie de moduln care se ncadreaz n standardele de calitate. n final, ntregul lot de piese va fi separat ndou pri: un numr de piese corespunztoare calitativ i un numr de piese consideraterebut.

    Ne ntrebm care este nivelul mediu al pieselor corespunztoaren ntreg lotul? innd seamade scopul urmrit vom nota piesele corespunztoare cu cifra 1 i produsele rebut cu cifra 0. Frecvenade apariie a acestora este indicat n tabelul de mai jos:

    Variantele caracteristicii(xi) Numr de piese(nj)Corespunztor = 1

    Necorespunztor = 0955

    Total 100 piese

    ( ) ( )%95sau95,0

    100

    95

    595

    50951x

    n

    nx

    j

    jj==

    +

    +==

    Se poate afirma c media aritmetic a unei caracteristici alternative reprezint, de fapt, greutateaspecific a unitilor colectivitii pentru care s-a nregistrat varianta 1 (da).

    Dac notm cu p media caracteristicii alternative, cu N numrul de uniti care posed

    caracteristica, cu M numrul de uniti care nu posed caracteristica, atunci relaia de calcul a medieicaracteristicii alternative va fi:

    MN

    Np

    += n care N+M = totalul unitilor colectivitii.

    De obicei, media caracteristicii alternative se exprim n procente.Este evident faptul c, putem determina i ponderea unitilor care nu posed caracteristica:

    MN

    Mq

    += n care:

  • 8/3/2019 Curs Prelucrarea Statistic A

    13/25

    q = ponderea unitilor care nu posed caracteristican cazul nostru:

    %9595,0100

    95

    595

    95p ===

    +=

    %505,0

    100

    5

    595

    5q ===

    +

    =

    Se observ uor c:p+q = 0,95 + 0,05 = 1,00, relaie care va fi regsit obligatoriu n cazul caracteristicii alternative.

    1.2.3.2. Indicatorii de poziie

    n ansamblul indicatorilor tendinei centrale, pe lng medie, se utilizeaz i aa numiiiindicatori de poziie, n rndul crora cei mai cunoscui sunt modululi mediana.Aceti indicatorisunt considerai, la fel ca i media, valori tipice.

    Din analiza concomitent a mediei, modulului i medianei se pot trage concluzii asupra formeirepartiiei (simetric sau asimetric). n cazul repartiiilor simetrice, cu predilecie a repartiiei normale(clopotul lui Gauss), media are o puternic semnificaie i prezint un grad ridicat de ncredere, ca

    indicator al centrului de grupare. n cazul repartiiilor asimetrice (cu asimetrie stnga sau dreapta) esteutil asocierea modulului sau medianei, indicatori care pot avea utilitate mai ridicat n analiz,comparativ cu media.

    De altfel, n cazul repartiiei normale valoarea celor trei indicatori este foarte apropiat, aceastaconstituind i un criteriu rapid de apreciere a formei repartiiei statistice.

    Modulul (Moda)

    Valoarea modal a caracteristicii (valoare dominant sau cea mai probabil) reprezint aceavaloare a caracteristicii ce corespunde celui mai mare numr de uniti din cadrul colectivitii (nivelulcaracteristicii cu frecvena cea mai mare).

    Se consider seria: {4, 4, 5, 5, 5, 6, 6, 7}. Se constat c valoarea 5 apare de cele mai multe ori

    (frecvena = 3). Deci, modulul va fi 5.n cazul seriilor discrete, valoarea modal se identific uor, printr-o simpl examinare acuplurilor de valori {xj, nj}

    2

    n practica statisticii ntlnim cel mai des serii de repartiie cu intervale egale. n aceste cazuripentru determinarea valorii modale sunt necesare urmtoarele etape i operaiuni:

    . Dac frecvena cea mai ridicat se regsete n cadrul a dou niveluriconsecutive ale caracteristicii, atunci valoarea modal se determin ca medie aritmetic simpl a celordou variante, sau se consider c avem de-a face cu un interval modal, situaie n care apelm la ometod de calcul specific seriei de frecvene cu intervale.

    se identific intervalul (grupa sau clasa) cu frecvena cea mai mare, denumit interval modal. ncadrul acestuia se va regsi modulul.

    Estimarea valorii modalese poate face n dou variante:a) dac n cadrul intervaluluimodal frecvenele sunt simetric sau aproximativ simetric distribuite,

    atunci putem considera mijlocul intervalului modal ca reprezentnd modulul(media aritmetic simpl alimitelor minim i maxim ale intervalului modal).b) dac repartiia frecvenelor n intervalul modal nu este simetric (acesta este cazul cel mai des

    ntlnit n realitate), atunci modulul se determin innd seama de locul ocupat de acesta n intervalulmodal, de frecvena intervalului anterior celui modal i de frecvena n intervalul imediat urmtor.

    Relaia de calcul este urmtoarea:

    2Este evident faptul c putem vorbi de modul numai n cazul seriilor cu frecvene. n cazul seriilor simple nu apare valoaremodal.

  • 8/3/2019 Curs Prelucrarea Statistic A

    14/25

    +

    +=21

    1o hxM jj

    momo

    n care:

    Mo = modulul (moda);xj

    mo

    = limita inferioar a intervalului modal;

    hjmo = mrimea intervalului modal xx mominmax 1 = diferena dintre frecvena intervalului modal i frecvena intervalului anterior;2 = diferena dintre frecvena intervalului modal i frecvena intervalului urmtor.

    Calculul are n vedere distribuia frecvenelor n intervalul modal, n conformitate cu o parabolde gradul 2, situaie frecvent ntlnit n practic.

    Exemplu: S ilustrm calculul modulului n situaia repartiiei ncasrilor zilnice aletaxelor i impozitelor. Informaiile i operaiunile necesare calculului valorii modale se regsescn tabelul urmtor:

    ncasri zilnice(mil. lei)

    xj

    Numr de zile cu ncasri lanivelul intervalului de grupare

    (nj)

    Identificarea

    intervalului modal

    20 23* 723 26 13

    **26 29 28 ** interval modal29 32 1332 35 4Total 65

    * limita inferioar este inclus n interval1 = 28 13 = 152 = 28 13 = 15ntmpltor1 = 2.

    5,275,1261515

    15326Mo =+=+

    += mil. lei

    Se cuvin cteva observaii: asemntor modulului se definete valoarea antimodal, ca valoare a caracteristicii cu frecvena cea

    mai mic (cea mai puin probabil); dac se construiete graficul funciei de frecven (histogram sau poligonul frecvenelor) valoarea

    modal corespunde punctului de maxim al curbei frecvenelor;

    modulul este indicatorul centrului de grupare a crui determinare este cea mai simpl i deci cea mairapid; se pot ntlni i serii de repartiie multimodale. ncercarea de sintetizare a unei singure valori modale

    (eventual ca medie aritmetic simpl) nu are semnificaie; dac suntem n prezena unei serii cu frecvene relative (fx), calculul modulului nu difer de maniera

    de calcul prezentat anterior; n studii de pia (de exemplu, numrul cel mai des solicitat pentru nclminte), modulul constituie

    indicatorul de poziie cu gradul de utilitate cel mai ridicat.

  • 8/3/2019 Curs Prelucrarea Statistic A

    15/25

    Mediana (Me)

    Cunoscut i sub denumirea de cuartil de ordinul 2, medianareprezint valoarea caracteristiciice ocup locul central n seria de valori individuale, aranjate n ordine cresctoare sau descresctoare. Cualte cuvinte, medianamparte seria n dou pri egale (numrul unitilor cu valori inferioare medianeieste identic cu numrul unitilor cu valori superioare medianei).

    Calculul medianei se efectueaz n mod diferit n cazul seriei simple, cnd numrul variantelorcaracteristicii este identic cu numrul unitilor colectivitii, fa de seria cu frecvene, respectndu-secondiiile ce apar n definiia medianei.

    n cazul seriei simple putem ntlni dou situaii: seria are un numr impar de termeni saunumrul termenilor seriei este par. n ambele cazuri vom opera iniial, o aranjare a termenilor seriei nordine cresctoare sau descresctoare. Dac numrul termenilor seriei este impar, aflarea medianei estesimpl putndu-se identifica uor termenul ce deine locul central n serie. Valoarea caracteristiciicorespunztoare acestui termen este tocmai valoarea medianei.

    n cazul seriilor cu numr par de termeni, locul medianei se regsete ntre doi termeni alturai,situai la mijlocul seriei. Mediana se va calcula, n acest caz, ca medie aritmetic simpl a celor doitermeni.

    Exemplu: Dou echipe de muncitori planteaz puiei de brad. Prima echip este formatdin 5 muncitori, iar a doua echip din 6 muncitori, avnd realizri zilnice ca n tabelulurmtor:

    Muncitorul A B C D E F

    Nr. de puiei plantai zilnicde ctre un muncitor

    Echipa 1 9 6 7 8 5 -Echipa 2 9 4 5 7 8 3

    Pentru echipa 1, valorile caracteristicii aranjate n ordine cresctoare de mrime, formeaz seria:5, 6, 7, 8, 9

    Me

    Este uor de observat faptul c xme = 7.n cazul celei de-a doua serii valorile caracteristicii aranjate n ordine cresctoare sunt:3, 4, 5, 7, 8, 9

    Me

    n aceast situaie locul medianei cade ntre cel de-al treilea termen i termenul al patrulea. naceast situaie:

    62

    75Me =

    +=

    n primul caz, numrul de ordine al termenului ce corespunde medianei s-a stabilit prin raportul

    2

    1n +.

    Locul medianei, n cel de-al doilea caz, implic termenii de rang2

    ni 1

    2

    n+ .

    n cazul seriei cu frecvene, situaie cel mai des ntlnit n practic, respectnd ntrutotul definiiamedianei, calculul acesteia presupune urmtoarele operaii succesive: seria trebuie aranjat n ordine cresctoare a valorilor individuale ale caracteristicii (intervalelor de

    valori);

  • 8/3/2019 Curs Prelucrarea Statistic A

    16/25

    dac seria este o serie pe variante, se determin locul medianei n serie prin raportul2

    1nj + i

    corespunztor acestui loc, se identific valoarea caracteristicii, mrimea acesteia fiind de faptmediana;

    dac suntem n prezena unei serii de variaie cu intervale, sunt necesare unele operaii suplimentare: se determin intervalul median, corespunztor primei frecvene cumulate care depete

    2

    1nj + ;

    n cadrul intervalului median, valoarea medianei se determin prin interpolare, n bazaurmtoarei relaii:

    ( )n

    nn

    hxMe

    Me

    Me

    j

    mpj

    Mej

    ++=

    1

    2

    1

    n care:x

    Mej= limita inferioar a intervalului median;

    hMe = mrimea intervalului median;min

    maxMe

    Me

    jjxx

    n mp = suma frecvenelor precedente intervalului median;njMe = frecvena intervalului median.

    Calculul presupune repartiia uniform a frecvenelor n intervalul median.Exemplificm modul de calcul al medianei relund aplicaia practic referitoare la volumul

    ncasrilor zilnice pentru impozite i taxe:

    ncasrizilnice (mil.

    lei) xj

    Numr zile cuncasri la nivelul

    intervalului de

    grupare (nj)

    Frecvenacumulatcresctor nj

    Identificarea

    intervalului median

    20 23 7 723 26 13 20* 26 29 28 48 * interval median

    29 33 13 6132 35 4 65Total 65 -

    xMej

    = 26

    hMe

    = 3

    n mp = 20n

    Mej= 28

    Locul medianei n serie ( ) 332

    16512

    1 =+=+nj , indicnd faptul c mediana se regsete n

    intervalul 2629.

    39,2728

    3926

    28

    13326

    28

    2033326 =+=+=

    +=Me

    Sunt necesare cteva precizri suplimentare: n cazul utilizrii frecvenelor relative (fx) calculul medianei este similar celui prezentat anterior; mediana, ca indicator de poziie, nu are semnificaie n cazul n care seria este structurat n subgrupe

  • 8/3/2019 Curs Prelucrarea Statistic A

    17/25

    omogene, funcie i de alte caracteristici de grupare; spre deosebire de medie, valoarea medianei nu este afectat de valorile extreme ale seriei; asemntor calculului medianei se pot determina i alte cuartile, prezentnd un intens mai mare

    cuartile (cuartile de ordinul 4), care separ seria n patru subgrupe cu frecvene egale. Mediana este,de fapt, cea de-a doua cuartil.

    localizarea, n cadrul seriei, a valorilor mediei, medianei i modulului ofer informaii asupra formeidistribuiei caracteristicii analizate:dac MeMox == , atunci suntem n prezena unei repartiii simetrice;n cazul unei distribuii unimodale uor asimetrice, frecvenele sunt deplasate ntr-o parte sau

    alta. Conform unor observaii empirice, ntr-o asemenea situaie, ntre cei trei indicatori aitendinei centrale exist urmtoarea relaie:

    ( )MexMox = 3 folosirea unuia sau altuia dintre indicatorii tendinei centrale depinde de analiza calitativ a

    fenomenului. n seriile puternic asimetrice, mediana este mai semnificativ dect media.

    1.2.4. INDICATORII VARIAIEI

    Indicatorii tendinei centrale (media, mediana i modulul) sunt insuficieni pentru caracterizareacorect a unui fenomen economic sau social. Deci, aa cum sugereaz nsi denumirea lor, acetiasintetizeaz tendina de aglomerare a variantelor caracteristicii spre un anumit nivel tipic, stabil iesenial, singuri nu asigur investigarea complet a fenomenului. Se poate demonstra i este uor de intuitc pot exista serii n cadrul crora att media, mediana i modulul nu se difereniaz semnificativ i totuistructura intern este net diferit. Concentrarea spre centrul de grupare se poate realiza ntr-o serieomogen, fr diferenieri notabile n cmpul variaiei caracteristicii, dar se poate realiza i ntr-o serie devariaie cu mprtiere mare a valorilor caracteristicii.

    O imagine relativ complet asupra unor serii de variaie se poate obine dac indicatorii centruluide grupare sunt completai de aa-numiii indicatori ai variaiei, care au scopul de a msura tocmaivariaia nivelului caracteristicii n interiorul colectivitii. O colectivitate statistic este cu att maiomogen cu ct variaian interiorul ei este mai redus. Nivelul variaiei trebuie s primeasc ns o

    expresie cantitativ, pe ct posibil sintetic.Indicatorii variaieise mpart n dou categorii: indicatorii simpli ai variaiei; indicatorii sintetici ai variaiei.

    Acestora li se adaug indicatorii asimetriei i concentrrii.

    1.2.4.1. Indicatorii simpli ai variaiei

    n cadrul indicatorilor simpli ai variaiei prezint interes: amplitudinea variaiei; abaterile termenilor seriei de la media lor; abaterea intercuartilic.

    Toi aceti indicatori pot fi exprimai n mrimi absolute sau relative.Amplitudinea variaiei se calculeaz ca diferen ntre nivelul maxim i nivelul minim alcaracteristicii investigate, n cadrul seriei de valori ce servete acestui scop:

    xxAminmax

    = (amplitudine absolut)

    100% minmax

    =x

    xxA (amplitudine relativ)

    Amplitudinea absolut se exprim n aceeai unitate de msur n care este exprimatcaracteristica. Ca urmare, nu poate fi folosit dect pentru seriile ce se refer laaceeai variabil.

  • 8/3/2019 Curs Prelucrarea Statistic A

    18/25

    Compararea variaiei unor variabile diferite referitoare la aceeai colectivitate statistic impuneutilizarea amplitudinii relative a variaiei. Aceasta se exprim, de regul, n procente fa de nivelul mediual caracteristicii. Cu ct amplitudinea relativ este mai mic cu att colectivitatea este mai omogen.

    Avantajul nivelului unic al abaterii absolute i relative pentru ntreaga serie este diminuat defaptul c aceti indicatori in seama numai de valorile extreme, fcndu-se abstracie de repartiia valorilorntre aceste niveluri. Aceast deficien poate fi parial ameliorat prin calculul abaterilor fiecruitermen al seriei de la nivelul mediu. Se pot calcula: abateri individuale absolute:

    xxdii=

    abateri individuale relative:100%

    =

    x

    xxd i

    i

    ntr-o serie mare, numrul abaterilor termenilor de la media lor este consistent, ceea ce constituieun serios handicap. De aceea se determin i se utilizeaz n analiz abaterea maxim pozitiv iabaterea maxim negativ.

    xxdpoz

    =max..max

    , n expresie absolut

    100max.%.max

    =x

    xxdpoz

    , n expresie relativ

    Asemntor se determin abaterea maxim negativ:xxd

    neg=

    min.max, n expresie absolut

    100x

    xxd

    min

    .%neg.max

    = , n expresie relativ

    Abaterea intercuartilic, exprim diferena dintre valorile caracteristicii corespunztoarecuartilelor de diverse grade. Prezint importan ndeosebi abaterile intercuartilice:

    2323 QQxxQQ =

    1212 QQ xxQQ =

    1313 QQxxQQ =

    Abaterile intercuartilice se exprim n aceleai uniti de msur n care este exprimatcaracteristica.

    Spre deosebire de amplitudinea variaiei, abaterile intercuartilice prezint avantajul c evitvalorile individuale extreme, ofer informaii asupra concentrrii valorilor individuale i pot servi analizeiasimetriei distribuiilor.

    Ca i amplitudinea variaiei, abaterile intercuartilice nu pot fi utilizate n calcule algebrice.Se poate determina i un raport ntre abaterile intercuartilice i amplitudinea variaiei, cu

    exprimare n procente. Interes mai mare pentru exprimarea gradului de concentrare prezint raportul:

    10013

    A

    QQ

    Cu ct acest raport este mai mic, cu att concentrarea n seria de variaie este mai mare.

    1.2.4.2. Indicatorii sintetici ai variaiei

    Aa cum arat denumirea, aceti indicatori au menirea s ofere o imagine sintetic a mprtierii(dispersrii) valorilor caracteristicii, innd seama de toi termenii seriei.

  • 8/3/2019 Curs Prelucrarea Statistic A

    19/25

    Principalii indicatori sintetici ai variaiei sunt:abaterea medie absolut;variana;abaterea medie ptratic (abatere standard);coeficientul de variaie.Abaterea medie absolut ( )xd , se determin ca medie aritmetic simpl sau ponderat a tuturor

    abaterilor individuale ale caracteristicii de la media lor:

    n

    xxdx

    i = , pentru seria simpl;

    =

    j

    jj

    n

    nxxdx , pentru seria de frecven;

    = fxxdxjj

    , pentru seria cu frecvene relative.

    n calculul abaterii medii absolutenu se va ine seama de semnul algebric (abateri n modul),cunoscnd faptul c suma abaterilor absolute de la nivelul mediu este nul i deci, un calcul care s inseama de semnul abaterilor nu are sens.

    n unele situaii se poate opta pentru determinarea abaterii absolute medii fa de median (M e).Calculul este asemntor cu precizarea c n locul mediei aritmetice simple sau ponderate ( )x se va operacu mediana (Me).

    Sunt necesare urmtoarele precizri: abaterea medie liniar se exprim n aceleai uniti de msur n care este redat caracteristica; prezint dezavantajul c acord aceeai importan att abaterilor mari i abaterilor mici, importan

    diminuat sau amplificat n funcie de frecven; abaterea medie absolut calculat pe baza medianei va fi, de regul, mai mic dect abaterea medie

    absolut, calculat pe baza mediei aritmetice:

    dd xMe

    n cazul seriilor de frecven cu intervale se va lucra cu mijlocul intervalului.Exemplu: S exemplificm calculul abaterii medii absolute folosind lucrarea practic standard:

    ncasrizilnice

    (mil. lei)

    Mijlocul

    intervalului

    Xj

    Numr de ncasricu frecvene la

    nivelul intervalului

    de grupare nj

    Abaterile

    absolute

    xxj

    Produsul

    dintre abateri

    i frecvena

    lorjj

    nxx

    20 23 21,5 7 5,72 40,0423 26 24,5 13 2,72 35,3626 29 27,5 28 0,28 7,8429 32 30,5 13 3,28 42,6432 35 33,5 4 6,28 25,12

    Total 65= jn = 151jj nxx

    22,27=x mil. lei

  • 8/3/2019 Curs Prelucrarea Statistic A

    20/25

    323,265

    151==

    =

    n

    n jxx

    dxj

    jmil. lei

    Putem afirma c oficiul de impozite i taxe a ncasat n cursul trimestrului III, 27,22 mil. leizilnic, cu o variaie medie de 2,323 mil. lei, n plus sau n minus fa de medie.

    Variana3

    Msoar sintetic variaia caracteristicii ca i abaterea medie absolut, dar prin modalitatea decalcul (medie ptratic) acord mai mare importan abaterilor consistente de la nivelul mediu.

    Relaiile de calcul:

    ( )i

    i

    n

    xx

    x

    =

    2

    2 , pentru seria simpl;

    ( )

    =j

    jj

    xn

    nxx2

    2 , pentru seria de frecvene;

    ( ) = jjx fxx2

    , pentru seria cu frecvene relative.

    Operaiunile de calcul, n baza exemplului anterior, sunt prezentate n tabelul urmtor:

    ncasrizilnice

    (mil.

    lei)

    Mijlocul

    intervaluluixj

    Numr de zilecu ncasri la

    nivelul

    intervalului de

    grupare nj

    ( )xxj

    ( )2xxj

    ( )j

    nxjx2

    20 23 21,5 7 -5,72 32,7184 229,028823 26 24,5 13 -2,72 7,3984 96,179226 29 27,5 28 0,28 0,0784 2,195229 32 30,5 13 3,28 10,7584 139,859232 35 33,5 4 6,28 39,4384 157,7536Total - nj = 65 - - 625,0160

    22,27x = mil. lei

    ( )61,9

    65

    016,6252

    2 ==

    =

    n

    nxx

    xj

    jj

    Dac se justific, variana poate fi calculat lund n considerare mediana, n locul medieiaritmetice. ncercarea de exprimare a varianei printr-un coninut concret, nu are sens. Pentrurespectarea principiilor de calcul a mediei ptratice (caracteristica referindu-se n cazul de fa la ptratuldiferenelor dintre valorile individuale i media lor aritmetic) se impune extragerea rdcinii ptraticedin varian.

    3n lucrrile de statistic mai vechi apare sub denumirea de dispersie, ns majoritatea specialitilor consider n prezent c,acesta din urm este un termen generic pentru toi indicatorii ce reflect mprtierea valorilor.

    De asemenea, n statistica matematic variana apare ca moment centrat de ordinul 2.

  • 8/3/2019 Curs Prelucrarea Statistic A

    21/25

    Astfel, se determin unul din cei mai utilizai indicatori ai variaiei cunoscut sub denumirea deabaterea medie ptratic (abaterea standard):

    ( )

    ==

    n

    n

    j

    j

    XX

    xjx2

    2

    n cazul nostru 1,361,9x == mil. lei.

    Referitor la abaterea standardse impun cteva consideraii:- se exprim n aceleai uniti de msur ca i caracteristica, ceea ce reprezint un avantaj notabil

    comparativ cu variana;- abaterea medie ptratic ( )x este mai mare dect abaterea medie absolut ( )dx , n virtutea

    faptului c media ptratic este mai mare dect media aritmetic:

    dxx n cazul nostru 3,1 > 2,323.

    n general, se poate accepta relaia: xx 54

    d

    Analizele statistice prefer utilizarea abaterii standard, deoarece corespunde mai bineconceptelor rezultate din legea normal derepartiie, concepte pe care se bazeaz majoritatea metodelorde prelucrare a informaiei i se preteaz mai bine la calcule algebrice.

    - n cazul n care repartiia statistic respect legea normal sau dac variantele se distribuie cuaproximaie dup legea normal, atunci intervalul + xx xx ; acoper 68,26% din volumulcolectivitii statistice, ajungndu-se ca intervalul + xx 3;3 xx s acopere 99,74% din variaie.

    - cu toate avantajele conferite analizei , abaterea standard nu poate fi utilizat pentru a se faceaprecieri comparative referitoare la variaia unor caracteristici diferite, chiar dac acestea vizeaz unai aceeai colectivitate.

    Metode de calcul simplificat al varianei

    Variana caracteristicii X se poatedetermina i pe baza urmtoarelor relaii:

    xx2

    2i2

    x n= , pentru seria simpl,

    xnnx 2j

    j2j2

    x =

    , pentru seria cu frecvene,

    xfx2

    j2j

    2x = , pentru seria cu frecvene relative.

    Aceste relaii sunt convenabile atunci cnd apelm la facilitile oferite de calculatorul electronic.

    Variana beneficiaz de aceleai proprieti ca i media statistic i care pot fi utilizate n calcululsimplificat:

    - dac abaterile nivelurilor caracteristicii de la media lor se micoreaz de h ori, atunci varianase va micora de h2 ori;

    - dac din nivelurile individuale ale caracteristicii se scade constanta a, iar aceast constantnlocuiete valoarea medie ( )x n relaia de calcul, variana se va mri cu ptratul diferenei dintrevaloarea medie i constanta a;

    - dac micorm frecvenele absolute de un anumit numr de ori, variana nu se modific. Aceast

  • 8/3/2019 Curs Prelucrarea Statistic A

    22/25

    proprietate ne ajut s calculm variana caracteristicii cu ajutorul frecvenelor relative.Folosind aceste proprieti relaiile de calcul simplificat al varianei capt urmtoarea form:

    ( )axhhax

    n

    i

    x

    =22

    2

    2

    , pentru seria simpl

    ( )axhn

    nh

    ax

    22

    j

    j

    2

    2

    x

    j

    = , pentru seria cu frecvene

    ( )axhfh

    ax 22j

    2

    2x

    j

    = ,pentru seria cu frecvene relative.

    Ca i n cazul calculului simplificat al mediei, n cazul seriei de intervale, ndeosebi atunci cndintervalele sunt egale, se recomand s se aleag drept constant a, varianta caracteristicii cu frecvenacea mai mare, iar drept constant h mrimea intervalului, pentru a obine maximum de faciliti.

    Relum calculul simplificat al mediei aritmetice i extinzndu-l n calculul varianei, putemutiliza datele din tabelul de mai jos:

    ncasrizilnice

    (mil.

    lei)

    Centrul

    intervalului

    xj

    Numr de zile cuncasri la

    nivelul

    intervalului de

    grupare (nj)

    h

    axj

    h

    axj

    2

    j

    jn

    h

    ax2

    20 23 21,5 7 -2 4 2823 26 24,5 13 -1 1 1326 29 27,5 28 0 0 029 32 30,5 13 1 1 13

    32 35 33,5 4 2 4 16- - 65 - - 70a = 27,5h = 3x = 27,22

    ( ) 61,9965

    705,2722,27

    22

    x==

    Mrimea varianei este identic cu mrimea calculat iniial.n cazul caracteristicii alternative:

    ( )p1pqp2p == Se ine seama de faptul c:

    p + q = 1 i deci q = 1 - pReamintim coninutul indicatorilor: p = greutatea specific a unitilor care posed caracteristica (rspund afirmativ la ntrebarea

    formulat prin intermediul caracteristicii);q = greutatea specific a unitilor care nu posed caracteristica.Demonstraia calculului varianei caracteristicii alternative este urmtoarea:

    ( ) ( )( ) ( )ppqpqppqqppq

    MN

    Mp

    MN

    Nq

    MN

    MpNpp

    ==+=+=+

    ++

    =+

    += 1

    01 222222

    2

  • 8/3/2019 Curs Prelucrarea Statistic A

    23/25

    Relund exemplul anterior n care:p = 0,95q = 0,05

    0475,005,095,02 ==p

    i corespunztor 22,00475,022 ===pp

    Coeficientul de variaie (omogenitate),se calculeaz ca raport ntre abaterea medie ptratic inivelul mediu al caracteristicii i se exprim, de regul, n procente:

    100=x

    CVx

    x

    Coeficientul de variaieprezint avantajul c face posibil compararea variaiei n cadrul adou sau mai multe colectiviti, pentru fenomene diferite i exprimate n uniti diferite demsur.

    Coeficientul de variaie este considerat cel mai complet indicator al cuantificrii mprtieriivalorilor unei anumite caracteristici, sintetiznd relaia dintre variaie i tendina de concentrare avalorilor caracteristicii, descris prin nivelul mediu. Imaginea omogenitii sau eterogenitiicolectivitii statistice este convingtor redat prin mrimea coeficientului de variaie. Putnd lua numai

    valori pozitive, mai mari ca zero, un nivel ct mai sczut al coeficientului de variaie indic un grad marede omogenitate a colectivitii statistice. De altfel, n practic, se consider c o colectivitate statisticeste relativ omogen, prin prisma uneia sau mai multor caracteristici de variaie, dac nivelulcoeficientului de variaie se situeaz sub 30%.

    Niveluri ale coeficientului de variaie superioare acestui prag semnaleaz eterogenitateacolectivitii i deci necesitatea de a regrupa unitile n grupe tipice, pentru a se obine concluziifundamentate i o descriere corect a fenomenelor social-economice studiate.

    n cazul exemplului nostru, coeficientul de variaie are mrimea:

    %89,1110022,27

    1,3100 ===

    xCV

    x

    x

    Acest nivel, relativ mic, indic un grad de omogenitate ridicat i deci o justificat ncredere nconcluziile desprinse din analiza bazat pe indicatorii centrului de grupare i cei ai variaiei.

    1.2.4.3. Indicatorii de asimetrie

    Pentru aprecierea gradului de ncredere al indicatorilor tendinei centrale i de variaie estenecesar cunoaterea modului n care se distribuie frecvenele n cadrul seriei analizate, cu alte cuvintes definim cu aproximaieforma repartiiei.

    Un grad ridicat de ncredere este justificat pentru repartiia normal, n cazul creia abaterile de lamedie, ntr-un sens sau altul, au aceeai probabilitate de apariie. Cu alte cuvinte repartiia normal secaracterizeaz prin simetrie perfect, frecvenele crescnd uniform pe msur ce ne apropiem de valoareamodal, pentru a descrete n acelai ritm, n cea de-a doua parte a seriei.

    Pentru repartiia normal media, mediana i modulul au aceeai valoare.n practic vom ntlni, relativ rar, cazuri n care repartiia frecvenelor s fie perfect normal,

    datorit aciunii unei multitudini de factori ntmpltori sau a volumului insuficient al informaiilorobinute din observare. Sunt ns i numeroase fenomene care au legic distribuii asimetrice: repartiianscuilor vii dup rang, curbele de fertilitate specific, repartiia cstoriilor n funcie de vrst,repartiia angajailor n funcie de salariu etc.

    Seriile de distribuie pot fi deci simetrice, cu asimetrie spre stnga sau cu asimetrie de dreapta.Asimetrie stnga ntlnim n cazul n care valorile caracteristicii mai mici dect media au frecvene marin prima parte a seriei (partea stng). Asimetrie dreapta se semnaleaz n cazul n care frecvenele mai

  • 8/3/2019 Curs Prelucrarea Statistic A

    24/25

    mari se regsesc pentru nivelurile ce depesc media caracteristicii.Diferite forme de repartiie (vezi figura urmtoare):a) repartiie normal, perfect simetric. Cei trei parametrii ai centrului de grupare Mo,Mex,

    au aceleai valori.b) repartiie cu asimetrie stnga. n acest caz, MoMex . Suprafaa din stnga mediei este

    mai mare.c) repartiie cu asimetrie dreapta. Relaia dintre cele trei valori tipice este urmtoarea:

    MoMex . Suprafaa din dreapta mediei este mai mare.Iat cum se poate prezenta funcia de frecven n cazul repartiiei normale4

    a) b) c)

    MM eox == xMM eo

  • 8/3/2019 Curs Prelucrarea Statistic A

    25/25

    Coeficientul de asimetrie Pearson ofer indicaii nu numai despre forma repartiiei ci i despresemnificaia indicatorilor tendinei centrale.

    Reprezentarea grafic a frecvenelor (histograma sau poligonul frecvenelor) poate ntregiimaginea oferit de coeficientul de asimetrie.

    Indicatorii de asimetrie trebuie avui n vedere n special n interpretarea erorilor de selecie ncadrul observrii selective i n analiza corelaiei statistice.


Recommended