+ All Categories
Home > Documents > Statistica Descriptiva in Excel_1

Statistica Descriptiva in Excel_1

Date post: 16-Dec-2015
Category:
Upload: ana-maria-raluca
View: 51 times
Download: 1 times
Share this document with a friend
Description:
excel
21
Informatica juridicǎ Curs 5 1/21 STATISTICA DESCRIPTIVĂ Analiza seriilor statistice Evaluarea anumitor indicatori (parametri) statistici implică stabilirea caracteristicilor (proprietăŃilor) principale ale seriilor statistice. Acestea sunt: variabilitatea, omogenitatea, independenŃa şi concentrarea/împrăştierea (dispersia) către/faŃă de un una sau mai multe valori ale seriei. Variabilitatea termenilor unei serii statistice este determinată de faptul că fenomenul pe care îl reprezintă nu este univoc determinat, ci apare ca un rezultat al acŃiunii combinate a mai multor cauze (permanente sau întâmplătoare). Cu cât acŃiunea cauzelor întâmplătoare este mai mare, cu atât variabilitatea este mai mare şi gradul de omogenitate mai mic. Omogenitatea presupune o variaŃie minimă între termeni. Dacă în urma analizei se constată că o serie nu prezintă omogenitate, înseamnă că în acest caz colectivitatea este formată din mai multe tipuri calitative şi seria trebuie descompusă în subserii componente. IndependenŃa termenilor unei serii provine din faptul că fiecare valoare individuală reprezintă un element distinct şi obiectiv al unei populaŃii statistice. Termenii ce aparŃin aceleiaşi colectivităŃi se supun aceloraşi legi care se manifestă sub formă de tendinŃă. Concentrarea/împrăştierea (dispersia) către/faŃă de un /una sau mai multe valori ale seriei apare ca rezultat al intensităŃii unui efect produs de cauze esenŃiale şi întâmplătoare. Acest lucru determină frecvenŃele diferite de apariŃie a diferitelor valori din serie. Dacă intensitatea factorilor este uniformă, frecvenŃele de apariŃie sunt apropiate. În caz contrar, frecvenŃele de apariŃie se concentrează fie la un singur capăt al seriei, fie către o valoare centrală. Statistici descriptive pentru un atribut cantitativ 1. Indicatorii tendinŃei centrale În urma observării caracteristicii cantitative X în n probe se obŃin următoarele date primare: x 1 , x 2 ,..., x n (1) Gruparea datelor se face în funcŃie de tipul caracteristicii X. Astfel, dacă X este o variabilă discretă ce poate lua valorile distincte v 1 , v 2 ,..., v n , atunci în locul datelor iniŃiale se va reŃine repartiŃia empirică:
Transcript
  • Informatica juridic Curs 5

    1/21

    STATISTICA DESCRIPTIV

    Analiza seriilor statistice Evaluarea anumitor indicatori (parametri) statistici implic stabilirea caracteristicilor

    (proprietilor) principale ale seriilor statistice. Acestea sunt: variabilitatea, omogenitatea, independena i concentrarea/mprtierea (dispersia) ctre/fa de un una sau mai multe valori ale seriei.

    Variabilitatea termenilor unei serii statistice este determinat de faptul c fenomenul pe care l reprezint nu este univoc determinat, ci apare ca un rezultat al aciunii combinate a mai multor cauze (permanente sau ntmpltoare). Cu ct aciunea cauzelor ntmpltoare este mai mare, cu att variabilitatea este mai mare i gradul de omogenitate mai mic.

    Omogenitatea presupune o variaie minim ntre termeni. Dac n urma analizei se constat c o serie nu prezint omogenitate, nseamn c n acest caz colectivitatea este

    format din mai multe tipuri calitative i seria trebuie descompus n subserii componente. Independena termenilor unei serii provine din faptul c fiecare valoare individual

    reprezint un element distinct i obiectiv al unei populaii statistice. Termenii ce aparin aceleiai colectiviti se supun acelorai legi care se manifest sub form de tendin.

    Concentrarea/mprtierea (dispersia) ctre/fa de un /una sau mai multe valori ale seriei apare ca rezultat al intensitii unui efect produs de cauze eseniale i ntmpltoare. Acest lucru determin frecvenele diferite de apariie a diferitelor valori din serie. Dac intensitatea factorilor este uniform, frecvenele de apariie sunt apropiate. n caz contrar, frecvenele de apariie se concentreaz fie la un singur capt al seriei, fie ctre o valoare central.

    Statistici descriptive pentru un atribut cantitativ 1. Indicatorii tendinei centrale n urma observrii caracteristicii cantitative X n n probe se obin urmtoarele date

    primare:

    x1, x2,..., xn (1)

    Gruparea datelor se face n funcie de tipul caracteristicii X. Astfel, dac X este o variabil discret ce poate lua valorile distincte v1, v2 ,..., vn , atunci n locul datelor iniiale se va reine repartiia empiric:

  • Informatica juridic Curs 5

    2/21

    m

    m

    nnn

    vvv

    ....

    ....

    21

    21 (2)

    Unde ni, (i=1, m) reprezint frecvena apariiei (numrul de apariii) valorii vi, iar n reprezint numrul valorilor din irul iniial (1) i se numete frecven absolut a valorii v. Valoare m reprezint numrul de clase.

    Raportul fj =nj/n dintre frecvena absolut i numrul total de probe se numete frecven relativ. Se observ c

    f1 + f2 ++ fm =1 ntruct n1 +n2 + ... +nm = n.

    Frecvenele relative, numite impropriu i probabiliti de apariie, stau la baza calculrii densitii de repartiie a frecvenelor i a indicatorilor care exprim gradul de concentrare. De asemenea permit compararea a dou repartiii construite pe aceeai variabil, care difer numai prin numrul unitilor pe grupe.

    Atenuarea datelor, care accidental sunt prea mari sau prea mici dintr-o populaie statistic se face prin calcularea unor medii, n felul acesta fcndu-se o compensare a valorilor individuale. Acest calcul ne arat o anumit tendin a fenomenului studiat, media statistic fiind o valoare ce sintetizeaz ntr-o singur expresie numeric toate valorile din seria msurtori sau observaii. Termenii seriei difer de medie deoarece au fost influenai de diferii factori.

    Media aritmetic Media aritmetic simpl exprim un nivel mediu, anihilnd abaterile individuale,

    netipice. Ea este cuprins ntre valoraea cea mai mare i cea mai mic.

    Definiia 1. Dac n urma unei selecii apar valorile distincte x1, x2,..., xn, atunci media aritmetic este dat de formula:

    =

    =

    +++=

    n

    ii

    n xnn

    xxxx

    1

    21 1...

    n cazul datelor centralizate (n care avem repartiia de frecven (2)):

  • Informatica juridic Curs 5

    3/21

    =

    =

    +++=

    n

    iii

    nn vnnn

    vnvnvnx

    1

    2211 1...

    care se mai numete medie aritmetic ponderat. Numrul care arat de cte ori se repet fiecare valoare (nj) este "ponderea" valorii respective.

    Observaia 1. Media aritmetic are dezavantajul c este sensibil la valori extreme, iar dac termenii sunt prea "mprtiai", tinde s devin o valoare nereprezentativ. Media aritmetic este o valoare lipsit de coninut dac elementele sunt deosebite din punct de vedere calitativ, caz n care este mai util s se fac medii pariale pentru fiecare tip de colectivitate.

    Observaia 2. Dac avem mai multe medii, fiecare referindu-se la o anumit categorie, fiecare medie va fi ponderat n funcie de importana categoriei sale.

    Media geometric Media geometric este mai puin sensibil la valorile extreme dect celelalte medii,

    deci se ntrebuineaz cnd dorim s atenum divergenele mari dintr-o serie de determinri cu frecvene egale, fiind dup o expresie "cea mai exact medie". Se utilizeaz cnd valorile au o evoluie (de cretere sau scdere) permanent, nentrerupt, sau o raie din ce n ce mai mare, termenii fiind legai ntre ei printr-o relaie de produs. De asemenea se mai ntrebuineaz cnd vrem s dm o importan mai mare termenilor mai mici, n valoare absolut, sau cnd diferenele ntre termeni sunt foarte mari. Are dezavantajul c nu se poate ntrebuina cnd avem valori nule sau negative.

    Definiia 2. Dac x1, x2,..., xn sunt n valori, media geometric se definete prin

    nng xxxM ...21=

    Calculul se face mai uor cu ajutorul logaritmilor:

    =

    =

    n

    iig x

    nM

    1lg1lg

  • Informatica juridic Curs 5

    4/21

    Datorit faptului c se calculeaz mai uor cu ajutorul logarimilor, se mai numete "medie logaritmic". Ea se utilizeaz i la calcularea ritmului (de cretere sau descretere) numindu-se astfel i "medie de ritm". n rezumat, se ntrebuineaz cnd:

    - seria are o mare dinamicitate; - termenii au variaii mari;

    - distribuia are un caracter pronunat de asimetrie.

    Observaia 3. Media geometric se folosete atunci cnd prezint importan variaiile relative. De asemenea media geometric poate fi folositoare pentru calculul unor rapoarte.

    Media ptratica se ntrebuineaz cnd valorile prezint creteri din ce n ce mai mari. Ea constituie modelul matematic pentru abaterea medie ptratic. Media este sensibil la valori extreme, din care cauz este ntotdeauna mai mare dect celelalte medii. Are avantajul c se poate aplica i n cazul valorilor nule sau negative (care prin ridicare la ptrat devin pozitive). Se ntrebuinzeaz cnd dm importan valorilor mari. Definiia 3. Media ptratic este definit prin formula:

    =

    =

    n

    iispatr x

    nx

    1

    2,

    1

    sau n cazul datelor centralizate (media ponerat):

    =

    =

    n

    iiippatr vn

    nx

    1

    2,

    1

    Media Armonic Definiia 4. Media armonic este valoarea invers a mediei aritmetice ale valorilor

    inverse datelor de observaie:

    =

    =n

    i i

    h

    x

    nM

    1

    1

  • Informatica juridic Curs 5

    5/21

    Exprim caracterul sintetic al unor valori ce se afl n raport invers. Se utilizeaz cnd

    frecvenele sunt egale. Pentru o repartiie de frecven, media armonic se folosete rar. Se utilizeaz cu predilecie n economie.

    Media glisant numit i "medie mobil", se utilizeaz n cazul n care irul valorilor

    prezint fluctuaii mari, brute i e greu de apreciat tendina (trendul). Se presupune c media glisant corespunde mijlocului intervalului sintetic. Calculul se face mediind 3 sau 5 valori alturate.

    Definiia 5. Media glisant pentru 3, respectiv 5 valori alturate sunt date de formulele

    311

    3,+ ++

    =iii

    glisxxx

    x

    52112

    5,++ ++++

    =iiiii

    glisxxxxx

    x

    Mediana Definiia 6. Mediana este elementul dintr-un ir de date statistice care ar mpri intervalul n dou grupe egale ca numr, dup ce acestea au fost ordonate dup mrimea lor. Dac seria are 2n+1 elemente, atunci mediana este elementul n+1, iar dac are 2n elemente mediana este media aritmetic a celor doi termeni din mijloc.

    2. Indicatorii variaiei O medie este reprezentativ numai atunci cnd se calculeaz din valori omogene ntre

    ele. Cu ct fenomenele sunt mai complexe (dependente de mai multi factori), cu att variaia este mai mare i utilizarea mrimilor medii devine insuficient. De aceea este important de cunoscut ct de departe sunt valorile sumei statistice fa de medie. Comparaia se face cu media seriei, considerat ca fiind valoarea cea mai reprezentativ pentru populaia statistic.

    Analiza statistic a unei repartiii poate fi aprofundat prin calculul indicatorilor de variaie. Aceti indicatori trebuie s serveasc la:

    -verificarea reprezentativitii mediei ca valoare tipic a unei populaii statistice;

    -verificarea gradului de omogenitate a seriei;

    -caracterizarea statistic a formei i gradului de variaie a unui indicator;

  • Informatica juridic Curs 5

    6/21

    -cunoasterea gradului de influen a factorilor dup care s-a facut gruparea unitilor observate.

    Indicatorii simpli ai variaiei

    Indicatorii simpli ai variaiei servesc la caracterizarea gradului de mpratiere a mrimilor seriei statistice. Se pot exprima att n mrimi absolute ct i n mrimi relative.

    Din aceasta grup fac parte:

    -amplitudinea variaiei (absolut i relativ);

    -abaterile individuale (absolute i relative).

    Amplitudinea absolut se calculeaza ca diferena dintre valoarea maxim i valoarea minim al caracteristicii:

    Aa = xmax xmin

    Amplitudinea relativ se exprima de regul n procente i se calculeaz ca un raport ntre amplitudinea absolut i media aritmetic:

    Ar= 100x

    Aa

    Abaterile individuale absolute (di) se calculeaz ca diferena ntre fiecare valoare i media aritmetic:

    di = xi - x , i = 1,...,n

    Abaterile individuale relative (dr) se calculeaz ca raportul dintre abaterile individuale absolute i media aritmetic (se exprima n procente):

    dr = 100x

    d i , i = 1,...,n

    Gradul de variaie al unei caracteristici depinde de toate abaterile variantelor nregistrate i de frecvena lor de apariie i prin urmare indicatorii simpli ai variaiei nu pot

  • Informatica juridic Curs 5

    7/21

    exprima ntreaga variaie a unei populaii statistice. De aceea a fost necesar introducerea indicatorilor sintetici ai variaiei.

    Indicatorii sintetici ai variaiei

    Indicatorii sintetici ai variaiei, la fel ca i indicatorii tendintei centrale trebuie s se bazeze pe toate observaiile, sa fie uor de calculat, uor de nteles i s fie ct mai puin afectai de fluctuaiile de selecie.

    Indicatorii sintetici ai variaiei sunt:

    -abaterea medie liniar ;

    -abaterea medie patratic;

    -dispersia;

    -coeficientul de variaie.

    Abaterea medie liniar se calculeaz ca o medie aritmetic simpl sau ponderat, luate n valoare absolut:

    Pentru o serie simpl

    n

    xx

    d

    n

    ii

    =

    =1

    ||

    Abaterea medie liniar prezint dezavantajul c nu ine seama de faptul c abaterile mai mari n valoare absolut influenteaz n mai mare masur gradul de variaie a unei caracteristici, n comparaie cu abaterile mici. n plus, nu este indicat s se renune n mod arbitrar la semnul valorilor din care se calculeaz o valoare medie. Din aceste considerente se folosete ca principal indicator sintetic al variaiei abaterea medie patratic.

    Abaterea medie patratic sau abaterea standard () se calculeaz ca o medie patratic din abaterile tuturor elementelor seriei de la media lor aritmetic:

    = n

    xxn

    ii

    =

    1

    2)(

  • Informatica juridic Curs 5

    8/21

    Acest indicator este mai concludent dect abaterea medie liniar. Prin ridicarea la ptrat se d o importan mai mare abaterilor mari n valoare absolut, acestea influennd ntr-o msura mai mare gradul de variaie al variabilelor analizate.

    n literatura de specialitate se apreciaz ca pentru o serie de distribuie normal abaterea medie liniar este egal cu 4/5 din valoarea abaterii medii ptratice.

    Abaterea medie ptratic este un indicator de baz, care se folosete la analiza variaiei, la estimarea erorilor de selecie n calculul de corelaie.

    La fel ca abaterea medie liniar, abaterea medie ptratic se exprim n unitatea de masur a variabilei a crei variaie o caracterizeaz. Prin urmare cei doi indicatori nu se pot folosi pentru compararea gradului de variaie i n aceasta situaie se recurge la un alt indicator de variaie: coeficientul de variaie.

    Coeficientul de variaie (v) se calculeaza ca un raport ntre abaterea medie ptratic i media aritmetic. De obicei se exprim sub form de procente:

    v = 100x

    Semnificaie. Cu ct valoarea lui v este mai aproape de zero cu att variaia este mai slab,

    colectivitatea este mai omogen, media avnd un grad ridicat de reprezentativitate. Cu ct valoarea lui v este mai mare cu att variaia este mai intens, colectivitatea este mai eterogen,

    iar media are un nivel de semnificaie sczut.

    Se apreciaz c la un coeficient de peste 35-40%, media nu mai este reprezentativ i datele trebuie separate n serii de componente, pe grupe, n funcie de variaia unei alte

    caracteristici de grupare.

    Se poate afirma c acest indicator poate fi folosit ca un test n aplicarea metodei gruprii. Dac media aritmetic este aproape de zero, coeficientul de variaie nu are semnificaie.

    Dispersia ( 2 ) este media ptratelor abaterilor de la media aritmetic:

  • Informatica juridic Curs 5

    9/21

    ( )22 1 = xxn

    i .

    Msura dispersiei se refer la mprtierea valorilor dintr-un set de date. Media nu

    are semnificaie dac se aplic pe un set de date foarte dispersate. De exemplu dac lum valoarea medie a oraelor mari (peste 200.000 locuitori) va da o valoare de peste 400.000 datorit Bucuretiului care are 2.000.000. ns rezultatul nu are nici o semnificaie (nici un ora nu avea aceast valoare).

    Msurile dispersiei, exprimate sub forma unitilor de msur ale fenomenului

    cercetat, nu sunt ntotdeauna utile atunci cnd se compar dispersiile a dou sau mai multe serii. Compararea dispersiilor a dou sau mai multe serii d rezultate n urmtoarele 2 situaii:

    a) irurile care se compar pot fi exprimate n aceleai uniti, iar mediile pot fi aceleai sau au dimensiuni aproape egale.

    b) irurile care se compar pot fi exprimate n aceleai uniti, ns mediile difer. Dac seriile se exprim n uniti diferite, dispersiile nu pot fi comparate direct. De aceea de

    multe ori se folosete abaterea medie ptratic n loc de dispersie.

    n unele lucrri aceast mrime se numete varian (engleza :. variance). Variana este o msur important n special cnd se studiaz variaia a dou sau mai multe eantioane. O

    tehnic statistic foarte puternic este cunoscut sub numele de analiza de varian i utilizeaz dispersia pentru a decide dac un numr de eantioane difer semnificativ unul de

    altul.

    3. Indicatori de asimetrie si aplatizare(Skewness i kurtosis) Skewness Abaterea medie ptratic i dispersia sunt indicatori care dau o msur a mprtierii

    valorilor ntr-o distribuie de frecven. ntr-un anume sens ele ofer o msur a limii distribuiei. Aceasta ns nu ofer nici o informaie privind caracteristicile formei distribuiei

    de frecven. Figura de mai jos nfieaz 6 distribuii utiliznd histograma. Aceasta reprezint un set de date care au acelai numr de valori. Pe orizontal avem o unitate de

    msur exprimat n abateri medii patratice (), iar pe vertical avem media aritmetic. Dup cum se observ, se poate face o comparaie direct.

  • Informatica juridic Curs 5

    10/21

    Aparent cele ase distribuii de frecven sunt foarte diferite. Cele din partea dreapt

    (b, d, i f) sunt similare dintr-un singur punct de vedere, anume ele sunt asimetrice, vrful este plasat n stnga sau dreapta mediei. Spunem c avem o distribuie distorsionat sau

    asimetric (skewed). Cele din stnga (a, c, e) au un grad mic de distorsiune (asimetrie). n toate cazurile vrful este n apropierea mediei. Toate acestea sunt distribuite simetric.

    Pe de alt parte cele dou distribuii de pe fiecare rnd pot fi considerate similare, n sensul c

    au un anumit grad de ascuire sau kurtosis. Cele din primul rnd sunt foarte ascuite; ele au aceleai grad de kurtosis. Cele din al doilea rnd au ascuimea mai moderat, iar cele din al treilea rnd sunt relative plate.

    Distorsiunea msoar, deci, volumul de valori din distribuia concentrat de o parte i

    de alta a mediei. Dac acest volum de valori este mai mic dect media, spunem c distribuia este pozitiv distorsionat (b). Dac exist mai multe valori mai mari dect media, spunem c distribuia este negativ distorsionat (d).

  • Informatica juridic Curs 5

    11/21

    Exemplu in Excel :

    Introducei urmtoarele date de la adressa www.insse.ro :

    Dup ce introducei coninutul unei celule, validai acest fapt cu [Enter] sau [Tab].

    2.Pentru a edita coninutul unei celule folosii tasta [F2] sau dublu click.

    Pentru formatarea celulelor selectai domeniul dorit. Alegei din meniu comanda Format - Cells - Alignment i selectai opiunea Center din caseta derulant pentru aliniere n centrul celulei, selectai opiunea Merge text pentru reuniunea mai multor celule, selectai opiunea Wrap text pentru spargerea textului pe mai multe rnduri.(de ex. Celula B1)

  • Informatica juridic Curs 5

    12/21

    :

    4. Pentru formatare selectai domeniul dorit. Alegei din meniu comanda Format - Cells - Border i selectai tipul de linie dorit pentru ncadrarea celulei sau domeniului selectat, apoi apsai butonul pentru tipul de ncadrare dorit.

  • Informatica juridic Curs 5

    13/21

    3. Pentru a calcula numrul total de cauze n celula B17: se face clic pe B17 i se introduce formula =SUM(B2:B16) sau se face clic pe butonul

    4.Pentru calculul frecvenelor relative n celulele C2:C16: se nscrie n C2 formula pentru anul 1990=B2/$B$17 , n care B2 referin relativ=nr. cauze 1990 iar $B$17 referin absolut=total general nr.cauze

    Pentru calcularea formulei i n pentru ceilali ani fie prindem cursorul de umplere i tragem n josul coloanei pn la C16 sau executm operaia Fill astfel: selectm domeniul de la C3 la C16; din meniul Edit alegem opiunea Fill Down.

  • Informatica juridic Curs 5

    14/21

    Tot domeniul selectat se va completa cu formula calculat n celula C2. Referina relativ B2 va varia de la B2 la B16, iar referina absolut $B$17 va rmne neschimbat

    4. Pentru ca frecvenele relative s fie exprimate n procente selectm domeniul dup care din meniul FormatFormat cellsNumberPercentage

  • Informatica juridic Curs 5

    15/21

    Pentru a micora numrul de zecimale apsai pe butonul

    5.Pentru a obine evoluia temporal a numrului de cauze soluionate se urmeaz operaiile:

    Se selecteaz domeniul C1:C16 Se alege din meniul InsertChart dup care se urmeaz paii din Chart Wizard

  • Informatica juridic Curs 5

    16/21

    Pentru calcularea parametrilor statisticii descriptive Excel ofer mai multe moduri: prin calcularea funciilor, un mod simplu i mai rapid: pachetul de calcule statistice Data Analysis Tool oferit de Excel opiunea Descriptive Statistics, tabelul pivot pentru calculul statisticilor descriptive pe subgrupuri de date. Se pot calcula urmtorii parametrii: sum, medie aritmetic, modul, minim, maxim, deviaie standard, variaie, eroare standard, kurtosis, skewness, interval de confiden, al k-lea element mai mic sau mai mare, talia, i intervalul. Toi aceti parametrii se pot calcula pentru una sau mai multe variabile.

    Vom rezolva aceast problem cu ajutorul componentei Data Analysis Descriptive Statistics: 1. Pentru a folosi pachetul Data Analysis el trebuie instalat. Pentru aceasta verificai dac nu a fost

    instalat deja: deschidei meniul Tools. Dac opiunea Data Analysis este prezent, atunci se trece la pasul urmtor. Dac opiunea Data Analysis nu este prezent, atunci din meniul Tools se alege opiunea Add-Ins. Va aprea o fereastr asemntoare celei de mai jos n care se va bifa prima opiune Analysis ToolPak. Apsai butonul Ok.

  • Informatica juridic Curs 5

    17/21

    2. Alegei opiunea Data Analysis din meniul Tools. Din fereastra de dialog care apare selectm

    Descriptive Statistics. Clic pe OK.

    3. Dup apsarea butonului OK pe ecran va aprea urmtoarea fereastr de dialog:

    Urmeaz o descriere a cmpurilor ferestrei de dialog de mai sus:

  • Informatica juridic Curs 5

    18/21

    4. Input Range: Introducei referinele domeniului unde se gsete variabila pentru care dorim s

    calculm parametrii statisticii descriptive. n cazul nostru B1:B16. Pentru introducere executai click n cmpul Input Range, apoi click n celula B1 i executai o selecie pn n celula B16.

    5. Grouped by: se va selecta Columns dac fiecare variabil este introdus ntr-o coloan sau Rows dac fiecare variabil este introdus ntr-o linie. n cazul nostru vom bifa Columns.

    6. Labels in first row. Antetul de coloan sau linie poate s fie selectat sau poate lipsi. Dac selectm i antetul de coloan, atunci n pagina de rezultate va aprea acel antet, adic numele variabilei. In acest caz trebuie s bifm Labels in first row. Dac nu bifm funcia va ntoarce eroarea: Input range contents non numeric data, deoarece se consider i antetul de coloan ca fiind una dintre valorile variabilei. In cazul n care nu selectm antetul de coloan, ar trebui s nu bifm nici Labels in first row. Dac bifm Labels in first row atunci prima valoare a variabilei va fi luat drept antet de coloan i rezultatele vor fi greite. In cazul nostru selectm labels in first row.

    7. Opiunile Output se refer la locul amplasrii tabelului de frecven. Dac vom selecta opiunea New Worksheet Ply,tabelul de frecven va fi afiat la o pagin nou al crei nume trebuie introdus n cmpul New Worksheet Ply. Output Range este pentru cazul n care dorim ca rezultatul s fie afiat pe aceeai pagin cu tabelul ncepnd cu o anumit celul care trebuie introdus n cmpul Output Range.( n cazul nostru C1)New Woorkbook se bifeaz n cazul n care dorim ca rezultatul s fie afiat ntr-un alt fiier.

    Cel puin una dintre urmtoarele opiuni trebuie selectate. 8. Summary statistics se bifeaz pentru ca s se calculeze statisticile principale. 9. Confidence Level for Mean se bifeaz pentru a se calcula i semi- lungimea intervalului de ncredere

    pentru media populaiei. Nivelul de confiden implicit este 95%, se poate schimba cu un alt numr de la 1 la 99,9.

    10. Kth Largest ntoarce numrul al k-lea mai mic dect numrul cel mai mare. K este o constant care se introduce n cmpul corespunztor. Clic pe Kth Largest. Introducei numrul 2 n cmpul Kth Largest.

    11. Kth Smallest ntoarce numrul al k-lea mai mare dect numrul cel mai mic. K este o constant care se introduce n cmpul corespunztor. Poate fi diferit de K de la punctul 10. Clic pe Kth Smallest. Introducei numrul 2 n cmpul Kth Smallest.

  • Informatica juridic Curs 5

    19/21

    12. Click OK.

    13. Interpretarea rezultatelor Mean n medie s-au soluionat 458 de cauze. de ctre un judector

    Standard Error Eroarea standard calculat dup formula: n

    SES =, unde S este deviaia

    standard i n numrul de observaii.

    Median Mediana este o valoare a seriei astfel nct jumtate dintre observaii au valori mai

    mici (sau egale) i cealalt jumtate au valori mai mari (sau egale). Dac n este impar, atunci

    mediana este dat prin formula:

    Me = 21+nX

    . Dac n este par, atunci mediana este dat prin formula:

  • Informatica juridic Curs 5

    20/21

    Me = 21

    22+

    + nn XX

    .

    Mode Modulul este valoarea care are cea mai mare frecven din serie. In cazul modulului o

    situaie care apare este cea n care seria nu are modul, adic toate valorile apar o singur dat.

    Atunci va fi afiat valoarea #N/A. O alt situaie posibil este ca seria s fie bimodal sau

    trimodal. Atunci va fi afiat numai prima valoare n ordinea apariiei lor n cadrul seriei. In acest

    caz pentru determinarea tuturor valorilor modulului se poate face un tabel de frecven.

    Standard Deviation Deviaia standard sau Abaterea standard S = 2s . Unde s2 este variatia.

    Sample Variance Variaia este calculat dup formula: n

    XXs

    n

    ii

    =

    =1

    2

    2)(

    , unde n este talia

    seriei, niX i ,1, = seria de date, n cazul nostru ,numrul de cauze soluionate i X este media

    aritmetic a seriei.

    Kurtosis Excesul sau Boltirea msoar nlimea aplatizrii sau boltirii unei distribuii n

    comparaie cu o distribuie normal. Aceast msur este definit prin:

    4 = 3

    )(1

    41

    4

    =

    S

    XXn

    n

    ii

    .

    Excesul 4 este zero pentru o serie de date avnd o distribuie normal, este pozitiv pentru o

    serie de date avnd forma mai nalt dect cea a unei distribuii normale (cu media X i variaia S2) i este negativ pentru o serie de date a crei form este mai cobort dect cea a unei

    distribuii normale. In cazul nostru valoarea -0,669 a boltirii indic o curb puin mai aplatizat

    dect curba normal.

    Skewness Asimetria msoar abaterea de la aspectul simetric i direcia asimetriei (pozitiv sau

    negativ) fa de curba normal. Este calculat cu formula:

    n

    SXXn

    ii

    3

    13

    ]/)[( =

    =

    Asimetria este 0 pentru o serie de date avnd o distribuie normal, este pozitiv pentru o serie

    de date asimetric spre stnga (seria are mai multe valori mai mici), este negativ pentru o serie

    de date asimetric spre dreapta (seria are mai multe valori mai mari). In cazul nostru asimetria

    este 0,198, deci este puin deplasat la dreapta fa de curba normal.

  • Informatica juridic Curs 5

    21/21

    Range Intervalul este Maximul-Minimul. Maximul este 678, iar minmul este 390 Range=678-

    390=288

    Minimum Minimul valoarea cea mai mic din serie.

    Maximum Maximul valoarea cea mai mare din serie.

    Sum Suma sau Totalul valorilor seriei:

    =

    n

    iiX

    1 , unde niX i ,1, = seria de date.

    Count Numrul de observaii n=15.

    Largest(2) - Numrul al k-lea mai mic dect numrul cel mai mare.

    Smallest(2) - Numrul al k-lea mai mare dect numrul cel mai mic.

    Confidence Level (95,0%) ntoarce o valoare cu ajutorul creia se poate construi intervalul de

    confiden de 95% pentru media populaiei. Aceast valoare este 42.23 intervalul este =[ X -

    42.23, X +42.23] = [], unde X este media aritmetic a eantionului. Fie m media populaiei situat n acest interval. Media oricrui eantion al acestei populaii este mai departe de m ca

    X cu o probabilitate mai mare dect alpha. Alpha n cazul nostru este 5%. Presupunem c

    utilizm X , deviaia standard standard i talia pentru a construi un test cu un prag de semnificaie alpha n ipoteza c media populaiei este m. Nu vom respinge ipoteza dac m este n

    intervalul de confiden i vom respinge ipoteza dac m nu este n intervalul de confiden. Dac

    alpha este 0,95 trebuie s calculm aria de sub curba normal. Aceast valoare este 1,96.

    Intervalul de confiden este: ],[ ScritScrit EtXEtX + , unde X este media aritmetic, iar ES

    este eroarea standard, iar t critic este 1,96. Valoarea ntoars de program este ScritEt

    . Se poate

    calcula i cu funcia CONFIDENCE.


Recommended