+ All Categories
Home > Documents > Analiza Datelor Si SAS DAFI 2010 Part1

Analiza Datelor Si SAS DAFI 2010 Part1

Date post: 21-Jul-2015
Category:
Upload: adrian-cristea
View: 162 times
Download: 0 times
Share this document with a friend

of 68

Transcript

Academia de Studii Economice Masterat DAFI

Prof. univ. dr. Gheorghe RUXANDA

ANALIZA DATELORSI

SAS

Bucuresti 2010

Tema 1. Probleme ale m|sur|rii i cuantific|rii economico-sociale1.1 Necesitatea i rolul analizei datelorCunoa terea tiin ific | din orice domeniu de activitate uman | presupune, indiferent de natura i specificul obiectivelor concrete urm |rite, o complex | i riguroas | analiz | cantitativ | a fenomenelor i proceselor care fac obiectul cercet|rii. Este vizibil pentru oricine, i din ce n ce mai mult, c | n epoca modern | aproape orice individ angrenat ntr-o activitate uman | se ocup |, ntr-un fel sau altul, n mod direct sau indirect, cu date i informa ii, cu colectarea, prelucrarea i interpretarea acestora. Desf |urarea oric |rei activit|i umane implic | o produc ie continu | de date sau informa ii, care se acumuleaz | n timp i care pot fi folosite pentru cunoa terea structural| i evolutiv | a fenomenelor la care se refer | aceste informa ii, n scopul fundament |rii corecte i eficiente a deciziilor care trebuie luate. M ai mult dect att, desf |urarea activit|ilor umane nici m |car nu poate fi conceput| n zilele noastre f|r | un consum continuu, din ce n ce mai mare, de informa ie. Din acest punct de vedere, se poate spune c | informa ia a devenit unul dintre factorii de produc ie importan i i activi, un factor de progres i civiliza ie. Totdeauna, mulimile de date con in, ntr-un mod amalgamat i invizibil, att aspecte semnificative, ct i aspecte nesemnificative, ale manifest |rii fenomenelor. Deoarece cunoa terea tiin ific | vizeaz | n mod exclusiv aspectele informa ionale semnificative, apare necesitatea utiliz |rii unor metode i tehnici specifice analizei datelor, cu ajutorul c |rora informaia semnificativ | s | poate fi detectat|, separat| de informa ia nesemnificativ | i exprimat | sub o form | clar | i interpretabil|. Metodele i tehnicile de analiz | a datelor sunt cele mai adecvate instrumente utilizabile pentru identificarea unor structuri cauzale, pentru decelarea unor tendin e i configura ii specifice pe mulimea datelor analizate i ob inerea unor reprezent|ri simplificate ale informa iilor de mare complexitate. Utilitatea i eficien a utiliz |rii metodelor i tehnicilor de analiz | a datelor sunt maxime n situa iile n care informa iile supuse studiului sunt n cantit |i foarte mari. Din acest punct de vedere, domeniul economic poate fi considerat ca fiind un domeniu privilegiat. n cea mai mare parte a lor, metodele i tehnicile de analiz | a datelor au natur | multidimernsional|, astfel nct, comparativ cu metodele i tehnicile de analiz | statistic | descriptiv |, ele permit i investigarea leg |turilor i interdependen elor eviden iate la nivelul mulimilor de date. Materia prim | utilizat| n orice activitate de analiz | a datelor este reprezentat| de o colec ie sau mulime de date sau informa ii cantitative, referitoare la st |rile sau evolu iile unei mulimi de fenomene. Aceste date pot fi ob inute fie pe cale observa ional|, fie pe cale experimental|. Din punct de vedere al analizei datelor, orice mulime de informa ii supus | studiului este privit| ca fiind o reprezentare codificat|, ntr-o form | mai mult sau mai pu in implicit |, a unor aspecte informa ionale referitoare la niveluri i varia ii ale unor fenomene, evolu ii i tendin e relevante, leg |turi i influen e semnificative, ierarhii i configura ii structurale specifice. Datele supuse unui proces de analiz | nu eviden iaz |,n mod direct i explicit, prin ele nsele, informa ia util | i semnificativ |. De regul|, datele con in informa ia util| i semnificativ | sub o form | mascat|, ascuns |, amestecat| ntr-un mod nediferen iat i f|r | o logic | aparent|, cu informa ia nesemnificativ |, rezultat| din influen e accidentale i marginale. n acest sens, se poate spune c | la nivelul datelor primare supuse analizei, informa ia semnificativ | se g |se te sub o form | diluat| i disipat| ntr-o mulime informa ional| complex |, neordonat| i nestructurat| dup | vreun criteriu logic existent aprioric. Rolul analizei datelor este acela de a prelucra i filtra informa iile con inute n datele supuse studiului, cu scopul de a capta sau de a extrage esen a informa ional| con inut| n aceste date i de a eviden ia aceast| esen | informa ional| ntr-o form | de reprezentare inteligibil|, sugestiv |, simplificat| i sintetizatoare. Atingerea acestui scop presupune realizarea unei succesiuni de transform |ri efectuate asupra datelor primare i implic | utilizarea unor metode i tehnici specifice. Aceste transform |ri au scopul de a maximiza relevan a i interpretabilitatea datelor i presupun, printre altele, eliminarea informa iilor redundante sau lipsite de semnifica ie i generalitate, care au natur | accidental| sau marginal|. Din acest punct de vedere, procesul de analiz | a datelor apare ca fiind un proces specific de transformare informa ional|, proces care are ca intr |ri datele primare, iar ca ie iri informa ii sintetizatoare. Avnd n vedere modul n care se efectueaz |, precum i natura instrumentelor pe care le folose te, analiza datelor este, prin excelen |, o analiz | de tip multidimensional, reprezentnd, n compara ie cu analiza simpl |, unidimensional|, o schimbare de natur | calitativ |. Analiza statistic | descriptiv | permite reprezentarea unor colec ii foarte mari de date ntr-o manier | sugestiv | i asimilabil|, simplificat| i schematizant |. Spre deosebire de aceasta, analiza multidimensional| constituie o generalizare natural| a logicii i informa iilor referitoare la mai multe variabile sau dimensiuni. Activit|ile de manipulare a datelor i informa iilor, de prelucrare i interpretare corect| i eficient | a acestora, presupun existen a unui cadru conceptual adecvat i utilizarea unor metode i instrumente specifice. Att cadrul conceptual necesar, ct i metodele i tehnicile utilizabile n prelucrarea, analiza i interpretarea datelor i informa iilor, sunt subsumate de obiectul unei discipline tiin ifice numit| analiza datelor.

1.2 Specificitatea domeniului economico-social i modalit|i de abordareDe i metodele i tehnicile de analiz | a datelor sunt utilizate n majoritatea domeniilor activit|ii umane, putem afirma c | analiza datelor are cea mai larg | utilizare n domeniul economico-social, iar eficien a utiliz |rii ei n acest domeniu are o eficien a extrem de ridicat|. A a cum cum o s | ar|t|m n continuare, activitatea de cunoa tere tiin ific | din domeniul economico-social este caracterizat| de anumite accente specifice, n compara ie cu alte domenii ale cunoa terii umane. n virtutea acestor elemente de specificitate, domeniul economico-social pare a fi cel mai potrivit domeniu pentru utilizarea metodelor i tehnicilor de analiz | 1

multidimensional| a datelor. Dintre toate elementele de specificitate a domeniului economico-social, dou | consider |m a fi mai importante i mai relevante din punct de vedere al utiliz |rii analizei datelor: complexitatea ridicat| a fenomenelor economico-sociale i natura cantitativ | a acestor fenomene. mpreun | cu multe alte caracteristici specifice, aceste dou | caracteristici fundamentale impun modalit|i specifice de abordare pentru cunoa terea tiin ific | din domeniul economico-social. Necesitatea de a sintetiza i de a simplifica n procesul de cunoa tere a realit|ii, este impus | att de faptul c | datele utilizabile ntr-o analiz | mascheaz |, ascund, anumite aspecte, ci i de faptul c | realitatea analizat| este caracterizat| de o complexitate foarte ridicat|, care nu poate fi cuprins | i n eleas| numai pe baza intuiiei. n activitatea de analiz | cantitativ |, pe care se bazeaz | n mod direct cunoa terea tiin ific | din cele mai multe domenii de activitate, sunt implicate trei categorii esen iale de elemente: teorii i principii teoretice generale i specifice domeniului investigat, informa ii cantitative i calitative referitoare la fenomenele supuse studiului, metode i tehnici de cuantificare, evaluare, estimare i testare a m |rimilor specifice i a rela iilor existente la nivelul realit|ii investigate. Teoriile i principiile teoretice care stau la baza oric |rei analize cantitative sunt reprezentate de mulimea cuno tiin elor tiin ifice acumulate n decursul timpului, de realiz |rile ob inute pe plan tiin ific, att la nivelul general al cunoa terii umane, ct i la nivelul cunoa terii n domeniul abordat. Inform a iile cantitative i calitative referitoare la fenomenele i procesele studiate exprim | o mulime de st |ri i evolu ii concrete din realitatea investigat| i sunt rezultatul unui laborios proces de observare, m |surare i evaluare, proces n care intervin o serie de norme, principii, metodologii i instrumente specifice procesului de m |surare. Informa iile ob inute din realitatea investigat|, n urma unor procese de observare i de m |surare, sunt cunoscute sub numele de date. Datele reprezint| materialul brut, empiric, care st | la baza tuturor deciziilor din orice domeniu de activitate, iar de calitatea acestora depinde, n mod direct, calitatea respectivelor decizii. Metodele i tehnicile reprezint| un set de reguli, principii i proceduri de analiz|, prelucrare i interpretare a datelor.n analiza datelor, metodele i tehnicile se refer | la cuantificare, evaluare, estimare i testare, i sunt reprezentate de o mulime extins | i variat| de proceduri i instrumente statistico-matematice. Aceste proceduri sunt aplicate, sub o form | sau alta, informa iilor cantitative i calitative, datelor de intrare, n scopul deducerii anumitor rezultate i concluzii. De calitatea metodelor i tehnicilor utilizate ntr-o activitate de analiz | i de eficien a utiliz |rii lor depind, n mod direct i ntr-o propor ie foarte mare, att semnifica ia i validitatea concluziilor ob inute, ct i calitatea rezultatelor ob inute. Combinarea, la nivelul analizei cantitative, a celor trei categorii de elemente men ionate anterior, conduce la ob inerea unor rezultate i concluzii, care contribuie la adncirea procesului de cunoa tere a realit|ii studiate i care se pot concretiza sub mai multe forme: ob inerea de informa ii relevante suplimentare privind starea, evolu ia i conexiunile componentelor realit|ii investigate; relevarea unor noi principii i legit|i care guverneaz | micarea fenomenelor i proceselor din aceast | realitate; formularea unor concluzii cu privire la existen a unor leg |turi i specificit|i ce caracterizeaz | realitatea studiat|; validarea unor ipoteze formulate cu privire la popula iile reprezentate de fenomenele i procesele studiate; identificarea unor tipologii i structuri specifice pe mulimea de fenomene i procese analizate; estimarea unor efecte i influen e caracteristice interdependen elor dintre fenomene i procese; deducerea unor modele statistico-matematice, care s | descrie comportamentul fenomenelor i proceselor; efectuarea de predic ii cu privire la evolu ia fenomenelor i proceselor; efectuarea de simul|ri privind evolu ia fenomenelor i a interdepende elor manifestate ntre acestea. Fenomenele economico-sociale i micarea acestora n timp i spa iu, adic | procesele, au o caracteristic | ce le face s | se deosebeasc | n mod esen ial, fundamental, de fenomene i procese specifice altor domenii de activitate. Aceast | caracteristic | este dat| de faptul c | manifestarea la nivel observabil a acestor fenomene i a mic |rii lor, este extrem de complex | i mbrac | o deosebit de mare varietate de forme, fiecare fenomen sau proces economico-social existnd sub form | multiplicat| pe o scar| foarte m are. Proprietatea de multiplicitate la o scar | foarte mare, pe care o au existen a i manifestarea fenomenelor economice i sociale, este cunoscut| n literatura domeniului sub numele de caracter de mas | al fenom enelor econom ico-sociale. Formele sub care se manifest | fenomenele economice i sociale apar, de regul|, ca o amalgamare de aspecte esen iale i neesen iale, legate direct sau indirect de con inutul fenomenului, de ceea ce este esen ial i stabil n comportamentul acestuia, fiind caracterizate n timp, cel pu in la suprafa |, de un grad relativ ridicat de instabilitate. Partea consistent |, semnificativ | i stabil| a unui fenomen economico-social este, de obicei, ascuns | de aceast | multitudine de manifest |ri, astfel nct cunoa terea acesteia nu se poate face dect rareori prin observare direct|, fiind necesar, de cele mai multe ori, un demers logic extrem de complex, n cadrul c |ruia se urm |re te eliminarea a ceea ce este accidental, conjunctural, neesen ial i nesemnificativ n manifestarea fenomenului, re inndu-se ceea ce este trainic, cu caracter de regularitate, esen ial i semnificativ. O alt| caracteristic | a fenomenelor economico-sociale este cea legat| de multitudinea i eterogenitatea acestor fenomene, de dimensiunile la care are loc desf |urarea acestora, de numeroasele leg |turi func ionale existente ntre acestea i de multiplele interdependen e i condiion |ri dintre fenomenele economico-sociale i fenomenele specifice altor domenii. Gradul ridicat de interconectare a elementelor i multitudinea factorilor de influen |, implica i n manifestarea rela iilor de cauzalitate, reprezint| caracteristici definitorii pentru majoritatea fenomenelor i proceselor de natur | socio-economic |. Amploarea complexit|ii din domeniul economico-social rezult| i din faptul c | natura i intensitatea rela iilor de interdependen | cunosc o m are variabilitate n tim p i spa iu, c | sensul rela iilor de cauzalitate este reversibil, chiar contradictoriu, i c |, din cauza gradului ridicat de interconectare, manifestarea cauzalit|ii are loc, n multe situa ii, sub forma unor "reac ii n lan ". Specificitatea domeniului economico-social i caracteristicile care l fac s | se diferen ieze fundamental de celelalte domenii de activitate, impun ca procesul de cunoa tere n acest domeniu, investigarea tiin ific | a fenomenelor i proceselor de natur | economico-social| s | poarte o amprent| specific |, particular |. Caracterul complex al manifest |rii fenomenelor economice i sociale face ca activitatea de cunoa tere n acest domeniu s | fie puternic condiionat| att de m odalitatea concret| de abordare a obiectului studiat, ct i de natura i puterea metodelor, tehnicilor i instrumentelor de investigare utilizate. Faptul c | fenomenele economice i sociale se caracterizeaz | printr-un grad de complexitate foarte ridicat face ca activitatea

2

de investigare a comportamentului acestora s | fie deosebit de dificil| i rezultatele acesteia s | aib | un grad ridicat de relativitate din punct de vedere al semnifica iei i exactit|ii. n aceste condiii, succesul investiga iilor socio-economice, valabilitatea i stabilitatea concluziilor rezultate din analizele efectuate, depind n mod direct de compatibilitatea dintre natura instrumentelor de investigare folosite i specificul fenomenelor investigate. Alegerea modalit|ilor de abordare i a celor mai potrivite metode i tehnici de analiz | sau predic ie reprezint| condiia de baz | pentru ob inerea unor rezultate satisf|c |toare n activitatea de cunoa tere a fenomenelor din domeniul economico-social. n ceea ce prive te modalit|ile de abordare, cele mai des utilizate n analiza datelor sunt: abordarea sistemic |, abordarea statistic | i abordarea bazat| pe modelarea matematic | i informatic |.

1.2.1 Abordarea sistemic|O principal | modalitate de abordare, esen ial| pentru orice proces de investigare tiin ific |, impus | cu necesitate mai ales n cazurile n care domeniul vizat este caracterizat de un grad ridicat de complexitate, este cea cunoscut| sub numele de abordare sistem ic |. Att n sens teoretic, ct i n sens practic, abordarea sistemic | se deta eaz | ca metod | general|, universal | utilizat | n investigarea tiin ific |, indiferent de domeniul concret al investig |rii tiin ifice. n cazul particular al analizei datelor, abordarea sistemic | are o importan | special|, att n faza de analiz | propriu-zis |, ct i n faza de interpretare sa rezultatelor.

1.2.2 Abordarea statistic|Caracterul de mas | pe care l au fenomenele economice i sociale determin | ca manifestarea acestora, n timp i spa iu, s | intre sub inciden a unui principiu universal de regularitate i stabilitate, specific fenomenelor cu frecven | foarte mare de existen | i apariie, principiu sintetizat sub forma uneia din cele mai importante legi din domeniul cunoa terii umane: legea num erelor mari. Regularitatea i stabilitatea comportamentului fenomenelor economice i sociale sunt asigurate, n virtutea acestui principiu, de tendin a de com pensare a influen elor cu sensuri contrarii, pozitive i negative, exercitate de factorii neesen iali, nesemnificativi i accidentali implica i n determinarea rela iilor de cauzalitate dintre fenomenele socio-economice. O consecin | direct| i imediat| a acestui principiu const | n faptul c | investigarea comportamentului fenomenelor economice i sociale i formularea de concluzii sintetizatoare cu privire la amploarea sau sensul evolu iei acestor fenomene sunt cu mult mai u or de realizat i caracterizate de un grad mult mai ridicat de semnifica ie i exactitate n cazul n care sunt supuse studiului colectivit |i mari de fenomene comparativ cu situa ia n care studiul vizeaz | fenomene individuale, izolate. Necesitatea de a fructifica n procesul cunoa terii fenomenelor i proceselor economice sau sociale facilit|ile ce rezult| din faptul c | acestea au caracter de mas |, impune ca n ntreaga activitate de analiz | a datelor din domeniul economico-social s | prevaleze m odalitatea de abordare statistic | i folosirea metodelor i tehnicilor oferite de teoria probabilit|ilor i statistica m atem atic |. Modalitatea de abordare statistic | este impus | ca modalitate de investigare a fenomenelor de natur | socio-economic | i de faptul c | manifestarea acestora este caracterizat| de un grad ridicat de incertitudine i im previzibilitate. Elementele vizate n mod direct n cadrul investiga iilor tiin ifice bazate pe utilizarea metodelor i tehnicilor proprii analizei datelor, sunt reprezentate de fenomenele cu natur | stohastic |, adic | de fenomenele al c |ror comportament are caracter aleatoriu, dar care manifest | o anumit| regularitate mai mult sau mai pu in evident |. Definiie: Fenom enul stohastic este acel fenomen observabil, ale c |rui manifest |ri particulare sunt incerte, dar care eviden iaz | o anumit| regularitate a formelor de manifestare, o anumit| leg |tur | ntre aceste forme de manifestare. Necesitatea utiliz |rii n procesul de investigare a fenomenelor economice i sociale a modalit|ii de abordare statistic | este determinat| i de caracterul de relativitate, par ialitate i inexactitate al informa iei din acest domeniu. Imposibilitatea de a ob ine informa ii cu caracter exhaustiv despre desf |urarea fenomenelor economice i sociale impune ca activitatea de cunoa tere a ansamblului acestei desf|ur |ri s| se bazeze pe informa ii cu caracter par ial, ob inute pe baz | de sondaj. Extinderea concluziilor rezultate din analiza informa iilor ob inute prin sondaj la nivelul ntregului ansamblu de fenomene investigate de sondaj se bazeaz | pe metodele i tehnicile inferen ei statistice. Una din cerin ele de baz | impuse de modalitatea de abordare statistic | oric |rui demers tiin ific ce are ca obiect investigarea comportamentului unor fenomene i procese economice sau sociale poate fi exprimat | prin necesitatea de a studia variabilele ce descriu acest comportament, n interdependen a i sim ultaneitatea lor. Analiza izolat| a comportamentului fiec |rei variabile este incompatibil| cu modalitatea de abordare sistemic | i duce la o pierdere important | de informa ie semnificativ | n cazul n care variabilele sunt interdependente. Mai mult dect att, concluziile par iale desprinse n urma unei astfel de analize nu pot fi generalizate i nu au valabilitate la nivelul comportamentului "legat" al variabilelor, influen a interac iunii dintre acestea fiind, de cele mai multe ori, covr itoare. De regul|, analiza comportamentului individual al unui fenomen, n sensul s|u unidimensional, face obiectul analizei statistice descriptive. Analiza statistic | descriptiv | permite reprezentarea unor colec ii foarte mari de date ntr-o manier | sugestiv | i asimilabil|, simplificat| i schematizant |. Considernd o mulime de variabile aleatoare ce descriu un anumit fenomen economic sau social, vom ob ine rezultate total diferite dac | vom studia, de exemplu, reparti ia fiec |reia dintre ele izolat, separat de celelalte, comparativ cu situa ia n care n studiu ar fi vizat| reparti ia comun |, legat| a acestor variabile. Studiul comportamentului simultan, interdependent, al unei mulimi de variabile presupune metode i tehnici de complexitate i rafinament mult mai ridicate dect studiul comportamentului izolat al acestora i face obiectul unei discipline aparte, i anume analiza statistic | multidim ensional| sau m ultivariat|.

1.2.3 Abordarea bazat| pe modelarea matematic| i informatic|A a cum am ar |tat anterior, complexitatea ridicat| ce caracterizeaz | domeniul economico-social i celelalte elemente de specificitate ale fenomenelor apar innd acestuia, determin | ca orice demers tiin ific ntreprins n scopul adncirii cunoa terii 3

n acest domeniu s | presupun |, cu necesitate, utilizarea unor metode i tehnici de lucru corespunz |toare. Din rndul instrumentelor de investigare tiin ific |, a c |ror utilitate n contracararea dificult|ilor ridicate de gradul sporit de complexitate al domeniului studiat este de nenlocuit i a c |ror utilizare nso e te ast|zi demersul tiin ific din aproape oricare domeniu al cunoa terii umane, se deta eaz | m odelarea matem atic | i tehnica de calcul. Ca unul dintre cele mai utile i eficiente instrumente de cunoa tere a realit|ii, m odelarea matem atic | reprezint| procesul de descriere a comportamentului unor fenomene din natur | i societate sub o form | sintetic |, logic | i formalizat| matematic. Descrierea sub o form | matematic | a comportamentului fenomenelor i proceselor din cele mai diverse domenii de activitate a devenit ast |zi dorin a i, de cele mai multe ori, scopul oric |rui cercet|tor, indiferent de domeniul n care acesta activeaz |. Surprinderea interdependen elor, a legit|ilor i func ionalit|ilor ce caracterizeaz | fenomenele sau procesele din lumea ce ne nconjoar |, sub forma sintetic | a unui model matematic, este, probabil, cea mai relevant | m |sur | a nivelului la care a ajuns gradul de cunoa tere uman |. Din punct de vedere informa ional, modelul matematic, n forma sa final|, poate fi privit ca un "concentrat informa ional", avnd att calitatea de acumulator al informa iei receptate din segmentul de realitate economic | sau social| pe care l descrie, ct i de generator de informa ie nou |, inexistent | n momentul construirii lui.

1.3 M|surarea i cuantificarea n domeniul economico-socialPosibilitatea efectu |rii analizelor sau predic iilor din domeniul economico-social este strict condiionat| de existen a unei baze informa ionale care s | cuprind | informa iile necesare cu privire la nivelul, structura sau evolu ia n timp a fenomenelor i proceselor supuse investig |rii, sau cu privire la condiion |rile cauzale ale acestor fenomene i procese. Ob inerea informa iilor necesare pentru activitatea de analiz | a datelor este, de regul|, rezultatul unor procese de observare i m |surare a fenomenelor i proceselor supuse studiului i presupune existen a unor instrumente adecvate. Informa iile referitoare la un anumit fenomen supus studiului, informa ii necesare analizei comportamentului respectivului fenomen, reprezint| rezultatul unui proces de m |surare. Acest proces reprezint|, de fapt, o ac iune de atribuire de valori numerice pentru caracteristicile respectivului fenomen. Definiie: Prin proces de m |surare se n elege totalitatea activit|ilor de atribuire a unor valori numerice pentru caracteristicile fenomenului analizat. n cea mai mare parte a lor, informa iile necesare efectu |rii analizelor sau predic iilor din domeniul economico-social trebuie s | aib | natur | cantitativ |, s | reprezinte exprim area sub form | num eric | a caracteristicilor specifice fenomenelor analizate. Aceast | condiie presupune, n mod implicit, necesitatea existen ei unor unit|i de m |sur |, prin intermediul c |rora diferitele caracteristici ale fenomenelor economice sau sociale s | poat | fi exprimate, a unor instrum ente adecvate pentru m |surarea caracteristicilor fenomenelor i a unor m odalit|i de exprim are numeric |. Din nefericire ns |, att unit|ile de m |sur |, ct i instrumentele utilizate pentru exprimarea sub o form | cantitativ | a caracteristicilor fenomenelor economice i sociale, sunt caracterizate de inexactitate i instabilitate, iar utilizarea acestora este generatoarea unei multitudini de erori cu natur | extrem de variat|. Exprimarea sub o form | numeric | a caracteristicilor fenomenelor i proceselor economice sau sociale presupune un proces de observare a formelor individuale prin intermediul c |rora se manifest | acestea i de nregistrare a valorilor pe care le iau aceste caracteristici n momentul observ |rii. Odat| cu activitatea de nregistrare a m |rimilor caracteristicilor fenomenelor i proceselor economico-sociale, adic | a valorilor luate de variabilele supuse studiului, are loc i un proces implicit de m |surare, de cuantificare, proces ce presupune folosirea unor unit|i de m |sur | specifice i instrumente de lucru adecvate. De regul|, informa ia rezultat| n urma acestui proces este o informa ie brut|, primar |, care este cunoscut| sub numele de dat|. Cele mai dificile probleme cu care este confruntat| investigarea fenomenelor economice sau sociale, de-a lungul ntregului ir de procese de culegere, prelucrare i interpretare a informa iilor referitoare la aceste fenomene, apar tocmai n cadrul procesului de observare i nregistrare, de m |surare i cuantificare a caracteristicilor fenomenelor. n general, putem spune c | m |surarea i cuantificarea din domeniul socio-economic au ca obiective principale: stabilirea nivelului sau volumului fenomenelor economice i sociale; eviden ierea alc |tuirii lor structurale; caracterizarea evolu iei lor n timp sau spa iu; exprimarea leg |turilor acestora cu alte fenomene sau procese. Din punct de vedere conceptual, toate aspectele fenomenelor sau proceselor care fac obiectul m |sur |rii i cuantific |rii sunt reunite sub termenul generic de caracteristici ale acestor fenomene sau procese. n activitatea de m |surare i cuantificare din domeniul economico-social apar o serie de dificult|i, determinate de specificitatea acestui domeniu, cum ar fi: problema unit|ilor de m |sur |, par ialitatea informa iilor, problema erorilor, problema imposibilit|ii m |sur |rii directe etc.

1.3.1 Unit|ile de m|sur|O problem | dificil| i complex | care apare n mod frecvent n procesul de m |surare din domeniul economico-social, este cea dat| de faptul c | unit|ile de m |sur | utilizate pentru exprimarea sub form | numeric | a caracteristicilor unui anumit fenomen nu sunt stabile. Cu o problem | de acest fel este confruntat|, n special, activitatea de m |surare i cuantificare din domeniul economic. Spre deosebire de cele mai multe domenii ale tiin ei, n domeniul economic, unit|ile de m |sur | cunosc modific |ri substan iale n timp, modific |ri ce confer | rezultatelor m |sur |torilor un puternic caracter de instabilitate. De cele mai multe ori, varia ia unit|ilor de m |sur | este indus | chiar de modific |ri, de un anumit tip, ale fenomenelor i proceselor studiate, ale fenomenelor cu care acestea sunt, direct sau indirect, legate sau chiar a unor fenomene independente de fenomenele studiate.

4

1.3.2 Parialitatea informaiilorO alt| problem | ce ridic | o serie de dificult|i n m |surarea i cuantificarea din domeniul economico-social, este cea legat| de par ialitatea informa iilor disponibile pentru activit|ile de analiz | a datelor. Complexitatea fenomenelor economice i sociale, multitudinea a formelor de manifestare n timp i spa iu a acestora, fac ca ob inerea de informa ii printr-o observare complet| a desf |ur |rii acestor fenomene s | fie de cele mai multe ori imposibil|. n aceste condiii, modalitatea cea mai comod |, dar i cea mai eficient |, de ob inere a informa iilor necesare efectu |rii analizelor sau realiz |rii predic iilor este cea a observ |rii selective a manifest |rii fenomenelor. Aceast | modalitate de investigare se bazeaz | pe faptul c |, n anumite condiii, cunoa terea caracteristicilor ntregii popula ii poate fi ob inut| prin studierea direct| numai a unui anumit num |r de unit|i ce intr | n componen a acesteia, num |r care este mult mai redus n compara ie cu volumul total al popula iei. Alegerea unit|ilor ce vor fi efectiv supuse procesului de m |surare i nregistrare se face dup | criterii i reguli foarte precise, fundamentate riguros din punct de vedere statistico-matematic. Valorile pe care le iau caracteristicile unit|ilor studiate prin intermediul acestui procedeu alc |tuiesc a a-numitul e antion de observa ii. Investigarea fenomenelor i proceselor economice sau sociale pe baza informa iilor provenite din observ |ri selective i concluziile rezultate n urma acestei investig |ri sunt puternic influen ate de gradul n care informa iile ce alc |tuiesc e antionul sunt reprezentative la nivelul ntregii popula ii de la care au fost ob inute. De regul|, gradul de reprezentativitate al unui e antion este invers propor ional cu gradul de eterogenitate a popula iei i direct propor ional cu num |rul de unit|i incluse n e antion. n condiiile n care informa iile ob inute de la unit|ile selectate n e antion nu reproduc ntr-o m |sur | acceptabil| comportamentul fenomenului la nivelul ntregii popula ii, rezultatele analizelor efectuate vor fi incorecte, iar concluziile formulate pe baza acestora vor fi eronate. De aceea, n toate cazurile n care baza informa ional| utilizat| n procesele de analiz | a datelor este ob inut| pe calea observ |rii selective, este necesar | o laborioas | activitate de verificare a semnifica iei rezultatelor i de validare a concluziilor desprinse pe baza acestor rezultate. Implica iile negative ale caracterului de par ialitate a informa iilor din domeniul economico-social asupra valabilit|ii concluziilor formulate n urma prelucr|rii acestor informa ii, pot fi mult diminuate, dac | organizarea cercet|rii selective este f|cut | innd cont de o serie de principii de baz | ale teoriei selec iei, dac | n procesul de prelucrare a informa iilor sunt utilizate metodele i tehnicile statistico-matematice cele mai potrivite i dac | n extinderea rezultatelor nu sunt nc |lcate o serie de principii statistice elementare. Respectarea cu stricte e a cerin elor de acest tip poate conduce la ob inerea unor rezultate cu adev |rat excep ionale, chiar atunci cnd cantitatea de informa ie disponibil| este neglijabil| n raport cu dimensiunea i propor iile fenomenului studiat.

1.3.3 ErorileImpactul numeroaselor imperfec iuni legate de m |surarea i cuantificarea din domeniul economico-social este concretizat, din punct de vedere al proceselor de analiz | a datelor, n manifestarea unor distorsiuni i inexactit|i informa ionale. n mai toate cazurile, informa iile disponibile pentru efectuarea unor analize sau prognoze sunt afectate de erori. Faptul c | informa iile disponibile sunt puternic afectate de erori, ale c |ror surse sunt numeroase, variate i dificil de controlat, impune utilizarea unor modalit|i specifice de abordare i a unor instrumente de lucru corespunz |toare. Erorile ce nso esc observa iile rezultate din m |surarea i cuantificarea fenomenelor i proceselor economice sau sociale pot fi grupate n dou | mari categorii: erori cu caracter sistematic i erori cu caracter accidental, aleator.

Erorile cu caracter sistematicSunt erorile care afecteaz | n mod substan ial, semnificativ, natura i semnifica ia informa iilor i care pot determina denaturarea drastic | a rezultatelor ob inute i formularea unor concluzii fundamental eronate. Sursele erorilor cu caracter sistematic sunt numeroase i extrem de variate: gradul redus de reprezentativitate a informa iilor ob inute pe baz | de e antionare, imperfec iunile metodologice specifice calculului unor indicatori economici, raport|rile incorecte determinate de interesele de natur | fiscal| ale agen ilor economici, falsific |rile informa ionale la nivel guvernamental etc. Definiie: Eroarea cu caracter sistematic poate fi definit| ca reprezentnd diferen a dintre valoarea adev |rat| a unei m |rimi la nivel de popula ie i valoarea ob inut| pentru aceast| m |rime n urma m |sur |rii tuturor unit|ilor elementare ale popula iei. Problema cea mai dificil | legat | de impactul negativ al erorilor cu caracter sistematic este aceea c |, spre deosebire de erorile cu caracter ntmpl|tor, n cazul acestor erori nu se manifest | tendin a de compensare, astfel nct distorsionarea informa iei determinat| de aceste erori are loc numai ntr-un sens. n cazul erorilor de natur | sistematic |, influen a negativ | a acestora nu mai poate fi estompat | de caracterul de mas | al fenomenelor economico-sociale, care n cazul altor tipuri de erori poate conduce la compensarea efectelor erorilor.

Erorile cu caracter accidentalSunt erorile a c |ror influen | asupra semnifica iei informa iilor este neglijabil|; distorsiunile provocate de acest tip de erori la nivelul datelor ce descriu comportamentul fenomenelor economice sau sociale sunt, de regul|, de sens opus, astfel nct n numeroase situa ii are loc o compensare a influen elor acestora. Definiie: Eroarea cu caracter accidental, aleator poate fi definit| ca reprezentnd diferen a dintre valoarea unei m |rimi calculate pe baza unit|ilor apar innd unui e antion i valoarea aceleia i m |rimi calculat| pe baza tuturor unit|ilor popula iei. Faptul c | erorile de acest tip sunt distribuite dup | legea de probabilitate normal| ofer | posibilitatea abord |rii statistice a influen elor cu caracter distorsionant pe care le pot avea acestea asupra datelor. Pe de alt| parte, n virtutea legii numerelor mari, are loc un efect de compensare a erorilor de tip accidental, impactul negativ al acestora asupra calit|ii informa iilor utilizate n analiz | devenind neglijabil. 5

n principal, sursele erorilor cu caracter accidental, ntmpl|tor, in de o serie de factori cum ar fi: imperfec iunile instrumentelor de m |surare, deficien e n nregistrarea valorilor caracteristicilor urm |rite, efectuarea inexact| a unor calcule etc. O nsemn |tate cu adev |rat excep ional| pentru procesele de m |surare i cuantificare n care intervin erori cu caracter ntmpl|tor, o are faptul c | erorile de acest tip sunt distribuite dup | legea normal|, de medie nul|. Aceast | proprietate este deosebit de util| att pentru m |surarea impactului pe care erorile l au asupra informa iilor ob inute n urma proceselor de m |surare, de cuantificare i de analiz | a datelor, ct i pentru dezvoltarea unor proceduri specifice care au ca scop minimizarea influen ei erorilor asupra rezultatelor ob inute n analiza datelor. Formarea valorii unei m |sur |tori individuale, sub influena erorilor sistematice i accidentale, poate fi descris | cu ajutorul rela iei urm |toare:

Efectuarea analizelor de date n condiiile existen ei i manifest |rii erorilor de tip accidental, determin | necesitatea utiliz |rii unor metode i tehnici adecvate, de natur | statistico-matematic |.

1.3.4 M|surarea indirect|n numeroase situa ii din investigarea tiin ific |, este imposibil| m |surarea direct| a unor fenomene sau procese specifice domeniului economico-social. Situa iile de acest fel sunt ntlnite n cazul existen ei factorilor laten i sau ascun i, care au caracter neobservabil i care, n mod implicit, nu pot fi supu i unui proces direct de m |surare. Factorii laten i sunt expresia manifest |rii unor fenomene de maxim | generalitate, cu semnifica ie i consisten | foarte importante, caracterizate printr-o mare stabilitate a manifest |rilor lor. Ei reprezint| agreg |ri ale manifest |rilor unei multitudini complexe de fenomene cu natur | particular |. Datorit | semnifica iei i importan ei prin care factorii laten i se deta eaz | de fenomenele care reprezint| forme particulare de manifestare ale acestora, n numeroase investiga ii tiin ifice scopurile urm |rite sunt direct i strns legate ntr-o m |sur | mult mai mare de existen a factorilor laten i, n compara ie cu manifest |rile particulare ale acestora. De i au caracter neobservabil, factorii laten i se manifest | totdeauna n mod indirect, prin intermediul unor forme particulare de manifestare, forme care pot avea caracter observabil i care pot fi supuse unui proces de m |surare. n analiza datelor, se consider | c | formele particulare prin care se manifest | factorii laten i reprezint| indicatori ai factorilor laten i. n acest fel, informa iile disponibile cu privire la ace ti indicatori pot fi folosite pentru a deduce informa ii cantitative i calitative despre factorii laten i. Problema m |sur |rii indirecte, prin intermediul unor indicatori specifici, a factorilor cu natur | latent |, apare n mod frecvent n cazul investig |rii unor caracteristici psihosociale, n cercet|rile legate de cuantificarea nivelului de dezvoltare economic |, nivelului de dezvoltare social| sau nivelului progresului tehnic, n construirea unor indicatori agrega i etc. n aceste cazuri, se apeleaz | la proceduri speciale de estimare, la metode i tehnici de m |surare indirect| sau la metode de analiz| multidimensional|, cum ar fi: analiza componentelor principale, analiza factorial| sau analiza coresponden elor.

1.4. Definirea analizei datelorAnaliza datelor are ca obiectiv fundamental extragerea informa iei relevante, semnificative, care este con inut| n date, n informa ia primar |. Aceast | informa ie este utilizat|, n continuare, pentru rezolvarea unor probleme specifice ale analizei datelor: testare, estimare, interpretare, predic ii etc. Conceptul de analiz | a datelor este un concept extrem de cuprinz |tor i dificil de definit din punct de vedere al sferei de cuprindere, iar metodele i tehnicile utilizate n analiza datelor variaz | de la cele mai simple modalit|i de prezentare grafic | a datelor i calcul al unor indicatori statistici specifici, pn | la cele mai sofisticate metode de analiz | multidimensional|. Definiie: Activitatea de analiz| a datelor poate fi definit| ca reprezentnd o succesiune de opera ii de prelucrare i interpretare, opera ii efectuate asupra unor informa ii primare referitoare la fenomene i procese din realitatea economico-social| i bazate pe o mare varietate de metode i tehnici specifice, n scopul adncirii cunoa terii comportamentului acestor fenomene i procese i al formul|rii unor concluzii cu privire la specificitatea manifest |rii lor. n figura urm |toare, este eviden iat| o reprezentare simplificat| a procesului general de analiz | cantitativ |, a modului n care intervin cele trei elemente men ionate anterior i a principalelor faze ale acestui proces.

Figura 1.1: Reprezentarea simplificat| a unui proces general de analiz | cantitativ | 6

Privit ntr-un mod foarte general, procesul de analiz | a datelor poate fi prezentat ca o succesiune de opera ii sintetizate sub forma urm |toarelor activit|i: form ularea ipotezelor cu privire la comportamentul fenomenului ce constituie obiectul studiului; organizarea experim entelor necesare m |sur|rii caracteristicilor fenomenului studiat; culegerea datelor privind comportamentul fenomenului ; analiza i interpretarea datelor disponibile; form ularea concluziilor, efectuarea predic iilor i luarea deciziilor. Scopul urm |rit n cele mai multe probleme de analiz | a datelor este legat de crearea condiiilor informa ionale necesare pentru efectuarea de predic ii cu privire la comportamentul fenomenelor investigate. De i ntre activitatea de analiz | a datelor i activitatea de predic ie exist| numeroase deosebiri, legate n primul rnd de natura celor dou | activit|i, totu i, ntre cele dou | genuri de activit|i exist| o important | suprapunere. Aceast | suprapunere este determinat| de existen a unor modalit|i comune de abordare, de utilizarea unor concepte teoretice identice i de folosirea aceleia i game de instrumente de lucru. Cu toate c | obiectivele intermediare urm |rite n activitatea de predic ie sunt similare celor urm |rite n analiza datelor, totu i, scopul final al oric |rei activit|i de predic ie este legat n mod direct de prefigurarea evolu iei viitoare a fenomenelor i proceselor economice sau sociale, a modific |rilor structurale ce pot fi nregistrate n viitor de aceste fenomene i procese. Atingerea acestui scop este ns | condiionat| de desf |urarea unei laborioase activit|i de analiz | a datelor cu privire la realitatea fenomenului care face obiectul predic iei, activitate care, de regul|, precede procesul de predic ie propriu-zis. Con inutul activit|ii de analiz | a datelor din domeniul economico-social este strns legat de natura claselor de probleme supuse rezolv |rii. n func ie de aceast | natur |, analiza datelor poate presupune o anumit| succedare de activit|i specifice, utilizarea unei anumite game de metode i tehnici de lucru, urm |rirea anumitor obiective. n rndul categoriilor de probleme a c |ror rezolvare conduce la efectuarea unui proces de analiz | a datelor men ion |m: identificarea legit|ilor ce guverneaz | micarea fenomenelor i proceselor economice sau sociale, a principalelor tendin e i regularit |i specifice evolu iei acestora; identificarea principalilor factori sub a c |ror influen | se formeaz | comportamentul unor fenomene i procese; stabilirea sensului i intensit|ii leg |turilor cauzale manifestate ntre diferite fenomene i procese; determinarea gradului n care o mulime de factori de influen | contribuie la formarea unui anumit efect; verificarea unor ipoteze cu privire la existen a unor leg |turi de tip cauzal, la posibilitatea ca anumite caracteristici ale unor fenomene s | nregistreze anumite valori specifice etc; ierarhizarea factorilor ce determin | un anumit efect n func ie de importan a i semnifica ia influen ei acestora; stabilirea modului n care comportamentul fenomenelor este afectat de anumite decizii sau m |suri de politic | economic | i social|; identificarea principalelor posibilit|i prin intermediul c |rora comportamentul fenomenelor s| poat | fi influen at ntrun sens dorit; determinarea sensurilor n care comportamentul unui anumit fenomen poate evolua, a st |rilor posibile n care acesta se poate afla n spa iu i timp sau efectuarea de predic ii privind st|rile i evolu ia acestui fenomen. n func ie de specificul fiec |reia din aceste clase de probleme, activitatea de analiz | a datelor se poate concretiza printr-un anumit gen de opera ii de modelare statistico-matematic | i prelucrare informa ional| viznd: simplificarea i sintetizarea rela iilor de cauzalitate; m |surarea interdependen elor, cuantificarea influen elor i verificarea semnifica iei acestora; descrierea statistico-matematic | a comportamentului fenomenelor; efectuarea de predic ii; m |surarea gradului de omogenitate sau eterogenitate pentru anumite categorii de fenomene; clasificarea i ierarhizarea fenomenelor. Fiecare din aceste tipuri de opera ii presupune utilizarea unor instrumente de lucru corespunz |toare, eficiente n raport cu specificul problemei considerate. Dintre principalele metode i tehnici proprii analizei multidimensionale a datelor i utilizate pentru rezolvarea problemelor enumerate anterior men ion |m: analiza componentelor principale, analiza factorial|, analiza coresponden elor, tehnicile de scalare multidimensional|, metodele i tehnicile de estimare, analiza corela iilor canonice, analiza varian ei, analiza regresiei liniare i neliniare, metodele i tehnicile de recunoa tere a formelor.

1.5 Clasificarea metodelor de analiz| a datelorn general, n analiza de date, obiectul studiului este reprezentat de c |tre o mulime de date structurat| sub forma unui anumit num |r de variabile i a unui anumit num |r de observa ii. Aceast | structur | informa ional| este reprezentat| prin intermediul unei entit|i cunoscute sub numele de matrice de observa ii. n func ie de natura variabilelor analizate i de informa iile existente aprioric cu privire la natura leg |turilor cauz |-efect n care sunt implicate variabilele, metodele de analiz | a datelor pot fi grupate n dou | mari categorii: metode de analiz| a dependen ei i metode de analiz| a interdependen ei. Metodele de analiz| a dependen ei sunt metode statistice utilizate n cazul n care variabilele considerate n cadrul unei analize pot fi grupate n dou | submulimi i au ca scop testarea prezen ei sau absen ei unor interdependen e ntre cele dou | submulimi de variabile. n situa ia n care exist| informa iile necesare, astfel nct, variabilelor dintr-un set li se poate atribui semnifica ia de variabile dependente, iar variabilelor din cel|lalt set li se poate atribui semnifica ia de variabile independente, metodele de analiz | a dependen ei au ca scop de a determina dac | i cum variabilele independente influen eaz| variabilele dependente, att n manier | individual|, ct i n manier | comun |, simultan |. De regul|, dndu-se o mulime de date reprezentate de observa iile efectuate asupra unor variabile, cu ajutorul metodelor statistice se poate verifica doar dac | exist| leg |turi, interdependen e ntre variabile, putndu-se, eventual, determina sensul 7

leg |turilor (directe sau inverse) sau chiar m |sura intensitatea acestor leg |turi. Ceea ce nu se poate stabili cu ajutorul metodelor i tehnicilor statistice este natura, sensul rela iilor de cauzalitate, respectiv, care sunt variabilele dependente i care sunt variabilele independente ce determin | evolu ia, micarea celor dependente. Pentru a stabili cu exactitate rela ia cauz|-efect este nevoie de informa ii suplimentare, apriorice, exogene n raport cu metodele i tehnicile statistice utilizate. Exist| un anumit context al analizei datelor, n cadrul c |ruia delimitarea variabilelor dependente de variabilele independente este foarte clar |, neechivoc |. Acest context este ntlnit n cadrul experimentelor controlate, cnd, n urma stabilirii unor combina ii de nivele ale variabilelor independente, sunt m |surate nivelele nregistrate pentru variabilele dependente, ca urmare a influen ei exercitate de fiecare combina ie de nivele ale variabilelor dependente. n multe situa ii, analiza datelor este efectuat| pe mulimi de variabile pentru care nu exist| nici interesul i nici posibilitatea conceptual| de a separa din mulimea variabilelor analizate o submulime care s | reprezinte variabilele dependente i o alt| submulime care s | reprezinte variabile independente. n aceste situa ii, sunt utilizate metode de analiz | specifice, cunoscute sub numele de metode de analiz| a interdependen ei. Metodele de analiz| a interdependen ei sunt metodele statistice utilizate n cazul n care nu exist| posibilitatea de a identifica n mulimea variabilelor analizate variabile dependente i variabile independente i care au scopul de a stabili din ce cauz| i n ce m |sur | variabilele analizate sunt legate ntre ele. Utilizarea acestor metode are o mare varietate de scopuri, dintre care, printre cele mai importante, amintim: m |surarea gradului de interdependen |, identificarea variabilelor cu semnifica ie relevant|, identificarea unor categorii sau clase de variabile.

1.5.1 Metode de analiz| a dependeneiMetodele de analiz | a dependen ei pot fi clasificate n func ie de mai multe criterii, dintre care cele mai importante sunt urm |toarele: num |rul de variabile dependente: o singur | variabil| dependent| sau mai multe variabile dependente; num |rul de variabile independente: o singur | variabil| independent| sau mai multe variabile independente; tipul scalei pe care sunt m |surate variabilele dependente: scal| non-metric | sau scal| metric |; tipul scalei pe care sunt m |surate variabilele independente: scal| non-metric | sau scal| metric |; Metodele de analiz | a dependen ei pot fi clasificate n func ie de num |rul de variabile dependente i de num |rul de variabile independente n dou | grupe: metode unidimensionale de analiz| a dependen ei; metode multidimensionale de analiz| a dependen ei. n categoria metodelor unidimensionale se ncadreaz | analiza regresiei simple, analiza discriminantului, procedurile unidimensionale de verificare a unor ipoteze etc. Metodele de analiz | multidimensional| a dependen ei se mpart, n func ie de num |rul variabilelor dependente, n dou | categorii: metode de analiz| multidimensional| cu o singur | variabil| dependent|; metode de analiz| multidimensional| cu mai multe variabile dependente. n rndul metodelor de analiz | multidimensional| cu o singur | variabil| dependent | pot fi men ionate: analiza regresiei multiple, analiza discriminantului, analiza varian ei etc. Ca metode de analiz | multidimensional| cu mai multe variabile dependente putem men iona: analiza corela iilor canonice, analiza multidimensional| a varian ei etc. O clasificare sintetic | a metodelor de analiz | a dependen ei, n func ie de criteriile de mai sus, este prezentat| n tabelul urm |tor. Clasificarea metodelor de analiz | a dependen ei Num |r variabile independente Num |r variabile dependente O variabil| Scal| non-metric| Scal| nonmetric | Scal| metric | Scal| nonmetric | Analiza discriminantului (discret|) Scal| metric| testul t Mai multe variabile Scal| non-metric| Analiza multigrup a discriminantului (discret|) Analiza multigrup a discriminantului Analiza multigrup a discriminantului (discret|) Analiza multigrup a discriminantului Scal| metric| Analiza multidimensional| a varianei (MANOVA) Analiza corelaiilor canonice Analiza multidimensional| a varianei (MANOVA) Analiza corelaiilor canonice

O variabil|

Analiza Regresie discriminantului simpl| Regresie logistic| Analiza discrimi- Analiza nantului (discret|) ANOVA Analiza simultan| (MONANOVA) Analiza Regresie discriminantului multipl| Regresie logistic|

Mai multe variabile

Scal| metric |

1.5.2 Metode de analiz| a interdependeneiAnaliza interdependen ei are ca scop s | identifice i s| eviden ieze situa iile n care variabilele sunt corelate ntre ele i s| explice modul n care are loc corelarea variabilelor supuse analizei. n func ie de num |rul de variabile analizate, metodele de 8

analiz | a interdependen ei se mpart n dou | categorii: metode de analiz| a interdependen ei dintre dou | variabile; metode de analiz| a interdependen ei dintre mai multe variabile. n cadrul metodelor de analiz | a interdependen ei dintre dou | variabile putem men iona: analiza corela iei simple, analiza bazat| pe tabele de contingen | etc. Dintre metodele de analiz| a interdependen ei dintre mai multe variabile putem men iona: analiza componentelor principale, analiza factorial|, analiza coresponden elor, analiza cluster etc. n tabelul urm |tor este prezentat| sintetic clasificarea metodelor i tehnicilor de analiz | a interdependen ei. Clasificarea metodelor de analiz | a interdependen elor Num |r variabile Dou | variabile Tabele de contingen| (bidimensionale) Modele log-liniare Analiza corespondenelor Modele log-liniare Tabele de contingen| (multidimensionale) Tipul scalei Scal| non-metric | Scal| metric | Analiza corelaiei simple

Mai multe variabile

Analiza componentelor principale Analiza factorial|

1.6 Analiza preliminar| a datelorUna din cele mai importante etape ale procesului de analiz | a datelor din domeniul economico-social este cea a analizei prelim inare, cunoscut| i sub numele de analiz| exploratorie a datelor. Analiza preliminar| este o activitate anterioar |, preg |titoare, a analizei propriu-zise a datelor, care are ca scop iniializarea procesului de analiz |. n cadrul acestei etape, informa iile primare disponibile sunt supuse unui proces de prelucrare n cadrul c |ruia are loc o filtrare a informa iilor din punct de vedere al semnifica iei i utilit|ii pe care le au acestea n raport cu scopurile urm |rite. Activitatea de analiz | preliminar| a datelor presupune utilizarea unei game variate de metode i tehnici statistico-matematice n scopul ob inerii unei sugestive caracteriz |ri statistice a acestor informa ii. Preponderent| ca utilizare n faza de analiz | preliminar| a datelor i cu o utilitate de necontestat pentru activitatea tiin ific | din aceast | etap |, este analiza grafic |. Utilizarea tehnicilor de analiz | grafic | n faza preliminar| a analizei datelor vizeaz |, n principal, urm |toarele categorii de probleme: identificarea principalelor tendin e manifestate la nivelul observa iilor disponibile; depistarea principalelor leg |turi existente ntre variabilele supuse analizei; detectarea valorilor extreme, izolate, a c |ror apari ie n mulimea datelor analizate nu se justific | din punct de vedere statistic. Exist| n prezent numeroase instrumente software, cu ajutorul c |rora pot fi efectuate, ntr-o manier | comod | i eficient |, cele mai complexe reprezent |ri grafice.

1.7 Suportul software n analiza datelorApariia calculatoarelor bazate pe microprocesoare i larga accesibilitate a acestora din punct de vedere al pre ului i software-ului aplicativ au f|cut ca, n prezent, s | nu existe domeniu de cercetare n care calculatorul electronic s | nu fie instrumentul cel mai frecvent folosit pentru rezolvarea celor mai diverse probleme. Prelucrarea unui volum uria de informa ii, pe baza unor algoritmi de o complexitate deosebit| i n condiii de precizie ridicat|, nu se poate realiza dect cu ajutorul calculatorului electronic, chiar a unui calculator electronic performant. n domeniul analizei datelor, exist| zeci i zeci de produse software, de dat| mai mult sau mai pu in recent|. O inventariere, pe care nu o putem pretinde a fi exhaustiv |, dar care poate fi considerat| ca fiind minimal |, pe care am f|cut-o n anul 2005, cu privire la instrumentele software existente n lume la acest moment, ne-a condus la identificarea a peste 100 de astfel de instrumente software specializate. Num |rul lor este cu att mai semnificativ cu ct aceste produse software sunt de notorietate mondial|, avnd o larg | utilizare n domeniul analizei datelor. Printre cele mai noi i mai performante instrumente software existente n prezent, destinate, total sau par ial, activit|ilor de analiz | a datelor, putem men iona: SPSS 10.0, SPSS Inc., Chicago, IL, USA, 1999; STATISTICA 6.0, StatSoft Inc., Tulsa, OK, USA,2001; S-PLUS 2000, MathSoft Inc., Seattle, W ashington, USA, 1999; SAS 8.2, SAS Institute Inc., Cary, NC, USA, 2001; SYSTAT 9.0, SPSS Inc., Chicago, IL, USA, 1999; MATHEMATICA 4.0, W olfram Research, Champaign, IL, USA,1999; EVIEWS 3.0, Quantitative Micro Software, Irvine, CA, USA, 2000. n afar | de existen a unei mari variet|i de instrumente software destinate analizei datelor, n prezent se poate identifica o tendin | de dezvoltare exploziv | a preocup |rilor din acest domeniu, tendin | determinat| de necesit|ile informa ionale tot mai mari i mai rafinate ale indivizilor i entit|ilor economice i sociale. 9

Tema 2. Concepte i operaii specifice econometriei i analizei datelor2.1 Concepte fundamentale ale analizei datelorTeoria i practica analizei datelor se bazeaz | pe o serie de concepte fundamentale, a c |ror definire este deosebit de important | pentru n elegerea demersului tiin ific presupus de acest tip de analiz |, pentru definirea i n elegerea procedurilor i instrumentelor specifice ale acestei discipline, pentru desf |urarea eficient| a organiz |rii i proiect|rii activit|tilor de analiz | i pentru interpretarea rezultatelor ob inute din analiz |. Conceptele utilizate n analiza datelor i definirea riguroas | a acestora prezint| importan | nu numai pentru a facilita definirea i n elegerea procedurilor, metodelor i tehnicilor de analiz | a datelor, ci i pentru asigurarea unei modalit|i coerente i sugestive de interpretare i prezentare a concluziilor rezultate din analiz |. Pe lng | conceptele proprii, specifice, n analiza datelor sunt utilizate numeroase concepte care in de domenii nrudite cu analiza datelor, cum ar fi: teoria probabilit|ilor i statistica, econometria, teoria economic |, informatica etc. Din acest motiv, mulimea conceptelor cu care se opereaz | n domeniul analizei datelor este extrem de cuprinz |toare i extrem de variat|.

2.1.1 DataConceptul cel mai important i cel mai frecvent ntlnit n analiza datelor, care, de fapt, intr | i n alc |tuirea numelui acestui tip de activitate tiin ific |, este reprezentat de dat|. Importan a acestui concept pentru domeniul analizei datelor este, cu adev |rat, covr itoare, deoarece el este cel care define te att intr |rile oric |rui proces de analiz | a datelor, materia prim | supus | prelucr|rii, ct i, ntr-un sens general, ie irile sale, rezultatele i concluziile ob inute. Datele pot fi privite ca reprezentnd semnale i mesaje provenite din realitatea nconjur |toare, pe baza c |rora receptorul i poate forma o anumit| imagine despre respectiva realitate, poate ob ine un anumit grad de cunoa tere a acelei realit|i. Imaginea format| este cu att mai fidel| n raport cu realitatea, cu ct cantitatea semnalelor i mesajelor este mai mare, respectiv, cu ct acestea sunt mai pu in afectate de perturba ii i de distorsiuni. De regul |, datele nu sunt recep ionate n mod pasiv de beneficiarul lor, f|r | nici un efort din partea acestuia. Aproape f|r | excep ie, ob inerea datelor necesare pentru orice activitate de analiz | constituie un proces costisitor i laborios. n analiza datelor, datele reprezint| expresia cantitativ | sau calitativ | a unor fapte reale, care sunt manifest |ri ale fenomenelor i proceselor investigate. Eterogenitatea fenomenelor i a manifest |rii concrete a acestora face ca datele referitoare la ele s | fie extrem de variate. Definiie: Datele reprezint| expresii cantitative i calitative ale unor fenomene i procese din realitatea nconjur |toare. Datele pot s| difere n func ie de mai muli factori: de sursa care le-a generat, de tipul i de natura lor. Indiferent de varietatea lor, datele pot fi grupate n trei categorii fundamentale: date cantitative, date calitative i date mixte. Toate cele trei tipuri de date pot fi, ns |, exprimate sub form | cantitativ |.

2.1.2 Populaia i eantionulUnul din conceptele fundamentale ale analizei datelor, de care este legat| definirea multora dintre conceptele uzuale ale acestei discipline este cel de popula ie statistic |. n raport cu acest concept fundamental sunt definite majoritatea celorlalte concepte utilizate n analiza datelor: e antion, caracteristici, variabile, observa ii, parametri, grade de libertate. Definiie: Popula ia sau colectivitatea general| este reprezentat| de mulimea tuturor m |sur |torilor efective sau conceptuale care prezint| interes pentru cercet|tor sau experimentator. n general, se poate spune c | popula ia statistic | reprezint|, obiectul de studiu global al analizei datelor. Aceasta deoarece majoritatea tehnicilor i instrumentelor de analiz | a datelor au ca scop deducerea unor legit|i care guverneaz | popula ia statistic |, ob inerea unor estima ii pentru o serie de m |rimi specifice aceleia i popula ii statistice, efectuarea de predic ii referitoare la structurarea pe tipologii sau la evolu ia popula iei statistice. De i popula ia reprezint| obiectul investiga iei tiin ifice, totu i, analiza datelor vizeaz | n mod direct, aproape exclusiv, observa iile de la nivelul e antionului. Popula ia statistic | poate fi definit| ca reprezentnd totalitatea observa iilor posibile dintr-un studiu. Generic, o unitate component | a unei popula ii statistice se nume te unitate elementar |, element, individ, subiect, obiect, profil, form |, articol sau caz. Ca exemple de unit|i elementare ale unei popula ii statistice putem men iona: cump |r |torul, firma, locuitorul unei |ri sau al unui ora , produsul, familia etc. n func ie de num |rul, finit sau infinit, al elementelor din care este alc |tuit | o popula ie statistic |, aceasta poate fi de dou | tipuri: popula ie finit| i popula ie infinit|. Teoretic, ntr-o problem | de analiz | a datelor pot fi studiate, fie toate observa iile posibile, adic | ntreaga popula ie, fie o parte, mai mare sau mai mic | a acestora, numit| e antion. Definiie: E antionul reprezint| o submulime de m |sur |tori selectate dintr-o popula ie, o submulime a popula iei statistice supus | investiga iei tiin ifice. E antionul are o importan | fundamental| n analiza datelor deoarece acesta, i nu popula ia total|, reprezint|, de fapt, baza informa ional| utilizat| n procesele de analiz | a datelor. Informa iile primare manipulate n activitatea de analiz | a datelor sunt 10

de fapt rezultatele m |sur |torilor efectuate la nivel de e antion. O modalitate de vizualizare a rela iei, a raportului n care se g |se te e antionul fa | de popula ia statistic | este prezentat| n figura urm |toare.

Figura 2.1: Ilustrarea rela iei dintre e antion i popula ie O foarte mare importan | principial| pentru analizele cantitative bazate pe studiul e antioanelor, o are postulatul statistic n conformitate cu care un e antion exprim | informa ional ntr-o oarecare m |sur | popula ia din care a fost extras, propriet|ile i structura popula iei fiind cu att mai fidel exprimate de e antion cu ct volumul acestuia este mai mare.

2.1.3 Caracteristici i variabileDin punct de vedere al informa iei statistice, o popula ie statistic | prezint| interes nu n raport cu unit|ile, ca atare, din care este alc |tuit | popula ia, ci n raport cu tr |s |turile, propriet|ile acestor unit|i. Propriet|ile unit|ilor elementare apar innd unei popula ii statistice sunt numite n analiza datelor caracteristici sau atribute. Fiecare unitate elementar | a popula iei investigate poate avea o singur | caracteristic | sau mai multe caracteristici. n cel de-al doilea caz, n studierea popula iei statistice apare necesitatea abord |rii multidimensionale, necesitatea utiliz |rii unor instrumente i tehnici de analiz | specifice caracterului multidimensional. n func ie de natura lor, caracteristicile unit |ilor unei popula ii pot fi de dou | tipuri: caracteristici calitative i caracteristici cantitative. Caracteristicile sau atributele unit|ilor elementare ce alc |tuiesc o anumit| popula ie sunt elemente ale unei realit|i date, de natur | empiric |. De regul|, n activitatea tiin ific | nu se opereaz | cu elementele realit|ii ca atare, ci cu sim boluri care sunt reprezent|ri abstracte ale realit|ii. M |surarea caracteristicilor unit|ilor unei popula ii este echivalent | cu atribuirea de simboluri, numerice sau nenumerice, acelor caracteristici. n general, simbolurile care pot s| ia o varietate de valori se numesc variabile. n cadrul demersurilor tiin ifice care au ca scop investigarea fenomenelor i proceselor economice sau sociale, caracteristicile unit|ilor unei popula ii sunt reflectate prin intermediul conceptului de variabile, tocmai pentru a sugera natura schimb |toare a acestora, variabilitatea lor n timp i spa iu. Variabila este, poate, cel mai important concept vehiculat n cadrul oric |rui proces de analiz | a datelor, n raport cu care se define te ntreaga succesiune de opera ii de prelucrare specifice acestui proces. Informa iile care sunt elemente de intrare n procesele de analiz | a datelor, reprezint|, aproape f|r | excep ie, m |sur |tori asupra unor caracteristici, m |sur |tori care definesc valori ale variabilelor ce simbolizeaz | caracteristicile popula iei analizate. Definiie: Variabila reprezint| o abstractizare a mulimii de valori posibile pe care le poate nregistra o caracteristic | a unui anumit fenomen. Varietatea fenomenelor economico-sociale i modalit|ile diferite de exprimare a caracteristicilor acestora fac ca variabilele prin intermediul c |rora sunt descrise aceste caracteristici s| aib | natur | diferit|. Ca i caracteristicile popula iilor, dup | natura pe care o au, variabilele pot fi de dou | tipuri: variabile calitative i variabile cantitative. n analiza datelor apare necesitatea trat|rii diferen iate a datelor de tip calitativ i cantitativ deoarece exist| diferen e substan iale ntre aceste tipuri de date att din punct de vedere al modalit|ilor de abordare i interpretare, ct i din punct de vedere al metodelor i tehnicilor utilizate n analiz |. Din aceste motive, se face o deosebire net| ntre variabilele de tip calitativ i variabilele de tip cantitativ. Definiie: Variabilele calitative sunt variabile ce difer | prin tip, se refer | la propriet|i nenumerice ale unit|ilor elementare apar innd unei popula ii i nu pot fi exprimate numeric. n cazul n care, n mod conven ional, valorile lor sunt codificate prin numere, aceast| exprimare nu este relevant| numeric. Variabile calitative sunt: sexul, op iunea cump |r |torului, op iunea aleg |torului, profesia, starea civil | etc. Definiie: Variabilele cantitative sunt variabile care difer | prin m |rime, se refer| la propriet|i numerice ale unit|ilor elementare dintr-o popula ie i sunt exprimate n unit|i numerice: de lungime, de greutate, valorice etc. Variabile cantitative sunt: pre ul unui produs, cheltuielile lunare ale unei familii, salariul mediu lunar, venitul na ional, volumul fizic al produc iei etc. n func ie de natura valorilor pe care le iau, variabilele se mpart n dou | categorii: variabile de tip discret i variabile de tip continuu. Definiie: Variabilele de tip discret sunt variabile care pot lua o mulime limitat|, finit| de valori i care se mai numesc i variabile categoriale. Valorile luate de variabilele discrete se numesc alternative, categorii, variante sau m odalit|i. De regul|, variabilele

11

calitative sunt variabile de tip discret. Variabile de tip discret pot fi ns | i unele variabile cantitative. Definiie: Variabilele de tip continuu sunt variabile care pot lua valori apar innd unui interval continuu. Practic, mulimea valorilor posibile ale variabilelor de tip continuu este o mulime infinit |. De regul|, variabilele calitative nu sunt variabile de tip continuu.

2.1.4 ObservaiiStrns legat de conceptul de variabil|, este un alt concept, la fel de important i frecvent utilizat n analiza datelor, i anume, conceptul de observa ie. Definiie: Observa ia este reprezentat| de valoarea sau setul de valori nregistrate pentru o anumit| unitate elementar | a popula iei, la una sau mai multe caracteristici ale acesteia. De fapt, observa iile sunt valori pe care le iau variabilele supuse analizei, valori care sunt rezultate din m |sur |torile efectuate asupra caracteristicilor unit|ilor apar innd popula iei investigate. Observa ia reprezint| n procesul de analiz | a datelor unitatea elementar | de informa ie utilizat| n procesele de prelucrare, mulimea observa iilor constituind baza informa ional| a analizei datelor. Practic, mulimea de observa ii supuse procesului de analiz | este echivalent | cu e antionul, care, la rndul s|u, nu este altceva dect tot o mulime de observa ii. De cele mai multe ori, prin observa ie se n elege chiar entitatea elementar | care intr | n alc |tuirea popula iei analizate i de la care se ob in informa ii. n acest sens, observa ia este sinonim | cu cazul, obiectul, individul, subiectul, articolul.

2.2 Tipuri de date primaren func ie de modul n care sunt ob inute, datele primare pot fi clasificate n mai multe categorii. Vom prezenta, n continuare, dou | dintre clasific |rile cele mai importante ale datelor primare: clasificarea n func ie de natura contextului n care acestea sunt ob inute i clasificarea n func ie de modul de ob inere a acestora.

2.2.1 Date experimentale i date non-experimentaleDin punct de vedere al naturii contextului n care datele sunt ob inute, al modului n care investigatorul controleaz | sau nu, n procesul ob inerii datelor, popula ia supus | studiului, datele pot fi grupate n dou | categorii: date experim entale; date non-experim entale sau date observa ionale. Diferen ele dintre datele experimentale i non-experimentale in nu numai de natura contextului n care ele sunt ob inute, ci i de modul n care ele sunt utilizate n analiza datelor, de metodele, instrumentele i procedurile utilizate pentru prelucrarea acestora.

2.2.1.1 Date experimentaleDatele experimentale sunt datele ob inute prin organizarea unor experimente de tip controlat, desf |urate n condiii clare i prestabilite. Contextul ob inerii datelor de tip experimental este restric ionat, prin impunerea unor reguli specifice. n general, organizarea unui experiment controlat presupune, n primul rnd, izolarea fenomenelor i proceselor studiate, precum i eliminarea, n ct mai mare m |sur |, a influen elor externe, care nu prezint | interes pentru analiz |. O alt| etap | important | a experimentului controlat este aceea a stabilirii factorilor i cauzelor importante, cu semnifica ie, care i exercit| influen a asupra m |rimilor exogene, precum i a alegerii nivelelor la care influen a acestora va fi urm |rit |. Cea de-a treia etap | a procesului de ob inere a datelor experimentale const | n desf|urarea experimentului propriu-zis, etap | n care sunt doza i, n condiii specifice, factorii de influen |. n aceast | etap |, se fixeaz | nivele concrete pentru fiecare din factorii de influen |, se creaz| condiiile necesare pentru exercitarea influen elor factorilor i se m |soar | efectul influen ei factorilor asupra m |rimii sau m |rimilor de ie ire. Datele ob inute n urma unui astfel de proces, adic | datele experimentale, sunt reprezentate de dou | categorii de informa ii: valorile fixate pentru nivelurile factorilor de influen | i valorile rezultate pentru variabila sau variabilele dependente, n urma exercit|rii acestor influen e. Definiie: Datele experim entale reprezint| informa ii ob inute prin organizarea unor experimente controlate, n care influen ele factorilor asupra efectului sunt controlate n mod direct, prin fixarea unor combina ii precise de influen e. Datele experimentale sunt caracteristice doar unor domenii de cercetare, i anume acelor domenii n care pot fi organizate experimente specifice, necesare ob inerii acestor date. Experimentarea este posibil| doar n anumite domenii ale cunoa terii, cum ar fi, de exemplu, domeniul tiin elor naturale: fizic |, chimie, biologie etc. ntr-o alt| modalitate de exprimare, se poate spune c | datele experimentale sunt date de laborator, prin laborator n elegnd aici o serie de condiii speciale, care se refer | att la o serie de restric ii i instrumente specifice de m |surare, ct la modalitatea de desf |urare a unor procese cauzale specifice. Spre deosebire de aceste domenii, n domeniul economico-social experimentarea este fie total imposibil|, fie posibil|, dar numai foarte rar i n condiii foarte restrictive i costisitoare.

2.2.1.2 Date non-experimentaleDatele non-experimentale, care se mai numesc i date observa ionale, sunt datele ob inute prin observarea fenomenelor i proceselor n micarea lor natural|, liber |, f|r | impunerea unor restric ii, f|r | a se exercita un control de un anumit fel asupra fenomenelor i proceselor investigate.

12

Definiie: Datele non-experim entale reprezint| informa ii ob inute prin observarea liber | a mic |rii fenomenelor i proceselor studiate, f|r | interven ia direct| a investigatorului asupra condiiilor n care se desf |oar | acest | micare. Ob inerea datelor de tip non-experimental reprezint| rezultatul observ |rii pasive, constat|rii. Interven ia observatorului, a celui care face m |sur |torile, este de tip ex-post, are loc dup | ce desf |urarea fenomenelor i proceselor reale a avut loc. Datele de tip non-experimental sunt datele specifice domeniului economico-social, domeniu n care organizarea de experimente este fie dificil|, fie imposibil|. Mai mult dect att, complexitatea influen elor din domeniul economico-social, multitudinea interac iunilor din acest domeniu, determin | o relevan | foarte sc |zut | pentru eventualele date de natur | experimental|.

2.2.2 Date de tip profil, serii de timp i date panelDin punct de vedere cronologic, observarea unei popula ii de fenomene sau procese, n scopul ob inerii informa iilor necesare, poate avea loc sub dou | forme diferite: static i dinamic. Din acest punct de vedere, datele primare pot s| constituie fie o imagine de tip static a popula iei, n care aceste date s | reprezinte informa ii legate de starea unit|ilor popula iei la un moment dat, fie o imagine de tip dinamic, evolutiv, n care datele s | reprezinte informa ii legate de evolu ia n timp a unei sau unor unit|i ale popula iei. Avnd n vedere aceste dou | modalit|i de a observa unit|ile unei popula ii, datele primare pot fi grupate n trei categorii: date de tip profil; date de tip serii de tim p; date de tip panel; Ca i n cazul datelor experimentale, analiza datelor diferen iaz | semnificativ modalit|ile de abordare, n raport cu fiecare din aceste categorii de date. Din acest motiv, consider |m c | este necesar | o scurt| prezentare a acestor trei tipuri de date.

2.2.2.1 Date de tip profilDatele de tip profil reprezint| rezultate ale unor m |sur |tori efectuate, la un moment dat, asupra uneia sau mai multor caracteristici, de-a lungul unit|ilor popula iei, adic | pe mulimea unit|ilor sau obiectelor care sunt supuse studiului. Datele de tip profil se mai numesc date de tip secven | sau date de tip sec iune i reprezit| t|ieturi informa ionale efectuate ntr-o anumit| popula ie la un moment dat, t|ieturi care sunt de tip transversal, n raport cu axa timpului. Definiie: Datele de tip profil reprezint| informa ii ob inute prin m |sur |tori de natur | static |, efectuate asupra caracteristicilor unor unit|i ale unei popula ii, la acela i moment de timp. O observa ie n contextul datelor de tip profil este reprezentat| de valoarea sau de valorile unei singure entit|i, ale unei singure unit|i din popula ie. Num |rul de observa ii coincide, n cazul datelor de tip profil, cu num |rul de unit|i observate i nregistrate. D atele de tip profil nu ncorporeaz | n semnifica ia pe care acestea o poart|, influen a timpului asupra form |rii caracteristicilor la nivelul popula iei i sensul scurgerii timpului, nici n mod explicit i nici n mod implicit. Ca exemple de date de tip profil, putem men iona: datele referitoare la salariul individual dintr-o lun | al lucr|torilor unei firme; datele referitoare la popula ia medie a statelor lumii ntr-un anumit an; datele referitoare la rata infla iei nregistrat| de |rile lumii ntr-o anumit| perioad |; sexul cump |r |torilor ce cump |r | un anumit bun ntr-o anumit| perioad |; num |rul mediu nregistrat de popula ia jude elor unei |ri ntr-un anumit an; volumul anual al vnz |rilor unor m |rci de autoturisme, num |rul voturilor nregistrate de partidele nscrise ntr-o campanie electoral| etc. De regul|, datele de tip profil se refer | la starea pe care o au la un anumit moment indivizii apar innd unor anumite colectivit|i, gospod |riile, firmele, ramurile, unit|ile administrativ-teritoriale, |rile lumii etc.

2.2.2.2 Date de tip serii de timpDatele de tip serii de tim p, numite i serii cronologice sau, pur i simplu, serii de tim p, reprezint| rezultate ale unor m |sur |tori efectuate asupra caracteristicilor unei unit|i a popula iei studiate, de-a lungul timpului, la momente succesive ale evolu iei acesteia, la anumite intervale de timp. Intervalele de timp pentru care se fac m |sur |torile pot fi reprezentate de: ore sau frac iuni de ore, zile, s |pt|mni, decade, luni, trimestre, semestre, ani. Deoarece intervalele sunt egale i reprezint| scurgerea timpului, observa iile rezultate n urma acestor m |sur |tori sunt succesive i, de regul|, echidistante n timp. Definiie: Datele de tip serii de tim p sau seriile cronologice reprezint| informa ii ob inute prin m |sur |tori de natur | dinamic |, efectuate asupra caracteristicilor unei unit|i a unei popula ii la momente sau n intervale succesive de timp. Datele reprezentate de seriile de timp se refer | la evolu ia n timp a st|rii unui individ, gospod |rii, zone geografice, |ri etc. Datele de acest tip pot fi date de tip interval sau date de tip moment. Datele de tip interval sunt datele care se refer | la caracteristici care sunt m |rimi de tip stoc, n timp ce datele de tip moment sunt date care se refer | la caracteristici care sunt m |rimi de tip flux. i n acest caz, datele de tipul seriilor de timp pot fi privite ca reprezentnd sec iuni informa ionale, ns | aceste sec iuni sunt de-a lungul axei timpului, de-a lungul evolu iei, adic | sunt sec iuni longitudinale n raport cu axa timpului.

2.2.2.3 Date de tip panelDatele de tip panel sunt date care reprezint| combina ii, mixturi ale datelor de tip profil i datelor de tipul seriilor de timp. Ele sunt rezultate ale m |sur |torilor efectuate asupra caracteristicilor unor unit|i individuale, att de-a lungul unit|ilor individuale, ct i de-a lungul timpului. Definiie: Datele de tip panel reprezint| informa ii ob inute prin m |sur |tori mixte, de natur | static | i de natur | dinamic |, efectuate asupra caracteristicilor acelora i unit|i ale unei popula ii la momente sau n intervale succesive de timp. Datele de tip panel pot fi imaginate ca reprezentnd t|ieturi informa ionale mixte, transversale i longitudinale, n raport 13

cu axa timpului. n cazul datelor de tip panel, observarea se face ntr-o not| de simultaneitate: att asupra mai multor unit|i ale popula iei, ct i asupra evolu iei n timp a acestor unit|i. Exemplul cel mai sugestiv pentru datele de tip panel este cel al bugetelor de familie, n contextul c |rora se fac nregistr |ri pe perioade de mai muli ani a veniturilor i cheltuielilor tuturor familiilor care alc |tuiesc e antionul respectiv.

2.2.3 Scala de m|surare a variabilelorA a cum am men ionat anterior, materia prim | n analiza datelor este reprezentat| de m |sur |torile efectuate asupra unor caracteristici ale popula iei statistice. n analiza datelor, aceste m |sur |tori sunt considerate a reprezenta valori ale unor variabile definite n raport cu caracteristicile analizate. Indiferent de tipul ei, valoarea nregistrat| de o caracteristic | la nivelul unui obiect este totdeauna rezultatul exprim |rii univoce a valorii respectivei caracteristici n func ie de grada iile unei anumite scale.

2.2.3.1 Definirea scaleiM |surarea reprezint| un proces prin intermediul c |ruia se asociaz | numere sau simboluri unor caracteristici sau propriet|i ale unor obiecte sau ale unor subiec i, care constituie obiectul studiului. Atribuirea de numere sau simboluri pentru caracteristicile sau propriet|ile unor obiecte se face pe baza respect|rii unor reguli prestabilite i prin utilizarea unor proceduri specifice. De exemplu, dac | obiectul studiului este reprezentat de indivizi care sunt poten iali cump |r |tori ai unui anumit produs, atunci caracteristicile c |rora este necesar a li se atribui numere sau simboluri pot fi: vrsta, venitul, sexul, profesia etc. M |surarea caracteristicilor sau propriet|ilor unor obiecte sau subiec i este totdeauna caracterizat| de o anumit| specificitate, determinat| de natura caracteristicii m |surate, i presupune, cu necesitate, existen a unor repere, a unor sisteme de referin |, cunoscute sub numele de scal|. Ca element fundamental al procesului de m |surare a caracteristicilor fenomenelor i proceselor economice, scala poate fi definit| sub forma urm |toare. Definiie: O scal| reprezint| un etalon corespunz |tor, care stabile te modul dup | care sunt atribuite valori variabilelor; a defini o scal| de m |surare este echivalent cu: a stabili o mulime de valori posibile ale variabilei, mulime numit| i spa iu de selec ie; a preciza regulile dup | care sunt atribuite simboluri pentru elementele unei realit|i date, adic | a defini o structur | a spa iului de selec ie. n func ie de natura variabilelor exprimate cu ajutorul lor, exist| patru tipuri de scale, pe care le von defini n cele ce urmeaz |.

2.2.3.2 Tipuri de scaleCa i procesul de m |surare ca atare, scala sau sistemul de referin | este, de asemenea, specific | naturii pe care o are caracteristica supus | procesului de m |surare. Din acest punct de vedere, exist | mai multe tipuri de scale de m |surare: scala nominal|, scala ordinal|, scala interval i scala raport. Primele dou | tipuri de scale sunt scale de tip non-m etric, iar ultimele dou | sunt scale de tip m etric.

2.2.3.2.1 Scala nominal|Scala nominal| este o scal| non-m etric |, pe baza c |reia valorile variabilelor sunt definite prin intermediul simbolurilor nenumerice. M |surarea variabilelor pe scala nominal| este echivalent | cu procesul de codificare a variabilelor. Chiar n cazul n care pentru codificare sunt folosite numere, aceste numere sunt, totu i, pur conven ionale. Definiie: Scala nominal| este o scal| non-metric |, prin intermediul c |reia valorilor posibile ale caracteristicilor m |surate li se atribuie simboluri f|r | relevan | numeric |, n func ie de natura acestor valori. Scala nominal| este utilizat| pentru a m |sura caracteristici ale c |ror valori sunt de natur | calitativ |, necuantificabil|. Valorile pe care pot s| le ia caracteristicile de acest tip sunt cunoscute sub numele de categorii sau alternative. Variabilele m |surate pe scala nominal| se numesc variabile nom inale i sunt variabile a c |ror form | de exprimare este de tip atributiv i care pot fi folosite numai pentru stabilirea apartenen ei la o anumit| clas | a entit|ii descrise prin intermediul variabilei. O clas | special| a variabilelor de tip nominal o reprezint| variabilele binare, care sunt variabile ce pot s | ia doar dou | valori de tip nenumeric. Variabilele de tip nominal sunt variabile discrete i pot fi utilizate numai n scopuri de clasificare de tip calitativ, natura nenumeric | a acestor variabile f|cnd imposibil| utilizarea lor pentru compara ii, ierarhiz |ri sau ordon |ri. n cazul m |sur |rii pe scala nominal|, valorilor pe care pot s| le ia caracteristicile supuse m |sur |rii, respectiv categoriilor sau alternativelor, li se atribuie sim boluri, care sunt de natur | nenumeric |. Pe scala nominal|, dou | valori diferite ale caracteristicii m |surate sunt eviden iate prin intermediul a dou | simboluri diferite. Elementele scalei nominale, diviziunile acesteia, sunt reprezentate de simbolurile atribuite valorilor caracteristicii studiate, sau, mai exact, de categoriile respectivei caracteristici. Scala nominal| este reprezentat| chiar de mulimea acestor simboluri. De exemplu, mulimile: , , , reprezint| scale de tip nominal utilizate pentru a m |sura caracteristici cum ar fi sexul, domeniul de activitate, categoria social|, profesia. Ceea ce este caracteristic scalei nominale este faptul c | subiec ii studia i nu pot fi compara i din punct de vedere al valorii pe care o nregistreaz | la caracteristica m |surat| pe aceast | scal|. Pe baza valorilor nregistrate pe scara nominal| nu se poate afirma care subiect este mai bine situat din punct de vedere al caracteristicii studiate sau, cu att mai pu in, n ce m |sur | un subiect este situat mai bine dect altul.

14

Tot pe aceast | scal|, caracteristicilor li se pot atribui i numere, numai c | aceste numere nu au sensul propriu-zis de num |r, avnd practic aceea i semnifica ie ca i simbolurile. Att simbolurile propriu-zise, ct i numerele cu rol de simbol, atribuite caracteristicilor pe aceast | scal| de m |surare, au numai rol de clasificare n anumite grupe a subiec ilor sau de contorizare a num |rului de subiec i din fiecare categorie, neputnd fi folosite n nici un tip de calcul numeric. Prin intermediul valorilor m |surate pe scala nominal| subiec ii se diferen iaz | ntre ei doar din punct de vedere al apartenen ei la o anumit| clas | sau al apartenen ei la o anumit| categorie. Aceasta nseamn | c | utilizarea scalei nominale pentru m |surarea caracteristicilor m |surabile pe aceast | scal| genereaz | clase sau categorii de subiec i. Pentru caracteristicile m |surate pe scala nominal|, poate fi calculat un num |r limitat de indicatori statistici, care reprezint|, de fapt, contoriz |ri ale simbolurilor ap |rute pe scala nominal|. Ace ti indicatori sunt modulul i frecven a. n cazul caracteristicilor m |surate pe scala nominal| poate fi eviden iat| i distribu ia de frecven |. ntr-o analiz | de date, variabilele nominale pot fi reprezentate de o serie de variabile cum ar fi: sexul, categoria social|, tipul familiei, profesia, marca unui produs etc. Unica transformare de tip invariant a scalei nominale este reprezentat| de opera ia de recodificare, aceast| opera ie neafectnd apartenen a la o anumit| clas | a valorilor m |surate pe acest| scal|.

2.2.3.2.2 Scala ordinal|Scala ordinal| este o scal| non-m etric |, similar | scalei nominale, adic | o scal| de codificare cu deosebirea c | pe aceast| scal| este posibil| ordonarea valorilor variabilelor. Aceast | scal| este folosit| cu prec |dere pentru m |surarea preferin elor consumatorilor. Scala ordinal| permite clasificarea valorilor unei variabile n func ie de rangul acestora, ns | diferen ele ntre ranguri nu sunt relevante i nu au sens. Acest tip de scal| nu d | posibilitatea stabilirii gradului n care caracteristicile a dou | entit|i distincte difer | ntre ele (mai mult, mai pu in). Definiie: Scala ordinal| este o scal| non-metric |, prin intermediul c |reia valorilor posibile ale caracteristicilor li se atribuie numere de ordine sau ranguri, n func ie de pozi ia acestor valori ntr-o ierarhie. Variabilele m |surate pe aceast | scal| se numesc variabile ordinale, sunt variabile calitative de tip discret i nu pot fi exprimate sub o form | numeric | real|. Ca exemple de variabile ordinale putem men iona: categoria de venit (mic, mediu, mare), nivelul studiilor (elementare, medii, superioare), preferin a consumatorilor pentru un anumit produs (foarte mare, mare, mic |, foarte mic |, deloc), nivelul calitativ al unui produs sau serviciu (inferior, mediu, superior), starea economic | (recesiune, stagnare, expansiune) etc. Scala ordinal| este utilizat| n cazul n care caracteristica subiec ilor supu i analizei determin | o diferen iere a subiec ilor din punct de vedere al poziiei pe care fiecare dintre ace tia o ocup | ntr-o ierarhie, ntr-o ordonare, adic | n cazul n care caracteristica ia valori de tip ordinal. Valorile pe care pot s| le ia caracteristicile m |surate pe scala ordinal| sunt valori ordinale sau note, cunoscute i sub numele de ranguri. Acestor valori li se atribuie fie numere de ordine, fie simboluri care eviden iaz | o anumit| ordine a valorilor caracteristicii. Pe scala ordinal|, dou | valori diferite ale unei caracteristici sunt eviden iate prin intermediul a dou | ranguri diferite, adic | prin intermediul a dou | pozi ii diferite n cadrul ierarhiei. Elementele scalei ordinale, diviziunile acesteia, sunt reprezentate de numerele sau de simbolurile folosite pentru reprezentarea rangurilor, respectiv de poziiile posibile n respectiva ordonare. Scala nominal| este reprezentat| chiar de mulimea acestor numere sau simboluri. Cu toate c | valorile caracteristicilor de tip ordinal nu sunt numere propriu-zise, ele diferen iaz |, totu i, pozi ia unui subiect n raport cu un alt subiect, spun ceva despre aceast | pozi ie. Valorile unei caracteristici m |surate pe scala ordinal| permit doar ordonarea subiec ilor din punct de vedere al acestei caracteristici, determinnd o ierarhizare a subiec ilor sau obiectelor. Prin intermediul valorilor pe care le pot lua caracteristicile m |surate pe scala ordinal|, indivizii se diferen iaz | ntre ei doar din punct de vedere al rangului, al locului pe care l ocup | n ierarhia generat| de scala ordinal|. Aceasta nseamn | c | utilizarea scalei ordinale pentru m |surarea caracteristicilor m |surabile pe aceast | scal| genereaz | ierarhii, ordon |ri ale subiec ilor. M |surarea pe scala ordinal| permite compara ii ntre subiec i din punct de vedere al caracteristicii m |surate, dar aceste compara ii se refer | numai la modul n care un subiect este situat n raport cu altul, f|r | a se putea spune i n ce m |sur | subiec ii difer | ntre ei dup | caracteristica respectiv |. Diferen ele dintre dou | valori succesive de pe scala ordinal| nu pot fi considerate ca fiind egale, ele nedeterminnd o distan are egal| ntre indivizi, astfel nct s| se poat | afirma, de exemplu, c | subiectul situat pe primul loc este de trei ori mai bun dect subiectul situat pe locul al treilea. Pentru caracteristicile m |surate pe scala ordinal|, pot fi calcula i o serie de indicatori statistici cum ar fi: modulul, mediana, coeficientul de corela ie a rangurilor, frecven a. De asemenea, pentru caracteristicile de tip ordinal se poate eviden ia i distribu ia de frecven |. Este important s| se fac |, n acest context, precizarea c | media i diferen ele valorilor variabilelor ordinale sunt nerelevante, nu au sens informa ional i nici sens logic. Singura transformare invariant | a scalei ordinale este transla ia, adic | transformarea care p |streaz | ordinea valorilor unei variabile. Analitic, acest tip de transformare invariant | a scalei ordinale poate fi definit astfel: unde a este o constant |, pozitiv | sau negativ |, care d | sensul i m |rimea transla iei valorilor scalei ordinale, valori reprezentate de x.

2.2.3.2.3 Scala intervalEste o scal| quasi-m etric | pe care se poate defini un punct de referin |, dar acest punct nu este o origine "zero" real|, ci conven ional|, arbitrar |. Valoarea "zero" pe acest tip de scal| nu indic | nicidecum absen a fenomenului m |surat. Deci, pentru scala de tip interval, originea scalei este arbitrar |, avnd importan | doar scalarea valorilor n interiorul intervalului. Aceast | scal| permite scalarea valorilor unei variabile n cadrul unui interval de valori reale, f|r | a avea ns | o origine precis | a acestor valori. Cu valorile m |surate pe aceast | scal| pot fi efectuate diferen e, raporturi ale diferen elor, dar nu are sens determinarea raportului a dou | valori. 15

D


Recommended