+ All Categories
Home > Documents > Elemente de Statistic A Aplicate in Ecologie-3

Elemente de Statistic A Aplicate in Ecologie-3

Date post: 15-Jul-2015
Category:
Upload: seedy19
View: 1,054 times
Download: 1 times
Share this document with a friend

of 218

Transcript

tefan R. ZAMFIRESCU Oana ZAMFIRESCU ELEMENTE DE STATISTIC APLICATE NECOLOGIE Carte finanat din Contract CNCSIS 1179/2006 Refereni tiinifici: Prof. dr. Ioan MOGLAN Departamentul de Biologie, Universitatea Al.I. Cuza Iai Conf. dr. Luminia BEJENARU Departamentul de Biologie, Universitatea Al.I. Cuza Iai Lect. dr. Marcel ROMAN Catedra de Matematic, Universitatea Tehnic Gh. Asachi Iai ISBN: 978-973-703-389-5 tefan R. ZAMFIRESCU Oana ZAMFIRESCU ELEMENTE DE STATISTIC APLICATE NECOLOGIE Editura Universitii Alexandru Ioan Cuza Iai 2008 CUPRINS INTRODUCERE ................................................................................................................. 71. CONCEPTE GENERALE .............................................................................................. 82. APRECIEREA I PREZENTAREA DATELOR ...................................................... 122.1. SCALE DE MSURARE I TIPURI DE VARIABILE .......................................................... 122.2. REPREZENTAREA DATELOR ....................................................................................... 173. DESCRIEREA STATISTIC A PROBELOR ECOLOGICE ................................. 233.1. TENDINA CENTRAL ............................................................................................... 233.2. VARIABILITATEA ...................................................................................................... 294. DISTRIBUII PROBABILISTICE ............................................................................. 344.1. DISTRIBUIA BINOMIAL .......................................................................................... 364.2. DISTRIBUIA POISSON ............................................................................................... 404.3. DISTRIBUIA BINOMIAL NEGATIV ......................................................................... 424.4. ESTIMAREA DISPERSIEI UNEI POPULAII .................................................................... 444.4.1. Indici de dispersie ............................................................................................ 444.4.2. Modelul binomial ............................................................................................. 494.4.3. Modelul Poisson ............................................................................................... 514.4.4. Modelul binomial negativ ................................................................................. 534.5. DISTRIBUIA NORMAL ............................................................................................ 554.5.1. Aprecierea normalitii datelor ........................................................................ 615. STATISTIC INFERENIAL: ELEMENTE INTRODUCTIVE ........................ 655.1. ESTIMAREA MEDIEI POPULAIONALE ........................................................................ 655.2. ESTIMAREA UNEI PROPORII ..................................................................................... 715.3. ESTIMAREA EFECTIVULUI POPULAIONAL ................................................................ 715.4. ESTIMAREA INDICELUI DE DIVERSITATE .................................................................... 725.5. TESTAREA IPOTEZELOR STATISTICE .......................................................................... 746. TESTAREA UNEI IPOTEZE PRIVIND MEDIA UNEI SINGURE POPULAII ............................................................................................................. 797. TESTAREA DIFERENEI DINTRE DOU PROBE .............................................. 857.1. COMPARAREA A DOU PROBE INDEPENDENTE .......................................................... 857.1.1. Testul t (Student) pentru probe independente .................................................. 857.1.2. Testul U (Mann-Whitney) ................................................................................. 897.2. COMPARAREA A DOU PROBE NEINDEPENDENTE ...................................................... 927.2.1. Testul t (Student) pentru perechi de observaii ................................................ 937.2.2. Testul T (Wilcoxon) .......................................................................................... 968. TESTAREA DIFERENELOR DINTRE TREI SAU MAI MULTE PROBE...... 1028.1. PRINCIPIUL ANOVA .............................................................................................. 1038.1.1. Testarea omogenitii varianei interne ......................................................... 1048.2. TIPURI DE ANOVA ................................................................................................. 1078.2.1. ANOVA unifactorial ..................................................................................... 1088.2.2. ANOVA unifactorial neparametric Kruskal-Wallis .................................... 1168.2.3. ANOVA bifactorial fr replicare ................................................................ 1188.2.4. ANOVA bifactorial neparametric Friedman .............................................. 1268.2.5. ANOVA bifactorial cu replicare ................................................................... 1289. CORELAIA I REGRESIA ..................................................................................... 1439.1. ANALIZA CORELAIEI ............................................................................................. 1449.1.1. Analiza corelaiei parametrice ....................................................................... 1479.1.2. Analiza corelaiei neparametrice ................................................................... 1539.2. ANALIZA REGRESIEI ................................................................................................ 15710. ANALIZA FRECVENELOR I A DATELOR NOMINALE ............................ 17110.1. TESTUL 2 DE CONCORDAN ............................................................................. 17310.2. TESTUL 2 DE ASOCIERE ...................................................................................... 17710.3. TESTUL EXACT AL LUI FISHER ............................................................................... 18310.4. TESTUL MCNEMAR ............................................................................................... 187BIBLIOGRAFIE ............................................................................................................. 192ANEXA 1: CHEIE DIHOTOMIC PENTRU DETERMINAREA TIPULUI DE ANALIZ STATISTIC ...................................................................................... 195ANEXA 2: TABELE CU VALORI CRITICE .............................................................. 198ANEXA 3: FUNCII MICROSOFT OFFICE EXCEL ............................................... 205INDEX ALFABETIC ...................................................................................................... 215 INTRODUCERE nprezent,valorificareainvestigaiilorecologicenupoatefi conceputfroanalizstatisticadatelor,fraa-numitaasigurare statisticceredmsurancareconcluziileacestorinvestigaiiarputeafi reale.Analizastatisticadatelor,frafiunscopnsinealdemersului tiinificnecologie,reprezintounealtcepermiteomaibun comprehensiuneiprezentareainformaieiconinutederezultatele cercetrilor. n prezent, prelucrarea statistic a datelor este facilitat de utilizarea computeruluiiaprogramelorcorespunztoare.Utilizareaacestoratrebuie sfiefcutnumaidupnelegereaconcepteloriprocedurilormetodelor statistice. Altfel, aceste instrumente vorreprezenta un fel de cutie neagr n care se introduc rezultatele cercetrilor i din care rezult nite concluzii despre a cror corectitudine nu se poate spune mare lucru. Prezenta lucrare ncearc s ofere o baz conceptual pentru cei care sedediccercetrilorcucaracterecologic.Dinacestmotiv,peparcursul capitoleloraparnumeroaseexempleinspiratedincercetriecologice. Lucrareapoatefinsdeajutoripentruanalizadatelorrezultatenurma investigaiilor din diverse ramuri ale biologiei sau ale tiinelor conexe. nprimaparteacriisuntprezentateoseriedenoiunidebazn statistic,caresasigurenelegerealimbajuluiintrinsecalacesteitiine. Urmeazopartededicatstatisticiidescriptiveiprincipalelordistribuii probabilisticecuaplicativitatenecologie.Parteaurmtoaretrateaz aspecteledeprincipiualestatisticiiinductiveiprezintprincipaleleteste care se utilizeazpentrucomparaia probelor. n continuare sunt prezentate modalitideanalizaasocieriidintredouvariabile,iarultimaparte cuprinde metode de analiz ale frecvenelor. La finalul crii sunt trei anexe: prima reprezint o cheie de decizie asupra metodelor statistice, prin care pot fiprelucratedate,adouacuprindetabelelecuvalorilecriticenecesare pentrudiferitetestestatistice,iaratreiacuprindefunciilestatisticedin programul MS-Excel. Cartea se termin cu un index alfabetic al termenilor statistici folosii pe parcursul lucrrii. 1. CONCEPTE GENERALE Statisticareprezintoparteimportantdinpreocuprileactualeale biologiloriecologilor.Termenulstatisticestefolositndouipostaze: fie se refer la colecii de informaie cantitativ i la metode de procesare a acestora,fielaprocesuldestabilireaunorconcluziiprivindgrupuride dimensiuni mari, n urma analizei unor pri din aceste grupuri. Statisticaestetiinacareseocupcuorganizarea,descriereai analizanumericafenomenelorcuantificabile,dezvluindparticularitile lordevolum,structur,dinamic,conexiune,precumiregulilesaulegile care le guverneaz. Pentruecologiipentruceicare,ngeneral,studiazfenomene variabile cu implicaii preponderent probabilistice, statistica este util pentru dirijareacolectrii,organizriiiprezentriidatelor,precumipentru tragerea concluziilor cu o anumit probabilitate sau grad de incertitudine de pe urma analizei datelor. Trebuiemenionatcoanalizstatisticnudemonstreaznimic,ci doarindicprobabilitateaunuianumitrezultatsauconcluziitrasenurma analizei datelor. Attnstatistic,ctincadrulecologieiiacelorlalteramuriale biologiei,aparenoiuneadepopulaie.Accepiuneabiologicaacestui termen este de grup de indivizi ce aparin unei anumite specii, ntre care se stabilesc interaciuni i ale cror gene alctuiesc un genofond omogen.Din punct de vedere statistic, populaia are un neles mai larg dect cel biologic, referindu-selaocoleciedeunitiindividuale,ceconstituieobiectulunei investigaii.Populaiastatisticreprezintungrupdeentitideunanumit tipdinuniverssaudintr-osubdiviziunespecificatauniversului.Este grupul de dimensiuni mari pe care dorim s-l cunoatem. Aa cum spuneam nprimulparagraf,cunoatereaunuiastfeldegrupsaupopulaiisepoate face prin intermediul analizei unei pri. O astfel de parte, care este extras din populaie pentru a fi studiat, se numete n general eantion sau prob. Noivomfolosincontinuarenoiuneadeprobbinencetenitn Concepte generale9 comunitateatiinificecologic.Deciprobaesteungrupmaimic,dar reprezentativ pentru populaia din care a fost extras. Studiuluneipopulaiipresupuneinvestigareauneiasaumaimultor caracteristici ale unitilor din probe, caracteristici care se numesc variabile. Valorileuneivariabilecorespunztoareentitiloruneipopulaiisenumesc valoriindividuale.Valorileindividualecunoscute,corespunztoare unitilor din probe, se numesc date sau observaii. necologie,demulteori,senumrentitiledintr-ungrupsau dintr-ocolecie.Pentrucaoastfeldenumrtoaresaibvaloare,trebuie specificat dimensiunea grupului sau coleciei, care se numete unitatea de prob.Unsetdeunitideprobalctuiescoprob,iarobservaiaeste numrul de entiti dintr-o anumit unitate de prob. Principaladiferendintrenumrtoriimsurtorieste,ncazul msurtorilor,lipsaunuicontrolasupradimensiuniiunitilordeprob. Atunci cnd se numr entiti, se poate decide care este unitatea de prob. Coninutuluneicapcanesauptratdeprobreprezintoprobdac entitile investigate sunt msurate, i o unitate de prob dac entitile sunt doar numrate. Ontrebarecuunrspunsnuntotdeaunaevidentsereferla identificarea populaiei din care provin unitile de prob. Dac ceea ce s-a capturatdinzececapcanedesolconstituieoprob,careestepopulaiadin care a fost extras aceast prob? n acest caz, populaia este reprezentat de numrul total de capcane care ar fi putut fi instalate n ntreaga suprafa de studiu. O astfel de populaie este una ipotetic. Pentrucaoprobsfiereprezentativpentrupopulaiadincarea fostextrasestenecesarcaprelevareaacesteiasfiefcutaleator, randomizatsaula ntmplare. Aceasta nseamn c unicul criteriu folosit n extragerea unitilor de prob este ca toate unitile s aib anse egale de afacepartedinprob.Deexemplu,dacprobaseobinecuajutorulunor capcanecumomeal,animalelecarevorcdeanacesteavorficelemai flmnde i eventual cu o greutate mai mic. Astfel, proba obinut nu va fi reprezentativpentrupopulaie,deoareceanimalelecuogreutatemaimic au anse mai mari s fie capturate dect cele cu o greutate mai mare i care sunt mai stule. Dac proba nu este reprezentativ, atunci generalizrile care sevorfaceporninddelaaceasta,cuprivirelantreagapopulaie,vorfi eronate.Dacnereferimlaexemplulanterior,probaobinutcuajutorul 10Elemente de statistic aplicate n ecologie capcanelorcumomealestereprezentativpentrupopulaiastatistica animalelor flmnde din populaia biologic. Obinerea unor probe aleatoare esteasiguratdemetodeledelucruutilizatenfunciedecaracteristicile entitilorurmrite.ncazulncareexistsuspiciuneacoprobnueste aleatoare,acestlucrutrebuiespecificatsauconcluziilerezultateprin extrapolaretrebuielegatedepopulaiastatisticdincareprobaafost extras. Unaltaspectimportantestereprezentatdeindependena observaiilordinprobe.Aceastasereferlafaptulcapariiauneianumite valoriindividualentr-oprobnuinflueneazprobabilitateadeapariien probaalteivalori.Deexemplu,dacsestudiazopopulaieipotetic format din zece entiti, probabilitatea de a extrage o entitate este de 11u, iardacnusefacereintroducere,probabilitateadeaextrageurmtoarea entitateestede19iaamaideparte.Deciextragereauneientiti modificprobabilitateadeextragereacelorlalteiobservaiilenusunt independente.Oastfeldesituaienutrebuiesconstituieunmotivde preocupare n cazul populaiilor mari, aa cum sunt majoritatea populaiilor biologice. Uneori,obinereaunorobservaiineindependenteesteintenionat. Deexemplu,cndsedoretestudiereaefectuluiunuianumittratament asupra variabilei, se fac observaii repetate asupra acelorai entiti pentru a evideniadacdeosebiriledintreobservaiisuntdiferitesemnificativ,adic dactratamentulamodificatvalorilevariabileisemnificativ.Dacnsse facobservaiirepetateasuprauneisingureentiti,atunciconcluziile rezultatenupotfiextrapolatelapopulaiadeprovenienaentitii respective, deoarece proba cu dimensiunea unu nu este reprezentativ. Undescriptorsauomsurauneivariabilenprobsenumete statistic. O statistic a unei probe se folosete de obicei pentru a estima un parametrualpopulaiei.Deexemplu,mediavalorilordintr-oprobesteo statistic,iarmediapopulaieidincareafostextrasproba,unparametru. Dat fiind faptul c n ecologie sunt rare cazurile n care se poate afla media uneipopulaiiprininvestigareafiecreiunitideprob,mediapopulaiei respective poate fi estimat pornind de la statistica probei reprezentative. Populaiileipoteticeauparametriipoteticiisuntdeobiceifolosite pentru comparaii. De exemplu, media numrului de plante dintr-o anumit specie din zece ptrate de 1 m2 este o estimare a mediei numrului de plante Concepte generale11 perptratsaumetruptrat,adicparametrulpopulaieideptratecares-ar putea delimita n aria de studiu. Astfel de parametri sunt utili atunci cnd se compardiferitezonedestudiu(douzonestepice,douzonedepdure, dou bazine acvatice etc.). Atuncicndseestimeazunparametrupopulaionalporninddela statisticacorespunztoare,dimensiuneaprobeisaunumrulunitilorde prob are o mare importan. n general, cu ct proba are o dimensiune mai mare,cuattvafimaireprezentativpentrupopulaiadeprovenieni estimareaparametrilormaiprecis.Totuiobinereaunorprobeextremde numeroase este uneori imposibil sau presupune un efort foarte mare care ar puteafiinvestitnaltedireciidecercetare.Astfel,estebinesexisteun echilibruntreacestedouaspecte,ntredimensiuneaprobeiiefortul necesar obinerii acesteia. 2. APRECIEREA I PREZENTAREA DATELOR Variabilelesuntcaracteristicisaucaracterecareauvaloricepotfi diferite de la un individ la altul, ntr-o populaie. Deci o variabil poate lua maimultevaloriindividualenpopulaiastudiat.Valorileindividuale determinateprininvestigareaunorindivizisauunitidintr-oprobse numesc date. 2.1.SCALE DE MSURARE I TIPURI DE VARIABILE Deexemplu,ntr-opopulaiedepetidintr-oanumitspecie,se investigheaz lungimea indivizilor. Lungimea reprezint o caracteristic sau uncaracteraltuturorindivizilordinpopulaie,deciesteovariabil. Lungimeapetilorarevaloridiferitedelaunindividlaaltulsaudelaun grup de indivizi la altul. Aceste valori ale tuturor indivizilor din populaie se numesc valori individuale. Dac se captureaz un anumit numr de peti (se extrageoprob)dinpopulaiadestudiuisemsoarlungimeafiecrui individ, valorile individuale astfel determinate constituie datele. nfunciederelaiilecesepotstabilintrevalorileindividualeale uneivariabile,aceastapoateaparineunuianumittipdevariabil,carela rndul su poate fi apreciat pe o anumit scal cu anumite reguli i limitri. n general, sunt recunoscute patru astfel de scale de apreciere a variabilelor: nominal,ordinal,deintervalideraport.Relaiadintreacestescale este una ierarhic, adic o scal de nivel superior ncorporeaz proprietile scalelor inferioare acesteia. Scalanominal.Esteceamaisimplmodalitatedeaprecierea variabilelor. n esen, permite doar identificarea categoriilor n care valorile individuale pot fi clasificate. Categoriile se exclud reciproc, adic o anumit valoarepoateaparinedoaruneisingurecategoriidinscal.Variabilele corespunztoareacesteiscalesenumescvariabilenominalesauatribute. Aprecierea i prezentarea datelor13 Oricaredouvalorialeuneiastfeldevariabilepotaparineaceleiai categorii sau la dou categorii diferite ale scalei ordinale, cu alte cuvinte pot fi egale sau diferite (tab. 2.2). Deexemplu,sexulindiviziloruneipopulaiiesteovariabil nominal,alecreivaloriindividualeposibilesuntmasculifemel.Doi indivizidintr-opopulaiepotaveaacelaisex(masculsaufemel)saupot aveasexediferite(unulestemascul,cellaltestefemel)launmomentdat. Decivalorilevariabileisexpotfiegale(aparinaceleiaicategoriiascalei nominale) sau diferite (aparin la categorii diferite ale scalei nominale). Alte exempledevariabilenominalentlnitenecologiesunt:culoarea,tipulde habitat, specia. Scalaordinal.Aceastaincludeproprietilescaleinominale (identificare i clasificare), la care se mai adaug posibilitatea de ordonare a categoriilor ntr-o serie, de la valoarea cea mai mic la cea mai mare, sau de specificareamagnitudiniiacestora.Variabilelecorespunztoareacestei scalesenumescvariabileordinale.Oricaredouvalorialeuneiastfelde variabilepotfiegalesaudiferite.ncazulncaresuntdiferite,valorilese potordona,adicsepoatespunecunadintrevaloriestemaimaredect cealalt (tab. 2.2). n general, valorile variabilelor ordinale se reprezint sub form de magnitudine relativ. Deexemplu,dacntr-opopulaiedelupiurmrimvariabila agresivitate,valorileindividualepotfineagresiv,puinagresiv, agresiv i foarte agresiv. Doi indivizi pot fi egali sau diferii din punctul de vedere al agresivitii, iar dac sunt diferii, atunci se poate determina c unulestemaiagresivdectcellalt(covaloareestemaimaredect cealalt), dar nu se poate spune exact cu ct. O alt modalitate de a reprezenta valorile pe scala ordinal const n folosireaunorsimbolurinumericecorespunztoaremagnitudiniivalorilor, numiteranguri.Rangurilesuntutilemaialescndseurmrete reprezentareauneivariabilepeoscalcumaimultecategoriiordinale. Astfel,valoareaceamaimic,neagresivdinexemplulanterior,primete rangul unu, urmtoarea doi i aa mai departe. UnexempludescalordinalestescalaDAFOR(acronimuleste formatprinpreluareaprimeilitereavalorilorscalei),utilizatpentru aprecierea abundenei unei specii de plante ntr-un ptrat de prob (tab. 2.1). 14Elemente de statistic aplicate n ecologie Tabelul 2.1 ValoareDominatAbundentFrecventOcazionalRar Rang 54321 Trebuiereinutcvalorilenumericealerangurilornupotfifolosite pentruaefectuaoperaiisimple,deoareceacesteanuausensvaloarea abundentnuestededouorimaimaredectvaloareaocazionalsau diferena dintre valoare dominant i valoarea abundent poate s nu fie egalcuceadintrevalorileocazionalirar.Rangurilesuntdoar simboluri numerice care arat magnitudinea valorilor sau poziia lor n setul de valori ordonate. Scaladeinterval.Permiteattordonareadatelor,ctiprecizarea distaneidintreunitilescalei.Valorileexprimatepeaceastscalpotfi sczute unele din altele pentru a afla exact care este diferena dintre ele. Din cauzafaptuluicscaladeintervalnuareovaloarezeroabsolut,nuse poaterealizamprireavalorilorpentruaaflacuctunaestemaimare dect cealalt (tab. 2.2). Deexemplu,variabiladetipdatesteapreciatpeoscalde interval.Dactreispeciidepsridetaliemic(paseriforme)revindin migraie pe 5, 10 i 15 mai, putem spune c a treia specie ajunge cu zece zile maitrziudectprima,darnuputemspunecarenevoiedetreiorimai mult timp pentru a ncheia migraia. Un alt exemplu de scal de interval este scala Celsius de apreciere a temperaturii: uC este o valoare convenional, aleas s desemneze temperatura de nghe a apei. Ca urmare, o temperatur de1uCnunseamndedouorimaicalddectSC.Datoritfaptuluic scalaCelsiusdeapreciereatemperaturiinuareunzeroabsolut,aceasta prezintivalorinegativecarenuarputeaexistancazuluneivalorizero absolute. Scala de raport. Pe lng proprietile celorlalte scale (identificare, clasificare,ordonare,precizareadiferenei),aceastamaipermitei mprireavalorilorunelelaaltelepentruaputeaafladecteoriunaeste mai mare dect cealalt (tab. 2.2). De exemplu, lungimea se apreciaz pe scal de raport, iar o lungime de Su cm este de trei ori mai mare dect una de 1u cm. Aprecierea i prezentarea datelor15 Aceast proprietate este posibil datorit faptului c scalele de raport auvalorizeroabsolute,adiczeronseamnnimic,vid.Caurmare,aceste scale nu pot prezenta valori negative. De exemplu, scala Kelvin de apreciere a temperaturii este o scal de raport,deoarecevaloareauK( 27S,1SC)reprezinttemperaturafade carenimicnupoatefimaireceilacarenmaterienumaiexistenergie sub form de cldur. Variabilelecorespunztoare scalei de interval i scalei de raportpot fi de dou tipuri: discontinui i continui. Variabilelediscontinuisaudiscretepotluaanumitevalori(de obicei,ntregiipozitive),ntrecarenuexistvaloriintermediare.Aceste variabilereprezintcaracterenumrabilesaumeristice(numrdesolzi, numrdeou, numrdeelemente florale, numr de pui etc.). De exemplu, dimensiunea pontei unei psri este o variabil discret, ale crei valori sunt ntregi i pozitive; nu exist cuiburi cu numr fracionar de ou. Variabilelecontinuipotluaoricevaloaredintr-unanumitinterval, iarntreoricaredouvaloriexistoinfinitatedevaloriposibile.Aceste variabilereprezintcaracteremsurabilesaumetrice(lungime,lime, nlime, greutate, temperatur etc.). De exemplu, ntre 1u cm i 11 cm pot exista,nprincipiu,oinfinitatedevaloriposibile,nfunciedenumrul zecimalelor considerate. Tabelul 2.2. Caracteristicile eseniale ale tipurilor de variabile Scala de apreciere a variabilelorSemnele care se pot pune ntre valori Nominal=; =Ordinal=; =; De interval =; =; ; De raport =; =; ; ; Conversia datelor de la o scal la alta Conversia datelor se poate face doar n sensul pierderii unei pri din informaia deinut de acestea. Ca urmare, conversia se poate face doar de la oscalsuperioarierarhicctreunadenivelinferior.Astfel,datele msuratepeoscaldeintervalsauderaportpotficonvertitelaoscal ordinal sau nominal. Datele msurate pe o scal ordinal pot fi convertite doar la o scal nominal. 16Elemente de statistic aplicate n ecologie Exemplul2.1.Dacs-audeterminatnlimileunorplantedestep n centimetri, variabila urmrit, nlimea, este una continu, exprimat pe oscalderaport.Pentruarealizaconversialaoscalordinal,sedau rangurivaloriloriniiale.Astfel,valoareaceamaimicvaprimirangul1, urmtoarea2,iarvaloareaceamaimarevaprimirangulmaxim.nlimea de 1S cm va primi rangul 1, ceea ce arat c este vorba de valoarea cea mai mic, iar nlimea de 2S cm va primi rangul 9, adic valoarea maxim din prob. Valorile egale ale nlimii vor primi media rangurilor pe care le-ar fi primitdacarfifostdiferite.Observmntabelul2.3cexisttreivalori egale,de1S cm,ialtedouvaloriegalentreele,de17 cm.Celetrei valori de 1S cm, dac ar fi fost diferite, ar fi primit rangurile 2, S i 4. Fiind egale, primesc media rangurilor pe care le-ar fi primit dac ar fi fost diferite, adic (2 +S +4)S = S. La fel se procedeaz i n cazul celor dou valori de17 cmmediarangurilorpecarele-arfiprimitdacarfifostdiferite este(S +6)2=S,S.ncontinuare,pentruconversialaoscalordinal, seconsiderovaloaredereferinanlimiidinprob,dupcaretoate celelaltevaloriseexprimnrelaiecuaceasta:egalecuvaloareade referinsaudiferitedeaceasta.Dacdinanumitemotiveneintereseaz plantelecunlimeade17 cm,atuncivomaveadouvalori= 17i apte valori = 17 Tabelul 2.3 nlimea (cm), scal de interval sau raport 131515151717192123 Ranguri intermediare (dac valorile ar fi diferite) 123456789 Ranguri, scal ordinal13335,55,5789 Valori nominale, scal nominal 17171717=17=17171717 Cea mai frecvent conversie este cea de la datele apreciate pe o scal de interval sau de raport, la una ordinal. O astfel de conversie este necesar atuncicnddatelevorfianalizateprinmetodeneparametrice,deoarecenu sunt ndeplinite condiiile de aplicare ale metodelor parametrice. Variabile derivate nanumitesituaii,variabileleoriginalesuntprocesatematematic, Aprecierea i prezentarea datelor17 astfelnctsrezultevariabilederivatecumarfi:rapoarte,proporii, procente i rate. Raportul este o relaie simpl ntre dou numere. De exemplu, dac lungimea capului la o viper de step este 17,7 mm i limea de 11,7 mm, raportul lungime:lime este de 17,7: 11,7. Implicit, raportul lime:lungime estede11,7: 17,7.Uneori,unadintrevaloripoateficonvertitprin mprirelaunitate.Deexemplu,dacntr-oprobsunt19 mosculii 27 cmclc,atunciraportulmasculi:femeleeste 19: 27sau1: 2719,adic 1: 1,421. Raportul poate fi scris i ca o fracie. n cazul exemplului anterior, raportuldintremasculiifemeleestede1927 = 11,421.Rezultatul calculrii fraciei se numete coeficient; astfel, 11,421 = u,7u4. Proporia este raportul dintre parte i ntreg. Dac lungimea total a unei vipere de step este 49u mm, iar lungimea cozii este 6S mm, proporia reprezentatdecoadeste6S: 49u = u,1S.Dacsecalculeazoproporie pornind de la raportul dintre numrul de valori dintr-o categorie i numrul totaldevaloridintoatecategoriile,atunciaceastasenumetefrecven proporional. Procentul se obine prin nmulirea valorii unei proporii cu 1uu. Rata reprezint raportarea unei observaii la unitatea de timp. Ratele se folosesc pentru a exprima anumite variabile cum ar fi creterea, dinamica unei populaii, micarea. De exemplu, dac o plantul crete 1S cm n 1u zilc, atunci rata de cretere este de 1S1u = 1,S cmzi. Numeroi indici ecologici cum ar fi indicii de diversitate sunt de fapt variabilederivate.Uneoriacesteapotfi analizateprinmetodestatisticedar numai dup o conversie sau transformare prealabil a datelor. 2.2. REPREZENTAREA DATELOR Unul dintre inconvenientele majore ale prezentrii datelor sub form de tabele const n faptul c informaia nu este evident imediat. Ea poate fi perceputdoardupoanalizndetaliuafiecreivalorisauamajoritii valorilordintabel.Pentrufacilitareapercepieiinformaieiconinutede date,estenecesarprocesareaitransformareaacestorantr-oprezentare vizual.Modalitateaceamaidesutilizatdeprezentareadatelorconstn 18Elemente de statistic aplicate n ecologie folosireareprezentrilorgrafice.Tipuldereprezentaregraficsealegen funcie de tipul de variabil. Reprezentareavariabilelordiscrete.Procesareadatelorconstn acestcaznaranjarealorntabeluldedistribuieafrecvenelor,adicse prezintfiecarevaloareavariabileiifrecvenacorespunztoareacesteia, adic de cte ori se ntlnete o anumit valoare n prob. Exemplul2.2.ntr-unstudiuseurmretenumruldefitoindivizi (deplante)dinspeciaCrambetatarian20deptratede10x10mdintr-o pajite stepic. Tabelul de distribuie a frecvenelor se prezint astfel: Tabelul 2.4 Nr. fitoindivizi/ptrat (x)012571016193860 Frecvena ()5431121111 ncontinuaresereprezintgraficpeabscisvalorileordonateale variabilei(x),iarpeordonatvalorilefrecvenelor()corespunztoare valorilorvariabilei.Practic,frecvenafiecreivaloriavariabileieste reprezentat printr-o coloan cu nlime corespunztoare. Se obine astfel o diagram n coloane (dreptunghiuri) a distribuiei frecvenelor unei variabile discrete. Trebuie remarcat spaiul dintre coloanele corespunztoare valorilor ordonatealevariabileiacestasugereazabsenavalorilorintermediare dintre valorile alturate ale unei variabile discrete (fig. 2.1). Figura 2.1. Diagrama reprezentrii frecvenelor prin coloane Diagramapoatefirealizatiprinreprezentareafrecvenelorprin 01234560 1 2 5 7 10 16 19 38 60fxAprecierea i prezentarea datelor19 puncte (fig. 2.2). n acest caz, se impune ca acestea s nu fie unite, pentru a sugera,caincazulspaiuluidintrecoloanelegraficuluianterior,ceste vorba de valorile unei variabile discontinue. Figura 2.2. Diagrama reprezentrii frecvenelor prin puncte Aceleai tipuri de reprezentri pot fi utilizate i pentru reprezentarea distribuiei frecvenelor variabilelor nominale i a celor ordinale. n cazul variabilelor nominale, ordinea valorilor acestora pe abscis este arbitrar. Reprezentareavariabilelorcontinui.Datoritfaptuluic variabilele continui iau valori din aproape n aproape, exist posibilitatea ca o prob s nu conin nici mcar dou valori identice. Ca urmare, nu se mai poateoperacufrecvenauneisingurevalori,pentruc,ntr-oastfelde situaie, toate valorile fiind diferite, vor avea frecvena egal cu 1, adic vor apreanprobosingurdat.Astfel,ncazulncaresedorete reprezentareadistribuieifrecvenelorvaloriloruneivariabilecontinui,este necesar gruparea valorilor din prob n clase de frecven, ceea ce implic parcurgerea mai multor etape de procesare a datelor: 1.Aflareanumruluideclase.Numruldeclase(k)esterezultatul rotunjitlacelmaiapropiatntreg,cesepoateaflafolosindunadin urmtoarele dou relaii: k = 1 +S,S log10(n) sau k < S log10(n) n numrul de valori din prob. 01234560 1 2 5 7 10 16 19 38 60fx20Elemente de statistic aplicate n ecologie 2. Aflarea intervalului de clas. Intervalul de clas (h) este rezultatul relaiei: b =xmcx-xmink

xmux valoarea maxim (cea mai mare) din prob; xmn valoarea minim (cea mai mic) din prob. 3.Aflarealimitelorfiecreiclase.Pentrufiecareclastrebuieaflat limitainferioar(x|n)ilimitasuperioar (xxup).ngeneral,relaiadintre cele dou valori pentru oricare clas k este: xsupk = xn]k +b . Limita inferioar a primei clase va fi egal cu valoarea cea mai mic dinprobdacaceastaesteunnumrntreg,adicpentruk = 1,xn]1 =xmn.Dacxmnnuesteunntreg,atuncixn]1vafintregulaflatprin rotunjireaprin lipsal lui xmn.Limita superioar a primei clase se va afla adunndlavaloareaminimsaulalimitainferioaraclaseivaloarea intervalului de clas, conform relaiei: xsup1 = xn]1 +b sau xsup1 = xmn +b . Pentruaaflaxn]2,laxsup1sevaaduga1.Astfel,ntreceledou clase nu va exista nici un fel de suprapunere, adic o valoare din prob egal cu xsup1 va face parte doar din prima clas. n acest fel se vor afla limitele celorlalte clase. Ultima clas, k, va trebui s includ valoarea cea mai mare din prob, adic pe xmux . 4. Aflarea frecvenei fiecrei clase. Frecvena claselor se va afla prin numrareavalorilordinprobcuprinsentrelimitainferioaricea superioarafiecreiclase.nfinal,trebuiecafiecarevaloaredinprobs fieinclusntr-unadinclase.Sumafrecvenelortuturorclaselortrebuies fie egal cu numrul de valori din probe, adic = n. Frecveneleclaselorsepotreprezentasubformauneihistograme. Spredeosebiredediagramafrecvenelorprezentatpentruvariabilele Aprecierea i prezentarea datelor21 discrete,histogramaarecoloaneleunite,ceeacesugereazcontinuitatea dintre clasele de frecven ale valorilor unei variabile continui. Oaltmodalitatedereprezentareafrecvenelorclaselorestei poligonul frecvenelor. Acesta se construiete prin unirea punctelor ale cror coordonate sunt reprezentate de mijlocul intervalului de clas i de frecvena claseirespective.Mijloculintervaluluideclasseaflcalculndmedia aritmetic dintre limitele fiecrei clase: mijlocul clasei k =xin]k+xsupk2 . Toaterezultateleobinutenurmaprocesriidatelorsenscriun tabelul de frecvene (tab. 2.5), care trebuie s cuprind: clasa, limitele clasei, mijlocul intervalului de clas i frecvena fiecrei clase. Exemplul2.3.ncadrulunuistudius-amsuratlungimeanmma 100 de peti dintr-o anumit specie. 194140226269284243303235229239 206262233307285180248205284191 154224307236198288241252385220 299273275164137357246271246276 229280227253286190291297296288 225234244351267265239283190244 288245289241289278255253240153 208328235283214300228204343228 194233218321303254225232196245 223305220338269224319259240293 n = 1uuk = 1 +S,S log10(1uu) = 7,6 = 8xmux = S8Sxmn = 1S7b =385-1378= S122Elemente de statistic aplicate n ecologie Tabelul 2.5. Tabelul de distribuie a frecvenelor claselor de lungime (mm) kxinfxsupmijlocfF (f cumulat) 1137168152,555 2168199183,5813 3199230214,51932 4230261245,52759 5261292276,52382 6292323307,51294 7323354338,5498 8354385369,52100 Figura 2.3. Histograma frecvenelor Figura 2.4. Poligonul frecvenelor0510152025301 2 3 4 5 6 7 8Frecvena (f)Clasa (k)051015202530152,5 183,5 214,5 245,5 276,5 307,5 338,5 369,5Frecvena (f)Clasa (mijloc) 3. DESCRIEREA STATISTIC A PROBELOR ECOLOGICE Statistica descriptiv este partea statisticii care se ocup de culegerea ideclasificareadatelorstatisticei,peaceastbaz,dedescrierea fenomenelorinvestigate.Roluleiestedearezumacantitativinformaia culeas, de a descrie i de a pune n eviden esenialul, n fine, de a realiza sinteze cu ajutorul unui limbaj numeric. n natur, atunci cnd investigm o populaie, rareori ntlnim valori individuale identice ale unor variabile.La o privire mai atent a datelor, se poateobservaexistenaunorvalorinjurulcroratindssedistribuie majoritatea, dac nu toate celelalte valori individuale. Descrierea statistic a probelorprelevatedinpopulaiiscoatenevidendouaspecteeseniale: tendina central i variabilitatea valorilor individuale. 3.1. TENDINA CENTRAL Tendinacentralaunordatereprezintovaloaresauocondiie reprezentativpentrutoatedateledinprobsaupentruvalorileindividuale din populaie. De exemplu, enunuri ca majoritatea florilor dintr-o prob au culoarearoiesaudiametrulmediualflorilorestede2cmsurprind tocmai aceast tendin central a valorilor individuale din probe. nfunciedescaladeapreciereadatelordinprobiimplicita caracteristicilortipuluidevariabilurmrit,existmaimultemsurisau descriptori ai tendinei centrale, dintre care cei mai des utilizai sunt: modul, mediana i media. Modul (Mo). Msura tendinei centrale, reprezentat de valoarea din probcufrecvenaceamaimare,adiccelmaidesntlnit,senumete mod. De exemplu, dac o prob este reprezentat de 20 de plante la care se urmrete culoarea florilor, iar zece dintre acestea au flori de culoare roie, apteaufloride culoare violet i trei sunt grena, atunci modul probei va fi 24Elemente de statistic aplicate n ecologie valoarearouavariabileiculoareaflorilor.Aacumreiesedinacest exemplu,modulsepoatefolosipentrudescriereatendineicentraleaunei variabileapreciatepeoscalnominal;defaptestesinguruldescriptorde acest fel ce se poate folosi pentru valorile unei variabile nominale. Modul se poatefolosiipentrucelelaltetipuridevariabileordinale,discretei continui.ncazulvariabilelorcontinui,sepoatecamodulsnupoatfi aplicat. Dat fiind faptul c aceste variabile iau valori din aproape n aproape i c ntre oricare valori alturate exist un numr infinit de valori posibile, sepoatentmplacantr-oprobtoatevalorilesfiediferite,cazncare frecvena fiecrei valori va fi egal cu unu. Deci, ntr-o astfel de situaie, nu existniciovaloarecufrecvenmaimaredectcelelalteimodulnuse poate calcula dect pentru clasele de frecven. nexemplul2.3lungimeapetiloresteovariabilcontinu.Modul probeieste288,pentrucareexist3valori.Dactoatevalorilearfifost diferite, atunci s-ar fi putut afla clasa modal de distribuie a frecvenelor ca fiindclasacufrecvenaceamaimare.ncazulexempluluiluatndiscuie, clasa modal este clasa nr. 4 cu frecvena 27. Dacntr-odistribuieafrecveneloraparmaimultevrfuride frecven sau moduri, aceasta va fi numit distribuie multimodal. Multe caractererspunztoarededimorfismulsexualprezintnpopulaiio distribuiebimodal.nfigura3.1apareoastfeldedistribuiebimodal: modul pentru femele este 29 de plci subcaudale, iar pentru masculi este 37. Figura 3.1. Diagrama distribuiei frecvenelor numrului de subcaudale la Vipera ursinii moldavica 0123456782526272829303132333435363738394041fNr. subcaudalefemelemasculiDescrierea statistic a probelor ecologice25 ncazulunorastfeldedistribuii,carenusuntsimetricefadeo singur valoare a tendinei centrale, se recomand ca analiza statistic s se facseparat,pecategoriidiscretedinprobmasculi,femele,juvenili pentru care datele se prezint mai mult sau mai puin simetrice. Mediana(Me).Estemsuratendineicentralecarereprezint valoareacentralsaumediavalorilorcentralealeunuisetdedateordonate cresctor. Valoarea central este cea care, n setul de date ordonat cresctor, esteprecedatisuccedatdeacelainumrdevaloriindividuale.Rezult c mediana se poate utiliza pentru date care se pot ordona, adic pentru date msurate pe o scal de raport, interval sau ordinal, i se poate folosi pentru dateleapreciatepeoscalnominal.Esteconsideratunadintrecelemai robustemsurialetendineicentrale,deoarecenuesteinfluenatde eventualele valori atipice, cum se poate ntmpla n cazul mediei, i se poate utilizachiarincazurilencaresecunoscdoarmagnitudinile(sau rangurile) unor valori ce nu au fost nregistrate. Modalitateadecalculamedianeidepindedenumrulvalorilordin prob (n): dac proba are un numr par de date (n = 2k +1), atunci mediana va fi reprezentat de valoarea central: pt. n = 2k +1, atunci Hc = xk+1 sau Hc = x(n+1)2 . De exemplu,pentruseria de date 1, 2, 2, 3, 4, 4, 5, Hc = S, pentru c are un numr egal de valori la stnga i la dreapta sa. dac proba are un numr par de date (n = 2k), atunci mediana va fi reprezentat de media celor dou valori centrale sau de intervalul median: pt. n = 2k, atunci Hc =xk+xk+12 sau Hc =xn2+x(n2)+12 . Deexemplu,pentruseriadedate1,2,2,3,4,5,6,7,celedou valori centrale sunt 3 i 4, deci Hc = (S +4)2 = S,S. ncazulncareexistnumeroaseobservaiicuaceeaivaloarecu ceaamedianeidatoritprezentriidatelorsubformdeintervaledeclas, 26Elemente de statistic aplicate n ecologie atunci formulele de calcul se modific astfel: pt. n = 2k +1, atunci Hc = xn]Mc +b 12(])-PMc-1]Mc ; pt. n = 2k, atunci Hc = xn]Mc +b 12(1+])-PMc-1]Mc , xn] Mclimitainferioaraclaseimediane(clasadefrecvence conine valoarea median); b valoarea intervalului de clas; suma frecvenelor tuturor claselor; FMc 1 frecvena cumulat a clasei dinaintea clasei mediane (suma frecvenelor claselor care preced clasa median); Mc frecvena clasei mediane. Exemplu3.1.ntr-unstudius-aurmritacoperireaprocentual realizat de o specie de ierburi de step, n 20 de suprafee de prob. Acoperire80-100%60-80%40-60%20-40%0-20% f Frecvena (f)1296220 Conformdefiniieimedianei,aceastaartrebuiesreprezintemedia acoperirilor din suprafeele de prob 1u i 11. Valorile exacte ale acoperirii nu sunt accesibile, acestea fiind aproximate prin clase de acoperire. Acestea suntechivalentedinpunctdevederestatisticunorclasededistribuiea frecvenelor.Dacsimbolizmfiecareobservaieprinprocentulmediual fiecrei clase, datele se prezint astfel: 10103030303030305050 50505050505050707090 Cifrelescrisengroatarreprezentaceledouvaloricentrale necesare calculrii medianei n cazul unui numr par de date. Se observ c suntmaimultevaloriegalecuSu;sunt9valorinclasa(intervalul) median.Frecvenacumulataclaseidedinainteaceleimedianeeste 2 +6 = 8.Deci,pnlaprimavaloarecentral,maisunt2suprafeede prob.Rezultcprimavaloarecentralsegsetela29dinintervalul clasei mediane. Intervalul de clas este egal cu 2u%; 29 din 2u reprezint Descrierea statistic a probelor ecologice27 4,4S.Daclaaceastvaloareadugmlimitainferioaraclaseimediane (4u),obinem44,4S,adicprimavaloarecentralaacoperirii.Folosind acelairaionament,seobineiadouavaloarecentral:4u +2u S9 =46,67.Medianavafiegalcumediacelordouvaloricentrale:(44,4S +46,67)2 = 4S,S6. O alt modalitate const n aplicarea formulei de mai sus, care are la baz acelai raionament: xn] Mc = 4ub = 2u = 2u FMc1 = 8Mc = 9 Hc = 4u +2u 12(1+20)-89= 4u +2u 2,59= 4S,S6 . Media(x, ).Esteunuldintreceimaicunoscuiimaiutili descriptoriaitendineicentrale.Existmaimultetipuridemedie,darcel maiutilizatestemediaaritmetic.Dacsecalculeazmedialundn consideraietoiindiviziiuneipopulaii,atunciaceastasenumetemedie populaional,esteunparametrupopulaionalisenoteazcu.Media obinutnurmaanalizeidatelordintr-oprobsaumediaprobeiesteo statisticaprobeisimbolizatcux.Mediaprobeipoatefiunestimator direct al mediei populaionale (x estimeaz pe p). Formuladecalculamedieiestesumatuturorvalorilorsupra numrul acestora: pentru populaie p =xN ; pentru prob x=xn , x fiecare valoare individual din populaie sau prob; N numrul tuturor valorilor individuale din populaie; n numrul tuturor valorilor din proba prelevat din populaie. Relaia dintre medie, median i mod. ncazuluneivariabileacreivaloriindividualesuntdistribuite perfectsimetric,media,medianaimodulsuntegale.ncazulunei Hc = xn]Mc +b 12(1+])-PMc-1]Mc

28Elemente de statistic aplicate n ecologie distribuiiuorasimetriceunimodale,medianasedispunentremediei mod.nmajoritateadistribuiilorbiologiceseobservoabaterepozitiv, adic media are valoare mai mare dect mediana, care la rndul ei este mai mare dect modul (fig. 3.2). Figura 3.2. Relaia dintre mod, median i medie: A distribuie simetric; B distribuie asimetric Dintre cele trei msuri ale tendinei centrale, media este singura care inecontdetoatedateledinprobeiastfelsintetizeazntreagainformaie furnizatdeacestea.Valoareamedieiestefolositnnumeroasetehnicide analizstatistic.Deasemenea,poateficombinatcumediilealtorprobe din aceeai populaie, n cadrul mediei generale, atunci cnd datele sunt rare sau greu de obinut. meuia geneial=(nixi)ni

x media probei i n numrul de valori din proba i Media este ns uor influenat de apariia unor valori atipice (foarte marisaufoartemicifademajoritateavalorilor).nastfeldesituaii, medianareprezintundescriptormairobustaltendineicentraleaprobei. Medianaesteutilinanalizapreliminar,deoarecescoateneviden tendinele generale ale datelor. Modulreprezintomodalitaterapidiaproximativdeaaprecia tendinacentralaprobeiideaindicacentruldistribuieiobservaiilor, apreciate pe o scal ordinal sau nominal. Mo=Me=x Mo u) =k+x-1xxx +k p(x -1) . Exemplul4.3.Caresuntprobabilitilecapenitesuprafeede prob s apar zece sau mai puini indivizi? Media numrului de indivizi pe suprafa de prob este trei, iar deviaia standard este cinci. x= Ss2 = S Trebuie calculat valoarea lui k: k =325-3 = 4,S . Se calculeaz probabilitatea pentru x = u: p(u) = [1 +34,5-4,5= u,1uu4 . n continuare se pot calcula probabilitile pentru celelalte valori mai mari ca unu, cu ajutorul formulei recurente: p(1) =4,5+1-1133+4,5 u,1uu4 = u,18u7p(2) =4,5+2-1233+4,5 u,18u7 = u,1988 . nacelaimodsecontinuipentrucelelaltevalori.Rezultatele probabilitilorpentruvalorilemaimicisauegalecuzecesunttrecuten tabelul urmtor: 44Elemente de statistic aplicate n ecologie xp(x) 00,1004 10,1807 20,1988 30,1723 40,1292 50,0879 60,0556 70,0334 80,0192 90,0107 100,0058 p(x)0,9938 Sepoateobservacsumaprobabilitilorvalorilorestemaimic dect 1. Probabilitile pentru valorile mai mari de 1u vor fi extrem de mici. Pemsurcevaloareakcreteideviaiastandard(s2)scadenraportcu media(x ),graduldesimetriealdistribuieicrete.Pentruvalorialelui k > 2u, distribuia probabilistic este aproape simetric. 4.4. ESTIMAREA DISPERSIEI UNEI POPULAII 4.4.1. Indici de dispersie Dispersiauneipopulaiisereferlamodulderepartizarea indivizilornspaiu.Dispersiaseapreciazpebazapoziieiunorindivizi, relativ la poziia celorlali. n general, dispersia unei populaii poate fi de trei tipuri: uniform, aleatoareigrupat(fig.4.2).ncelemaimultecazuri,dispersiaeste privit din perspectiv spaial, dar se poate investiga i dispersia n timp a unor evenimente. n primul caz, unitatea de prob poate fi un ptrat, n timp ce n al doilea caz, poate fi un interval de timp. Dac se urmresc organisme parazite, atunci unitatea de prob poate fi organismul gazd. n principiu, aprecierea dispersiei se face n funcie de variabilitatea 00,020,040,060,080,10,120,140,160,180,20 1 2 3 4 5 6 7 8 9 10p(x)xDistribuii probabilistice45 densitiientitilorpeunitatedeprob.ncazuluneidispersiiuniforme, densitile entitilor pe unitate de prob vor fi cam aceleai i variabilitatea acestor densiti va fi relativ mic. n cazul unei dispersii grupate, densitile voraveavaloriextreme,fiefoartemari,fieaproapenule,iarvariabilitatea acestordensitivafirelativmare.ncazuldispersieialeatoare,vorexista densiticuvalorimari,miciiintermediarei,caurmare,variabilitatea acestordensitivafiintermediarfadevariabilitateadensitilordin celelalte tipuri de dispersie. Figura 4.2. Tipuri de dispersie: I uniform, II aleatoare, III grupat Porninddelaacestprincipiu,dacsefolosetevarianadensitilor peunitatedeprobcadescriptoralvariabilitiiimediadensitilorpe unitate de prob ca termen de comparaie a magnitudinii varianei, se poate calcula un indice de dispersie astfel: Indice de dispersie =s2x . Cnddatelesuntprezentatesubformdetabeldedistribuiea frecvenelor,atunciformulelevarianeiimedieipotfiadaptatepentru facilitarea calculelor astfel: xx x11x1 1x22x2 2 xkkxk k = n (x )x=(x])n

s2 =|](x-x )2]n-1 . 46Elemente de statistic aplicate n ecologie Indicelededispersiepoatefisubunitar,egalcuunitateasau supraunitar.Astfel,nfunciedevaloarearaportului,sepoatedecidecare este tipul de dispersie: dac s2x< 1, dispersia este uniform; dac s2x= 1, dispersia este aleatoare; dac s2x> 1, dispersia este grupat. Cesentmpldacvaloareaindiceluidedispersieestefoarte apropiatde1?Valoarearespectivpoateficonsideratcaaproximativ egalcu1sau,lafeldebine,poateficonsideratnfunciedesituaieca fiind mai mare sau mai mic dect 1. ntr-oastfeldesituaie,pentrualuaodecizieobiectivtrebuieca acesteiasiseatribuieoprobabilitate,adicsserealizezeoestimare statistic.Pentruaceastaseimpuneostandardizareaindiceluidedispersie prinnmulireaacestuiacunumrulgradelordelibertate,adiccunumrul unitilor de prob minus unu (n -1), obinndu-se o statistic de tip _2: _2 = (n -1) s2x. Cndnumrulunitilordeprobesterelativmic(n < Su),se comparstatistica_2cuvalorilecriticealedistribuiei_2pentrun -1 grade de libertate i pentru pragul de confiden u,97S i, respectiv, u,u2S: dac _2 < _(0,975,n-1)2=> dispersia este uniform; dac _(0,975,n-1)2< _2 < _(0,025,n-1)2=> dispersia este aleatoare; dac _2 > _(0,025,n-1)2=> dispersia este grupat. noricaredintresituaiiledemaisus,niveluldeconfidenal estimrii este de u,uS (cele dou valori critice exclud fiecare cte 0,025 din fiecare coad a distribuiei _2). Deci probabilitatea ca dispersia s fie de un anumit tip este de u,9S sau 9S%. Distribuii probabilistice47 Cndnumrulunitilor de prob este relativ mare (n Su), atunci se calculeaz o statistic J conform relaiei: J = 2 _2 -2 (n -1) -1 . Aceaststatisticsecomparcuvaloareacritic1,96,careesteo valoare z ce exclude u,uS din distribuia normal standard (seciunea 4.5): dac J < -1,96 => dispersia este uniform; dac |J| < 1,96 => dispersia este aleatoare; dac J > 1,96 => dispersia este grupat. i n acest caz, nivelul de ncredere este de u,uS, deci probabilitatea ca dispersia s fie de un anumit tip este de u,9S sau 9S%. Indicelededispersiefacedistinciadintreceletreitipuri,darnu poateindicagraduldeaglomerarencazuluneidispersiigrupate,deoarece esteputernicinfluenatdenumrultotaldeentitiindividualedintoate unitiledeprob.Pentruaapreciagraduldeaglomeraredintr-odispersie grupat,sefoloseteindiceleGreen(I6),careelimindependenade numrultuturorindivizilordintoateunitiledeprob.Numrultotalde indivizidintoateunitiledeprobvafiegalcu(x)ncazulncare datele sunt sub form de tabel de frecvene sau cu (x) dac datele sunt sub form de densiti pe unitatea de prob. I0 =s2x-1(x])-1 sau I0 =s2x-1(x)-1 Acest indice ia valori ntre u, pentru dispersie aleatoare, i 1, pentru dispersiegrupat,cugradmaximdeaglomerare(toateentitileaufost identificatentr-osingurunitatedeprob).Acestindicepoatefifolosit pentru compararea gradului de aglomerare a unor probe diferite ca numr de entiti, medie sau numr de uniti de prob. 48Elemente de statistic aplicate n ecologie Exemplul4.4.ntr-opopulaiedeplante,prininvestigareaa14 ptratedeprobs-auobinutdensitileindivizilor.Careestetipulde dispersie al populaiei? 00053481 230592210 x = 12614 = 9s2 = 2u7,69s2x = 207,699= 2S,u8 . Indicele de dispersie este evident mai mare ca 1. n continuare vom verifica dac dispersia aglomerat este semnificativ. _2 = (14 - 1) 2S,u8 = Suu,u4 Aceastvaloaresecomparcuvalorilecriticecalculatepentru1S gradedelibertateipentruniveluriledesemnificaieu,97Si,respectiv, u,u2S (anexa 3): _(0,975,13)2= S,uu9_(0,025,13)2= 24,7S6 . Valoareacalculat(_2 = Suu,u4)estemaimaredectlimita superioar(_(0,025,13)2= 24,7S6)aintervaluluideconfidenpentru dispersia aleatoare, deci populaia investigat are o dispersie aglomerat, cu o probabilitate de u,9S sau 95%. SeestimeazgraduldeaglomerarecuindiceleGreen(I0).Datele sunt sub form de densitate pe ptrat de prob, deci numrul total de indivizi identificaincele14ptrateestedatdesumanumruluideindivizidin fiecare ptrat. I0 = 23,08-1126-1 = u,177 Distribuii probabilistice49 Avnd n vedere c I0 ia valori ntre 0 i 1, se poate concluziona c gradul de aglomerare nu este destul de sczut. nsituaiancarenumrulunitilordeprobestemaimaredeSu, sepoateverificadacfrecveneleobservatealevariabileiconcordcu frecveneleestimatecuajutoruluneiadintredistribuiileprobabilistice discrete(binomial,Poisson,binomialnegativ)ceservetedreptmodel. Practic,secalculeazprobabilitateadeaobineoanumitvaloarea variabileipeunitatedeprob,dupcareseconvertetenfrecvenprin nmulireacunumrulunitilordeprob.Concordanafrecvenelor observatecuceleestimate(cumodelul)sepoatefaceprinreprezentarea grafic a ambelor frecvene i prin testul _2 de concordan (seciunea 10.1). n seciunile urmtoare ne vom referi la compararea grafic a frecvenelor. 4.4.2. Modelul binomial Calculareaprobabilitiibinomialedeobinereauneivaloria variabilei pe unitate de prob se bazeaz pe procedura descris n exemplul 4.1, cu deosebirea c numrul de ncercri (k) se estimeaz ca fiind valoarea rotunjit obinut prin calcularea expresiei: k =x2x -s2 . Parametrii p i q reprezint probabilitatea ca o anumit poziie dintr-o unitate de prob s fie ocupat de o entitate. p =xk , iarq = 1 -p . Pebazaacestorparametriisecalculeazprobabilitateabinomial (p(x))deaobineoanumitvaloareavariabilei(x)peunitatedeprob. Ulteriorseaflfrecvenaestimatavaloriixprinnmulireaprobabilitii acesteia cu numrul unitilor de prob i = p(x) n. 50Elemente de statistic aplicate n ecologie Exemplul4.5.S-audeterminatdensitileindiviziloruneispeciide plante din 50 de ptrate de prob cu o anumit suprafa. Care este tipul de dispersie al populaiei de plante? Nr. indivizi pe ptrat 16 17 18 19 20 21 22 Frecvena3 5 8 14 11 6 3 Variabilaestenumrulindivizilorpeptratdeprobiovomnota cu x. Frecvenele observate le vom nota cu . Pentru a calcula numrul mediu de indivizi pe ptrat (x), trebuie aflat numrul total de indivizi din toate ptratele. Deoarece datele sunt prezentate subformdetabeldefrecven,numrultotaldeindiviziidentificaivafi (x). x16 17 1819202122 Suma35814116350 x48 85 144 266 220 126 66 955 x=95550= 19,1s2 =3(16-19,1)250-1+5(17-19,1)250-1++3(22-19,1)250-1= 2,S8 Indicelededispersieesteevidentsubunitar,decisepoateca populaia s aib o dispersie uniform. Indicele de dispersie = 2,3819,1 = u,124 _2 = u,124 (Su -1) = 6,u99J = 2 6,u99 -2(Su -1) -1 = -6,SS6-6,SS6 < -1,96 => dispersie uniform semnificativ n continuare se calculeaz valorile k i p: k =19,1219,1-2,38 = 21,82 = 22p =19,122= u,876 q = 1 -u,876 = u,124 . Distribuii probabilistice51 Porninddelaacestevalori,sepotcalculaprobabilitilepentrux indivizi la ptrat de prob (anexa 3): p(16) =22!16!(22-16)! u,87616 u,124(22-16) = u,uSS1 . La fel se procedeaz i pentru celelalte valori, dup care se nmulesc cu numrul unitilor de prob, obinndu-se frecvenele estimate ('). xp(x)' 1630,033 1,6541750,082 4,1071880,160 8,02419140,238 11,88120110,251 12,5342160,168 8,3962230,054 2,684 Sepoateobservacexistoconcordandestuldemarentre frecveneleobservateiceleestimatepebazamodeluluibinomial.Deci putem concluziona c dispersia populaiei este uniform. 4.4.3. Modelul Poisson Calculareaprobabilitiideobinereauneivaloriavariabileipe unitatedeprob,conformdistribuieiPoisson,sebazeazpeprocedura descris n exemplul 4.2. Exemplul4.6.ntr-unstudius-aurmritdensitateaindivizilorunei specii de arpe n 100 de ptrate de prob, ntr-o formaiune ierboas. Ce tip de dispersie prezint populaia studiat? 024681012141616 17 18 19 20 21 22frecvenaxf f'52Elemente de statistic aplicate n ecologie Nr. indivizi/ptrat 0 1 2 3 4 5 6 7 8 Frecvena7 16 25 18 16 10 5 2 1 Se calculeaz media i deviaia standard la fel ca n exemplul 4.5. x0 12345678 Suma7 16 25 18 16 10 521 100 x 0 16 50 54 64 50 30 14 8 286 x=286100 = 2,86s2 =7(0-2,86)2100-1+16(1-2,86)2100-1++1(8-2,86)2100-1= S,11 Indicele de dispersie poate fi considerat fie aproximativ egal cu 1, fie supraunitar. Indicele de dispersie =3,112,86 = 1,u88 _2 = 1,u88 (1uu -1) = 1u7,7u6J = 2 1u7,76 -2(1uu -1) -1 = u,641u,641 < 1,96 => dispersie aleatoare semnificativ ncontinuaresecalculeazprobabilitateaPoisson(p(x))pentru toate valorile variabilei x (anexa 3). Se obin astfel probabilitile de apariie axindivizilaptratdeprob.Probabilitateadeaobinexindivizin 1uu deptrateseobinenmulindp(x)cu1uu.Valorileastfelobinute reprezint frecvenele teoretice ('). p(u) = 2,718S-2,86 2,8600!= u,uS727p(1) = 2,718S-2,86 2,8611!= u,16S79 La fel se procedeaz i pentru celelalte valori, dup care se nmulesc cu numrul unitilor de prob, obinndu-se frecvenele estimate ('). Distribuii probabilistice53 1i = u,uS727 1uu = S,7272i = u,16S79 1uu = 16,S79 . xp(x)' 070,057 5,7271160,164 16,3792250,234 23,4223180,223 22,3294160,160 15,9655100,091 9,132650,044 4,353720,018 1,778810,006 0,636 Sepoateobservacexistoconcordandestuldemarentre frecveneleobservateiceleestimatepebazamodeluluiPoisson.Deci putem concluziona c dispersia populaiei studiate este aleatoare. 4.4.4. Modelul binomial negativ Calculareaprobabilitiideobinereauneivaloriavariabileipe unitatedeprob,conformdistribuieibinomialenegative,sebazeazpe procedura descris n exemplul 4.3. Exemplul4.7.ntr-unstudius-aurmritdensitateaindivizilorunei speciideplanten1uudeptratedeprob.Careestetipuldedispersieal populaiei? Nr. indivizi/ptrat0 1 2 3 4 5 6 7 8 9 1011 Frecvena20 27 18 12 10 4 2 3 2 0 11 Se calculeaz media i deviaia standard la fel ca n exemplul 4.5. x01 2 3 4 5 6 7 8 9 10 11 Suma 2027 18 12 10 4 2 3 2 0 1 1 100 x027 36 36 40 20 12 21 16 0 10 11 229 0510152025300 1 2 3 4 5 6 7 8frecvenaxf f'54Elemente de statistic aplicate n ecologie x=229100 = 2,29s2 =20(0-2,29)2100-1+27(1-2,29)2100-1++1(11-2,86)2100-1= S,16 Indicele de dispersie este evident supraunitar. Indicele de dispersie =5,162,29 = 2,2S2 _2 = 2,2S2 (1uu -1) = 222,96SJ = 2 222,96S -2(1uu -1) -1 = 7,u817,u81 > 1,96 => dispersie grupat semnificativ Pentrudistribuiabinomialnegativestenecesarcalcularea parametrului k. Acesta este o variabil continu, motiv pentru care valoarea sa nu se rotunjete ca n cazul distribuiei binomiale. k =2,2925,16-2,29 = 1,829 ncontinuaresecalculeazprobabilitateaPoisson(p(x))pentru toate valorile variabilei x: p(u) = [1 +2,291,829-1,829= u,226S ; p(1) =(1,829+1-1)12,292,29+1,829 u,226S = u,2Su4 ; p(2) =(1,829+2-1)22,292,29+1,829 u,2Su4 = u,1811 . Lafelseprocedeazpentrurestulvalorilorluix.Probabilitilede apariie a x indivizi la ptrat de prob se nmulesc cu numrul unitilor de prob(1uu),obinndu-seastfelfrecveneleestimate(')conform modelului binomial negativ. 1i = u,227 1uu = 22,6S1i = u,2Su4 1uu = 2S,u41i = u,181S 1uu = 18,1SDistribuii probabilistice55 xp(x)' 0200,226522,65 1270,230423,04 2180,181118,11 3120,128512,85 4100,08638,63 540,05595,59 620,03543,54 730,02202,20 820,01351,35 900,00820,82 1010,00490,49 1110,00290,29 Sepoateobservacexistoconcordandestuldemarentre frecveneleobservateiceleestimatepebazamodeluluidistribuiei binomialenegative.Decisepoateconcluzionacdispersiapopulaiei studiate este aglomerat. 4.5. DISTRIBUIA NORMAL Distribuianormalesteunadintredistribuiilecontinui.Aceasta descrie,maimultsaumaipuin,distribuiaunuimarenumrdevariabile, motivpentrucarereprezintobazconceptualpentrumulteprocedeede analiz statistic. Variabilele continui pot lua orice valoare ntre anumite limite. Dac sereprezintgraficdistribuiafrecveneloruneiastfeldevariabilentr-o populaie,prinintermediuluneiliniicontinui,aceastavaaveaoform simetric,declopot.Deaceea,aceastdistribuiemaiestenumiti clopotulluiGauss,careesteunuldinautorii(Moivre1733,Legendre 1805, Laplace 1812) care a descris riguros aceast distribuie (Gauss 1809). Teoretic,dacserealizeazhistogramafolosindunnumrinfinitdevalori individuale,iarintervaluldeclasestecelmaimicposibil,histogramasau poligonul frecvenelor tinde s devin o curb continu (fig. 4.3). 0510152025300 1 2 3 4 5 6 7 8 9 10 11frecvenaxf f'56Elemente de statistic aplicate n ecologie Figura 4.3. Distribuia frecvenelor valorilor unei variabile Numeroasevariabilecontinuintlnitennaturauodistribuie normal.Deasemenea,multevariabilecareauoamplitudinemarea valorilorprezintodistribuieaproximativnormal.Uneledistribuii discretetindsdevinaproximativnormalesausimetricepemsurce parametrii legai de numrul de valori cresc. Proprietile distribuiei normale 1. Distribuiaestedefinitdemedie(p)idedeviaiastandard(o). Poziia distribuiei pe abscis este determinat de valoarea mediei, iarlrgimeaacesteia,dedeviaiastandard(fig.4.4).Cumaceti parametripotaveaoinfinitatedevaloridiferite,nseamnc exist un numr infinit de distribuii normale. 2. nlimea curbei fa de ordonat este dat de funcia de repartiie (x) pentru fiecare valoare individual a variabilei: (x) =1c2nc-(x-)22o2. fxDistribuii probabilistice57 Figura 4.4. Distribuii normale diferite dup medii (m) i deviaii standard (s) 3. Curbaesteperfectsimetricfademedie,motivpentrucare media i mediana sunt egale n distribuia normal. De asemenea, valorile variabilei egale cu media sunt cele mai frecvente i astfel mediaesteegalcumodulvalorilorindividuale.nconcluzie, media,medianaimodulvaloriloruneivariabilenormal distribuite sunt egale. 4. Curbadistribuieicuprindeprobabilitateatotal,adic 1.Dacse considersuprafaadelimitatdecurbcafiind1uu%,atunci suprafaadelimitatdevaloareap -oip +oreprezint aproximativ 68,26% din total. Adic n jur de 68% dintre valorile variabileisuntcuprinsenacestintervalsauprobabilitateacao valoareselectataleatordinpopulaiesfiecuprinsdeacest intervalestedeu,68.ntrep -2oip +2osegsete9S,44% dinsuprafaacurbei,adicprobabilitateadeaobservaovaloare dinacestintervalestedeu,9S44,iarintervalulp -So,p +So cuprinde99,74%dinvalorileindividualesauprobabilitateadea extrageovaloaredinacestintervalestedeu,9974(fig.4.5).n practicsefolosescprobabilitileu,9Siu,99,pentrucare intervalele sunt p _1,96o i, respectiv, p _2,S8o. Probabilitatea caovaloaresfienafaracelordouintervalevafi1 -u,9S =u,uSi,respectiv,1 -u,99 = u,u1.Acesteproprietipotfi folositepentruapreciereaposibilitilordeapariieaunor rezultate. m1 m2s1s258Elemente de statistic aplicate n ecologie Figura 4.5. Suprafee ale distribuiei normale Distribuia normal standard Oricedistribuie normalparticular (N(p, o)) poate fi convertit la distribuianormalstandardcaresecaracterizeazprinfaptulcaremedia zero i deviaia standard unu (N(u,1)). Aceast conversie se realizeaz prin calculareascoruluizpentrufiecarevaloareindividualavariabileix,n funcie de media i de deviaia standard populaional (p i o): z =x-c . n practic, parametrii populaionali nu pot fi cunoscui cu exactitate, cazncarepotfisubstituiicustatisticileprobei(xis),cucondiiaca dimensiunea probei sa fie mai mare sau egal cu Su (n Su). z =x-xs

Astfel,pentruvalorilexmaimicidectmedia,zvaaveaovaloare negativ, iar pentru cele mai mari dect media, o valoare pozitiv. Scorul z aratlacedistande medie exist o anumit valoare, unitatea de referin fiind deviaia standard. Intervaleledeprobabilitatealedistribuieinormalestandardvorfi -3 -2 - + +2 +3 x0,68260,95440,9974Distribuii probabilistice59 -1, +1 pentru aproximativ u,6826 sau 68,26%, -2, +2 pentru u,9S44 sau 9S,44% i -S, +S pentru u9974 sau 99,74%. Pentru probabilitile de u,9S iu,99,intervalelevorficuprinsentre-1,96, +1,96i,respectiv, -2,S8, +2,S8 (fig. 4.6). Figura 4.6. Suprafee ale distribuiei normale standard Probabilitilepentrudiferitevalorialeluizsunttabelate(anexa2) saupotficalculate(anexa3)porninddelacoadadinstnga(cuvalori extreme negative) a N(u,1) i pn la valoarea z calculat. Exemplul4.8.Considernddateledinexemplul3.1reprezentnd nlimile a Su de indivizi de migdal pitic (Amygdalus nana), s se estimeze: a) Ceprocentdinpopulaiearenlimeacuprinsntre6u cmi 8u cm? b) ntreceintervaldenlimesuntcuprinse95%dinvalorile nlimii n populaie? Se cunoate c x= 7u,8S i s = 6,92. Pentruarspundelaprimantrebaretrebuiefcutconversiacelor dou valori la distribuia normal standard, adic trebuie calculate scorurile zpentruceledounlimi,dupcareseaflprobabilitilesauprocentele celorcorespunztoare.Simplificnd,separcurgeurmtoareaschem x - z - p. -2,58 -1,96 -1 0 +1 +1,96 +2,58z0,990,950,682660Elemente de statistic aplicate n ecologie Pentru x =60 scorul z =60-70,856,92=-10,856,92= -1,S68 . Pentru x =80 scorul z =80-70,856,92=9,156,92 = 1,S22 . Probabilitile celor dou scoruri z se caut n tabel (anexa 2) sau se calculeaz (anexa 3) p(-1,S68) = u,uS8p(1,S22) = u,9u7 . Primaprobabilitatearatcdincoadastng(cuvalorinegative)a N(u,1)ipnlaz = -1,S68suntcuprinseS,8%dinsuprafaadelimitat decurb.AdouaaratcdincoadastngaN(u,1)ipnlaz = 1,S22 sunt cuprinse 9u,7% din suprafaa delimitat de curb. Ca s aflm ce procent din valorile nlimii se gsesc ntre 6u cm i 7u cm, trebuie sczute probabilitile: u,9u7 -u,uS8 = u,849 . Rspunsullaprimantrebareestecntre6u cmi7u cmsunt cuprinse aproximativ 8S% din valorile nlimii n populaie. Pentruarspundelaadouantrebareestenevoiesseparcurg schema de raionament de la prima, dar n sens invers: p - z - x. Scorulzpentruoanumitprobabilitateseafldintabel(anexa2) sau se calculeaz (anexa 3). Avnd n vedere c att tabelul din anexa 2, ct ifunciadinanexa3considerprobabilitateadincoadastngaN(u,1), nseamn c aflarea scorului z pentru p = u,9S va returna limita superioar aunuiintervaldispusasimetricfademedie,limitainferioarfiindctre -.Astfel,pentruaobinescorurilezcaresdelimitezeosuprafade u,9SdinN(u,1)simetricfademedie,trebuiecadiferena1 -u,9S =u,uSsfiempritnmodegalnambelecozialedistribuiei(canfig. 4.6). Deci se afl scorurile z pentru p = u,u2S i, respectiv, pentru p = 1 -u,u2S = u,97S. La fel ca la punctul a), primul z separ u,u2S pn n coada stng,aldoilea,u,97Spnncoadastng,iarntreceidoisegseteo suprafa ce reprezint u,9S din suprafaa total de sub clopot. Distribuii probabilistice61 z(0,025) = -1,96z(0,975) = +1,96 Maidepartesecalculeazceledouvalorialenlimii(x)pornind de la cele dou scoruri z, pe baza relaiei pentru aflarea scorurilor z. z =x-xs= zs = x -x= x = x+zsx = 7u,8S +(-1,96) 6,92 = S7,29x = 7u,8S +1,96 6,92 = 84,41 Rspunsul de la punctul b) este c ntre S7,29 cm i 84,41 cm sunt cuprinse 9S% din valorile nlimii n populaie. 4.5.1. Aprecierea normalitii datelor Metodelestatisticeutilizatenecologiesuntdedoucategorii: parametriceineparametrice.Celeparametricesuntmaiputernice,dar totodat mai restrictive n sensul c se pot aplica doar dac datele ntrunesc oseriedecondiii.Ocondiiecomunpentrutoatetesteleparametriceeste cadatelesfieaproximativnormaldistribuite.Metodeleneparametricenu prevdaceastcondiieidinaceastperspectivsemainumesci independente de distribuie. Ele pot fi utilizate pentru o gam mai variat de situaii, dar sunt mai puin puternice (seciunea 5.5, Erori statistice). Deci, pentru a putea utiliza metode statistice parametrice, trebuie s severificenormalitateadistribuieidatelor.Dinstarttrebuiesubliniatc variabileletrebuiesfieapreciatepeoscaldeintervalsauraport,cualte cuvinte trebuie s fie continui sau discrete (n cazul celor discrete trebuie s existe un numr relativ mare de valori posibile). nstatisticexisttestededicate,careverificdacdateleauo distribuieaproximativnormal,darcaresuntrelativcomplicateirareori utilizate, motiv pentru care doar le menionm pe cele mai cunoscute: testul Shapiro-Wilk, testul Kolmogorov-Smirnov, testul Cramr-von-Mises, testul Jarque-Bera. Testareanormalitiisepoatefaceicuajutorultestului_2de concordanntrefrecvenelevalorilorvariabilelordinprobifrecvenele estimate pe baza funciei de repartiie a distribuiei normale. Acest procedeu 62Elemente de statistic aplicate n ecologie este i el destul de laborios. O verificare simpl, dar laborioas a normalitii distribuiei datelor, o reprezint aprecierea empiric a similaritii dintre poligonul frecvenelor valorilorvariabileiinvestigateicurbanformdeclopotadistribuiei normale.ncadrulexerciiuluidinexemplul2.3(fig.2.3,2.4)sepoate spunecfrecveneleobservateauodistribuiecepoateficonsiderat aproximativ normal. Verificareanormalitiidatelorsepoatefaceiporninddela proprietilematematicealedistribuieinormale.Astfel,dacvalorilesunt distribuitesimetricfademedie,adicntremedieimediannuexisto diferen mare (seciunea 3.1 Relaia dintre descriptorii tendinei centrale), iaproximativ7u%dinvalorisuntcuprinsenintervaluldelimitatde valorile (x-s) i (x+s), atunci se poate aprecia c variabila analizat este aproximativ normal distribuit n prob. Exemplul 4.9. S se verifice rapid dac datele din exemplul 3.1 au o distribuie apropiat de cea normal. Simplavizualizareadescriptorilortendineicentralearatc distribuia valorilor din prob este aproximativ normal deoarece acetia au valori foarte apropiate. Ho = 69Hc = 69,8 x= 7u,8S Intervalul x _s are urmtoarele limite: 7u,8S -6,92 = 6S,9S7u,8S +6,92 = 77,77 . ntre aceste dou valori se gsesc S4 din Su de valori, adic 68% din valoriledinprob.Acestprocentesteapropiatdecelcuprinsnintervalul p -o, p +o al unei distribuii normale, adic de 68,26%. Dac datele nu sunt normal distribuite, atunci cel mai simplu este s Distribuii probabilistice63 sefoloseascometodstatisticalternativ,neparametric.Folosirea metodelorparametricenastfeldesituaiiestetotuipermisdacse realizeaz o transformare a datelor care s corecteze distribuia acestora. Transformareadatelorestenecesardacdatelesuntsubformde numrdeentiti.Astfeldevariabilediscreteauodistribuieevident asimetric.nastfeldesituaiisefolosesctransformricareauroluldea normaliza distribuia datelor. Numeroasetehniciparametricecomparmediileprobelorcarese presupunecauvarianesuficientdeasemntoareicare,dinaceast cauz, pot fi ignorate. Datele discrete ce reprezint numrtori de entiti nu ndeplinesc aceast condiie, deoarece variana este dependent de medie n sensul c populaiile la care media are o valoare mare, mprtierea valorilor fa de medie este mai mare i, implicit, variana va fi mai mare. n astfel de situaii transformrile au rolul de a ntrerupe relaia dintre medie i varian, adic de a stabiliza variana datelor. Transformrilecelemaiutilizatenecologiesuntlogaritmul, radicalul i transformarea arcsin (anexa 3). Acestea se calculeaz n diferite condiii pentru toate valorile individuale din probe. Transformarealogaritmicseutilizeazatuncicndvariana probeiestemaimaredectmediaacesteia.Deasemenea,aresiroluldea normalizadistribuiadatelor.Valoareatransformatx'auneivalori individualexsecalculeazfolosindcelmaiadesealogaritmulzecimalsau pe cel natural: xi = log10(x) sau xi = ln(x) . Dacnprobexistvaloriegalecuzero,atuncilogaritmulnuare sensitransformareasepoatefacefieadugndounitatelatoatevalorile, fiefolosindtransformareaarcsinh(sinushiperbolicinvers)returneaz valoarea zero dac x = u. xi = log(x +1)xi = orcsinb(x) Transformareaprinextragerearadicaluluisefoloseteatunci cnd variana datelor de tip numr de entiti este aproape egal cu media i 64Elemente de statistic aplicate n ecologie pentru normalizarea distribuiei. i aici, n cazul existenei valorilor nule, se poate aduna o constant la toate valorile din prob (1 sau u,S): xi = xxi = x +1 sau xi = x +u,S . Transformareaarcsinsefoloseteatuncicnddatelesuntsub form de proporii sau procente. n cazul unor astfel de variabile distribuia valorilor este trunchiat de cele dou valori extreme: u i 1 pentru proporii i u i 1uu pentru procente. Rezultatul transformrii n radian se transform n grade (anexa 3). xi = orcsin(x) pentru proporii xi = orcsin __x100] pentru procente nanumitesituaiiestenevoiederealizareatransformriiinverse (anexa 3) pentru raportarea rezultatului n forma iniial a datelor (x' - x). Transformarea invers se realizeaz astfel: Pentru transformarea prin logaritmare: x = ontilog(xi)x = ontilog(xi) -1 . Pentru transformarea arcsinh: s = sinb(xi) . Pentru transformarea prin radical: x = xi2

x = xi2 -1 sau x = xi2 -u,S . Pentru transformarea arcsin: x = (sin(x'))2

x = (sin(x'))2 1uu . 5. STATISTIC INFERENIAL: ELEMENTE INTRODUCTIVE Statisticainferenial(inductivsauanalitic)esteparteastatisticii carecuprindemetodedeaprecierecriticavariabilitiiparametrilor empirici. Inferena statistic reprezint tratarea teoretic a datelor pentru a se ajungelaconcluziilogice,asociateobservaiilorefectuate.Dinpunctde vedereecologic,inferenastatisticreprezintstabilireaunorconcluzii despre populaii pornindu-se de la analiza probelor prelevate din populaiile respective.ngeneral,serecunoscdoucategoriilargideinferenestatistice: estimarea unor parametri populaionali i testarea ipotezelor statistice. 5.1. ESTIMAREA MEDIEI POPULAIONALE Dac dintr-o populaie se preleveaz o prob aleatoare, aceasta va fi unadinnumeroaseleprobealeatoarecaresepotextragedinpopulaia respectiv.Fiecaredintreacestepopulaiivaaveastatisticidiferite:medii diferite,deviaiistandarddiferite.Cutoateacestea,statisticileacestor populaii sunt estimatori ai parametrilor populaionali (fig. 5.1). Diferenele dintre aceste probe sunt cauze ale erorii de eantionare, ce rezult din faptul cuneleprobevorcuprindemaimultevalorimari,ntimpcealtele,mai multevalorimicidinpopulaiadecercetat.Eroareadeeantionarenueste rezultatulunorgreelirealizatedeobservator,cireflectmprtierea aleatoareceseregsetenprobe.Mediileprobelorprelevatealeatordin populaiesedistribuienjurulmedieipopulaionale,lafelcumvalorile individuale ntr-o prob se distribuie n jurul mediei probei (fig. 5.2). Acest conceptareovaloarefundamentaliestesurprinsdeTeoremalimit central (Moivre 1738, Laplace 1813): mediile probelor (x) extrase dintr-o populaienormaldistribuitsuntlarndullornormaldistribuitenjurul medieipopulaionale().Mediileprobelorextrasedintr-opopulaie nenormal distribuit au o distribuie aproximativ normal dac dimensiunea probei este mare (n > 30). 66Elemente de statistic aplicate n ecologie Figura 5.1. Reprezentarea grafic a prelevrii repetate a probelor din populaie. (linie continu sensul prelevrii; line ntrerupt sensul estimrii) Figura 5.2. Distribuia normal a mediilor probelor fa de media populaiei Utilitateaacesteiteoremeconstnfaptulcnuestenecesar prelevarea repetat a probelor din populaie pentru a cunoate modul lor de distribuire;elevoraveaodistribuienormal.Astfel,putemluan considerare doar o singur medie a unei probe prelevate dintr-o populaie ca fiindunadintrenumeroaselemediiacrordistribuiearfinormal.Lafel cumdeviaiastandardsurprindemprtiereavalorilorindividualefade media probei, tot aa, mprtierea mediilor probelor poate fi surprins de o deviaiestandardamediilorprobelor, care se numete eroarea standard a mediei. x1x2x3 x4 x5 x6Populaie , Populaie 1 x1, s1 Populaie 2 x2, s2 Populaie 3 x3, s3 Populaie i xi, si Statistic inferenial: elemente introductive67 Estimarea mediei populaionale se poate face pornind de la media i deviaia standard ale unei probe i cu ajutorul erorii standard a mediei. Dat fiindfaptulcdistribuiamediilorprobelorseabatedelanormalitatepe msur ce dimensiunea probei scade, se apeleaz la o distribuie care descrie maibinedistribuiamediilorprobeloratuncicnddeviaiastandarda populaieiesteestimatprindeviaiastandardaprobei.Aceastdistribuie se numete distribuia t sau distribuia Student. DistribuiaStudentestesimilarnmulteprivinecudistribuia normal,dar,spredeosebiredeaceasta,estedefinit,pelngmediai deviaiastandard,idenumrulgradelordelibertate(n 1).Aacumo valoarezcorespundeuneianumiteproporiidindistribuianormal standard, tot aa o valoare t corespunde unei proporii a distribuiei Student, dar n plus ia n consideraie i dimensiunea probei prin intermediul gradelor de libertate. Valorile lui t scad odat cu creterea diferenei n 1, astfel c o valoarecritict(0,05,)cedefineteu,9Ssauexcludeu,uSdindistribuia Student pentru o infinitate de valori ca grade de libertate are valoarea 1,96, adic exact valoarea lui z(0,95) ce definete aceeai proporie din distribuia normalstandard.Decidistribuiattindesdevinnormalodatcu creterea dimensiunii probei. Valoriledistribuieitsunttabelatesausepotcalculanfunciede proporiaexclusdindistribuieidenumrulgradelordelibertate.De exemplu, valoare t ce exclude u,uS din distribuia Student pentru n 1 = 4 gradedelibertateeste2,776.Proporia(u,uS)sauprocentul(S%)exclus este repartizat n mod egal n cele dou cozi ale distribuiei (fig. 5.3). Figura 5.3 -2,776 0 2,7760,025 0,02568Elemente de statistic aplicate n ecologie Deciexistdefaptdouvalorit:+2,776careexcludeu,uS2 =u,u2S din coada din dreapta a distribuiei i 2,776 care exclude u,u2S din coada stng a distribuiei. Dacdorimsreprezentmvaloareatcareexcludeu,uSdin distribuiedoarncoadadreaptpentru4gradedelibertate,atuncitrebuie cutatntabelvaloareaceexcludeu,1dindistribuie,careexcludecte u,uS n fiecare coad din distribuie (fig. 5.4). Aceast valoare este _2,1S2. Deci,dacneintereseazosingurcoadadistribuiei,trebuiecutat valoarea t care exclude o proporie dubl din distribuie. Figura 5.4 Estimarea intervalului de confiden al mediei populaionale pe baza deviaieistandardaprobeiicuajutoruldistribuieitareurmtoarele condiii de aplicare: 1. proba este prelevat aleator din populaia de interes; 2. datele sunt apreciate pe o scal de raport sau de interval; 3. variabila este aproximativ normal distribuit n prob. Pentru a realiza estimarea este nevoie de valoarea mediei probei xi a deviaiei standard estimate s. Cuajutoruldeviaieistandardsecalculeazeroareastandarda mediei: sx=sn . -2,132 0 2,1320,050,05Statistic inferenial: elemente introductive69 Se estimeaz intervalul de confiden pentru o probabilitate de u,9S (9S%) a mediei populaiei pornind de la relaia: p = x_sx t(0,05,n-1) . Dinaceastrelaierezultlimitainferioar(II)iceasuperioar (IS) a intervalului de confiden: II = x-sx t(0,05,n-1)

IS = x+sx t(0,05,n-1) . Concluzia estimrii este c intervalul II-IS include media populaiei din care a fost extras proba, cu o probabilitate de 9S% (u,9S). Exemplul5.1.LaoprobformatdinSudeindivizideviperde step(Viperaursiniimoldavica)extrasaleatoriudintr-opopulaies-a msuratlungimeanmmdelavrfulbotuluiipnlacloac.S-aestimat apoi intervalul de confiden al mediei pentru o probabilitate de 9S%. 39022844066215146443375450260 330500340363491325390425418422 389435470360370400390430164340 Se verific dac datele ndeplinesc condiiile de aplicare: proba a fost prelevataleatoriudinpopulaiadeinteres;lungimeaesteovariabil continu apreciat pe o scal de raport; pentru a verifica normalitatea datelor putem folosi elemente din statistica descriptiv a probei. Ho = S9uHc = S89,Sx= S62,17 Cele trei msuri ale tendinei centrale au valori relativ apropiate. Se poate considera c datele sunt aproximativ normal distribuite. n continuare se calculeaz deviaia standard a probei: 70Elemente de statistic aplicate n ecologie s = 96,62 . Cu ajutorul acestei valori se afl eroarea standard a mediei: sx=96,6230= 96,625,47= 17,64 . Seestimeazlimiteleintervaluluideconfidenalmediei.nacest sens, se caut valoarea t n tabel. t(0,05,29) = 2,u4S p = S62,17 _17,64 2,u4S = S62,17 _S6,u8II = S62,17 -S6,u8 = S26,u9IS = S62,17 +S6,u8 = S98,2S Intervalul S26,u9-S98,2S include media populaional a lungimii de la vrful botului la cloac cu o probabilitate de 9S%. Reprezentareagraficaintervaluluideconfidenalmedieise realizeazprinintermediulunorsegmentedispusedeasupraidedesubtul mediei, ce simbolizeaz limita inferioar i cea superioar (fig. 5.5). Figura 5.5. Intervalul de confiden al mediei (95%) Acesttipdereprezentarepoatefifolositiatuncicndsecompar 362,17300320340360380400420x326,09398,25Statistic inferenial: elemente introductive71 mediilemaimultorprobedinpopulaiidiferite.Suprapunereaintervalelor indic absena unei diferene marcante ntre mediile celor dou populaii din care au fost prelevate probele analizate. 5.2. ESTIMAREA UNEI PROPORII n ecologie, se folosesc adesea frecvenele de apariie ale unei valori nprobereprezentatsubformauneiproporiisauprocentdintotal. Proporia unei specii n prob reprezint o estimare a proporiei populaiei n comunitateaanalizat.Probeleulterioarereprezintestimatoriaiproporiei populaieidinspeciadeinteresncomunitate.Proporiilerezultatedin analizaacestorprobevorfidiferitedatoriteroriideselecie.Aceste proporii ale probelor se vor distribui n jurul proporiei populaiei n acelai fel cu modul n care se distribuie mediile probelor n jurul mediei populaiei. Deviaiastandardadistribuieisenumeteeroarestandardiseestimeaz astfel: E. S. =_p(1-p)n-1

p proporia speciei n numrul total de specii. Intervalul de confiden al proporiei populaiei este: p _(1,96 E. S. ) . 5.3. ESTIMAREA EFECTIVULUI POPULAIONAL Indicele Lincon-Petersen este un estimator al numrului de indivizi dintr-o populaie, pe baza proporiei indivizilor marcai n prima prob care se regsesc (sunt recapturai) n a doua prob. N =(n1+1)(n2+1)(m2+1)-1 , N estimarea efectivului populaiei; n1 nr. indivizilor capturai, marcai i eliberai n prima prob; n2 nr. total al indivizilor capturai n a doua prob; m2 nr. indivizilor marcai, recapturai n a doua prob. 72Elemente de statistic aplicate n ecologie Deviaia standard aproximativ a acestui estimator este: s = _(n1+1)(n2+1)(n1-m2)(n2-m2)(m2+1)2(m2+2) . Intervaluldeconfidenalefectivuluipopulaiei(N)porninddela relaia: N = N _1,96 s . 5.4. ESTIMAREA INDICELUI DE DIVERSITATE Indicii de diversitate sunt utili n aprecierea biodiversitii unei zone. Celmaisimpluindicatoraldiversitiibiologiceestebogiaspecificsau numruldespecii.Existoseriedeindiciaidiversitiicare,pelng numruldespecii,iaunconsideraieictdeechitabilsuntreprezentate speciile din comunitate, prin intermediul numrului de indivizi. Unul dintre cei mai folosii astfel de indici este indicele Shannon-Weaver: E = -p ln(p)p proporia indivizilor speciei i din suma nr. de indivizi ai tuturor speciilor. Estimareadeviaieistandardcaresdescriemprtiereavalorilor indicilorcalculaipentruaceeaicomunitate,njuruluneimedii populaionale,estedificil.Dinraiunipractice,valoareaindiceluitrebuie tratatcaovariabilordinal.Astfel,ovaloareaindiceluiegalcu4,unu trebuieconsideratcafiinddedouorimaimaredectunaegalcu2,u. Tehnicile statistice care se pot aplica valorilor apreciate pe o scal ordinal sunt n general neparametrice sau independente de distribuie. De exemplu, unsetdeindiciobinuiprinanalizamaimultorprobeextrasedinaceeai zonpoateficomparatcuunaltsetextrasrezultatdinaltzonprin intermediul testului u Mann-Whitney (seciunea 7.1.2). Oaltmodalitatedecomparareaindicilorconstntransformarea acestora n diversiti relative (EcI), exprimate proporional sau procentual: Statistic inferenial: elemente introductive73 EcI =HHmcx =HIn(S)

Emuxdiversitateamaximpentruacelainumrdespecii (diversitateauneicomunitiidealecuacelainr.despecii cuceareal,ncaretoatespeciilesuntreprezentateprin acelai nr. de indivizi); S bogia specific sau nr. de specii identificate n comunitate. Cnd se compar valorile indicilor de diversitate (E) trebuie avute n vedere dou aspecte: se compar indici pentru comuniti asemntoare (de exemplu,secomparocomunitatedepsricualtatotdepsri,nude mamifere);secomparindicirezultaidinanalizaunorprobecunumere apropiate de organisme. Exemplul 5.2. ntr-un studiu al vegetaiei de step din rezervaia de la Valea lui David s-au calculat diversitile pentru cinci comuniti vegetale din asociaia Taraxaco serotinae-Festucetum valesiacae i diversitatea unei comuniti din aceeai asociaie, studiat nainte de 1969 i notat cu A. Releveu HHre|FS|n(F) |n(S) 11,519 0,438 0,143 32,0 -1,947 3,466 21,543 0,454 0,156 30,0 -1,858 3,401 31,971 0,579 0,239 30,0 -1,430 3,401 52,051 0,637 0,311 25,0 -1,168 3,219 42,130 0,662 0,337 25,0 -1,089 3,219 Media1,843 0,554 0,237 28,4 -1,498 3,341 A1,639 0,423 0,107 48,0 -2,232 3,871 Sepoateobservacmediaindicilordediversitateacelorcinci releveeactualeestecevamaimaredectvaloareaindiceluipentrureleveul A, dei numrul de specii (S) n cel din urm este evident mai mare. Acest fapt poate fi explicat prin echitabilitatea redus a speciilor n releveul A. Echitabilitatea n acest exemplu a fost calculat pe baza relaiei: E =cHs=> E = ln(S) +ln(E) . 74Elemente de statistic aplicate n ecologie Cumechitabilitateaesteunnumrsubunitar,logaritmulvafiun numrnegativ,deciindiceledediversitateEesteegalcudiversitatea maximEmux = ln(S)careestemicoratdeechitabilitateasczuta abundenei speciilor ln(E) 5.5. TESTAREA IPOTEZELOR STATISTICE noricetiin,progresulseobineprinrealizareaobservaiilor asupraunorprocesesaufenomeneiprinexperimentealecrorconcluzii suntutilizatesubformaunorgeneralizrisauteoriicaresexplice observaiile.Demersultiinificdebuteazcurealizareaobservaiiloricu explicarea lor. Explicaia unei observaii tiinifice se numete ipotez i are urmtoarelecaracteristici:estenconcordancuobservaiilefcute,adic, dacesteadevrat,atuncivaexplicaceeaces-aobservat;poatefitestat prin experimente, adic, dac este fals, atunci acest lucru poate fi dovedit. Decetrebuiedoveditfalsitateauneiipotezeinuveridicitateaei? nfilosofiatiinei,seconsidercspoatedovedicoipotezfalseste fals, n timp ce o ipotez adevrat poate s nu se dovedeasc niciodat c este adevrat. Ca urmare, o ipotez este considerat adevrat att timp ct nupoatefiinfirmatprinalteobservaii,experimenteitestri.Cnd ncercriledeadovedifalsitateauneiipotezeeueaz,atuncincrederea, confidenanipotezarespectivcrete.Dacoastfeldeipotezareo aplicativitatelargiexplicnumeroaseevenimente,atuncieadevineo teorie. La fel ca n cazul ipotezelor, o teorie adevrat s-ar putea s nu poat fi dovedit a fi adevrat, n timp ce una fals se poate dovedi a fi fals. Sepoateastfelspunectiinaavanseazmaidegrabinfirmnd dect afirmnd i c pn la urm teoriile incorecte vor fi invalidate. Metodologiatiinificdeconfirmareauneiipotezeopereazpe bazalogiciidacatunci:dacipotezaestecorect,atuncirezultatul testrii trebuie s fie unul anume. Dac rezultatul testrii este altul dect cel prezisdeipotez,aceastaserespingeitrebuiecutatoexplicaiemai bun. Acest proces tipic pentru tiin este numit testarea ipotezelor. Testarea unor concluzii tiinifice prin procedee statistice se numete testareaipotezelorstatisticeireprezintoaplicarespecifica metodologieitiinifice.Formulareaipotezelorstatisticesefaceastfelnct Statistic inferenial: elemente introductive75 sexistedoardourezultateposibile.Deexemplu,sepotformuladou ipoteze:afirmaiaAesteadevratiafirmaiaAnuesteadevrat. Dac primul enun este cel adevrat, atunci, conform filosofiei tiinei, nu se poatedovediacestfapt.Dacnssetesteazaldoileaenuniacestase dovedete a fi incorect (o ipotez fals se poate dovedi c este fals), atunci serespingeenunultestatafirmaiaAestefalsiseacceptcellalt enun afirmaia A este adevrat ca unic alternativ corect. Cnd se lucreaz pe probe extrase din populaii, deci doar cu o parte dinntregullacarenfinalsevafacereferin,vaexistantotdeaunao probabilitatecaprobasnufiereprezentativpentrutoatpopulaia.Cu toate acestea, se va putea preciza probabilitatea ca o ipotez din cele dou s fiecorectsauincorect.Dacprobabilitateacaeasfieincorecteste foartemic,atuncisepoateconsideracipotezarespectivestecorecti invers,dacprobabilitateacaipotezasfiecorectestefoartemic,atunci se poate concluziona c ipoteza este incorect. noricetestareaipotezelorstatistice,ipotezeleformulatesunt ntotdeauna contradictorii. Ipoteza testat prin diferite procedee numite teste statisticeeste aa-numita ipoteznul (H). Aceasta presupune n general lipsa efectului, lipsa diferenei i, ca urmare, conine sau implic o egalitate. Cealaltipotez,ipotezaalternativ(H1sauHa),senumeteipotez alternativ. De exemplu, dac dorim s artm c A este diferit de B, atunci E0 va fi A = B (conine o egalitate), iar cea E1 va fi A = B. Ipoteza care se testeazestedefaptE0.Dacaceastasedovedeteadevrat,atuncise acceptcaatare.DacE0sedovedeteafifals,atunciserespingeise accept E1 ca unic alternativ. Oriceteststatisticconstntr-oseriedecalculeaplicatedatelordin probecareaucarezultatosingurvaloarenumitstatisticatestului. Statistica unui test reprezint o translaie a datelor din probe la o distribuie cunoscut.Esteunprocessimilarcuceldetrecereauneivaloridelao distribuie normal particular la o valoare z a distribuiei normale standard, valoarececorespundeuneianumiteproporiidindistribuiesauunei anumiteprobabiliti(seciunea4),conformschemeix-z-p. Statistica testului, proprie unui anumit tip de distribuie, este comparat cu o valoarecusemnificaiedepragpentruoanumitprobabilitate,numit valoare critic. n funcie de poziionarea statisticii testului fa de valoarea critic,seiadeciziadeacceptaresaurespingereaipotezeinule.Valorile 76Elemente de statistic aplicate n ecologie criticepentrufiecareteststatisticsuntcalculateiaranjatentabelesause pot calcula pornind de la funciile specifice distribuiilor. nfunciedentrebarealacaretrebuiesrspundtestulstatistic, ipotezeleacestuiasepotscrienmaimultevariante.Dacipotezeleconin semnele=i=,atunciserealizeazuntestnvariantbilateral (H: A = B; H1: A = B).Denumireaprovinedelafaptulcexistdou situaii n care se poate respinge ipoteza nul i accepta ipoteza alternativ: cndA > BicndA < B.Dacipotezeleconinsemnele,,>i B sauH: A B; H1: A < B).noricaredinceledouvarianteexistdoaro singursituaiencaresepoaterespingeipotezanulisepoateaccepta ipotezaalternativ:dacinumaidacA > B,pentruprimaperechede ipoteze, i dac i numai dac A < B, pentru a doua pereche de ipoteze. n general, testele unilaterale se utilizeaz doar dac exist un motiv apriori care s sugereze o tendin direcional a datelor. Este bine ca testele bilateralessefacdupotestarenvariantbilateral.ntreceledou variante ale unui test nu exist nici o diferen n privina modului de calcul alstatisticiitestului,cidiferdoaripotezeleipraguldesemnificaiemai micncazultestelorunilaterale(seciunea5.1,fig.5.3,5.4iexplicaiile aferente). Luareauneideciziistatisticeserealizeaznfunciedepragulde probabilitate.Acestasemainumeteiniveldeconfiden,dencredere sau prag de semnificaie i se noteaz cu u. Valorile o cel mai des utilizate necologiesuntu,uSsauu,u1isedesemneaznaintedederularea testului.Praguldesemnificaie(o)sauprobabilitateacalculatpentruo anumitstatisticaunuitest(p)trebuieprecizatnconcluziileoricrei cercetrincares-aufolosittestestatistice(deexemplu,rezultatuleste semnificativnproporiede9S%saupentruo=u,uSsau pentru p < u,uS sau pentru p=u,uuuS). SepoatentmplacaE0sfierespinspentruovaloarea probabilitiiegalecuu,uS,darsnupoatfirespinsdacnivelulde ncredere stabilit apriori este de u,u1. Aceast situaie se datoreaz faptului c,pentrumajoritateadistribuiilor,valoareacriticcretepemsurce niveluldencrederescade.Cedecizieseiantr-oastfeldesituaieicum poate fi ea argumentat pentru a elimina subiectivismul? Statistic inferenial: elemente introductive77 n orice test statistic pot s apar dou genuri de erori statistice (tab. 5.1): eroare de genul I, ce const n respingerea eronat a E0 cnd este adevrat; riscul sau probabilitatea de a face o astfel de eroare este u; eroare de genul II, ce const n acceptarea eronat a E0 cnd este fals; riscul sau probabilitatea de a face o astfel de eroare este . Tabelul 5.1. Consecinele posibile ale unei decizii statistice Ipoteza adevrat E0E1Ipoteza acceptatE0Corect (1 -o)Eroare IIp = [ E1Eroare Ip = o Corect (1 -[) DacsedoretereducerearisculuideacomiteoeroareI,atuncio trebuie s scad, ceea ce conduce la creterea riscului [ de a comite o eroare II i invers. Se consider c o=u,uS asigur un echilibru ntre riscul de a comite o eroare de genul I i cel de a comite o eroare de genul II. Dac valoarea o se decide de la nceput sau se poate calcula pentru o anumitstatisticaunuitestcorespunztoruneifunciidedistribuie, valoarealui[nusecalculeaz.Valoarealui[scadepemsurce dimensiuneaprobelor(n)creteicretepemsurcediferenadintre valorile comparate (A i B) scade. Riscul [ variaz de la un test la altul. Un testputernicnseamndefaptcareunriscmic,adicestemaipuin influenatdedimensiuneaprobeiidediferenelemicidintrevalorile comparate. Legat de puterea unui test sau de riscul de a comite o eroare de genul II, trebuie menionat c testele neparametrice sau independente de distribuie sunt mai puin puternice dect cele parametrice, mai restrictive. Din aceast cauzuncercettorarputeamanifestaotendindeevitareatestelor neparametricenideeafolosiriiunortestemaiputernice.Oastfelde atitudine se poate dovedi eronat nu trebuie sacrificat validitatea utilizrii unui test n favoarea puterii acestuia! Regula de siguran n privina alegerii unuitestparametricsauneparametricestec,dacexistondoialorict demiccuprivirelamodulncaredateledinprobesatisfaccondiiile 78Elemente de statistic aplicate n ecologie restrictive ale unui anumit test parametric, atunci mai bine se apeleaz la un test neparametric alternativ celui parametric. Rezumndaspecteleprezentatepnacum,testareaipotezelor statistice se realizeaz prin parcurgerea urmtoarelor etape: 1. Enunareaclarantrebriilacaresedoreteaflarearspunsului n urma prelucrrii datelor din probe. 2. Identificarea tipului de variabil i a scalei de apreciere a acesteia iapreciereadistribuieiprobei.Aceastetappermiteluarea decizieiprivindutilizareaunuitestparametricsauaunuia neparametric. 3. Pebazarspunsurilordinprimeledouetapeseformuleazcele douipotezestatistice(practicsealegeovariantbilateralsau unaunilateralatestului)isestabiletereguladedecizie(se desemneaz nivelul de ncredere sau de confiden o). 4. Se calculeaz statistica sau statisticile testului. 5. Se compar statistica obinut


Recommended