ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
ECO-STATISTICA:
OBIECTIVE:
A. EVALUAREA CELEI MAI PROBABILE VALORI A
UNEI CARACTERISTICI A MEDIULUI IN ZONA
INVESTIGATA si a ERORII DE ESTIMARE
In zona investigata cu o probabilitate de 90% (riscul
asumat alfa =10%)
presiunea este cuprinsa in intervalul:
• 771,444-0.011 mmHg
• 771,444+0.011 mmHg
B. EVALUAREA CORELATIILOR DINTRE VALORILE
CARACTERISTICILOR MEDIULUI
Presiunea = -6.467* Temperatura + 890.9
Coeficient de corelatie: -0.89028
C. EVALUAREA CELEI MAI PROBABILE VALORI A
UNEI CARACTERISTICI A MEDIULUI INTR-UN
ANUMIT PUNCT AL ZONEI INVESTIGATE
Titlu diagramă
y = -6.467x + 890.9
700.00
720.00
740.00
760.00
780.00
800.00
820.00
840.00
0.00 5.00 10.00 15.00 20.00 25.00 30.00
temperatura
pre
siu
ne
presiunea-temperatura
Liniară (presiunea-temperatura)
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
1. EVALUAREA CELEI MAI PROBABILE VALORI
A UNEI CARACTERISTICI A MEDIULUI IN
ZONA INVESTIGATA si a ERORII DE ESTIMARE
care depinde de
a. Densitatea punctelor de observatie
b. Variabilitatea caracteristicii studiate
c. Riscul asumat
Ex.: CONTINUTUL DE HUMUS DIN SOL IN
PADUREA BANEASA este de 250ppm PLUS /MINUS
15ppm cu un RISC DE 10%.
V+/-EROARE
T=10GRADE Celsius+/-2 grade Celsius
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
DATELE UTILIZATE PENTRU PRELUCRARI
STATISTICE
Variabile/caracteristici ALFANUMERICE
Ex.: LITOLOGIA: “GRANIT”, “BAZALT”,....
Pentru valorile alfanumerice operatiile posibile in
cadrul prelucrarilor statistice sunt:
� COMPARAREA (identice sau diferite)
� CONCATENAREA (alaturarea celor doua valori)
Pentru prelucrari suplimentare, valorile alfanumerice
se codifica BINAR utilizand doua cifre:
� 0 (zero) care semnifica absenta valorii
alfanumerice
� 1 (unu) care semnifica prezenta valorii
alfanumerice
Variabile/caracteristici NUMERICE
Ex.: TEMPERATURA: 100C, 150C, ...
PRESIUNEA: 760 mm colHg
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
ETAPELE PRELUCRARILOR STATISTICE
1. ANALIZA VARIABILITATII GLOBALE (A.V.G)
DATELE UTILIZATE: VALORILE
variabilelor/caracteristicilor mediului: v(i); i=1,2,...n
OBIECTIVUL: cea mai probabila valoare a caracteristicii
studiate si eroarea de estimare a acestei valori
( )αε±v
( )%10210 00CC ±
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
PRELUCRAREA DATELOR ALFANUMERICE
Cea mai simpla varianta de evaluare a celei mai probabile
valori alfanumerice se bazeaza pe HISTOGRAMA
NOMINALA.
Frecventa
absoluta a
valorilor
alfanumerice
Valorile alfanumerice intr-o
succesiune arbitrara arin salcie ?
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
PRELUCRAREA DATELOR NUMERICE
a) Analiza valorilor extreme conduce la doua variante
decizionale:
a. Eliminarea: daca numarul valorilor extreme este
redus
b. Prelucrarea separata a grupului de valori
extreme: daca grupul este numeros.
Eliminarea valorilor extreme conduce la reducerea marimii
erorii de estimare pentru cea mai probabila valoare a
caracteristicii studiate in zona investigata.
Aplicatie temperatura Tema T7:
Nr.valorii
Valoarea
variabilei
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Din diagrama de variabilitate a temperaturii rezulta ca nu
sunt valori extreme care sa fie eliminate din setul de date
original. In continuare se vor prelucra toate cele 40 de
valori disponibile.
b) Analiza distributiei valorilor de temperatura utilizand
HISTOGRAMA VALORILOR TEMPERATURII
Normalitatea unei distributii (simetria histogramei) se
cuantifica prin COEFICENTUL DE ASIMETRIE:
• ZERO cand histigrama este SIMETRICA
• NEGATIV daca asimetria este de STANGA
• POZITIV daca asimetria este de DREAPTA
Dupa aplicarea transformarilor radical (valmax+1-v) si 1/v
s-a decis sa se calculeze valoarea cea mai probabila cu
valorile netrensformate ale temperaturii deoarece
coeficientul de asimetrie corespunzator valorilor originale
este cel mai mic: -0,27.
c) calculul valorii celei mai probabile si a erorii de estimare
a acesteia pentru un risc asumat de 10%.
F.abs.T
T
Vmin VMAX
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
LABORATOR 1.
1.Crearea fisierului cu date:
� Date numerice:
o Coordonatele punctelor de masura (x,y) [m]
o Presiunea aerului [mmHg]
o Temperatura aerului [oC]
� Date alfanumerice:
o Litologia: “granit”, “diorit”
2. Construirea diagramei de variabilitate pentru
identificarea valorilor EXTREME
c) Evaluarea distributiei valorilor caracteristicilor
numerice
Instrumentul utilizat: HISTOGRAMA
V
Vmin Vmax
Frecventa absoluta
D n1=2
n2=4
n3=3 n4=1
0
1
2
3
4
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Frecventa absoluta: numarul de aparitii al unei valori
in
Amplitudinea selectiei de valori:
minmax VVA −=
Interval de grupare (STURGESS):
)ln(33,21 n
AD
⋅+=
Utilizarea HISTOGRAMEI pentru studiul distributiei
valorilor
In functie de tipul HISTOGRAMEI se stabileste modul de
calcul al celei mai probabile valori din zona investigata:
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Tipuri de HISTOGRAME: si modul de prelucrare specific
� HISTOGRAMA UNIMODALA SI SIMETRICA
DISTRIBUTIA VALORILOR ESTE NORMALA
Valoarea cea mai probabila se calculeaza cu toate valorile
utilizate pentru constructia histogramei
� HISTOGRAMA ESTE UNIMODALA SI
ASIMETRICA
Valoarea cea mai probabila se calculeaza cu toate valorile
utilizate pentru constructia histogramei DAR
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
NORMALIZATE CU AJUTORUL UNOR FUNCTII
ANALITICE ELEMENTARE (ex.: log(v)=t)
DACA NU SE NOMRALIZEAZA DISTRIBUTIA
VALORILOR , VALOAREA CEA MAI PROBABILA
VA FI SUPRAESTIMATA/SUBESTIMATA IN
FUNCTIE DE TIPUL DE ASIMETRIE (DE DREAPTA
respectiv de STANGA)
� HISTOGRAMA BIMODALA SIMETRICA
`
Selectia de valori este NEOMOGENA si pentru prelucrare
valori sunt separate in doua grupuri OMOGENE pentru
care se calculeaza valori diferite ale celei mai probabile
valori CU VALORILE ORIGINALE
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
� HISTOGRAMA BIMODALA ASIMETRICA
Selectia de valori este NEOMOGENA si pentru prelucrare
valori sunt separate in doua grupuri OMOGENE pentru
care se calculeaza valori diferite ale celei mai probabile
valori CU VALORILE ORIGINALE NORMALIZATE.
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
CALCULUL CELEI MAI PROBABILE VALORI DIN
ZONA INVESTIGATA
Cea mai PROBABILA valoarea a unui set de valori cu
distributie NORMALA (HISTOGRAMA
UNIMODALA-SIMETRICA) este MEDIA
ARITMETICA A VALORILOR.
n
v
v
ni
i
i∑=
== 1
Daca distributia valorilor este NON-NORMALA
(HISTOGRAMA este ASIMETRICA) valoarea cea mai
probabaila calculata cu formula MEDIEI
ARITMETICE va fi
SUBESTIMATA/SUPRAESTIMATA in functie de
tipul de asimetrie.
Pentru eliminaea
SUPRAESTIMARII/SUBESTIMARII celei mai
probabile valori se NORMALIZEAZA distributia
valorilor.
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
APLICATIE
Calculul celei mai probabile valori a PRESIUNII in zona
investigata.
Etapele de prelucrare (dupa construirea histogramei):
1) Evaluarea tipului de histograma:
a. Unimodala
b. Asimetrica
i. de stanga
ii. moderata
2) Calculul mediei aritmetice a valorilor presiunii
(nenormalizate), media care va subestima cea mai
probabila valoare a presiunii.
3) Normalizarea distributiei valorilor
a. Transformarea valorilor folosind functia
RADICAL de ordinul 2
nivt ii ,...,2,1;2 ==
b. Construirea histogramei cu valorile transformate
c. Compararea histogramelor construite cu valorile
originale si cu valorile transformate:
i. Calitativ/vizual (aproximativ)
ii. Cantitativ pe baza coeficientului de
asimetrie (SKEWNESS) care este:
1. ZERO pentru histograma SIMETRICA
2. NEGATIV pt.hist. asim. STANGA
3. POZITIV pt.hist.asim. DREAPTA
4) Calculul mediei cu valorile transformate, daca
distributia acestora are un coeficient de asimetrie mai
mic decat al valorilor originale. mmHgv 444,771=
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
2. Calculul erorii de estimate a mediei cu formula:
( ) Hg0.011443mm),2
1( =−⋅= να
αε tn
s
( )Hg0.164949mm
1
1
2
=−
−
=∑=
=
n
vv
s
ni
i
i
CONCLUZIA analizei variabilitatii globale
In zona investigata valoarea cea mai probabila a presiunii
este 771,444 mmHg cu o eroare de estimare de 0,011443
mmHg in conditiile unui risc asumat de 10%.
presiunea
Probabilitate
a de aparitie
a valorii
771,44mmH
g
0,014 0,014
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
EVALUAREA CORELATIILOR DINTRE VALORILE
CARACTERISTICILOR MEDIULUI
Metodologia de evaluare a corelatiilor dintre caracteristicile
mediului (numerice/alfanumerice) este constituita din
urmatoarea succesiune de prelucrari:
• Identificarea corelatiei dintre variabilele selectate
(exista corelatie in C1 si C2) prin metode grafice.
• Evaluarea intensitatii corelatiei dintre cele doua
variabile selectate:
o Standardizarea variabilitatii celor doua variabile
selectate pe domeniul valoric [0,1]
o Calculul coeficientilor de corelatie dintre cele
doua variabile selectate;
� Coeficientul de corelatie lineara PEARSON
C1
C2
C1
C2
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
• Val minima: -1: indica o corelatie
lineara perfecta de tip INVERS
PROPORTIONAL.
• Val medie: 0: indica lipsa corelatiei
lineare dintre cele doua variabile
selectate
• Valoarea MAXIMA: +1 indica o
corelatie lineara perfecta de tip
DIRECT PROPORTIONAL
• Modelarea matematica a corelatiei dintre cele doua
variabile selectate
21 CbaC ⋅+=
r = -1 r = 0 r = +1
C1 C1 C1
C2 C2 C2
a
C1
C2
1C∆
2C∆
2
1
C
Cb
∆
∆=
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
LABORATOR
Se evalueaza/analizeaza corelatia dintre:
PRESIUNE si TEMPERATURA
1. Identificarea corlatiei:
a. Realizarea diagramei de corelatie:
EXISTA CORELATIE
2. Evaluarea intensitatii
STANDARDIZAREA
DIAGRAMA DE CORELATIE CU VALORILE
STANDARDIZATE
CALCULUL COEFICIENTULUI PEARSON:
-0,89
INTENSITATEA CORELATIEI INVERSE DINTRE
PRESIUNE SI TEMPERATURA ESTE F.BUNA!
3. Modelarea MATEMATICA a corelatiei dintre
PRESIUNE si TEMPERATURA:
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
C. EVALUAREA CELEI MAI PROBABILE VALORI A
UNEI CARACTERISTICI A MEDIULUI INTR-UN
ANUMIT PUNCT AL ZONEI INVESTIGATE
DATELE NECESARE
• Coordonatele punctelor de observatie: Xi,Yi ;
i=1,2,...,n
• Valorile variabilei cercetate in toate punctele de
observatie disponibile: Vi; i=1,2,...,n
APLICATIA:
DATELE utilizate sunt:
• n =40 puncte de observatie
• Variabilele investigate:
o Alfanumerica: LITOLOGIA cu 2 valori distincte:
� Calcar
� Argila
o Numerica:
� Presiunea [mmHg]
� Temperatura [oC]
METODOLOGIA DE EVALUARE
1. ANALIZA VARIABILITATII GLOBALE are ca
obiectiv evaluarea celei mai probabile valori a variabilei in
zona investigata.
APLICATIA:
• Evaluarea celei mai probabile valori a
LITOLOGIEI in zona investigata.
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
2. ANALIZA VARIABILITATII SPATIALE a
variabilelor investigate
OBIECTIV: identificare LEGII DE VARIATIE
SPATIALA variabilelor investigate
( )yxfV ,= ?????
APLICATIA:
Lege de variatie spatiala pentru
• Variabila alfanumerica (LITOLOGIA)
• Variabile numerica (presiunea/temperatura)
3. EVALUAREA VALORII VARIABILEI IN ORICE
PUNCT DIN DOMENIUL INVESTIGAT
APLICATIA:
Evaluarea:
• Pentru LITOLOGIE
• Pentru presiune/temperatura
4. EVALUAREA ERORII DE ESTIMARE A
VARIABILEI IN ORICE PUNCT DIN DOMENIUL
INVESTIGAT.
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
PROGRAMUL SURFER:
• Realizeaza doua tipuri de fisiere:
i. Worksheet (similare cu fisierele de tip excel)
ii. Plot-pentru reprezentari grafice si aplicarea
metodologiei de evalure a distributiei
spatiale.
APLICATIA:
• Evaluarea celei mai probabile valori a
LITOLOGIEI in zona investigata.
INSTRUMENTUL UTILIZAT:
HISTOGRAMA NOMINALA
REZULTAT:
• PROBABILITATE DE APARITIE CALCAR:
20/40*100=50%
• PROBABILITATE DE APARITIE ARGILA:
20/40*100=50%
VALORILE ALFANUMERICE
FRECVENTA ABSOLUTA
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
APLICATIA:
Lege de variatie spatiala pentru
• Variabila alfanumerica (LITOLOGIA)
• Variabile numerica (presiunea/temperatura)
Metodologia de lucru
• Reprezentarea distributiei spatiale a punctelor de
observatie (SURFER< datele din fisierul excel: sheet:
datasurfer (x,y pentru cele 40 de puncte de observatie)
File+new Plot+Map+New+Post Map+
• Evaluarea legii de variatie spatiala a variabilei
alfanumerice:LITOLOGIE cu doua valori distincte:
1. argila
� codificarea binara a valorii argilei
� calculul variogramei experimentale
omnidirectionale
NOTA_CURS
VARIOGRAMA EXPERIMENTALA (V.E.)-forma de
exprimare sintetica a legii de variatie spatiala pentru
caracteristicile alfanumerice si numerice.
DATELE NECESARE pentru calculul V.E. sunt:
• coordonatele punctelor de observatie
(x,y)
• valorile caracteristicii:
o 0/1 pentru cele alfanumerice
o Valorile pentru cele numerice
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
FORMULA DE CALCUL pentru V.E.
( )( )
( )( )
∑ −⋅⋅
=dN
ji vvdN
d
r
rr
1
2
2
1γ
• Calculul variogramei experimentale cu prg.SURFER
1. CREAREA UNUI FISIER DE TIP: PLOT
File+New+Plot
2. LANSAREA PROGRAMULUI DE CALCUL
AL VARIOGRAMEI
Grid+Variogram+New Variogram
3. Selectarea fisierului cu date
4. Selectarea datelor: x, y, Cod_argila
5. Calculul si salvarea variogramei pentru
argila:Variograma_ARGILA.
6. Calculul variogramei pentru calcar:
Variograma_CALCAR
OBSERVATIE:
dr
( )dr
γ
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Daca sunt doar DOUA valori alfanumerice
DISTINCTE variogramele sunt identice pentru
aceste valori.
Variogramele pentru variabile/caracteristici
ALFANUMERICE se numesc VARIOGRAME
INDICATOARE
7. Calculul variogramei experimentale pentru
variabilele numerice:
� Presiune: Variograma_PRESIUNE
• MODELAREA MATEMATICA A VARIOGRAMEI
EXPERIMENTALE consta in identificarea unei
functii continui care interpoleaza cu abateri minime
valorile variogramei experimentale
1. modelarea matematica a Variogramei ARGILEI
2. etc.
• EVALUAREA DISTRIBUTIEI SPATIALE PENTRU
VARIABILELE ALFANUMERICE
NOTA CURS:
Harta distributiei spatiale a variabilelor ALFANUMERICE
este o harta cu distributia PROBABILITATII DE
APARIATIE a valorii afanumerice studiate (ARGILA).
De regula pe aceste harti se reprezinta numai zonele cu
probabilitati mai mari de 50%.
o Aplicatia:
� Reteaua de interpolare pentru probabilitatea
de aparitie a argilei (GRID_ARGILA)
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
� Reprezentarea grafica a distributiei spatiale
a probabilitatilor de aparitie pentru ARGILA
� Definitivarea reprezentarii grafice