Metadate si Sisteme Informatice Geografice
Nevoia de metadate
0
20
40
60
80
100
120
Timp
Importanta datelorImportantacalculatoarelor
Pe masură ce puterea de calcul se ieftineste, in mod comparativ, creste si importanta cantitatii de date stocate.
Este necesara o metoda de catalogare si administrare a datelor.
Utilizarile metadatelor De a mentine o investitie internă a
organizatiilor in date geospatiale, de a furniza informatii despre datele detinute
de o organizatie, de a cataloga datele, de a crea birouri pentru vinderea acestora si de brokeraj
de a furniza informatiile necesare procesarii şi interpretarii datelor care vor fi receptate prin transfer de la o sursa la alta
Viziuni
Pamantul digital: intelegand planeta noastră in secolul 21 de Al Gore
Microsoft ”Digital Nervous System" de Bill Gates
Cu toate ca de cele mai multe ori asemenea viziuni nu mentioneaza in mod explicit metadatele, totusi aceasta vor fi cheia dezvoltarii lor
Definind metadatele geospatialeO inregistrare de tip metadata este o inregistrare “surogat” care descrie o altă sursa de informatii. Inregistrarea mai poate fi numita si “date despre date”.
US Federal Geographic Data Committee, (FGDC), defineste metadatele ca prezentand:
• disponibilitate -- date necesare pentru a determina setul de date care exista pentru o localizare;
• oportunitate de utilizare -- date necesare pentru a determina daca setul de date indeplineste anumite nevoi;.
• acces -- date necesare pentru a achizitiona un set de date identificat;
• transfer -- date necesare pentru a procesa si utiliza un set de date.
(Sursa: FGDC Content Standard for Digital Geospatial Metadata (Conţinutul standard pentru metadate geospaţiale digitale), CSDGM).
Aplicatii pentru metadate geospatiale
Gasirea datelor spatiale
Transferarea datelor dintr-un sistem in altul
Cererea unui serviciu de la un alt calculator
Tipuri de metadate (1)
Metadate la nivelul colectiei
– Continut Introducere in continutul colectiilor de date
– Scop Identificarea potentialelor surse de date
Tipuri de metadate (2)
Nivelul setului de date
– Continut Descrierea continutului unui set de date
– Scop Evaluarea utilitatii datelor
Tipuri de metadate (3)
Nivelul entitatilor
– Continut Descrierea detaliata a datelor si entitatilor
– Scop Interoperarea sistemelor deschise
Formatele metadatelor: Exemplul 1 Dublin Core Utilizate foarte mult pentru a descrie
‘documente ca obiecte’ Consta in 12 elemente toate sunt optionale
sau pot fi duplicate– Titlu, Autor, Editor, Alt agent, Data, Tipul
obiectului, De la, Identificator, Relatie, Sursă, Limba, Acoperire
Foarte flexibile, lipsa consecventa a preciziei semantice si sintactice
Formatele metadatelor: Exemplul 2 Continutul standard al metadatelor spatiale Metadate la nivelul setului de date.
Dezvoltate de US Federal Geographic Data Committee
Detaliat, sistem extensiv de inregistrari incluzand:Introducere Organizarea standardelor 0 Metadate 1 Informatii pentru identificare 2 Informatii despre calitatea datelor 3 Informatii despre organizarea datelor spaţiale 4 Informatii despre sistemul de referinţă spaţial 5 Informatii despre entitati şi atribute 6 Informatii despre distributie 7 Informatii despre metadatele de referinta 8 Informatii citate 9 Informatii despre perioada de timp 10 Informatii despre modul de contactare
Componentele sistemului de metadate Formatul metadatelor
– Implementarea metadatelor aleasa ca baza pentru sistem
Unelte pentru creare– Orice metoda automata de generare de date
Transporturi– Metode pentru interogarea si transportul
metadatelor intr-un mediu retea
Metadate in sisteme de descoperire a resurselor Utilizate pentru a spori acuratetea
interogarilor pentru descoperirea resurselor– Glosare– Tezaure– Liste de denumiri geografice
Glosare
Definesc cuvinte, un termen care poate fi utilizat atunci cand se catalogheaza inregistrari– de ex. Utilizează rau nu apa curgatoare
Deseori necesita date catalogate de un bibliotecar expert
Tezaure si dictionare
Definirea relatiilor dintre termeniRelatii Descriere Exemple
Relatiiierarhice
Definesc termenii de relationarede ingustime si largime dintretermeni
“Calatorie” este mairaspandit decât "calatorie cuavionul"
Relatiiasociative
Definesc similaritatea de inteles atermenilor
“Excursie” este asociat cu“calatorie”
Relatii deechivalenta
Termeni cu acelasi inteles “Voiaj” este un termen carenu este preferat pentru“calatorie”
Liste de denumiri geografice
Fac legatura dintre nume de locuri si localizari spatiale
Lista de denumiri geografice KINDS (http://midas.ac.uk/kinds) extinde relatiile dintre tezaure pentru a descrie relatiile dintre unitati spatiale
Relatiile KINDS Gazetteer
IerarhicRegatul Unit Este termenul cel mai cuprinzator
pentru ‘geografia recensamintelor'Orasul Manchester Este continut in Greater ManchesterGreater Manchester Contine Orasul Manchester
Asociativ03BN(un cod ID pentru ozona de recensamant)
In mod spatial coincide cu Patratul SD
03BN In mod spatial coincide cu Patratul SJ
Echivalent03BN(un cod ID pentru ozona de recensamant)
Este "termenul preferat" pentru City of Manchester
Orasul Manchester Este un termen nepreferat pentru 03BN
Unelte pentru crearea metadatelor Uneltele de creare sunt utilizate pentru
crearea in mod automat a metadatelor Cerinta pentru unelte de creare creste
pe masura ce creste nivelul de detaliere in formatul metadatelor
Gasirea datelor din seturile de date
intr-un mediu distribuit, datele şi metadatele vor fi pastrate pe diferite servere. – protocolul Z39.50 permite cautarea
resurselor de date pastrate pe diferite servere
De asemenea, metadatele pot fi introduse in obiectele datelor.– introducerea metadatelor in paginile web– XML, eXtensible Markup Language
Z39.50 - un protocol pentru a interoga servere după indecsi multipli
Un client de tip Z39.50 accepta o cerere si o distribuie la mai multe servere cu metadate de indecsi. Rezultatele sunt colationate de client şi returnate utilizatorului ca un singur output
Client
Servere
Includerea metadatelor in interiorul paginilor/datelor web
<HTML>
<HEAD>
Descrierea paginii metadate
</HEAD>
<BODY>
Hyper-text-ul amplasat in afara paginii
</BODY>
</HTML>
Catalogare prin căutarea după index
XML - Extinzand Internet-ulXML eXtensible Markup Language permite definirea “etichetelor “ clasice pentru scopuri specifice. De ex. Pentru a descrie limitele unui set de date geografice.
<MINIMUM X="348304"><MINIMUM Y="234985"><MAXIMUM X="549854"><MAXIMUM Y="459054">
Permite comunicarea directa a metadatelor intre aplicatiile de retea.
Viitorul metadatelor in sistemele pentru descoperirea resurselor Formate de metadate multiple
– Warwick Framework De la surogate statice le surogate
dinamice– Generarea automată a metabatelor bazate
pe cerintele utilizatorilor
Warwick Framework
O propunere pentru dezvoltarea “pachetelor” de date care include: datele insasi si una sau mai multe metadate pentru descrierea datelor.
Raspunde la problema ca nici un singur format de metadate nu este adecvat pentru mai multe necesitati.
Metadate si suportul SIG
Utilizarea SIG este o activitate de cunoastere intensiva. Utilizatorii trebuie sa cunoască concepte asociate cu SIG si cu cartografia la fel de bine cum trebuie sa cunoască modul de functionare al pachetului SIG. De cele mai multe ori aceaste cunostinte sunt complexe si consumă timp. SIG pot fi facute mult mai simplu de utilizat daca ar putea fi dezvoltate anumite sarcini la nivel legislativ pentru pachetele SIG sau daca SIG ar putea furniza sfaturi utilizatorilor pentru a fi folosite cel mai bine.
Plewe şi Johnson (1997) prezinta un sistem care citeste fisiere metadate şi sfatuieste utilizatorul asupra calitatii aspectelor asociate datelor care ar trebui utilizate.
Metadate şi SIG deschise (1) Scop:
– Transferarea datelor de la un sistem la altul (sustinută cu o reformatare adecvata, sau accesul “din zbor” a bazelor de date din sisteme deschise)
– Necesitatea serviciilor de la servere aflate in retea
Condus de Open GIS Consortium (http://www.opengis.org)
Metadate si Open GIS (2)
Structuri de date Open GIS create DAR, probleme intelectuale mult mai
serioase privind standardizarea imaginilor geografice ale lumii. Caracterizate prin lipsa unor “scheme globale”.
Concluzii Existenta metadatelor dezvoltate rapid
de catre savantii informaticieni pentru descoperirea resurselor. – Dublin Core devine standard pentru
“documente ca obiecte”. DC suporta cimpuri spatiale si temporale.
Micul suport formal pentru metadate in programele SIG comerciale.
SIG deschise au obtinut un succes tehnic dar standardizarea imaginilor geografice ale lumii va fi mai dificila.