Post on 04-Apr-2018
transcript
7/29/2019 sisteme informatice de asistare a deciziei
1/44
Ciclul de via al depozitelor de date
Masa de informaii care se va stoca n depozit trebuieorganizat de aa manier nct s reflecte att datele
importante ct i contextul lor
Cerine:
Datele operaionale sunt integrate n depozitprin utilizarea de convenii consistente n
privina numelor, msurtorilor, atributelor i
semanticii.
Depozitul de date se proiecteaz innd contde cerineleexprese ale viitorilor utilizatori.
Structura depozitului de date are n vedereidentificarea precis a datelor stocate iaccesul rapid la ele.
7/29/2019 sisteme informatice de asistare a deciziei
2/44
Realizarea depozitelor de date
Modelarea dimensional ofer suportul necesar pentru
proiectarea structurii depozitului de date.
Structura se implementeaz sub forma unei baze de date cares asigure att stocarea unui volum imens de date ct i accesulrapid la ele (baze de date client-server).
Urmtoarea etap este popularea cu date a depozitului - .Aceast etap va fi reluat periodic pentru a aduga datele noi.
n final, depozitul este dat n exploatare curent explorare analiz raportare.
activiti asistate de instrumente software de la simple browserei generatoare de rapoarte la instrumente sofisticate de data mining.
7/29/2019 sisteme informatice de asistare a deciziei
3/44
Exploatarea curent va evidenia noi cerine informaionale
pentru asistarea deciziei, cerine care vor conduce laextinderea structurii depozitului,
popularea cu date istorice a extensieiintegrarea noilor date n aplicaii de analiz.
Procesul de dezvoltare a depozitelor de date este incremental iciclic pe tot parcursul vieii.
Proiectare
Populare Analiz
7/29/2019 sisteme informatice de asistare a deciziei
4/44
Modelarea dimensional
Principiul : obiectivul major al unui sistem
decizional este analiza performanelor
organizaiei.
Indicatorii de performan vor fi analizai de-a lungul
unor dimensiuni - axe de analiz .Acest tip de modelare este independent de tehnologiile ce vor fi
utilizate.
7/29/2019 sisteme informatice de asistare a deciziei
5/44
Modelarea dimensional
tehnic de proiectare logic ce permite
structurarea variabilelor, fiind folosit pentru
vizualizarea modelelor de date sub forma unui set de
variabile cheie pentru activitatea analizat (variabiledescrise n funcie de caracteristicile activitii
respective)
permite conceptualizarea i reprezentareaaspectelor cantitative, msurabile ale activitii n
strns legtur cu contextul n care s-a
desfurat activitatea respectiv.
7/29/2019 sisteme informatice de asistare a deciziei
6/44
Modelarea dimensional
Colecia de fapte un ansamblu de date
corelate constnd din variabile i date de
context.
Faptele modeleaz subiectul de analiz. O fapt
reprezintmsuraactivitiideterminat la intersecia
tuturor informaiilorreferitoare la activitate.
O tranzacie a activitii sau un eveniment
Starea unui obiect
Modificrile striiunui obiect
7/29/2019 sisteme informatice de asistare a deciziei
7/44
Modelarea dimensional
Dimensiunileparametrii activitii, decupajul
din activitatea global care corespunde msurii
criteriile de agregare.
zi, lun, an, trimestru, sezon (interval de timp),locaie,zongeografic,client, furnizor, produs saugrup(clas, categorie)
de clieni, furnizori, produse,angajat,structurorganizatoric
Dimensiunea modeleaz o perspectiv de analiz; ea se
compune din parametrii corespunznd informaiilor care
fac s varieze msurileactivitii.
Tot ca dimensiune se pot modela variante de msuri:
valori reale, valori bugetate, valori estimate. Aceast
dimensiune oarecum artificial se cheam scenariu
7/29/2019 sisteme informatice de asistare a deciziei
8/44
Modelarea dimensionalCaracteristici
Furnizeaz informaii descriptive despre fiecare
variabil(msur, indicator)
Conin n general date statistice. Atributeledimensionale nu se schimb aa de des ca faptele
totui, pot apare modificri iar modelul dimensional
trebuie spermit modificarea pentru a asigura coerena
i corectitudinea datelor.Sunt eseniale pentru analiz. Un model dimensional ce
ofer un numr mare de atribute dimensionale permite
analize ct mai complexe i ct mai variate
7/29/2019 sisteme informatice de asistare a deciziei
9/44
Modelarea dimensional
Dimensiunile sunt identificate n bazele de datetranzacionale ca fiind cmpurile ce conin
caracteristicile unei tranzacii, datele de identificare a
tranzaciei respective, de obicei coduri-chei externe care
fac legtura cu nomenclatoarele ce le expliciteaz.
Dimensiunea se materializeaz prin setul de valori
posibile care alctuiesc domeniul caracteristiciirespective, valorile se numesc membrii
dimensiunii.
7/29/2019 sisteme informatice de asistare a deciziei
10/44
Timp
IDTimp
Zi
Lun
Trimestru
Semestru
An
Este mai fin
Reprezentarea grafic la nivel conceptual a unei
dimensiuni
7/29/2019 sisteme informatice de asistare a deciziei
11/44
Modelarea dimensional
Dimensiunile pot avea multiplii - grupe de valori aledimensiunii respective cu o caracteristic comun.
IERARHII - structuri arborescente formate din
dimensiuni i multiplii acestora.
Membrii unei dimensiuni se pot aranja n una sau mai
multe ierarhii .
Ierarhia organizeaz parametrii unei dimensiuni dup
o relaie de tip este mai fin n conformitate cu
nivelul lor de detaliu.
7/29/2019 sisteme informatice de asistare a deciziei
12/44
Ierarhii alternative ale dimensiunii TIMP
Anul
Sezonul
Semestrul
Trimestrul Sptmna
Luna
Data calendaristic
Ziua
IerarhiaAnotimp
Ierarhia
Calendar
IerarhiaSapte_zile
7/29/2019 sisteme informatice de asistare a deciziei
13/44
Ierarhiile alternative ale dimensiunii CLIENT
Zona
Statut
Judet
LocalitateCategorie
Client
Subctg
Ierarhia
Forma
Juridica
Ierarhia
Clasificare
Ierarhia
Geografie
all
7/29/2019 sisteme informatice de asistare a deciziei
14/44
Modelarea dimensional
Variabile (msuri) - aspectul cantitativ, comensurabil n
uniti clasice de msur (kg.,buci, uniti monetare). O
variabil este un atribut numeric al unui element dinbaza de fapte, un indicator sau o msur prin care se
poate analizaperformanaactivitii modelate.
Exemple
volumul vnzrilor (cantitativ/valoric), volumulachiziiilor, costul transportului, volumul datoriilor, volumul
creanelor, profitul, volumul taxelor i impozitelor.datele
cantitative centralizate
7/29/2019 sisteme informatice de asistare a deciziei
15/44
Modelarea dimensional
Tabela de fapte
ocup locul central n cadrul unui model dimensional i
corespunde coleciei de fapte.
regrupeaz toi indicatorii referitori la un subiect de
analiz care partajeaz acelai ansamblu de dimensiuni
i care nu pot fi dedui din ali indicatori.
7/29/2019 sisteme informatice de asistare a deciziei
16/44
VnzriCantitate
Valoare
Tabela defapte
Msuri ale activitii
Reprezentarea grafic la nivel conceptual a unei
tabele de fapte
7/29/2019 sisteme informatice de asistare a deciziei
17/44
Modelarea dimensional
GranularitateaFAPTELOR reprezint gradul dedetaliere a acestora - nivelul de detaliu necesar
analizelor, care exprim numrul de membri ai uneidimensiuni.
Se recomand ca tabela de fapte s menin granularitatea cea mai
fin posibil.
determin dimensiunile principale ale modelului
determin volumul bazei de date
7/29/2019 sisteme informatice de asistare a deciziei
18/44
Modelarea dimensional
Gradul de imprastiere a datelor
ex: masura: vanzaridimensiuni :client, produs, timp
Indicatorul volumul vanzarilor va avea valori valide numai
pentru o mica fractiune a produsului cartezian a
dimensiunilor ( daca vanzarile reale se inregistreaza doar
pentru 1% din combinatiile posibile clienti *produse*nr
zile gradul de imprastiere este de 9,99%)
7/29/2019 sisteme informatice de asistare a deciziei
19/44
Modelarea dimensional
Un model tridimensional se poate vizualiza/reprezenta cu
ajutorul unui cub.Un model multidimensional are ns mai multe dimensiuni
un hypercub.
Perspectivele multidimensionale asupra
datelor sunt numite cuburi de date.
7/29/2019 sisteme informatice de asistare a deciziei
20/44
Modelarea dimensional
Modelul steao reprezentare intuitiv a cubului de date
conineo tabel de fapte(coninutul cubului de
date)
un set de tabele dimensionale (dimensiunile
activitii).
7/29/2019 sisteme informatice de asistare a deciziei
21/44
Timp
IDTimp
ZiLun
Trimestru
Semestru
An
Vnzri
Cantitate
Valoare
Magazin
IDMagazin
Denumire magazin
Localitate
Jude
Regiune
ara
Produs
IDProdus
Denumire prod.Marc prod.
Subcategorie prod
Categorie prod
Raion
7/29/2019 sisteme informatice de asistare a deciziei
22/44
Modelarea dimensional
Modelul fulg de zpado variant a schemei stea, rezultatul descompunerii
uneia sau mai multor dimensiuni care au ierarhii(integrarea unor subdimensiuni sau a unor dimensiuni
alternative).
dimensiunile sunt normalizate - apariia unui numrmare de noi tabele poate compromiteperformanele de
navigare complicnd lucrurile n termeni de lizibilitate
i gestiune
7/29/2019 sisteme informatice de asistare a deciziei
23/44
Timp
IDTimp
Zi
LunTrimestru
Semestru
An
Vnzri
CantitateValoare
Magazin
IDMagazin
Denumire magazin
Produs
IDProdus
Denumire prod.
Marc prod.Subcategorie prod
Categorie prod
Raion
Adres
IDLocalitate
Jude
Regiune
ara
7/29/2019 sisteme informatice de asistare a deciziei
24/44
Modelarea dimensional
Galaxia (constelaia)
o colecie de scheme stea care au atributedimensionale comune.
Fuzionarea mai multor modele stea i/sau fulg de nea
care utilizeaz dimensiuni comune.
7/29/2019 sisteme informatice de asistare a deciziei
25/44
Serviciu
IDServiciu
Denumire serv.
Subcategorie serv.
Categorie serv.
Vnzri serv
Valoare serv.
Magazin
IDMagazin
Denumire magazin
Localitate
Jude
Regiune
ara
Timp
IDTimp
Zi
Lun
Trimestru
Semestru
An
Vnzri prod.
Cantitate
Valoare prod.
Produs
IDProdusDenumire prod.
Marc prod.
Subcategorie prod
Categorie prod
Raion
7/29/2019 sisteme informatice de asistare a deciziei
26/44
Modelarea logic
Implementarea modelului dimensional n mediul
relaional:
fiecare fapt corespunde unei tabele, numit
tabele de fapte
fiecare dimensiune corespunde unei tabele,
numit tabel de dimensiuni.
7/29/2019 sisteme informatice de asistare a deciziei
27/44
Tabela de fapte
CARACTERISTICI:
Conine un numr foarte mare de tuplurimilioane- care reprezint produsul cartezian al
dimensiunilor
Dimensiunea ei crete dinamic, n funcie decantitatea de date ncrcate la fiecare ciclu de mprosptare a
bazei de date, precum i n funcie de cantitatea de date istorice
stocate n baza de date.
7/29/2019 sisteme informatice de asistare a deciziei
28/44
Tabela de fapte
Este tabela care reflect performanaactivitii analizate. Conine toate msurile
importante.
Cheia primar a tabelei este o cheie compusdin cheile primare ale tabelelor dimensionale
Este normalizat i realizeaz o legturindirect ntre dimensiuni
7/29/2019 sisteme informatice de asistare a deciziei
29/44
Modelul stea
Tabela de fapte se leag de dimensiuni prin join-uri de
egalitate.Fiecare atribut din cheia primar a tabelei de fapte
reprezint cheia primar a unei dimensiuni
Atributele care nu sunt chei pot fi agregate (tabelele
de fapte conin doar atribute numerice)
Tabelele sunt denormalizate
7/29/2019 sisteme informatice de asistare a deciziei
30/44
Vnzri (IDProdus, IDMagazin, IDTimp,
Cantitate, Valoare)Timp (IDTimp, Zi , Lun, Trimestru,
Semestru, An)
Magazin (IDMagazin, DenMagazin,Localitate, Jude Regiune, ar)
Produs (IDProdus, Denumire prod., Marc
prod., Subcategorie prod., Categorie prod.,
Raion)
7/29/2019 sisteme informatice de asistare a deciziei
31/44
Modelarea logic
Paradigma obiect
Fiecare tabel de fapt corespunde uneiclase, denumitclas de fapt;
fiecare dimensiune corespunde unei clase,denumitclas de dimensiuni.
7/29/2019 sisteme informatice de asistare a deciziei
32/44
Etapele generale ale procesului de
proiectare a unui depozit de dateDelimitarea procesului economic ce va fi modelat.
Stabilirea nivelului de granularitate.Alegerea dimensiunilor - criterii de agregare
Alegerea msurilor
7/29/2019 sisteme informatice de asistare a deciziei
33/44
Seciune din modelul relaional al unei aplicaii
tranzacionale n domeniul bancar:
Tranzaciile clienilor sunt operaii de tipul pli, ncasri, depunere sau
ridicare de numerar din contul personal.Costul fiecrei tranzacii este comisionul bancar, diferit pentru fiecareoperaie i modificabil n timp.
Tranzaciile sunt efectuate n mai multe filiale aflate n localiti diferite.
CLIENT
Client_id
Nume_clientTip_client
AdresaContTelefonData_deschidere
TRANZACII
Tranz_nb
Data_tranzOperaie
Client_idOperator_idSumaComision_id
COSTURI
TRANZACII
Comision_id
Denumire
DescriereCostData_modif
7/29/2019 sisteme informatice de asistare a deciziei
34/44
Modelare dimensional
msura activitii:
comisioanele asociate operaiilor
dimensiuni:
dat,operaie,
filial,
client
7/29/2019 sisteme informatice de asistare a deciziei
35/44
Dimensiunea DimensiuneaTIMP OPERAIE
TRANZACII
DimensiuneaFILIALADimensiuneaCLIENT
Schema stea a unui depozit de date
Timp_idZiuaLunaTrimestruAn
Operaie_idDenumire
Timp_id
Operaie_idFiliala_idClient_id
SumComision
Client_idNumeTip_client
Filiala_idNumeOraZona
7/29/2019 sisteme informatice de asistare a deciziei
36/44
TRANZACII
CLIENT
FILIALA
Schema fulg de nea a unui depozit de datenomenclatoarele au subnomenclatoare sau nomenclatoare alternative
Timp_id
Ziua
Luna
Trimestru
An
Operaie_id
Denumire
Timp_idOperaie_id
Filiala_id
Client_idSumComision
Client_id
Nume
Tip_client
Localitatea
Filiala_id
Nume
Ora
Timp_id
Ziua
Sezon
Oras
Zona
Tip client
Ctg client
Subctg client
7/29/2019 sisteme informatice de asistare a deciziei
37/44
Dimensiunea DimensiuneaTIMP OPERAIE
TRANZACIICLIENT
DimensiuneaFILIALA
DimensiuneaCLIENT
PERSONAL
Dimensiunea
OPERATOR
Schema constelaie a unui depozit de date
Timp_idZiuaLunaTrimestruAn
Operaie_idDenumire
Timp_id
Operaie_id
Filiala_id
Client_id
SumComision
Client_idNumeTip_client
Filiala_id
NumeOraZona
Timp_id
Filiala_id
Operator_id
Nr_tranzaciiComision_mediu
Operator_id
NumeData_incadrareSalariu
7/29/2019 sisteme informatice de asistare a deciziei
38/44
Aspecte particulare ale proiectrii
dimensionale
Aditivitatea faptelor
faptele sunt numericei n general aditive i valorificate de o
manier continu(msurile sunt numerice i aditive pentru apermite rezumarea unui numr mare de nregistrri n cteva
nregistrri).
Fapte semi-aditive: fapte care pot fi adiionate doar dup
anumite dimensiuni (stocuri, solduri de conturi, contorizarea unorindicatori)
Fapte non-aditive: nu pot fi deloc adiionate (indicatoricalculai ca raport intre ali indicatori)
7/29/2019 sisteme informatice de asistare a deciziei
39/44
Vnzri
IDTimpIDProdus
TotalCantitate
TotalValoare
NrClienti
Marjabrut
Timp
IDTimp
Zi
Lun
Trimestru
Semestru
An
Produs
IDProdus
Denumire prod.
Marc prod.
Subcategorie prod
Categorie prod
Raion
Marjabrut = Profitbrut / Costprodus
Marjabruta este non aditiv deoarece aceasta se
calculeaza ca ratie a sumelor si nu ca suma a raiilor.
7/29/2019 sisteme informatice de asistare a deciziei
40/44
Vnzri
IDTimp
IDProdus
TotalCantitate
TotalValoare
NrClienti
Costprodus
Timp
IDTimp
Zi
Lun
Trimestru
Semestru
An
Produs
IDProdus
Denumire prod.
Marc prod.
Subcategorie prod
Categorie prod
Raion
TotalCantitate, TotalValoare, NrClienti i Costprodus sunt
perfect aditive.
NrClieni este semi-aditiv.
7/29/2019 sisteme informatice de asistare a deciziei
41/44
Aspecte particulare ale proiectrii
dimensionaleTabelele de fapte fr fapte - pentru reprezentareaacelor procese ale activitii care dei nu prezint fapte
msurabile sunt interesante pentru procesul de analiz, decitrebuie s fie cuprinse n depozitul de date
Tabelele de urmrire a evenimentelorau ca scopcontorizarea evenimentelor rezultate din prezena simultan a
mai multor dimensiuni n acelai loc i n acelai timp
7/29/2019 sisteme informatice de asistare a deciziei
42/44
Participare
IDTimpIDCurs
IDProfesor
IDStudent
Ora/TimpIDTimp
Curs
IDCurs
Profesor
IDProfesor
Student
IDStudent
7/29/2019 sisteme informatice de asistare a deciziei
43/44
Aspecte particulare ale proiectrii
dimensionaleTabelele de acoperirespre deosebire de cele de urmrire aevenimentelor au ca scop de a pune n eviden ceea ce nu s-a
ntmplat mai degrab dect ceea ce s-a ntmplat. Tabelelede acoperire in evidena tuturor instanierilor unor
dimensiuni care la un moment dat sunt supuse unor stri,
explicnd astfel componenta deacoperire din denumirea
lor
Un exemplu clasic este tabela de urmrire a produselor aflate
n promoie. Prin comparaie cu tabela aferent activitii de
vnzare se pot determina produsele aflate n promoie dar care
nu au fost vndute
7/29/2019 sisteme informatice de asistare a deciziei
44/44
Vnzri
IDTimp
IDProdus
IDPromoTotalCantitate
TotalValoare
NrClienti
Costprodus
Dataultimachiz
Timp
IDTimp
Produs
IDProdus
Promoie
IDPromo
Produse
promo
IDTimp
IDProdus
IDPromo
existen