Implementace Warehousu
• monitoring – výběr dat ze zdrojů
• integrace – zavlečení, pročištění
• zpracování – zpracování dotazu, indexace
• Správa dat – meta
Monitorovací techniky
– periodické ??????
– databázové triggery
– uložení logů
– replikace dat
– ukládání transakcí
– dotazování
– frekvence – periodická (denní, týdenní apod.) nebo podle velkých změn a množství změn
– transformace dat – konverze dat na jednotný formát, rušení a předávání položek
Integrace
Čištění dat
– migrace – (např. koruna – dolar)
– praní – užití dominově – specifické znalosti
– slévání – (např. seznam adres, slučování zákazníků
– auditing zjišťování pravidel a vztahů
Zavlékání dat
– off-line vs. on-line
– frekvence plnění – (např. v noci, 1x za týden, měsíčně apod.)
– paralelní – oddělené plnění
Odvozená data
– indexy
– agregáty
– naturalizované pohledy – definují nové relace
– problémem je kdy aktualizovat odvozená data?