Čo keby organizácie spracovali všetky svoje údaje na podporu rozhodovania? Čo by sa stalo, keby použili špecializovaný softvér, ktorý slúžil na prezentáciu informácií a ich analýzu? Niektoré dáme Príklady dátového skladu odpovedať na tieto otázky.

Príklady dátového skladu
V prvom rade je dôležité rozlišovať medzi dvoma pojmami, ktoré nás vďaka svojej skratke môžu ľahko zameniť a od začiatku je zámerom, aby používateľ vedel, čo môže očakávať, a aby poznal niektoré základné pojmy, ktoré chystá. čeliť. Tu ukážeme nekonečné množstvo príkladov, ktoré slúžia na to, aby mal jedinec nástroje na rozlíšenie týchto prvkov.
definícia
Vzhľadom na rozdiel medzi týmito dvoma pojmami pristúpime k ich formálnej definícii, pretože ide o proces, ktorý extrahuje, transformuje, konsoliduje a integruje údaje organizácie, vnútorné aj vonkajšie, aby boli prístupné a užitočné pri rozhodovaní. -výroba.
Rovnakým spôsobom môže byť dátový sklad tiež definovaný ako základňa s informáciami o elektronickom súborovom systéme, ktorá uchováva potrebné údaje na analýzu informácií a rozhodovanie. Jeho rozdiel je v tom, že je obchodne orientovaný, integrovaný, časovo variabilný a energeticky nezávislý.
Data Warehousing (DWH) je v zásade proces a Data Warehouse (DW) je databáza.
rysy
Existuje niekoľko aspektov, ktoré charakterizujú dátový sklad, ktoré poskytujú potrebné nástroje na jeho optimálne využitie, a sú teda v súlade s naprogramovanými smernicami, ktoré generujú nástroje na jeho používanie najlepším možným spôsobom. Podrobne popíšeme charakteristiky dátového skladu:
Obchodne orientovaný
Do dátového skladu sa vkladajú iba relevantné údaje na analýzu a rozhodovanie. To znamená, že sa neberú do úvahy údaje, ktoré nemajú žiadnu analytickú hodnotu, napríklad adresy miestností, PSČ, e -mailové adresy. Majú však rôzny záujem, ako je typ klienta, geografická poloha, vek atď.
Spravujú sa entity na vysokej úrovni, ako sú klienti, produkty, položky, oblasti a ďalšie. Dáta sú uložené viacrozmerným spôsobom, tj. V skutočnosti a rozmerovými tabuľkami.
Integrovaný
Všetky údaje z heterogénnych zdrojov sú konsolidované, aby bola zaručená ich kvalita a čistota. Hlavnými zdrojmi údajov sú:
Podľa typu používateľa.
-
- Prevádzkové: Daily produkuje veľké množstvo údajov, ale samy osebe majú malý význam pre požadovanú analýzu. Ide napríklad o predaj produktov.
- Stredné: Generuje údaje s implikáciou v krátkodobom a strednodobom horizonte na základe prevádzkových údajov. Dobrým príkladom tohto konceptu je generovanie zásob.
- Manažérske: Používa údaje vyplývajúce z procesu integrácie a transformácie. Na druhej strane generuje nové informácie. V zásade sa týka používateľa Dátového skladu.
Podľa oblasti alebo oddelenia organizácie
-
- Oblasti: Každý z nich má dobre definované zodpovednosti. Produkujú svoje vlastné údaje, ktoré sú zdieľané s ostatnými oblasťami.
- Členenie: Obvykle sú geografické. Poskytujú údaje o polohe, ktoré je potrebné začleniť spolu s ostatnými.
Podľa zdroja
-
- Interné: Generujú si vlastné údaje pochádzajúce z každodenných činností spoločnosti.
- Externé: Dopĺňajú interné údaje, napríklad sčítania ľudu a štatistiky.
Variant v čase
Umožňuje prístup k rôznym verziám tej istej situácie, pretože aktuálne údaje sú v príkladoch dátového skladu uložené spolu s historickými údajmi.

Nie je prchavý
Zaručuje stabilitu informácií, pretože keď sa údaje zadajú, už sa nemenia. To znamená, že s údajmi sa manipuluje iba vtedy, keď sú zadané a keď sa s nimi nahliada.
Stručne povedané, hlavné vlastnosti Dátového skladu sú:
Vlastnosti
Spracováva údaje vo veľkom, čo je dôsledok akumulácie historických, súčasných a agregovaných údajov, z rôznych zdrojov.
Umiestňuje celý objem údajov do jednej centralizovanej databázy. Štruktúrujte údaje multidimenzionálnym spôsobom.
výhody
Vďaka svojim vlastnostiam a vlastnostiam predstavuje dátový sklad nasledujúce výhody:
- Skracuje minimálny čas potrebný na zhromaždenie všetkých relevantných údajov o konkrétnej téme.
- Poskytuje analytické nástroje.
- Mnoho správ a analýz je definovaných používateľom.
- Umožňuje vám priamy prístup k ukazovateľom organizácie, ich analýzu a monitorovanie.
- Pomáha identifikovať faktory, ktoré ovplyvňujú chod spoločnosti.
- Umožňuje napredovať a určovať budúce správanie inštitúcie.
- Používatelia sa môžu na údaje pýtať rýchlo a jednoducho.
Stručne povedané, Data Warehouse pomáha organizácii zodpovedať základné otázky pre rozhodovanie. Tým sa dosahujú konkurenčné výhody, ktoré optimalizujú ich pozíciu na trhu, na ktorom pôsobia. Niektoré z týchto otázok sú:
- Aký je profil klientov?
- Aké je ich správanie?
- Aká je ziskovosť podnikania?
- Aké je riziko pre organizáciu?
- Aké služby a produkty využívate a ako ich môžete zvýšiť?
Oblasť použitia
Dátový sklad je možné prispôsobiť akejkoľvek organizácii bez ohľadu na jeho veľkosť a zložitosť. Je to dôsledok programu akejkoľvek inštitúcie, spoločnosti alebo organizácie pri prijímaní príslušných rozhodnutí týkajúcich sa údajov, ktoré vytvára.
Riziká aplikácie
Vyžaduje si to veľké investície zo strany organizácie. Prínosy jeho implementácie nevidíme v krátkodobom, ale strednodobom a dlhodobom horizonte.
Manipulácia s údajmi ohrozuje manipuláciu s citlivými údajmi.
Aspekty, ktoré je potrebné vziať do úvahy
Ako už bolo spomenuté na začiatku, pri aplikácii týchto prvkov na používanie servera je potrebné vziať do úvahy niekoľko aspektov. Medzi nimi môžeme spomenúť nasledujúce:
Náklady na aplikáciu
Dátový sklad nesie náklady na výstavbu, prevádzku a podporu. Náklady na výstavbu zahŕňajú náklady na ľudské zdroje, čas a technológiu, pričom náklady na prevádzku a údržbu zohľadňujú náklady na vývoj, rast a náklady vyplývajúce zo zmien v pôvode údajov.
Vplyv na ľudí
Aplikácia Data Warehouse vždy generuje očakávania u používateľov, ktorí budú nevyhnutne musieť získať nové zručnosti. Úspech tohto druhu údajov závisí od aktívneho používania a od spätnej väzby od používateľov.
Vplyv na obchodné a rozhodovacie procesy
Aplikáciou Data Warehouse sa dajú odhaliť určité nedostatky v podnikových procesoch, ale zároveň sa zvýši dôvera v rozhodnutia prijaté na základe ním získaných výsledkov.
Architektúra
Obecná architektúra príkladu dátového skladu je znázornená na obrázku vyššie. Ako je vidieť, tento systém zahŕňa sériu interakcií medzi svojimi komponentmi. V tejto súvislosti a ako súhrn je možné jeho činnosť opísať takto:
- Údaje sú získavané z rôznych zdrojov, ako sú webové služby, súbory a ďalšie databázy, interné aj externé.
- Akonáhle sú dáta extrahované, sú integrované, transformované a vyčistené, aby boli neskôr načítané do Dátového skladu.
- Za účelom generovania taktických a strategických informácií sa načítaním údajov získavajú správy a analýzy.
- Nakoniec môžu používatelia konzultovať a skúmať generované správy a analýzy.
prvky
Teraz popíšeme niektoré prvky, ktoré je možné vyhodnotiť v dátovom sklade a na ktoré by sme mali prihliadať.
Zdroje dátových skladov
Spravidla sú výsledkom každodennej činnosti spoločnosti, v takom prípade sa nazývajú interné zdroje. Keď sa údaje získavajú napríklad z webových serverov, považujú sa za externé zdroje. Líšia sa od seba, pretože závisia od ich pôvodu, formátu, funkcie atď.
Extrakcia, transformácia a načítanie
Známy ako ETL, je to proces, ktorý zahŕňa všetky úlohy, ktoré sa vykonávajú od získania údajov až po ich načítanie do Dátového skladu. Sú to: extrakcia, manipulácia, kontrola, integrácia, čistenie údajov, načítanie a aktualizácia.
Extrakcia
Obsahuje techniky zamerané na získavanie iba príslušných údajov z rôznych zdrojov a ich uchovávanie vo vnútornom úložisku. Tento typ úložiska umožňuje manipuláciu s údajmi bez zasahovania alebo zmeny zdrojov alebo Dátového skladu s viacerými údajmi, vytvára extrakčnú vrstvu medzi čítaním a načítaním, ukladaním a správou metadát generovaných v procese a uľahčuje integráciu.
Extrakcia je založená na potrebách používateľov a požiadavkách definovaných pre riešenie.
premena
Toto sú techniky zodpovedné za zaistenie kompatibility rôznych formátov, ako aj filtrovanie a klasifikovanie údajov a súvisiacich zdrojov.
Táto funkcia je zodpovedná za použitie všetkých príslušných príkazov vo vzťahu k údajom, aby ich propagovala silným a rozumným spôsobom, ktorý je kompatibilný a konzistentný s dátovým skladom. Okrem toho je zodpovedný za čistotu a kvalitu údajov.

carga
Pokiaľ ide o techniky počiatočného načítania údajov a pravidelnú aktualizáciu dátového skladu.
- Počiatočné načítanie sa týka prvého načítania údajov, ktoré Data Warehouse prijme. Spravidla je to časovo veľmi náročné kvôli veľkému počtu záznamov patriacich do dlhých časových období.
- Pravidelná aktualizácia sa týka vkladania malých objemov údajov. Vaším cieľom je pridať do vzoriek dátového skladu iba tie údaje, ktoré sú vygenerované z poslednej aktualizácie. Závisí to od potrieb a požiadaviek používateľa.
Stručne povedané, prostredníctvom procesu načítania údajov je údržba Dátového skladu zaručená.
V súhrne je možné povedať, že proces ETL sa vykonáva nasledovne:
- Údaje, akonáhle sú extrahované z príslušných zdrojov, sú uložené vo vnútornom úložisku.
- Údaje sú síce uložené vo vnútornom úložisku, ale sú integrované a transformované.
- Keď sú údaje vyčistené, po predchádzajúcom kroku sú odoslané do Dátového skladu.
Správy
Správy sú grafické nástroje, ktoré umožňujú používateľovi získať podrobné správy o informáciách o vašej spoločnosti. Spôsob interakcie s týmito správami je pre používateľa veľmi jednoduchý, pretože sú ľahko zrozumiteľnými pokynmi. V zásade musíte vybrať možnosti z ponuky s prihliadnutím na podmienky a špecifikácie prezentovaného predmetu.
OLAP
Je to najsilnejšia súčasť Dátového skladu, pretože obsahuje špecializovaný viacrozmerný dotazovací modul systému.
Umožňuje analýzu organizácie z rôznych historických scenárov. Svoje správanie a vývoj premieta z multidimenzionálnej vízie, to znamená kombináciou rôznych perspektív, tém záujmu alebo dimenzií. To umožňuje odvodiť trendy objavením vzťahov medzi perspektívami, ktoré by bolo na prvý pohľad ťažké nájsť.
Data Mining
Je to predovšetkým štatistický nástroj, pomocou ktorého je možné predpovedať. Ide o vyvodzovanie správania bez toho, aby existovali vopred stanovené pravidlá. Generuje správy okrem iného vo forme tabuliek a grafov, ktoré proaktívne podporujú rozhodovanie. Funguje na základe informácií, ktoré už boli úplne spracované.
Rozdiel medzi OLAP a ťažbou údajov
Hneď ako sa zvážia hlavné aspekty OLAP a Data Minig, je možné medzi nimi stanoviť základný rozdiel.
- Pomocou OLAP sa interpretuje súčasná situácia spoločnosti a poskytuje rýchle odpovede, ktoré uľahčujú rozhodovanie.
- Data Minig predpovedá situácie na základe štúdia skrytých znalostí, ktoré vyvolávajú určité typy správania.
V dôsledku toho sa oba systémy zaoberajú riešením rôznych typov analytických situácií.
Data Minig a jeho vzťah s Data Warehouse
Systém Data Minig je podporná technológia pre koncových užívateľov, ktorej cieľom je získať užitočné informácie z informácií obsiahnutých v databáze spoločností. Inými slovami, pôvod informácií použitých algoritmami Data Minig sú zvyčajne historické údaje obsiahnuté v dátovom sklade.
Musí existovať integrácia medzi technikami Data Minig a procesmi, ktoré sú súčasťou Data Warehouse. Inými slovami, na vykonanie obchodnej analýzy musí existovať dohoda medzi Data Minig, Data Warehouse a serverom OLAP.
Zakaždým, keď Data Warehouse poskytne nové výsledky, môže spoločnosť znova požiadať Data Minig o optimalizáciu rozhodovania.
Stručne povedané, Data Minig a Data Warehouse sú plne kompatibilné nástroje. Dátový sklad poskytuje pamäť a inteligenciu Data Minig.
Tradičné databázy vs Dátový sklad
Analýza doposiaľ odhalených aspektov nás vedie k pochopeniu, že dátový sklad sa líši od databáz, ktoré podporujú každodenné transakcie organizácií. Tu sú základné rozdiely
- V tradičných databázach sú informácie usporiadané tak, aby ich bolo možné ľahko získať a aktualizovať. Dátový sklad je organizovaný a orientovaný na koncového používateľa, ktorý môže iba podávať otázky.
- Transakčné databázy sa starajú o každodenné spracovanie údajov. Dátový sklad pracuje s historickými údajmi, to znamená zodpovedajúcimi dlhým časovým obdobiam.
- K tradičným databázam sa dostanete niekoľkokrát počas pracovného dňa. V dátovom sklade sú údaje a dotazy minimálne, pretože sa k nim pristupuje sporadicky.
- Objem údajov, ktoré Data Warehouse spravuje, je oveľa väčší ako ten, ktorý sa spravuje v tradičných databázach.
- Štruktúra transakčných báz je stabilná. Štruktúra dátového skladu sa líši v závislosti od jeho vlastného vývoja a použitia.
Ďalej niektoré založíme Príklady dátového skladu.
Príklady dátového skladu
Národná spoločnosť, ktorá sa zameriava na predaj čistiacich potrieb pre veľkoobchod a maloobchod, ktorá je vzhľadom na svoj objem predaja považovaná za stredne veľkú, má hlavný cieľ maximalizovať svoje zisky. Podobne, ak chcete získať viac zákazníkov, chcete expandovať na novú úroveň trhu a neskôr rozšíriť svoj sortiment. Jednou z jeho hlavných politík je neustále sa zlepšovať, aby získal lepšiu pozíciu voči svojim konkurentom vo vzorkách dátového skladu.
Aplikácia Data Warehouse ponúka organizácii nasledujúce výhody.
- Umožňuje používateľom mať prehľad o firme.
- Transformujte operačné údaje na analytické informácie zamerané na rozhodovanie.
- Generujte dynamické správy, ktoré uľahčujú vašu analýzu.
- Uľahčuje tvorbu stratégií na plnenie cieľov organizácie.
- Prospieva to stabilite štruktúry spoločnosti.
Ďalší príklad denného dátového skladu sa týka manažmentu vzdelávacej inštitúcie, ktorá má nedostatky v komunikácii so svojimi študentmi. Podobne mu chýba jednotné informačné centrum, ktoré by malo všetky ich informácie. Cieľom inštitúcie je sprevádzať študentov počas ich kariéry a po ukončení štúdia, ponúkať nové návrhy, ktoré zlepšia výkonnosť organizácie a rozvoj študentov.
Aplikáciou dátového skladu sa snažíme reagovať na potreby univerzity. V zásade platí, že odstránenie duplikácie informácií a prítomnosti chybných podrobností o študentoch, ako aj všetkých informácií, ktoré sú vo všeobecnosti považované za nekvalitné a ktoré nie sú relevantné. Navyše sú všetky informácie integrované a vytvárajú jednotný záznam o študentoch, ktorý slúži ako základ pre správny vývoj projektu inštitúcie.
Nakoniec sa propagujú marketingové činnosti, ktoré univerzite prinášajú väčší úžitok a napomáhajú jej rastu prostredníctvom správneho riadenia informácií.
Na záver, v príkladoch dátového skladu ponúka príležitosť vedieť, čo sa deje v organizácii, čo sa stalo, čo sa môže stať a prečo. Môžete si pozrieť článok typy počítačových vírusov.



