Шта је складиште података? Врсте, дефиниција и пример

Шта је складиштење података?

ДО Складиштење података (ДВ) је процес прикупљања и управљања подацима из различитих извора ради пружања смисленог увида у пословање. Складиште података се обично користи за повезивање и анализу пословних података из хетерогених извора. Складиште података је језгро БИ система који је изграђен за анализу података и извештавање.

То је спој технологија и компоненти које помажу стратешком коришћењу података. То је електронско складиштење велике количине информација предузећа које је дизајнирано за упите и анализе уместо за обраду трансакција. То је процес претварања података у информације и њихово благовремено стављање на располагање корисницима како би направили разлику.

У овом водичу за складиште података (ДВХ) научићете више о

База података за подршку одлучивању (складиште података) води се одвојено од оперативне базе података организације. Међутим, складиште података није производ већ окружење. То је архитектонска конструкција информационог система који корисницима пружа тренутне и историјске информације за подршку доношењу одлука којима је тешко приступити или их представити у традиционалном оперативном складишту података.

Многи знате да 3НФ-ова база података за систем инвентара има табеле повезане једна с другом. На пример, извештај о подацима о тренутном инвентару може да садржи више од 12 спојених услова. Ово може брзо успорити време одговора на упит и извештај. Складиште података пружа нови дизајн који може помоћи у смањењу времена одговора и побољшати перформансе упита за извештаје и аналитику.

Систем складишта података је такође познат под следећим именом:

  • Систем подршке одлучивању (ДСС)
  • Извршни информациони систем
  • Менаџмент информативног система
  • Решење пословне интелигенције
  • Аналитичка апликација
  • Складиште података

Историја Датаварехоусе -а

Датаварехоусе користи корисницима да разумеју и побољшају перформансе своје организације. Потреба за складиштењем података развијала се како су рачунарски системи постајали све сложенији и потребни за руковање све већим количинама информација. Међутим, складиштење података није нова ствар.

Ево неких кључних догађаја у еволуцији складишта података-

  • 1960.- Дартмоутх и Генерал Миллс у заједничком истраживачком пројекту развијају димензије појмова и чињенице.
  • 1970.- Ниелсен и ИРИ уводе димензионалне податке за малопродају.
  • 1983.- Тера Дата Цорпоратион представља систем за управљање базом података који је посебно дизајниран за подршку одлучивању
  • Складиштење података започело је касних 1980 -их када су ИБМ -ов радник Паул Мурпхи и Барри Девлин развили Бусинесс Дата Варехоусе.
  • Међутим, прави концепт дао је Инмон Билл. Сматрали су га оцем складишта података. Писао је о разним темама о изградњи, коришћењу и одржавању складишта и Фабрике корпоративних информација.

Како Датаварехоусе функционише?

Складиште података ради као централно спремиште у које информације пристижу из једног или више извора података. Подаци улазе у складиште података из трансакционог система и других релационих база података.

Подаци могу бити:

  1. Струцтуред
  2. Полуструктурирано
  3. Неструктурирани подаци

Подаци се обрађују, трансформишу и уносе тако да корисници могу приступити обрађеним подацима у складишту података путем алата Бусинесс Интеллигенце, СКЛ клијената и табела. Складиште података спаја информације које долазе из различитих извора у једну свеобухватну базу података.

Спајањем свих ових информација на једном месту, организација може свеобухватније анализирати своје клијенте. Ово помаже да се осигура да су узете у обзир све доступне информације. Складиштење података омогућава рударство података. Дата мининг тражи обрасце у подацима који могу довести до веће продаје и профита.

Врсте складишта података

Три главне врсте складишта података (ДВХ) су:

1. Складиште података предузећа (ЕДВ):

Ентерприсе Дата Варехоусе (ЕДВ) је централизовано складиште. Пружа услугу подршке одлучивању у целом предузећу. Нуди јединствен приступ за организовање и представљање података. Такође пружа могућност класификације података према предмету и даје приступ према тим поделама.

2. Складиште оперативних података:

Оперативно складиште података, које се такође назива ОДС, није ништа друго до складиште података потребно када складиште података нити ОЛТП системи не подржавају потребе организација за извештавање. У ОДС -у, складиште података се освежава у реалном времену. Због тога је широко префериран за рутинске активности попут чувања евиденције запослених.

3. Дата Март:

Податковни март је подскуп складишта података. Посебно је дизајниран за одређену дјелатност, попут продаје, финансија, продаје или финансија. У независном податковном пољу подаци се могу прикупљати директно из извора.

Опште фазе складишта података

Раније су организације почеле релативно једноставно коришћење складишта података. Међутим, временом је почела софистициранија употреба складиштења података.

Ово су опште фазе коришћења складишта података (ДВХ):

Офлајн оперативна база података:

У овој фази, подаци се само копирају из оперативног система на други сервер. На овај начин учитавање, обрада и извештавање о копираним подацима не утичу на перформансе оперативног система.

Офлајн складиште података:

Подаци у Датаварехоусе -у се редовно ажурирају из Оперативне базе података. Подаци у Датаварехоусе -у се мапирају и трансформишу како би испунили циљеве Датаварехоусе -а.

Складиште података у реалном времену:

У овој фази складишта података се ажурирају кад год се догоди нека трансакција у оперативној бази података. На пример, систем резервације авио -компанија или железнице.

Интегрисано складиште података:

У овој фази складишта података се стално ажурирају када оперативни систем изврши трансакцију. Датаварехоусе затим генерише трансакције које се шаљу назад у оперативни систем.

Компоненте складишта података

Четири компоненте складишта података су:

Менаџер оптерећења: Менаџер оптерећења се назива и предња компонента. Обавља све операције повезане са екстракцијом и учитавањем података у складиште. Ове операције укључују трансформације за припрему података за унос у складиште података.

Управник складишта: Управитељ складишта обавља операције повезане са управљањем подацима у складишту. Обавља операције попут анализе података како би се осигурала конзистентност, стварање индекса и приказа, генерирање денормализације и агрегације, трансформација и спајање изворних података те архивирање и копирање података.

Менаџер упита: Менаџер упита је такође позната и као позадинска компонента. Обавља све оперативне операције везане за управљање корисничким упитима. Операције ових компоненти складишта података су директни упити у одговарајуће табеле за заказивање извршавања упита.

Алати за приступ крајњим корисницима:

Ово је категорисано у пет различитих група, као што су 1. Извештавање о подацима 2. Алати за упите 3. Алати за развој апликација 4. ЕИС алати, 5. ОЛАП алати и алати за рударење података.

Коме треба складиште података?

ДВХ (складиште података) је потребно за све врсте корисника као што су:

  • Доносиоци одлука који се ослањају на масовну количину података
  • Корисници који користе прилагођене, сложене процесе за добијање информација из више извора података.
  • Користе га и људи који желе једноставну технологију за приступ подацима
  • Такође је од суштинског значаја за оне људе који желе системски приступ доношењу одлука.
  • Ако корисник жели брзе перформансе велике количине података која је неопходна за извештаје, табеле или графиконе, складиште података се показало корисним.
  • Складиште података је први корак Ако желите открити „скривене обрасце“ токова података и груписања.

За шта се користи складиште података?

Ево најчешћих сектора у којима се користи складиште података:

Ваздушна линија:

У систему Аирлине користи се у оперативне сврхе, попут распоређивања посаде, анализе профитабилности руте, промоције програма за честе летаче итд.

Банкарство:

Широко се користи у банкарском сектору за ефикасно управљање ресурсима доступним на столу. Неколико банака се такође користило за истраживање тржишта, анализу учинка производа и пословања.

Здравствена заштита:

Здравствени сектор је такође користио складиште података за стратегију и предвиђање исхода, генерисање извештаја о лечењу пацијената, размену података са осигуравајућим друштвима, службама медицинске помоћи итд.

Јавни сектор:

У јавном сектору складиште података се користи за прикупљање обавештајних података. Помаже државним агенцијама да воде и анализирају пореску евиденцију, евиденцију здравствене политике за сваког појединца.

Сектор инвестиција и осигурања:

У овом сектору складишта се првенствено користе за анализу образаца података, трендове купаца и за праћење кретања на тржишту.

Задржи ланац:

У малопродајним ланцима складиште података се широко користи за дистрибуцију и маркетинг. Такође помаже у праћењу артикала, обрасцима куповине купаца, промоцијама и такође се користи за одређивање политике цена.

Телекомуникације:

Складиште података се користи у овом сектору за промоције производа, одлуке о продаји и за доношење одлука о дистрибуцији.

Угоститељство:

Ова индустрија користи складишне услуге за дизајнирање, као и за процјену својих рекламних и промотивних кампања у којима желе циљати клијенте на основу њихових повратних информација и образаца путовања.

Кораци за имплементацију складишта података

Најбољи начин за решавање пословног ризика повезаног са имплементацијом Датаварехоусе-а је употреба трокраке стратегије, као што је доле

  1. Стратегија предузећа : Овде идентификујемо техничке, укључујући тренутну архитектуру и алате. Такође идентификујемо чињенице, димензије и атрибуте. Мапирање и трансформација података се такође преноси.
  2. Постепена испорука : Имплементацију складишта података треба постепено заснивати на предметним областима. Повезане пословне субјекте попут резервације и наплате треба прво применити, а затим међусобно интегрисати.
  3. Итеративно прототипирање : Уместо приступа примене великог праска, Датаварехоусе би требало развијати и тестирати итеративно.

Овде су кључни кораци у имплементацији Датаварехоусе -а заједно са његовим резултатима.

Корак Задаци Деливераблес
1Потребно је дефинисати обим пројектаОпсег дефиниције
2Потребно је утврдити пословне потребеЛогички модел података
3Дефинишите захтеве оперативног складишта податакаМодел оперативног складишта података
4Набавите или развијајте алате за екстракцијуИздвојите алате и софтвер
5Дефинишите захтеве за складиште податакаМодел транзиционих података
6Документујте податке који недостајуЛиста задатака
7Мапира Оперативно складиште података у складиште податакаД/В карта за интеграцију података
8Развити дизајн базе података складишта податакаД/В Дизајн базе података
9Издвојите податке из складишта оперативних податакаИнтегрисани Д/В екстракти података
10Учитај складиште податакаПочетно учитавање података
ЈеданаестОдржавајте складиште податакаТекући приступ подацима и накнадна учитавања

Најбоље праксе за имплементацију складишта података

  • Одлучите о плану за тестирање доследности, тачности и интегритета података.
  • Складиште података мора бити добро интегрисано, добро дефинисано и са временским жигом.
  • Приликом дизајнирања Датаварехоусе -а водите рачуна да користите прави алат, придржавате се животног циклуса, водите рачуна о сукобима података и спремни сте да научите да сте своје грешке.
  • Никада не мењајте оперативне системе и извештаје
  • Не трошите превише времена на вађење, чишћење и учитавање података.
  • Укључите све заинтересоване стране, укључујући пословно особље, у процес имплементације Датаварехоусе -а. Утврдите да је складиштење података заједнички/ тимски пројекат. Не желите да креирате складиште података које није корисно за крајње кориснике.
  • Припремите план обуке за крајње кориснике.

Зашто нам је потребно складиште података? Предности Мане

Предности складишта података (ДВХ):

  • Складиште података омогућава пословним корисницима да брзо приступе критичним подацима из неких извора, све на једном месту.
  • Складиште података пружа конзистентне информације о различитим вишефункционалним активностима. Такође подржава ад-хоц извештавање и упите.
  • Складиште података помаже у интеграцији многих извора података како би се смањио стрес на производни систем.
  • Складиште података помаже у смањењу укупног времена за анализу и извештавање.
  • Реструктурирање и интеграција олакшавају кориснику коришћење за извештавање и анализу.
  • Складиште података омогућава корисницима приступ критичним подацима из више извора на једном месту. Због тога штеди време корисника за преузимање података из више извора.
  • Складиште података складишти велику количину историјских података. Ово помаже корисницима да анализирају различите временске периоде и трендове како би направили будућа предвиђања.

Недостаци складишта података:

  • Није идеална опција за неструктуриране податке.
  • Стварање и имплементација складишта података засигурно је збуњујућа ствар.
  • Складиште података може релативно брзо застарети
  • Тешко је извршити промене у типовима података и опсезима, шеми извора података, индексима и упитима.
  • Складиште података може изгледати лако, али заправо је превише сложено за просечне кориснике.
  • Упркос најбољим напорима у управљању пројектима, опсег пројекта складиштења података ће се увек повећавати.
  • Корисници складишта ће понекад развити различита пословна правила.
  • Организације морају потрошити много својих ресурса за обуку и имплементацију.

Будућност складиштења података

  • Променити у Регулаторна ограничења може ограничити могућност комбиновања извора различитих података. Ови различити извори могу укључивати неструктуриране податке које је тешко похранити.
  • Као што је величина од растућих база података, процене оног што чини веома велику базу података настављају да расту. Сложено је изградити и покренути системе складишта података који се увек повећавају. Хардверски и софтверски ресурси који су данас доступни не дозвољавају одржавање велике количине података на мрежи.
  • Мултимедијални подаци не могу се лако манипулисати као текстуални подаци, док се текстуалне информације могу дохватити данас доступним релационим софтвером. Ово би могао бити предмет истраживања.

Алати складишта података

На тржишту постоји много алата за складиштење података. Ево неких најистакнутијих:

1. МаркЛогиц:

МаркЛогиц је корисно решење за складиштење података које чини интеграцију података лакшом и бржом помоћу низа функција предузећа. Овај алат помаже у извођењу веома сложених операција претраживања. Може да тражи различите врсте података као што су документи, односи и метаподаци.

хттпс://ввв.марклогиц.цом/продуцт/геттинг-стартед/

2. Орацле:

Орацле је водећа база података у индустрији. Нуди широк избор решења за складишта података за локално и у облаку. Помаже у оптимизацији корисничког искуства повећањем оперативне ефикасности.

хттпс://ввв.орацле.цом/индек.хтмл

3. Амазон РедСхифт:

Амазон Редсхифт је алат за складиштење података. То је једноставан и исплатив алат за анализу свих врста података користећи стандардни СКЛ и постојеће БИ алате. Такође омогућава покретање сложених упита према петабајтима структурираних података, користећи технику оптимизације упита.

хттпс://авс.амазон.цом/редсхифт/?нц2=х_м1

Ево потпуне листе корисних Датаварехоусе Тоолс.

КЉУЧНО УЧЕЊЕ

  • Складиште података (ДВХ), познато је и као складиште података предузећа (ЕДВ).
  • Складиште података је дефинисано као централно спремиште у које информације долазе из једног или више извора података.
  • Три главна типа складишта података су Ентерприсе Дата Варехоусе (ЕДВ), Оператионал Дата Сторе и Дата Март.
  • Опште стање складишта података су офлајн оперативна база података, складиште података ван мреже, складиште података у реалном времену и интегрисано складиште података.
  • Четири главне компоненте Датаварехоусе-а су Менаџер учитавања, Менаџер складишта, Менаџер упита, Алати за приступ крајњим корисницима
  • Датаварехоусе се користи у различитим индустријама попут авиопревозника, банкарства, здравствене заштите, осигурања, малопродаје итд.
  • Имплементација Датаварехосуе -а је стратегија са три дела, тј. Стратегија предузећа, фазна испорука и понављајуће прототипирање.
  • Складиште података омогућава пословним корисницима да брзо приступе критичним подацима из неких извора, све на једном месту.