Wat is OLAP? Cube, Operations & Typen in Data Warehouse

Inhoudsopgave:

Anonim

Wat is OLAP?

Online Analytical Processing (OLAP) is een categorie software waarmee gebruikers informatie uit meerdere databasesystemen tegelijkertijd kunnen analyseren. Het is een technologie waarmee analisten bedrijfsgegevens vanuit verschillende gezichtspunten kunnen extraheren en bekijken.

Analisten moeten vaak gegevens groeperen, samenvoegen en samenvoegen. Deze bewerkingen in relationele databases zijn resource-intensief. Met OLAP kunnen gegevens vooraf worden berekend en vooraf worden geaggregeerd, waardoor de analyse sneller verloopt.

OLAP-databases zijn onderverdeeld in een of meer kubussen. De kubussen zijn zo ontworpen dat het maken en bekijken van rapporten eenvoudig wordt. OLAP staat voor Online Analytical Processing.

In deze tutorial leer je-

  • OLAP-kubus
  • Elementaire analytische bewerkingen van OLAP
  • Soorten OLAP-systemen
  • ROLAP
  • MOLAP
  • Hybride OLAP
  • Voordelen van OLAP
  • Nadelen van OLAP

OLAP-kubus:

De kern van het OLAP-concept is een OLAP-kubus. De OLAP-kubus is een gegevensstructuur die is geoptimaliseerd voor zeer snelle gegevensanalyse.

De OLAP-kubus bestaat uit numerieke feiten, meetwaarden genaamd, die zijn onderverdeeld in dimensies. OLAP Cube wordt ook wel de hyperkubus genoemd .

Gewoonlijk worden gegevensbewerkingen en analyses uitgevoerd met behulp van de eenvoudige spreadsheet, waarin gegevenswaarden in rij- en kolomindeling zijn gerangschikt. Dit is ideaal voor tweedimensionale gegevens. OLAP bevat echter multidimensionale gegevens, waarbij gegevens meestal worden verkregen uit een andere en niet-gerelateerde bron. Het gebruik van een spreadsheet is geen optimale optie. De kubus kan multidimensionale gegevens op een logische en overzichtelijke manier opslaan en analyseren.

Hoe werkt het?

Een datawarehouse haalt informatie uit meerdere databronnen en formaten zoals tekstbestanden, Excel-sheet, multimediabestanden, etc.

De geëxtraheerde gegevens worden opgeschoond en getransformeerd. Gegevens worden geladen in een OLAP-server (of OLAP-kubus) waar de informatie vooraf wordt berekend voor verdere analyse.

Elementaire analytische bewerkingen van OLAP

Vier soorten analytische bewerkingen in OLAP zijn:

  1. Oprollen
  2. Drill-down
  3. Snijd en dobbelsteen
  4. Draaien (draaien)

1) Roll-up:

Roll-up wordt ook wel "consolidatie" of "aggregatie" genoemd. De oprolbewerking kan op 2 manieren worden uitgevoerd

  1. Afmetingen verkleinen
  2. Concepthiërarchie opklimmen. Concepthiërarchie is een systeem om dingen te groeperen op basis van hun volgorde of niveau.

Beschouw het volgende diagram

  • In dit voorbeeld steden New Jersey en Lost Angles en opgerold naar land USA
  • De verkoopcijfers van New Jersey en Los Angeles zijn respectievelijk 440 en 1560. Ze worden 2000 na roll-up
  • In dit aggregatieproces beweegt de gegevens in de locatiehiërarchie zich omhoog van stad naar land.
  • Bij het oprollen dienen minimaal één of meerdere dimensies te worden verwijderd. In dit voorbeeld is de dimensie Quater verwijderd.

2) Drill-down

In drill-down gegevens worden gefragmenteerd in kleinere delen. Het is het tegenovergestelde van het rollup-proces. Het kan worden gedaan via

  • Verplaatsen in de concepthiërarchie
  • Een dimensie vergroten

Beschouw het bovenstaande diagram

  • Quater Q1 wordt afgebroken tot de maanden januari, februari en maart. Bijbehorende verkopen zijn ook registers.
  • In dit voorbeeld worden dimensiemaanden toegevoegd.

3) Plak:

Hier wordt één dimensie geselecteerd en wordt een nieuwe subkubus gemaakt.

In het volgende diagram wordt uitgelegd hoe de slice-bewerking presteerde:

  • Dimension Time wordt in plakjes gesneden met Q1 als filter.
  • Er wordt helemaal een nieuwe kubus gemaakt.

Dobbelsteen:

Deze bewerking is vergelijkbaar met een segment. Het verschil in dobbelstenen is dat je 2 of meer dimensies selecteert die resulteren in het maken van een subkubus.

4) Draaien

In Pivot roteert u de gegevensassen om een ​​vervangende presentatie van gegevens te bieden.

In het volgende voorbeeld is het draaipunt gebaseerd op itemtypen.

Soorten OLAP-systemen

OLAP hiërarchische structuur

Type OLAP Uitleg
Relationele OLAP (ROLAP): ROLAP is een uitgebreid RDBMS samen met multidimensionale gegevenstoewijzing om de standaard relationele bewerking uit te voeren.
Multidimensionale OLAP (MOLAP) MOLAP Implementeert bewerking in multidimensionale gegevens.
Hybride online-analytische verwerking (HOLAP) In de HOLAP-benadering worden de geaggregeerde totalen opgeslagen in een multidimensionale database, terwijl de gedetailleerde gegevens worden opgeslagen in de relationele database. Dit biedt zowel data-efficiëntie van het ROLAP-model als de prestaties van het MOLAP-model.
Desktop OLAP (DOLAP) In Desktop OLAP downloadt een gebruiker een deel van de gegevens lokaal uit de database of op zijn bureaublad en analyseert deze. DOLAP is relatief goedkoper in gebruik omdat het in vergelijking met andere OLAP-systemen zeer weinig functionaliteiten biedt.
Web OLAP (WOLAP) Web OLAP, een OLAP-systeem dat toegankelijk is via de webbrowser. WOLAP is een architectuur met drie niveaus. Het bestaat uit drie componenten: client, middleware en een databaseserver.
Mobiele OLAP: Mobile OLAP helpt gebruikers OLAP-gegevens te openen en te analyseren met behulp van hun mobiele apparaten
Ruimtelijke OLAP: SOLAP is gemaakt om het beheer van zowel ruimtelijke als niet-ruimtelijke gegevens in een geografisch informatiesysteem (GIS) te vergemakkelijken

ROLAP

ROLAP werkt met gegevens die in een relationele database staan. Feiten en dimensietabellen worden opgeslagen als relationele tabellen. Het maakt ook multidimensionale analyse van gegevens mogelijk en is de snelst groeiende OLAP.

Voordelen van het ROLAP-model:

  • Hoge data-efficiëntie. Het biedt een hoge data-efficiëntie omdat de queryprestaties en de toegangstaal zijn geoptimaliseerd, met name voor de multidimensionale data-analyse.
  • Schaalbaarheid. Dit type OLAP-systeem biedt schaalbaarheid voor het beheren van grote hoeveelheden gegevens, zelfs wanneer de gegevens gestaag toenemen.

Nadelen van het ROLAP-model:

  • Vraag naar meer middelen: ROLAP heeft een hoog gebruik van mankracht, software en hardwarebronnen nodig.
  • Geaggregeerd gegevensbeperkingen. ROLAP-tools gebruiken SQL voor alle berekeningen van geaggregeerde gegevens. Er zijn echter geen vaste limieten voor het verwerken van berekeningen.
  • Trage queryprestaties. De queryprestaties in dit model zijn traag in vergelijking met MOLAP

MOLAP

MOLAP gebruikt op array gebaseerde multidimensionale opslagengines om multidimensionale weergaven van gegevens weer te geven. In principe gebruiken ze een OLAP-kubus.

Lees hier meer over OLAP

Hybride OLAP

Hybride OLAP is een mix van zowel ROLAP als MOLAP. Het biedt een snelle berekening van MOLAP en een hogere schaalbaarheid van ROLAP. HOLAP gebruikt twee databases.

  1. Geaggregeerde of berekende gegevens worden opgeslagen in een multidimensionale OLAP-kubus
  2. Gedetailleerde informatie wordt opgeslagen in een relationele database.

Voordelen van hybride OLAP:

  • Dit soort OLAP helpt om schijfruimte te besparen, en het blijft ook compact, wat problemen met de toegangssnelheid en het gemak helpt voorkomen.
  • Hybride HOLAP's maken gebruik van kubustechnologie die snellere prestaties mogelijk maakt voor alle soorten gegevens.
  • ROLAP wordt onmiddellijk bijgewerkt en HOLAP-gebruikers hebben toegang tot deze direct bijgewerkte gegevens in realtime. MOLAP zorgt voor opschoning en conversie van gegevens, waardoor de relevantie van gegevens wordt verbeterd. Dit biedt het beste van twee werelden.

Nadelen van hybride OLAP:

  • Hoger complexiteitsniveau : het grootste nadeel van HOLAP-systemen is dat het zowel ROLAP- als MOLAP-tools en -toepassingen ondersteunt. Het is dus erg ingewikkeld.
  • Mogelijke overlappingen : er is een grotere kans op overlapping, vooral wat betreft hun functionaliteiten.

Voordelen van OLAP

  • OLAP is een platform voor alle soorten bedrijven, waaronder planning, budgettering, rapportage en analyse.
  • Informatie en berekeningen zijn consistent in een OLAP-kubus. Dit is een cruciaal voordeel.
  • Creëer en analyseer snel "Wat als" -scenario's
  • Zoek eenvoudig in de OLAP-database naar brede of specifieke termen.
  • OLAP biedt de bouwstenen voor bedrijfsmodelleringstools, dataminingtools en prestatierapportagetools.
  • Hiermee kunnen gebruikers kubusgegevens in delen en dobbelstenen maken, allemaal op basis van verschillende dimensies, metingen en filters.
  • Het is goed voor het analyseren van tijdreeksen.
  • Het vinden van enkele clusters en uitschieters is eenvoudig met OLAP.
  • Het is een krachtig online analytisch processysteem voor visualisatie dat snellere responstijden biedt

Nadelen van OLAP

  • OLAP vereist het organiseren van gegevens in een ster- of sneeuwvlokschema. Deze schema's zijn ingewikkeld om te implementeren en te beheren
  • U kunt geen groot aantal dimensies in één OLAP-kubus hebben
  • Transactiegegevens zijn niet toegankelijk met het OLAP-systeem.
  • Elke wijziging in een OLAP-kubus heeft een volledige update van de kubus nodig. Dit is een tijdrovend proces

Overzicht:

  • OLAP is een technologie waarmee analisten bedrijfsgegevens vanuit verschillende gezichtspunten kunnen extraheren en bekijken.
  • De kern van het OLAP-concept is een OLAP-kubus.
  • Diverse bedrijfstoepassingen en andere gegevensbewerkingen vereisen het gebruik van OLAP Cube.
  • Er zijn vijf primaire typen analytische bewerkingen in OLAP 1) Roll-up 2) Drill-down 3) Segment 4) Dobbelstenen en 5) Pivot
  • Drie soorten veelgebruikte OLAP-systemen zijn MOLAP, ROLAP en Hybrid OLAP.
  • Desktop OLAP, Web OLAP en Mobile OLAP zijn enkele andere typen OLAP-systemen.