Wat is datamodellering?
Datamodellering (datamodellering) is het proces waarbij een datamodel wordt gemaakt voor de gegevens die in een database moeten worden opgeslagen. Dit datamodel is een conceptuele weergave van data-objecten, de associaties tussen verschillende data-objecten en de regels. Gegevensmodellering helpt bij de visuele weergave van gegevens en dwingt bedrijfsregels, naleving van wet- en regelgeving en overheidsbeleid met betrekking tot de gegevens af. Datamodellen zorgen voor consistentie in naamgevingsconventies, standaardwaarden, semantiek en beveiliging terwijl de kwaliteit van de gegevens wordt gegarandeerd.
Gegevensmodel
Het gegevensmodel wordt gedefinieerd als een abstract model dat gegevensbeschrijving, gegevenssemantiek en consistentiebeperkingen van gegevens organiseert. Het datamodel legt de nadruk op welke gegevens nodig zijn en hoe deze moeten worden georganiseerd in plaats van welke bewerkingen op gegevens worden uitgevoerd. Datamodel is als het bouwplan van een architect, dat helpt bij het bouwen van conceptuele modellen en het leggen van een relatie tussen data-items.
De twee soorten datamodelleringstechnieken zijn
- Entiteitsrelatie (ER) -model
- UML (Unified Modeling Language)
We zullen ze later in detail bespreken.
Deze zelfstudie over datamodellering is het meest geschikt voor beginners, beginners en ervaren professionals. In deze zelfstudie over datamodellen worden concepten voor datamodellering in detail besproken-
- Waarom een datamodel gebruiken?
- Soorten datamodellen
- Conceptueel gegevensmodel
- Logisch gegevensmodel
- Fysiek gegevensmodel
- Voordelen en nadelen van datamodel
Waarom een datamodel gebruiken?
Het primaire doel van het gebruik van een datamodel zijn:
- Zorgt ervoor dat alle data-objecten die de database nodig heeft, nauwkeurig worden weergegeven. Het weglaten van gegevens leidt tot het maken van foutieve rapporten en leidt tot onjuiste resultaten.
- Een datamodel helpt bij het ontwerpen van de database op conceptueel, fysiek en logisch niveau.
- Datamodelstructuur helpt bij het definiëren van de relationele tabellen, primaire en externe sleutels en opgeslagen procedures.
- Het geeft een duidelijk beeld van de basisgegevens en kan door databaseontwikkelaars worden gebruikt om een fysieke database te maken.
- Het is ook handig om ontbrekende en overtollige gegevens te identificeren.
- Hoewel de initiële creatie van een datamodel arbeids- en tijdrovend is, maakt het op de lange termijn het upgraden en onderhouden van uw IT-infrastructuur goedkoper en sneller.
Soorten datamodellen
Typen datamodellen : er zijn hoofdzakelijk drie verschillende soorten datamodellen: conceptuele datamodellen, logische datamodellen en fysieke datamodellen, en elk model heeft een specifiek doel. De datamodellen worden gebruikt om de data weer te geven en hoe deze in de database zijn opgeslagen en om de relatie tussen data-items in te stellen.
- Conceptueel gegevensmodel: dit gegevensmodel bepaalt WAT het systeem bevat. Dit model wordt doorgaans gemaakt door zakelijke belanghebbenden en gegevensarchitecten. Het doel is om bedrijfsconcepten en regels te organiseren, te bepalen en te definiëren.
- Logisch gegevensmodel: definieert HOE het systeem moet worden geïmplementeerd, ongeacht het DBMS. Dit model wordt doorgaans gemaakt door Data Architects en Business Analysts. Het doel is om een technische kaart van regels en datastructuren te ontwikkelen.
- Fysiek gegevensmodel : dit gegevensmodel beschrijft HOE het systeem zal worden geïmplementeerd met behulp van een specifiek DBMS-systeem. Dit model wordt doorgaans gemaakt door DBA en ontwikkelaars. Het doel is de daadwerkelijke implementatie van de database.
Conceptueel gegevensmodel
Een conceptueel gegevensmodel is een overzichtelijke weergave van databaseconcepten en hun relaties. Het doel van het maken van een conceptueel gegevensmodel is om entiteiten, hun attributen en relaties vast te stellen. Op dit datamodelleringsniveau zijn er nauwelijks details beschikbaar over de feitelijke databasestructuur. Zakelijke belanghebbenden en data-architecten creëren doorgaans een conceptueel datamodel.
De 3 basis tenants van Conceptual Data Model zijn
- Entiteit : iets uit de echte wereld
- Attribuut : kenmerken of eigenschappen van een entiteit
- Relatie : afhankelijkheid of associatie tussen twee entiteiten
Voorbeeld van datamodel:
- Klant en product zijn twee entiteiten. Klantnummer en naam zijn attributen van de Klantentiteit
- Productnaam en prijs zijn kenmerken van de productentiteit
- Verkoop is de relatie tussen de klant en het product
Kenmerken van een conceptueel datamodel
- Biedt organisatiebrede dekking van de bedrijfsconcepten.
- Dit soort datamodellen zijn ontworpen en ontwikkeld voor een zakelijk publiek.
- Het conceptuele model wordt onafhankelijk van hardwarespecificaties zoals dataopslagcapaciteit, locatie of softwarespecificaties zoals DBMS-leverancier en technologie ontwikkeld. De focus is om gegevens weer te geven zoals een gebruiker ze in de "echte wereld" zal zien.
Conceptuele datamodellen, bekend als domeinmodellen, creëren een gemeenschappelijk vocabulaire voor alle belanghebbenden door basisconcepten en reikwijdte vast te stellen.
Logisch gegevensmodel
Het Logical Data Model wordt gebruikt om de structuur van data-elementen te definiëren en om onderlinge relaties te leggen. Het logische datamodel voegt meer informatie toe aan de conceptuele datamodelelementen. Het voordeel van het gebruik van een logisch datamodel is dat het een basis biedt om de basis te vormen voor het fysieke model. De modelstructuur blijft echter generiek.
Op dit datamodelleringniveau is er geen primaire of secundaire sleutel gedefinieerd. Op dit gegevensmodelleringsniveau moet u de connectordetails die eerder voor relaties zijn ingesteld, verifiëren en aanpassen.
Kenmerken van een logisch datamodel
- Beschrijft de gegevensbehoeften voor een enkel project, maar kan worden geïntegreerd met andere logische gegevensmodellen op basis van de reikwijdte van het project.
- Onafhankelijk van het DBMS ontworpen en ontwikkeld.
- Gegevensattributen hebben datatypes met exacte precisie en lengte.
- Normalisatieprocessen op het model worden doorgaans toegepast tot 3NF.
Fysiek gegevensmodel
Een Physical Data Model beschrijft een database-specifieke implementatie van het datamodel. Het biedt database-abstractie en helpt bij het genereren van het schema. Dit komt door de rijkdom aan metadata die wordt geboden door een Physical Data Model. Het fysieke gegevensmodel helpt ook bij het visualiseren van de databasestructuur door het repliceren van databasekolomsleutels, beperkingen, indexen, triggers en andere RDBMS-functies.
Kenmerken van een fysiek datamodel:
- Het fysieke gegevensmodel beschrijft de gegevensbehoefte voor een enkel project of applicatie, hoewel het misschien geïntegreerd kan worden met andere fysieke gegevensmodellen op basis van de projectomvang.
- Gegevensmodel bevat relaties tussen tabellen die betrekking hebben op kardinaliteit en nullabiliteit van de relaties.
- Ontwikkeld voor een specifieke versie van een DBMS, locatie, gegevensopslag of technologie die in het project moet worden gebruikt.
- Kolommen moeten exacte datatypes, toegewezen lengtes en standaardwaarden hebben.
- Primaire en externe sleutels, views, indexen, toegangsprofielen en autorisaties, enz. Worden gedefinieerd.
Voordelen en nadelen van datamodel:
Voordelen van datamodel:
- Het belangrijkste doel van een ontwerpend datamodel is om ervoor te zorgen dat data-objecten die door het functionele team worden aangeboden, nauwkeurig worden weergegeven.
- Het datamodel moet voldoende gedetailleerd zijn om te worden gebruikt voor het bouwen van de fysieke database.
- De informatie in het datamodel kan worden gebruikt om de relatie tussen tabellen, primaire en externe sleutels en opgeslagen procedures te definiëren.
- Datamodel helpt bedrijven om binnen en tussen organisaties te communiceren.
- Datamodel helpt bij het documenteren van gegevenstoewijzingen in het ETL-proces
- Help om de juiste gegevensbronnen te herkennen om het model te vullen
Nadelen van datamodel:
- Om een datamodel te ontwikkelen, moet men de fysieke kenmerken van de opgeslagen data kennen.
- Dit is een navigatiesysteem dat zorgt voor complexe applicatie-ontwikkeling, beheer. Het vereist dus kennis van de biografische waarheid.
- Zelfs kleinere wijzigingen in de structuur vereisen aanpassingen in de gehele applicatie.
- Er is geen vaste taal voor gegevensmanipulatie in DBMS.
Gevolgtrekking
- Datamodellering is het proces waarbij een datamodel wordt ontwikkeld voor de gegevens die in een database moeten worden opgeslagen.
- Datamodellen zorgen voor consistentie in naamgevingsconventies, standaardwaarden, semantiek en beveiliging terwijl de kwaliteit van de gegevens wordt gegarandeerd.
- Datamodelstructuur helpt bij het definiëren van de relationele tabellen, primaire en externe sleutels en opgeslagen procedures.
- Er zijn drie soorten conceptueel, logisch en fysiek.
- Het belangrijkste doel van het conceptuele model is om de entiteiten, hun attributen en hun relaties vast te stellen.
- Logisch datamodel definieert de structuur van de data-elementen en legt de relaties daartussen vast.
- Een Physical Data Model beschrijft de database-specifieke implementatie van het datamodel.
- Het belangrijkste doel van een ontwerpend datamodel is om ervoor te zorgen dat data-objecten die door het functionele team worden aangeboden, nauwkeurig worden weergegeven.
- Het grootste nadeel is dat zelfs kleinere wijzigingen in de structuur aanpassing in de gehele applicatie vereisen.
- Als u deze zelfstudie over datamodellering leest, leert u van de basisconcepten zoals Wat is datamodel? Inleiding tot verschillende soorten datamodellen, voor- en nadelen en voorbeeld van datamodellen.