Data Mart und Data Vault - Was ist das?

Dieser Beitrag erläutert die Konzepte von Data Mart und Data Vault und stellt den Zusammenhang der beiden im Kontext eines Data Warehouses dar.

Was ist ein Data Mart?

Ein Data Mart ist eine themenorientierte Datenbank, die ein partitioniertes Segment eines Data Warehouse ist. Die Daten eines Data Marts sind auf eine bestimmte Geschäftsabteilung wie Finanzen, Vertrieb, Personalwesen oder Marketing ausgerichtet. Data Marts sind deshalb attraktiv, weil sie auf diese spezifischen Geschäftsanforderungen spezialisiert sind.

Arten von Data Marts

Data Marts werden in drei Typen eingeteilt: abhängig, unabhängig und hybrid. Die Unterscheidung basiert auf der Beziehung zwischen dem Data Mart und dem Data Warehouse oder den Datenquellen.

  • Abhängige Data Marts werden innerhalb eines bestehenden Data Warehouse erstellt. Der spezifische Datensatz, der verwendet wird, kann in zwei verschiedenen Ansichten erstellt werden: eine logische oder eine physische Teilmenge. Die logische Sicht ist eine virtuelle Tabelle, die logisch vom Data Warehouse getrennt ist. Eine physische Teilmenge sind Daten, die physisch vom Data Warehouse getrennt sind.
  • Unabhängige Data Marts werden ohne die Verwendung eines Data Warehouse erstellt. Die Daten werden aus internen oder externen Datenquellen extrahiert und dann in einem Data-Mart-Repository für die analytischen Anforderungen des Unternehmens verarbeitet.
  • Ein hybrider Data Mart nutzt Daten aus Data Warehouses und anderen betrieblichen Quellsystemen. Er bietet ein zentrales Repository für die Anforderungen der Geschäftsabteilung aus zahlreichen Quellen.

Vorteile von Data Marts

Die Verwaltung von Daten kann für jedes Unternehmen eine große Herausforderung darstellen. Data Warehouses mit Data Marts können diese Schwierigkeiten lindern, aber Data Marts können auch einen effizienten Zugriff und eine verbesserte Leistung des Data Warehouse ermöglichen.

Data Marts ermöglichen einen effizienten Zugriff für Geschäftsteams, da Data Marts spezifische Dateneinheiten sind. Ein Beispiel: Ein/e Vertreter:in der Geschäftsberichterstattung muss einen Bericht für die Finanzabteilung erstellen. Dann kann diese/r Angestellte auf den Data Mart für das Finanzwesen in seinem Data Warehouse zugreifen, um die erforderlichen Informationen abzurufen, ohne die Daten anderer Abteilungen durchsuchen zu müssen. Dies spart Zeit und Ressourcen für das Unternehmen.

Data Marts verbessern auch die Leistung des Data Warehouse. Jede einzelne Abteilung kann ihre spezifischen Data Marts pflegen und muss sie nicht auf das gesamte Data Warehouse anwenden. Wenn ein Unternehmen abhängige Data Marts verwendet, wird deren Verarbeitung vom Data Warehouse getrennt, was zu einer Verringerung der Verarbeitungszeit und der Kosten führt.

Was ist ein Data Vault?

Einfach ausgedrückt ist ein Data Vault ein agiles System für Business Intelligence, das entwickelt wurde, um Unzulänglichkeiten im Data Warehouse zu beheben. Data Vault ist eine der beliebtesten Methoden, wenn es um die Entwicklung und Pflege eines Data Warehouse geht.

Was macht Data Vault anders?

Data Vault legt den Schwerpunkt auf Zusammenarbeit und "Reaktion auf Veränderungen". Andere Methoden wie 3NF und dimensionale Modellierung befassen sich zwar mit den Daten, nicht aber mit den Menschen und der Technologie, die Data Warehouses beeinflussen.

Data Vault berücksichtigt die sich ständig verändernde Technologieumgebung. Daher ist ein Data Vault als "lebendige Struktur" für Cloud- und lokale Datenbanken konzipiert. Es vereint Quellen von verschiedenen geografischen Standorten in einer Kombination aus Echtzeit- und Big Data-Formaten.

Vorteile eines Data Vault

  • Daten nahezu in Echtzeit: Ein Data Vault ist für die Verarbeitung von Terabytes bis Petabytes an Informationen ausgelegt. Unternehmen, die bereit für eine Big-Data-Lösung sind, können in hohem Maße von einer Data Vault-Lösung profitieren. Dies ist auf die Fähigkeit zurückzuführen, Daten zu verschlüsseln und nahezu in Echtzeit zu verarbeiten.
  • Anpassungsfähigkeit: Wenn sich Ihr Data Warehouse ändert, kann Ihr Data Vault sich mit verändern und skalieren. Es ist in der Lage, sich ohne Re-Engineering an Veränderungen anzupassen. Bei herkömmlichen Datenmodellen kann es Monate dauern, bis sie an Änderungen im Data Warehouse angepasst sind. Es ist kein zusätzlicher Arbeitsaufwand erforderlich, wenn dem zentralen Data Warehouse Informationen hinzugefügt werden.
  • Dokumentation: Data Vaults macht es einfacher, die Entwicklungsgeschichte nachzuvollziehen. Wenn Sie Änderungen nachverfolgen müssen, ist es weniger notwendig, die Entwickler zu finden, der die Änderung vorgenommen hat. Der Data Vault ist so aufgebaut, dass sich die Änderungen leicht historisch nachverfolgen lassen.

Wie hängen Data Mart und Data Vault zusammen?

Ein Data Warehouse mit Data Vaults ist gleich wie ein klassisches Data Warehouse in Form einer 3-Schichten-Architektur aufgebaut. Diese sind Schichten sind die Staging Area, das Core Data Warehouse und die Data Marts.

Im Core DWH befinden sich der Raw Vault und Business Vault. Die Daten werden von der Staging Area in den Raw Vault unverändert übergeben. Im Raw Vault selbst findet dann die Historisierung und Integration der Daten statt, indem sie auf Hubs, Satelliten und Links aufgeteilt werden. Nach dem Raw Vault wird dann der Business Vault beladen. Aufgabe von diesem ist die Konsolisierung und Abbildung von Business Rules / Geschäftsanforderungen, die den Inhalt und die Bedeutung der Daten verändern. Zum Beispiel können KPIs abgeleitet werden oder Daten geclustert werden.
Der abnehmerspezifische Zugriff auf die Daten erfolgt dann über die Data Mart Schicht.

dataformers unterstützt Sie gerne mit fachlicher Expertise und technischem Know-How bei der Entwicklung, Einführung oder Weiterentwicklung Ihres Data Warehouses. Kontaktieren Sie uns dafür hier.

Weitere Beiträge
crosschevron-left
Datenschutzinformation
Der datenschutzrechtliche Verantwortliche (dataformers GmbH, Österreich) würde gerne mit folgenden Diensten Ihre personenbezogenen Daten verarbeiten. Zur Personalisierung können Technologien wie Cookies, LocalStorage usw. verwendet werden. Dies ist für die Nutzung der Website nicht notwendig, ermöglicht aber eine noch engere Interaktion mit Ihnen. Falls gewünscht, treffen Sie bitte eine Auswahl: