Data Lineage
Eine Darstellung der Abhängigkeiten in der Datenaufbereitung. Entweder auf Ebene der Attribute oder auf Ebene der Entitäten. So kann nachvollzogen werden, wie sich Änderungen an der Schnittstelle auf die Kennzahlen auswirken oder aus welchen Datenquellen sich eine Kennzahl zusammensetzt.
Die Daten für das Lineage sollten nicht extra dokumentiert werden müssen, sondern sollten sich im Wesentlichen aus der Implementierung ergeben und im Rahmen der Weiterentwicklung mit nur wenig Aufwand zu pflegen sein.
Error Handling
Behandlung von Fehlern und die Benachrichtigung, dass ein Fehler vorliegt. Im Data Vault werden auch fehlerhafte Daten geladen, deshalb sollten Fehler in einem ‚Error Mart‘ oder vergleichbarem berichtet werden.
Orchestration
Die Abfolge der einzelnen Aufbereitungsschritte festlegen und dabei die Abhängigkeiten untereinander berücksichtigen.
Scheduling
Die Steuerung der Aufbereitungsprozesse mit der Möglichkeit das Laden zu parallelisieren sowie zeitgesteuert auszuführen. Idealerweise kann ein load balancing vorgenommen werden.
Deployment
Die Verteilung des erzeugten Codes auf Entwicklung, Integration und Produktion. Die Unterstützung von Tests.
Unterstützte Datenbanken
Aufführen einer Liste mit allen unterstützten Datenbanksystemen.
Voraussetzungen für die Installation
Handelt es sich um SaaS oder wird on premise installiert oder kann man zwischen beiden wählen. Bei einer Installation on premise: was sind die Voraussetzungen für eine Installation im Minimum bzw. was wird empfohlen.