Data Marts und die Definition multidimensionaler Datenräume
Wenn man sich mit multidimensionalen Datenräumen beschäftigt, dann tauchen Begriffe wie Datenmodellierung, Snowflake Schema, erste Normalform (1NF) oder 2NF (zweite Normalform) auf - viele Laien werden sich dann an die Kurvendiskussion in der Oberstufe erinnern und dabei an die erste oder zweite Ableitung einer Funktion denken - aber damit hat dieses Thema eher weniger zu tun. Wir wollen Sie mit dieser kleinen Serie in die Modellierung multidimensionaler Datenräume einführen - hierzu starten wir mit Data Mart.
Data Mart - was ist das?
Ein Data Mart ist - ganz vereinfacht ausgedrückt - eine Kopie des Teildatenbestandes eines Data Warehouse. (vgl. Bauer A., Günzel H. 2013)
Ein Data Mart wird meist erstellt, wenn ein Unternehmen oder Abteilung z.B. eine Analyse über einen Teilbereich des Data Warehouse benötigt. Aber auch wegen der Leistung eines Systems kann ein Data Mart gezogen und dann ausgelagert werden.
Der Hintergrund: Verlagerung der Rechenpower auf einen anderen Rechner oder die Verlagerung von Zugriffen auf einen anderen Speicher führt zur Erhöhung der Gesamtleistung des Systems - das System ist dann in der Lage Ergebnisse z.B. einer Analyse schneller zu liefern.
Gerade in der Zeit der neuen EU Datenschutzgrundverordnung (DSGVO) ist ein Data Mart sehr sinnvoll bzw. die richtige Entscheidung für viele Unternehmen.
Der Hintergrund: Nicht jeder Anwender hat das Recht alle Daten in einem Data Warehouse zu sehen, sondern besitzt nur bestimmte Zugriffsrechte - auch dies bekommt ein Data Mart sehr gut hin. (vgl. Kemper H., Bars H., Mehanna W.,2010)
In Data Marts werden meist multidimensionale Datenräume definiert, die sehr gut für Analysen geeignet sind.
Beispiel:
Eine Analyse soll z.B. folgende Fragestellung beantworten:
Wie hoch war der Umsatz im August 2016 in der Verkaufsregion West mit dem Produkt „Passion“ im Kundensegment „Consumer“?
Bei dieser Fragestellung tauchen folgende Aspekte auf:
Umsatz
August 2016
Verkaufsregion West
Produkt „Passion“
Kundensegment „Consumer“
Diese Aspekte werden als Fakten, Dimensionen und Hierarchisierungen bezeichnet. Und genau diese Aspekte liefert ein Data Mart schnell aus. Ein sauber erstellter Data Mart ist also in der Lage genau diese Daten bereitzustellen, die für die Abfrage in der Abteilung X in Frage kommen.
Was sich im Detail unter diesen Begriffen verbirgt, erfahren Sie nächste Woche im kommenden Blogbeitrag „Fakten, Dimensionen und Hierarchisierungen - Aspekte eines Data Mart“.
Empresa de varejo do segmento de moda está buscando um Analista de Soluções BI. Oportunidade com foco em processos e criação de novas soluções.
Requisitos:
Superior completo em Sistemas da Informação, Ciências da Computação ou áreas afins;
Experiência em Modelagem Multi-dimensional; DataMarts; Ferramentas de BI (Oracle BIEE, MicroStrategy, Cognus);
Atribuições:
Atuar no desenvolvimento de diversos projetos de Business Intelligence para o varejo; Executar atendimentos aos clientes internos suportando as novas demandas de sistemas; Trabalhar em equipe desenvolvendo novas funcionalidades.