Daten als Öl des 21. Jahrhunderts (1/2)

Jeden Tag werden 2,5 Mio. 1 TB Festplatten mit neuen Daten gefüllt d.h. die Höhe von 77 “Eifeltürmen” an Daten generiert. Das sind pro Tag ca. 2,5 Millionen Terabyte.

Warum bergen Daten so viel Potential?

Aus Daten können individuelle Empfehlungen pro Kundengruppe erstellt werden und das subjektive Bauchgefühl und Erfahrung ohne die Abhängigkeit von Mitarbeitern umgesetzt werden.

Es geht darum Einsichten (Insights) auf Daten zu gewinnen,. damit  bessere Entscheidungen zu gewinnen und einen datengetriebener Ansatz zu verwenden. Das datengetriebene Entscheidungsmanagement kann rückblickend oder in die Zukunft erfolgen.

Bei der Datenanlyse ist das Zusammenspiel zwischen Mensch und Maschine sehr wichtig. Ein Algorithmus kann bei der Indikation unterstützen, aber den Mensch nicht komplett ersetzen.

Das datengetriebenes Entscheidungsmanagement wird in folgende Disziplinen unterteilt:

  • Data Warehouse – Speicherung der Daten
  • Data Analytics – Analysen von konkreten Fragestellungen durchführen
  • Data Science – Welche Fragen müssen aus der Makroperspektive gestellt werden?

Data Warehouse

In einem Data Warehouse können konsistente Datenanalysen durchgeführt und Ergebnisse gemessen werden. Es handelt sich um ein zentrales Datenbanksystem das auf Datenalyse spezialisiert ist.

Das Data Warehouse soll die Integration von unterschiedlichsten Daten aus unterschiedlichen Quellsystemen in ein zentrales System (“Single Point of Truth”) gewährleisten. Durch die Seperation d.h. Trennung von operativen Systemen und Analysesystemen können auch komplexe Abfragen die Last der Systeme nicht beeinflussen.

Es muss die Datenextaktion aus Quellsysteme durchgeführt und Integrationsschicht für die Harmonisierung der Daten vorgenommen werden. Danach werden die Daten im Data Warehouse Data Marts (Kopien von Ausschnitten für relevante Abteilungen zum Schutz und Performance) verteilt.

Folgende Aufgaben existieren in einem Data Warehouse:

  • Datenbeschaffung und Integration von Systemen (auch die Aktualisierung)
  • Datenhaltung
  • Versorgung der Data Marts
  • Datenanlyse und Reports

Dazu wird der klassische ETL-Prozess verwendet:

  • Extraktion – Regelmäßige Abzüge der Daten (automatisiert oder pro Anfrage)
  • Transformation – Vereinheitlichung von Daten z.B. Datumsformat, doppelte Einträge löschen
  • Load – Speicherung in der Zieldatenbank

Folgende Fragen kann man sich bei der Einführung eines Data Warehouse stellen:

  • System – Welches System wird benötigt?
  • Kompetenzen – Kompetenzen im Unternehmen vorhanden oder externe Berater involvieren?
  • Parameter – Welche Abteilung benötigt welche Daten? Welche Zugriffsbeschränkungen? Wie häufig muss aktualisiert werden?

Im Data Warehouse gibt es natürlich auch ein paar Herausforderungen. Diese betreffen häufig den Datenschutz. Auch die Datenvermeidung / Datensparsamkeit muss gewährleistet werden d.h. persönliche Daten müssen anonymisiert oder pseudonymisiert werden.

Ein Data Warehouse ist notwendig für unternehmensweite Kennzahlen ausgehend vom “Single Point of Truth” zu gewährleisten. Für die objektive Beurteilung der Zahlen darf aber auch der zum Teil hoher initialer Aufwand nicht aus den Augen verloren werden.

0 Kommentare

Hinterlasse einen Kommentar

An der Diskussion beteiligen?
Hinterlasse uns deinen Kommentar!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.