Open Source Data Warehouse und Business Intelligence

Vortragender

Balázs Bárány, DiTech

Inhalt

Jedes Unternehmen, in dem Daten in größeren Mengen anfallen, kann von
einem Data Warehouse (DWH) und den dazu gehörenden Analyse- und
Auswertungsmöglichkeiten profitieren. Dies wird insgesamt als Business
Intelligence (BI) bezeichnet.

Der Bereich der BI-Lösungen war bis vor kurzem von teuren proprietären
Anbietern dominiert; in den letzten Jahren ist jedoch ein großes
Ökosystem von Open-Source-Projekten entstanden, die alle Aspekte eines
Data Warehouses und der darauf basierenden Business-Intelligence-Lösung
abdecken. Das erlaubt auch kleinen und mittleren Betrieben, ihre Daten
besser zu nutzen.

Ich stelle am Beispiel der Firma DiTech die grundlegenden Komponenten
eines DWH und einer BI-Lösung vor und zeige ihre Integration sowie die
Vorgehensweise bei der Entwicklung einer Business-Intelligence-Lösung
fürs Unternehmen.

Die vorgestellten Komponenten sind:

- PostgreSQL als Datenbank (Optimierung für Analyse)

- Pentaho Data Integration für den Datenimport ins DWH

- Pentaho BI Server: Web-Oberfläche, die Berichte und
Analysemöglichkeiten für Endanwender zugänglich macht

  - Berichtserstellung: Pentaho Reporting und JasperReports/iReport

  - Online Analytical Processing (OLAP): Mondrian und JPivot

  - Data Mining: Weka

- Empfehlenswerte Literatur

Kurz wird auch auf andere Open-Source-Lösungen, die ähnliche Bereiche
abdecken, sowie auf Fachliteratur eingegangen, um dem Publikum die Möglichkeit einer informierten Auswahl zu bieten.