 |
|
BI und Open Source: Interessante Nischen
|
|
(April 2007)
|
Inhalt dieses Artikels:
Open Source Data Warehouse ist technologisch
möglich | Basis der Open-Source-Projekte
zu BI ist schmal | Open-Source-Komponenten ermöglichen
individuelle BI |
|
| |
|
Autor: Stefan Keller, Berater für Anwendungsarchitekturen
Im "Commodity"-Markt für Business Intelligence
(BI)-Produkte ist der Einsatz von Open-Source-Komponenten eine ernst
zu nehmende Alternative. Das zeigt die Entwicklung: Denn in den
letzten Jahren sind die Vorbehalte gegen den Einsatz von Open-Source-Software
(OS-Software) auf breiter Front überwunden worden. Darum stellen
sich viele IT-Verantwortliche heute die Frage, ob eine OS-Strategie
auch für BI sinnvoll sein kann. Diese Überlegungen sind
nicht aus der Luft gegriffen, wie ein Blick auf den BI-Markt zeigt.
Stefan Keller, Experte für Anwendungsarchitekturen, fasst in
der jüngsten Ausgabe (01/2007) der Fachzeitschrift BI-SPEKTRUM
zusammen.
Die Mehrzahl der Angebote für BI-Software orientiert sich
am De-facto-Standard für die technische Architektur von Data
Warehouses: Mit einem Datenintegrationswerkzeug wird eine relationale
Datenbank befüllt, auf der die OLAP-Infrastruktur (Online
Analytical Processing) und das Standardreporting aufsetzen. Die
großen Hersteller von relationalen Datenbanken und die Schwergewichte
im BI-Markt bieten für diese Architektur Komplettlösungen
an, was die spezialisierten Anbieter unter Preisdruck setzt. Die
Produkte unterscheiden sich in ihrer Funktionalität kaum noch,
gleichzeitig sind echte Innovationen rar. Gerade in derartigen "Commodity"-Märkten
haben OS-Projekte gute Erfolgschancen, sei es (wie bei Linux) durch
Imitation erfolgreicher Produkte oder (wie im Fall von Eclipse
Business Intelligence Reporting Tool, BIRT) durch Investitionen
von Produktanbietern, die ihre Zukunft im Geschäft mit Add-ons
und Support sehen. Mit fortschreitender Standardisierung der Data-Warehouse-Technik
liegt es auch zunehmend näher, im OS-Umfeld nach passenden
Komponenten zu suchen.
|
| Open
Source Data Warehouse ist technologisch möglich |
 |
| |
|
|
Derzeit gibt es rund zwei Dutzend OS-Projekte zu den verschiedenen
Facetten der Business Intelligence, die fast alle auf J2EE-Technologien
ausgerichtet sind. Das Angebot an Lösungen zur Integration
von Massendaten ist hingegen schmal: Einzig Kettle enthält
eine GUI-Komponente zur Konfiguration von Transformations- und
Ladeprozessen, während andere Projekte primär Werkzeuge
zur Programmierunterstützung (Codegeneratoren und Frameworks)
entwickeln.
Als OS-Datenbanken für Business Intelligence kommen vor allem
MySQL und PostgreSQL in Betracht. MySQL glänzt bei den BI-typischen
komplexen Lesezugriffen mit hoher Geschwindigkeit, lässt aber
im aktuellen Release noch einige für das Data Warehousing
wichtige Features wie partitionierbare Tabellen vermissen. PostgreSQL
enthält hingegen alle wichtigen Datenbankfunktionen, erreicht
jedoch derzeit nicht die Performance von MySQL.
OLAP-Funktionalität ist im Open-Source-Umfeld beinahe ein
Synonym für Mondrian, einen in Java geschriebenen OLAP-Server.
Dieser ermöglicht mit den OLAP-Abfragesprachen MDX und XML/A
den Zugriff auf SQL-Datenbanken. Mondrian selbst hat kein Frontend,
aber mit der Bibliothek JPivot kann man Mondrian-Abfragen über
Java Server Pages in Weblösungen integrieren. Eine Alternative
zu JPivot ist OpenI mit dem Anspruch einer "Out of the Box"-Lösung.
Die bekanntesten OS-Produkte für die Reporterstellung sind
JasperReports und Eclipse BIRT. JasperReports ist eine Rendering-Bibliothek
zur Erzeugung von Standardreports innerhalb von J2EE-Anwendungen
und dürfte das am häufigsten eingesetzte OS-BI-Produkt
sein. BIRT ist das Reporting-Plug-in der Eclipse-Entwicklungsumgebung.
Seine Entwicklung wird massiv von der BI-Softwarefirma Actuate
unterstützt. Schon dieses Schlaglicht zeigt, dass ein Data
Warehouse aus OS-Komponenten technisch möglich ist. Aber -
ist es auch empfehlenswert?
|
|
| Basis
der Open-Source-Projekte zu BI ist schmal |
 |
| |
|
|
Erfolgreiche OS-Lösungen haben fast immer eine breite Community,
die sich aktiv an Entwicklung, Fehlersuche und Dokumentation beteiligt.
In den meisten BI-Projekten findet man dagegen nur eine Handvoll
aktiver Mitarbeiter. Das muss nicht gegen die Qualität der
Software sprechen. Aber das oft für OS vorgebrachte Argument "die
Community hilft bei Problemen besser als die Hotline des Anbieters" wird
fragwürdig, wenn nur wenige Personen das notwendige Know-how
haben. Kommerziellen Support gibt es nur für einzelne Produkte
(etwa JasperReports).
Ein weiteres Hindernis für die Nutzung von OS-Software im
Umfeld der Business Intelligence ist, dass es keine Standardschnittstellen
gibt. Um aus OS-Produkten ein Data Warehouse zu bauen, muss Individualsoftware
programmiert werden, welche die Komponenten miteinander verknüpft.
Aufgrund der kleinen Communities gibt es dafür wenig Referenzmaterial.
Kommerzielle Produkte bieten einen vor-integrierten Produktstack,
der dem Kunden diese Arbeit abnimmt. Allerdings hat das Startup-Unternehmen
Pentaho in den letzten Monaten wichtige OS-Projekte wie Mondrian
und Kettle unter seinem Dach zusammengeführt, um so eine quelloffene
Standardplattform für BI-Projekte am Markt zu etablieren.
Es gibt aber noch kein vollständiges Release, geschweige denn
Referenzkunden.
Die Entscheidung für OS-Produkte in einem Data-Warehouse-Projekt
bringt also erhebliche "First mover"-Risiken mit sich.
Gleichzeitig relativiert der Preisdruck im BI-Markt mögliche
Kostenvorteile von OS-Lizenzen. Darum drängt sich der Schluss
auf, dass OS-Produkte auf absehbare Zeit im Data Warehousing keine
große Rolle spielen werden.
|
|
| Open-Source-Komponenten
ermöglichen individuelle BI |
 |
| |
|
|
Trotzdem wäre es ein Fehler, Open Source Business Intelligence
als für den professionellen Einsatz nutzlos abzutun. Viele
Unternehmen benötigen außer den klassischen BI-Systemen
auch individuell entwickelte, hochspezifische Recherche-Logik,
oft auch mit Update-Funktionalität. Die Umsetzung solcher
Anforderungen durch Customizing einer Standardsoftware wird leicht
so aufwändig wie eine Eigenentwicklung. Außerdem kann
ein Releasewechsel des Produkts kostspielige Anpassungen der individualisierten
Systemkomponenten erzwingen. Von den Effizienzvorteilen der Nutzung
eines Standardprodukts bleibt dann wenig übrig.
In einer solchen Situation bieten sich quelloffene Komponenten
als Alternative an. Sie erlauben es, Individualsoftware auf J2EE-Basis
mit kontrolliertem Aufwand um fortgeschrittene Funktionalität
wie OLAP zu ergänzen, die bisher kommerziellen Produkten vorbehalten
war. Durch gezieltes Prototyping können dabei die Risiken
des Komponenteneinsatzes beherrscht werden – die notwendigen
Entwicklungs- und Testkompetenzen sollten im Projektteam ohnehin
vorhanden sein.
Angesichts des Trends zur zeit- und damit quellnahen Analyse von
Daten ist mit einer Zunahme der Bedeutung von individuell entwickelten
BI-Applikationen zu rechnen. Open Source Business Intelligence
könnte dabei zukünftig eine bedeutende Rolle spielen
- allerdings nicht, wie viele ihrer Protagonisten es sich derzeit
vorstellen, als geschlossener Produktstack, sondern als Baukasten
von flexibel nutzbaren Komponenten.
|
|
Mehr Informationen zum Thema BI erhalten Sie in der Zeitschrift
BI-SPEKTRUM ,
herausgegeben
vom Verlag SIGS-DATACOM GmbH.
Verlag und Autor behalten sich alle Rechte am Artikel vor. © 2007
SIGS-DATACOM GmbH |
|
|
|
Noch mehr Fachwissen über Business Intelligence? GULP Member erhalten 10 % Rabatt auf das BI-SPEKTRUM Jahresabonnement.
|
|
Kommentare zu diesem Artikel:
|