Open Source Business Intelligence mit Pentaho
Pentaho ist einer der führenden Anbieter für kommerzielle Open Source Business Intelligence
Lösungen mit weltweit mehr als vier Millionen Produkt-Downloads. Mit der BI Suite von Pentaho
erhalten Unternehmen aller Größen eine
Collaboration-basierte, quelloffene
BI-Plattform. Zudem sind die Lizenzkosten bei
Pentaho äußerst gering. |
Pentaho setzt auf bewährte Open Source Frameworks
Pentaho integriert mehrere bewährte Open Source-Projekte aus dem Bereich Business Intelligence:
Mondrian (Analyse), Kettle (ETL), Weka (Data Mining) oder JFreeReport (Reporting). Auch ist die Integration von
Hadoop, ein freies, in
Java geschriebenes
Framework für
skalierbare, verteilt arbeitende
Software möglich. Mithilfe von Hadoop lassen sich intensive Rechenprozesse mit großen Datenmengen
auf Computer
clustern durchführen. Die einzelnen
Frameworks der Pentaho
BI-Lösung werden über eine
AJAX-basierte
Web 2.0-Oberfläche gesteuert, die auch für
End-User leicht zu bedienen ist. Über die User Console können alle Pentaho-User zentral auf die
BI-Daten zugreifen und mit ihnen arbeiten.
Die neue Version Pentaho 4
In der neuen Version 4 von Pentaho können ab sofort auch nicht-technische User Business-Analysen
durchführen. Zudem wurde die
Datenanalyse für Business-User verbessert. Der Fokus lag hierbei auf folgenden Bereichen:
Des Weiteren wurde der Pentaho Analyzer, mit dem sich Daten aus OLAP-Quellen analysieren lassen, verbessert. In Charts können Farben, Hintergrund, Schriftart etc. nun von einzelnen Benutzern angepasst werden. Neu sind außerdem multiple Charts, die basierend auf einem zusätzlichen Attribut die Erstellung weiterer Charts ermöglichen. So können beispielsweise Absatzzahlen unterschiedlicher Produkte in den einzelnen Verkaufsregionen über einen gewissen Zeitraum miteinander verglichen werden.
Erweitert wurde auch der Zugriff auf Daten. Datenquellen können nun komplett über die Weboberfläche hinzugefügt werden. Dabei können auch entsprechende Tabellen ausgewählt, miteinander verknüpft und schließlich dem End-User bereit gestellt werden.
Die neue Oberfläche von Pentaho 4
- Interaktives Dashboard
- „interaktives Reporting“ zum Erstellen von Adhoc-Berichten
- „Point & Click“-Zugriff auf alle Daten
- Überarbeitete Benutzeroberfläche, die vom User angepasst werden kann
- Höhere Usability
Des Weiteren wurde der Pentaho Analyzer, mit dem sich Daten aus OLAP-Quellen analysieren lassen, verbessert. In Charts können Farben, Hintergrund, Schriftart etc. nun von einzelnen Benutzern angepasst werden. Neu sind außerdem multiple Charts, die basierend auf einem zusätzlichen Attribut die Erstellung weiterer Charts ermöglichen. So können beispielsweise Absatzzahlen unterschiedlicher Produkte in den einzelnen Verkaufsregionen über einen gewissen Zeitraum miteinander verglichen werden.
Erweitert wurde auch der Zugriff auf Daten. Datenquellen können nun komplett über die Weboberfläche hinzugefügt werden. Dabei können auch entsprechende Tabellen ausgewählt, miteinander verknüpft und schließlich dem End-User bereit gestellt werden.
Die neue Oberfläche von Pentaho 4
Weitere Features in Pentaho
Guided Analysis
Designtools für Berichte, OLAP-Analysen und Dashboards bieten dem Nutzer von nun an einfache Möglichkeiten, Links von einem Dokument zu einem anderen zu definieren. Dadurch entstehen geführte Navigationspfade. Diese ermöglichen dem Nutzer wiederum, sich mit einem Klick weitere Details oder zusätzliche Informationen anzeigen zu lassen.
Dashboard Content Linking
Im Pentaho Dashboard Designer ist es nun möglich zwischen den Elementen im Dashboard, Links zu erzeugen. Dadurch kann man mit dem jeweiligen Element im Dashboard, z. B. ein Chart, die Filter eines anderen Elements, beispielsweise eine Tabelle, steuern. Dies lässt sich auf nahezu alle Elemente im Dashboard anwenden – egal ob Dashboard Charts, Datentabellen, Pentaho Reports oder Analyzer-Ansichten.
Data-less Design Mode für Analyzer Reports
Erstellt man im Pentaho Analyzer einen Analyzer- Report, so werden von nun an beim Gestalten des Report nicht mehr sofortige Abfragen an die Datenbank ausgeführt. Dadurch kann der Benutzer das Layout des Reports fertig erstellen, ohne auf die Rückgabe der vorläufigen Ergebnismenge der Daten warten zu müssen. Erst wenn der Benutzer das Layout fertig hat, werden entsprechende Abfragen an die Datenbank versendet und Daten geladen. Dies reduziert den Datenverkehr auf der Datenbank.
Vereinfachtes Hadoop Map/ Reduce-Jobdesign
In der neuen Version 4.1.2 von Pentaho Data Integration (PDI) gibt es neben den Verbesserungen in Stabilität und Performance neue Wege, die das Erstellen von ETL-Jobs auf Basis von Apache Hadoop vereinfachen. So wurden neue Input- und Output-Schritte hinzugefügt. Außerdem kann im Job-Ausführungsschritt nun eine Transformation für Map/Reduce-Verfahren angegeben werden.
Pentaho und seine Einsatzszenarien
Pentaho bietet flexible Entwicklungsmöglichkeiten. So kann das Produkt als eingebettete Komponente
in anderen Anwendungen, als angepasste BI-Lösung oder als vollständig integrierte out-of-the-Box
Plattform eingesetzt werden. Wer den gesamten Funktionsumfang von Pentaho nutzen möchte, benötigt
dafür einen
J2EE/JEE-
Applikationsserver.
ETL,
Reporting und viele andere Funktionen können
jedoch ebenso in Standalone-Anwendungen eingebunden werden. Durch die
LDAP-Anbindung und das Java
Single Sign-on ist es daneben möglich, Pentaho in
bestehende IT-Landschaften einzubinden. Wie beim Modell kommerzieller Open Source Software üblich,
ist die Pentaho Suite als kostenfreie Community Version erhältlich oder als kostenpflichtige
Enterprise Version, die ihren Lizenznehmern neben professionellem Support auch erweiterte Features
zur Verfügung stellt. Mögliche Einsatzszenarien von Pentaho sind:
- Vertriebs-, Profitabilitäts- und Kundenanalyse
- Personalreporting
- Finanzreporting
- Supply Chain Analyse
- Operatives Reporting
- Data Mining

Fachartikel Java Magazin