Talend ist eine Open Source Lösung für ETL, was bedeutet Extract (Extraktion), Transform (Transformation) und Load (Laden). Dabei werden Daten aus verschiedenen Datenquellen extrahiert und in das Format und Datenschema der Zieldatenbank umgewandelt. Anschließend werden die dabei gewonnenen Informationen in die Zieldatenbank geladen. ETL-Prozesse werden u.a. verwendet, um ein Data Warehouse aufzubauen und zu betreiben. Das Talend Open Studio ist eine umfangreiche und vollständige Lösung für ETL. Dank des grafischen Business-Modeller ist sie auch für Nicht-Entwickler gut zu bedienen. |
Unterstützung zahlreicher Schnittstellen und Datenformate
Talend Open Studio (TOS) wird von der französischen Open Source-Firma Talend entwickelt und unter
der GPL vertrieben. Die Besonderheit von Talend ist seine doppelte Funktionsweise: Anders als die
meisten
ETL-Tools lässt sich Talend nicht nur für die
Zusammenführung von Daten aus verschiedenen Quellen (ETL) einsetzen, sondern auch für das Update
eines gesamten Data Warehouse geht. Dann nämlich ist die Vorgehensweise Extract, Load, Transform
(ELT) günstiger und effizienter.
Talend ist ein Code-Generator. Das bedeutet, die ETL-Prozesse werden zunächst grafisch modelliert. Dann wird Code generiert, der anschließend mit Talend Open Studio oder auf dem Server ausgeführt wird. Die Modellierung der Prozesse ist dank des grafischen Business Modeller sehr einfach – sie erfolgt per Drag&Drop.
Talend bringt zahlreiche Schnittstellen für die Verbindung zur Datenbank mit und unterstützt verschiedene Datenformate wie Excel, CSV und XML. Außergewöhnlich ist die hohe Anzahl an Konnektoren (250) zu den gängigen Datenbanken, CRM-Systemen und ERP-Anwendungen wie SalesForce, Sugar CRM oder Centric CRM.
Talend ist ein Code-Generator. Das bedeutet, die ETL-Prozesse werden zunächst grafisch modelliert. Dann wird Code generiert, der anschließend mit Talend Open Studio oder auf dem Server ausgeführt wird. Die Modellierung der Prozesse ist dank des grafischen Business Modeller sehr einfach – sie erfolgt per Drag&Drop.
Talend bringt zahlreiche Schnittstellen für die Verbindung zur Datenbank mit und unterstützt verschiedene Datenformate wie Excel, CSV und XML. Außergewöhnlich ist die hohe Anzahl an Konnektoren (250) zu den gängigen Datenbanken, CRM-Systemen und ERP-Anwendungen wie SalesForce, Sugar CRM oder Centric CRM.
Weitere Bestandteile im Portfolio
Neben der klassischen Datenintegration finden sich Master Data Management und Data Quality im
Portfolio des ETL-Experten. Im Folgenden werden sowohl Features der beiden Komponenten, als
Einsatzmöglichkeiten vorgestellt.
Master Data Management
Talend bietet Ihnen professionelle Lösungen für Master Data Management (MDM) in Ihrem
Unternehmen. Oftmals erschwert die komplexe Verwaltung von Unternehmensdaten auch die
Zusammenarbeit.Mithilfe von MDM können Stammdaten eines Unternehmens gepflegt und verwaltet werden.
Denn es liefert eine komplette Übersicht über alle relevanten Unternehmensdaten. Informationen und
Merkmale von Kunden, Lieferanten oder Produkten sind stets abrufbar.
Einzelne Geschäftsbereiche können auf diese Weise besser kontrolliert werden. Zudem trägt MDM einen wesentlichen Beitrag zur Kosteneffizienz und Optimierung von Prozessen in Ihrem Unternehmen bei.
Einzelne Geschäftsbereiche können auf diese Weise besser kontrolliert werden. Zudem trägt MDM einen wesentlichen Beitrag zur Kosteneffizienz und Optimierung von Prozessen in Ihrem Unternehmen bei.
Talend verfügt über eine Enterprise- und eine Community-Edition des MDM. Beide Versionen
sollen im Folgenden kurz vorgestellt werden:
Community Edition
Die kostenlose Community Edition eignet sich zur Umsetzung kleinerer Projekte. Sie bietet
Usern ein Active Data Model und eine Business User-Oberfläche.
Die Community Edition umfasst u.a. folgende Features:
- Domaingesteuerte Integration
- Data Profiler und Data Augmentation im Bereich Datenqualität
- Authoring und Such-Tool
- Hierarchie-Management
Enterprise Edition
Die Enterprise Edition enthält noch weitere, zusätzliche Features wie beispielsweise:
- SOA-Konsole
- Kommunikation in Echtzeit
- Workflow
- Hub-Versionierung
- Remote Management
Alles in allem ergeben sich durch ein agiles MDM zahlreiche
Vorteile für die Leistungsfähigkeit eines Unternehmens:
- Steigende Datenqualität
- Effektives Marketing
- Verbesserte Teamkoordination
- Optimierung der Berichterstattung
Datenqualität mit Talend
Sie suchen einfache Wege und Mittel, um ihr bisheriges Datenmanagement zu verbessern? Fakt
ist, dass sich mit einem ausgereiften Data Management Business-Lösungen optimieren lassen. Durch
den Einsatz von Data Quality-Tools können einzelne Unternehmensbereiche besser zugänglich gemacht
werden. Grund dafür ist, dass Daten problemlos in einzelne Projekte geladen werden können.
Ziel von Datenqualität ist es, Daten störungsfrei in andere Daten zu transformieren und dabei einen wesentlichen Beitrag zu professionellem Datenmanagement zu leisten. Fehlerhafte Daten können hierbei einfach erkannt werden, sodass einer Verzerrung entgegen gewirkt wird.
Möglichkeiten von Talends Datenqualität:
- Data Profiling: Analyse von Problemen in der Datenqualität sowie Messung der Entwicklung von Data Quality im Zeitablauf
- Data Cleansing: Optimierung der Datenqualität mithilfe von standardisierten Referenzdaten bzw. Value-Add-Informationen; Vergleich der Daten mit anderen Datenbanken
- Data Quality Portal: Ergebnisse von Analysen bzw. Reports verwenden
- Data Explorer: detailliertere Darstellung von Tabellen aus Datenbanken (Drill-Down)
- Erkennen von Duplikaten
- Bereinigung von Daten
- Anreicherung von Daten
Die Ancud IT berät Sie gerne hinsichtlich Planung und Einsatz von Data Quality-Tools in Ihrem
Unternehmen!
