Big Data in der Praxis

Welchen Nutzen hat Big Data für unser Unternehmen?

Wie gelingt die Migration bestehender Systeme auf Big Data?

Wie kann ich Hadoop  unter meine SQL basierten Systeme bringen?

Welche Chancen bietet Spark?

Gerne erörtern wir mit Ihnen gemeinsam die Antworten auf diese spannenden Fragen und viele mehr rund um Thema Big Data. Kontaktieren Sie uns, um einen Beratungstermin zu vereinbaren, informieren Sie sich über unser Einsteigerpaket Big Data oder werden Sie Mitglied des Big Data Lab e.V.

Wir unterstützen Unternehmen bei der Einführung von Big Data

  • Technologie- und Architekturberatung zu Big Data, Hadoop, Spark, Cassandra, Pig, Hive  etc.
  • Analyse Ihrer Anwendungsfälle und Herausarbeiten der richtigen technischen Umsetzung
  • Begleitung der Migration und Integration Ihrer bestehenden Infrastruktur mit Ihren Big Data Anwendungen
  • Betrieb, Administration, Clustern und Sizing von Hadoop Installationen
  • Workshops, Schulungen, Trainings zu Big Data, Hadoop
  • Entwicklung von Big Data IT-Lösungen.
  • Erstellung von Big Data Stacks auf Basis von Hadoop und analytischer Frontends wie Pentaho   
  • Migration von Altsystemen auf  Big Data / Hadoop
  • Performance Vergleiche auf Ihren Datenstrukturen mit Hadoop und Spaltenbasierten Alternativen Exsasol, Infobright, MongoDB
  • Vergleiche von Hadoop Distributionen

Ursprünglich von Amazon, Google und Yahoo entwickelt, läßt sich Big Data heute auch in klassischen Firmen vielfach anwenden. Die Fragestellungen werden dabei häufig durch die 3V

  • Volume – Umgang mit extremen Datenmengen –,
  • Velocity – Beschleunigung von Auswertungen und Zugriffszeiten – und
  • Variety – Erschließung unstrukturierter Daten –

beschrieben.


Big Data und NoSQL

Big Data ist eng verwandt mit dem NoSQL-Trend und der sogenannten polyglotten Persistenz. Seit den 70er Jahren wurden im Enterprise-Umfeld im Großteil der Fälle relationale Datenbanksysteme (RDBMS) für Datenhaltung und -verarbeitung eingesetzt. Diese Systeme sind großartig für klassische Anwendungen wie Buchhaltung, Enterprise Resource Planning (ERP) oder Customer Relationship Management (CRM). Bei typischen Big Data Anwendungen versagen klassische RDBMS – und zwar nicht, weil sie noch nicht ausgereift sind, sondern aus prinzipiellen unumstößlichen Gründen. Die Idee hinter NoSQL und polyglotter Persistenz ist es, die richtige Datenhaltungslösung für den richtigen Zweck einzusetzen.

Das ist das genaue Gegenteil dessen, was man in der Unternehmens-IT häufig antrifft: Die Datenbank eines einzigen großen Datenbankherstellers wird teuer eingekauft und gilt ab sofort unternehmensweit als gesetzt – obwohl sie für einen Großteil der Anwendungsfälle gar nicht optimal geeignet ist. Für viele Anwendungsfälle gibt es etablierte Workarounds wie Object Relational Mapper (ORM). Viele andere Anwendungsfälle sind mit klassischen Datenbanken gar nicht realistisch umsetzbar und hier kommen Big Data Lösungen ins Spiel.

NoSQL und serviceorientierte Architektur

Polyglotte Persistenz wird möglich durch einen Paradigmenwechsel in modernen Enterprise-Infrastrukturen. In althergebrachten Legacy-Infrastrukturen steht häufig die Datenbank eines großen Herstellers im Mittelpunkt aller Integrationsansätze. Das erzeugt Abhängigkeit und Unflexibilität. Bei Fusion zweier Unternehmen mit traditioneller Kerninfrastruktur sind die enormen möglichen Synergieeffekte kaum zu realisieren. Heutzutage sind Anpassungsfähigkeit und die schnelle Reaktion auf Marktveränderungen aber ein zentraler Wettbewerbsvorteil.

Eine serviceorientierte Architektur ermöglicht diese Flexibilität durch lose Kopplung von Geschäftsanwendungen. Dabei handelt es sich zunächst um ein Konzept, das losgelöst von der technischen Umsetzung ist. Ob mächtige Services mit einem ausgewachsenen ESB oder Micro-Services mit leichtgewichtigeren Integrationsmustern oder andere Lösungen das richtige für ein Unternehmen sind hängt vom Einzelfall ab. Das Konzept bleibt aber das gleiche. Geschäftsfunktionalität wird in Services gekapselt und für andere Systeme oder Endnutzer zugreifbar gemacht. Die technische Umsetzung wird vor den Nutzern der Services versteckt. Dadurch gewinnt das Team, das eine Lösung verantwortet, die Freiheit, die besten Komponenten für den jeweiligen Einsatzzweck zu wählen.

Big Data und Business Analytics

Business Analytics ist ein großer Treiber des Big Data Trends. Klassische Business Intelligence liefert strategische Entscheidungsunterstützung. Bereits hier können detailliertere Daten Mehrwert generieren. Hier kommen beispielsweise spaltenbasierte In-Memory Datenbanken zum Einsatz oder auch verteilte Suchengines, um die richtigen Daten schnell verfügbar zu haben.

Moderne Business Analytics Lösungen gehen noch einen Schritt weiter und verzahnen sich mit dem Kerngeschäft. Statt reiner Analysen werden Daten operationalisiert und ermöglichen datengetriebene Geschäftsmodelle. Die Vorteile sind erheblich:

  • Eine stärkere Automatisierung des Kerngeschäfts wird erreicht.
  • Statt aggregierter Information über Kunden/Abläufe/... werden einzelne Kunden/Abläufe/... in den Fokus gerückt.
  • Automatische Einzelfallentscheidungen werden möglich – z.B. zielgerichtete personalisierte Kundenansprache oder technische Steuerung komplexer Prozesse.
  • Veränderungen und Schwankungen im Geschäft werden simultan erkennbar und steuerbar.