Data Science Beratung

Die Leistungen von Ancud IT zu Data Science

Die Ancud IT-Beratung GmbH bietet Ihnen einen agilen und kollaborativen Ansatz, um Insights aus ihren Daten zu gewinnen. Wir beraten Sie gerne, um Ihr Data Driven Business zu fördern bzw. zum Leben zu erwecken. Außerdem beraten wir Sie in Methodiken und Prozessen im Bereich Data Science, Data Mining, Big Data Analytics und Predictive Analytics.

Mit der Verwendung von agilen Methoden liefern wir schnell erste Analysen Ihrer Daten. Zudem behalten Sie stets den Überblick über die aktuelle Projektentwicklung. Mit unserem technischen Setup können wir ohne große Zeitverluste Datenanalysen durchführen. Durch den Einsatz von Big Data Lösungen in der Cloud sind wir dazu in der Lage zu skalieren, um Ihnen ohne großen Aufwand nach Umsetzung des Proof of Concepts ein fertiges Produkt zur Verfügung stellen zu können. Wir verwenden vornehmlich Open Source Lösungen wie Apache Spark und sind Experten in wichtigen Analysesprachen wie Python und R. Außerdem profitieren Sie von unserem weitreichendem Wissen über Machine Learning Algorithmen, wie Deep Learning, Support Vector Machines und Random Forest.

Kollaboration

Agilität

Wegbereiter der digitalen Transformation

Das Data Science Team

Folgende Skills bringen unsere Data Scientists mit:

Ein Data Scientist verwendet mathematische Techniken und Algorithmen, um Lösungen für komplexe Business- und Wissenschaftsprobleme zu liefern. Er bedient sich dabei an Methoden, um Insights aus Daten zu gewinnen, die andernfalls nicht erreichbar gewesen wären.

 

Mathematische Skills

Statistik & Modellierung

Programmierkenntnisse / Software Engineering (Lifecycle, Testmanagement)

Business Know-How / Fachwissen

Data Warehousing / Big Data Wissen

Kommunikations- & Visualisierungskompetenz

Um einen Mehrwert zu generieren, kann ein Data Science Team zwei Lösungen bereitstellen: Analysen und Datenprodukte. Analysen tragen dazu bei, komplexe Zusammenhänge oder Trends für eine bessere Entscheidungsfindung zu entdecken. Datenprodukte sind Applikationen, denen Daten zugrunde liegen und diese durch Algorithmen als Ergebnisse präsentieren. Meist dient eine Analyse als Grundlage für die Datenapplikation.

Der Data Science Prozess

Businessverständnis

 

Am Anfang ist es sehr wichtig, das Problem welches gelöst werden soll zu verstehen. Das Problem wird von verschiedenen Seiten betrachtet und im iterativen Prozess eine Lösung erstellt. Das Problem wird in kleine Pakete geschnürt. In dieser Phase ergibt sich für den Data Scientisten eine erste Idee, welche Datenquellen benötigt werden, welche Modelle verwendet werden könnten und wie das Ergebnis aussehen soll (Datenprodukt oder Analyse). Hier werden alle benötigten Geschäftskennzahlen bestimmt, die vorhergesagt oder analysiert werden sollen. Auch werden hier Kriterien festgelegt, welche durch die Lösung erfüllt werden müssen.

 

Datenakquise und -verständnis

 

In diesem Schritt werden die Daten aus dem Quell- in das Analysesystem geladen. Zunächst muss ein Verständnis für die Daten aufgebaut werden und die Datenqualität überprüft werden. Daten aus der reellen Welt sind meistens nicht sauber, vollständig oder korrekt und müssen erst bereinigt werden. Auch haben die meisten Datenquellen einen speziellen Zweck, der nicht mit der aktuellen Frage übereinstimmt. In vielen Unternehmen gibt es verschiedenen Datenbanken für Kundendaten, Transaktionsdaten oder auch Daten aus der Webanalyse. Diese Datenbanken beinhalten verschiedene Informationen, sind auf einer unterschiedlichen Granularität oder haben eine unterschiedliche Datenqualität.

Nachdem das Verständnis für die Datenquellen aufgebaut ist und die Daten bereinigt sind, werden sie vereint und es wird an der Datenstruktur für die Lösung gearbeitet. Außerdem wird ständig überprüft, ob die Datenquellen ausreichend sind, um die Businessfrage zu beantworten oder ob neue Datenquellen angebunden werden müssen. Wurde die Frage in verschiedene Pakete geteilt, werden hier auch verschiedene Methoden für diese Pakete evaluiert.

 

Modellierung & Evaluierung

 

Das Ziel dieses Schrittes ist es, ein Modell zu entwickeln, welches die Businessfrage zufriedenstellend beantworten kann. Zunächst werden neue Attribute (Feature Engineering) entwickelt, die für das Modell wichtig sind. Anschließend wird das Modell trainiert, welches versucht das Ziel vorherzusagen. Hier werden Techniken aus dem Bereich „Machine Learning“, wie Deep Learning, Support Vector Machine oder Random Forest verwendet. Abschließend wird überprüft, ob das Modell für die Beantwortung der Frage geeignet ist. Dies wird anhand quantitativer Kriterien (Modell) und der im ersten Schritt festgelegten (qualitativen) Kriterien bestimmt.

 

Deployment

 

Um einen Return on Investment zu generieren wird im letzten Schritt das Modell in Produktion gesetzt. Eine Möglichkeit ist, dass das Modell direkt in den Business Prozess oder in das bestehende Data Warehouse integriert wird. Eine andere Möglichkeit ist, dass ein Datenprodukt entsteht, das eigenständig in die IT-Landschaft integriert wird. Außerdem gibt es die Möglichkeit, dass die gewonnenen Insights als Entscheidungsgrundlage präsentiert werden.

Unsere Experten von Ancud IT unterstützen Sie gerne bei der Planung und Realisierung von Data Science Projekten.

Ihr Ansprechpartner

Ulrich Zellbeck

Büro Berlin

+49 30 40006050