Referenzen im Bereich Data Science
Kunde: Energieversorger

Herausforderung
Anhand des Stromverbrauchs eines Haushalts soll entdeckt werden welche Geräte in welcher Zeit benutzt wurden. Als Datengrundlage stehen Zeitreihendaten zur Verfügung, welche im 15 Minuten Takt aggregiert zur Verfügung gestellt wurden.
Ansatz
Verwendete Machine Learning Algorithmen:
- Neuronale Netzwerke (im speziellen ein Convolutional Neuronal Network) zur Erkennung der angeschalteten Geräte.
- Genetische Algorithmen basierend auf Bayes, welche zunächst die einzelnen Verbraucher analysieren und dann dafür verwendet werden um den Gesamtverbrauch zu entdecken.
Verwendete Technologien:
TensorFlow
Keras
Python
C++
Kunde: Telekommunikationsunternehmen

Herausforderung
Bei einem großen Telekommunikationsanbieter entwickeln wir Algorithmen im Bereich Natural Language Processing, damit Maschinen gesprochene Sätze besser verstehen können. Auf Grundlage unserer Entwicklungen gibt die Maschine, ähnlich wie Amazon Alexa, Antworten zurück.
Ansatz
Die Algorithmen werden in Python entwickelt. Zur Speicherung der Daten verwenden wir Elasticsearch, welches auch für das Monitoring verwendet wird.
Außerdem erstellen wir auf Grundlage von Docker, Kubernetes, Java und Kafka eine hoch skalierbare und hochverfügbare Infrastruktur für Machine Learning Services.
Verwendete Machine Learning Algorithmen:
- Verschiedene Algorithmen im Bereich Natural Language Understanding, Natural Language Processing
Verwendete Technologien:
Python
Docker
Kubernetes
Java
Kafka
Elasticsearch
Kunde: Staatliche Ölfirma

Herausforderung
In diesem Projekt sollte die Wahrscheinlichkeit von Ölvorkommen im Meer vorhergesagt werden. Anhand von Sonardaten, welche die Dichte Unterwasserbodens gemessen haben wurden Bodentypen gruppiert und klassifiziert werden.
Ansatz
Die Klassifikation wurde u.a. mit k-nearest neighbour Algorithmen im Tool Weka klassifiziert. Explorative Datenanalyse wurde in MATLAB durchgeführt, und es wurde ein Visualisierungstool in C++ entwickelt, um das Profil des Bodens zu verstehen und die Wahrscheinlichkeit von Ölvorkommen in verschiedenen Regionen des untersuchten Gebiets zu bestimmen.
Verwendete Machine Learning Algorithmen:
- u.a. K-nearest Neighbour
Verwendete Technologien:
MATLAB
C++
Kunde: Medienunternehmen

Herausforderung
Anhand von Machine Learning Methoden sollen Videoszenen automatisch getaggt werden. Die Use Cases reichen von der Anzeige kontextueller Werbung auf Smart TVs, bis hin zur Erkennung von Jugendschutz. Es sollen u.a. Personen, Handlungen der Personen, Objekte erkannt und klassifiziert werden.
Ansatz
Verwendete Technologien:
Python
Docker
TensorFlow, Caffe, OpenCV
PostgreSQL