Schlagwortarchiv für: data science

Our talks at PyCon DE/PyData Berlin

At this year’s PyCon DE & PyData Berlin, we presented our learnings and experiences in two talks. These covered very different aspects of data work: On the one hand, we showcased predictive modeling applications in wind turbine maintenance and the challenges of anomaly detection. In a different presentation, we explained why code reviews are still important for data science tasks and how we can apply them to benefit from the effort.

Studierende zur Erstellung einer Masterarbeit (m/w/d)

Zur Verstärkung unserer Teams in Karlsruhe, Köln und Hamburg suchen wir Data Scientists / Data Engineers.

Review 2021

Wieder ein Jahr mit Corona. Aber auch wieder ein Jahr, in dem wir große Erfolge feiern durften.

Power BI Training

Wir möchten unseren Kunden mit unserem Power BI Training dabei helfen das Potential ihrer Unternehmensdaten vollständig zu nutzen!
Basis für den Einstieg und Einzel-Module für fortgeschrittene Anwender verfügbar sowie natürlich Beratung für ihre individuelle Data Challenge.

Professionelles Arbeiten mit Jupyter Notebooks/Lab

Materialien zum Vortrag Professionelles Arbeiten mit Jupyter Notebooks/Lab von Nico Kreiling

Daten-Grundlagenarbeit in Python

Machine Learning und intelligente Systeme werden immer allgegenwärtiger, vom Spam-Filter zum Chat-Bot, vom Staubsaugerroboter zum selbstfahrenden Auto. So unterschiedlich wie die Anwendungsszenarien, so vielfältig sind auch die zugrunde liegenden Verfahren. Deep Learning ist medial besonders breit vertreten und eignet sich für anspruchsvolle Probleme mit ausreichender Datenlage. Für tabellarische Daten hingegen sind die etablierten Klassifikations- und Regressions Algorithmen nach wie vor state-of-the-art. Diese können etwa von Cloud-Dienstleistern als Service eingebunden, mittels AutoML gefunden oder auch “von Hand” programmiert werden. Dabei gilt: Je untypischer und unsauberer die Daten, desto größer ist nicht nur der Aufwand, sondern auch das Verbesserungspotential von individueller Lösungen gegenüber fertigen Services.

Unabhängig davon, auf welche Art Machine Learning eingesetzt werden soll, lohnt es sich, die wesentlichen Grundlagen und Frameworks zu kennen, denn auch Cloud Services und AutoML-Tools nutzen unter der Haube ähnliche Prinzipien und Bibliotheken wie eine selbstentwickelte Lösung. In der vorherrschenden Python-Machine-Learning Welt sind vor allem NumPy, pandas und scikit-learn drei Frameworks, welche allgegenwärtig sind. Für das Heise Machine Learning Sonderheft haben wir daher einen entsprechenden Einführungsartikel geschrieben, welcher die wichtigen Prinzipen und Wirkungsweisen dieser Bibliotheken vorstellt und anschließend durch den manuellen Trainingsprozess eines einfachen Regressionsmodells führt.

Die interaktive Notebook-Version des Artikels ist frei zugänglich. Mittels Binder können Interessierte selbst Änderungen vornehmen, um spielend ein besseres Verständnis der Frameworks zu erlangen.

Ein kurzer Blick zurück

Ein turbulentes Jahr neigt sich dem Ende entgegen. Ein Jahr, in dem Corona praktisch alles überschattet hat. Dennoch können wir voller Dankbarkeit auf ein sehr erfolgreiches erstes Geschäftsjahr zurückblicken.

The political discourse on discrimination  –  how to use natural language processing for good

At this year’s CorrelCon, we presented our work in the OpenDiscourse project. Leveraging techniques from natural language processing, we analyzed the speeches held in the Bundestag.

Data Scientists / Data Engineers (m/w/d)

Zur Verstärkung unserer Teams in Karlsruhe, Köln und Hamburg suchen wir Data Scientists / Data Engineers.