


Good data quality can save lives
In a pro-bono project facilitated by DataKind we had the great opportunity to join a team of volunteer data scientists to enable the Lwala Community Alliance to monitor the quality of their data.

Our talks at PyCon DE/PyData Berlin
At this year’s PyCon DE & PyData Berlin, we presented our learnings and experiences in two talks. These covered very different aspects of data work: On the one hand, we showcased predictive modeling applications in wind turbine maintenance and the challenges of anomaly detection. In a different presentation, we explained why code reviews are still important for data science tasks and how we can apply them to benefit from the effort.

Live Demo: MIP Daten in Power BI
Live-Demo mit smart factory Shopfloor-Daten verschiedener Maschinen die über die Integrationsplattform MIS von mpdv nach Power BI

Back to School – Einblicke ins Berufsfeld Data Science
Im Rahmen einer Projektwoche an der Königin-Luise-Schule in Köln haben wir uns gefreut, Data Science als verhältnismäßig junges Berufsfeld vorstellen zu dürfen und den Jugendlichen einen Einblick in einen typischen Werdegang und in unseren Berufsalltag zu geben.

Serverless Spark ETL Pipelines und Orchestrierung mit AWS Glue und Step Functions
Für unseren Biotech-Kunden Centogene wurde nach einer leichtgewichtigen Lösung für Spark Jobs gesucht, um die zusätzliche Komplexität von Lösungen wie Google Dataproc oder AWS EMR sowie von manchen Orchestrierungstools zu vermeiden. Unsere Wahl fiel auf AWS Glue und AWS Step Functions.

Review 2021
Wieder ein Jahr mit Corona. Aber auch wieder ein Jahr, in dem wir große Erfolge feiern durften.

Power BI Solution Deutsch
Die Power BI Plattform ist ein zentraler Bestandteil unseres Technologiestacks, wenn es darum geht relevante Informationen effizient, aktuell und verständlich aufzuarbeiten und zu visualisieren. Nutzen Sie diesen Solutions-Showcase, um die Möglichkeiten der Plattform näher kennenzulernen und sich von unseren Lösungskompetenzen zu überzeugen.

Reicht auch Power BI only für mein Projekt?
Fragt sich so mancher Entwickler angesichts immer mehr Funktionsumfang und Enterprise Readyness auf Seiten Microsoft Power BI. Normalerweise beinhalten BI Projekte spezialisierten Komponenten wie zur Persistenz (Datenbanken, Data Lake & co.) oder für ETL. Power BI deckt den kompletten Bereich einer BI Lösung ab. Aber gibt es Dinge die gar nicht gehen in Power BI, wo sind Schwächen und gibt es das typische Power BI Projekt? Dieses spannende Thema wird in der Session diskutiert!

User Behavior in iNaturalist’s City Nature Challenges
At scieneers, social engagement is an important goal that we pursue with value-creating and sustainable projects. We are particularly interested in using our knowledge of data and our technical skills for "data for good" projects and sharing them with others. The following project from the CorrelAid network aims to investigate the internal dynamics of citizen science communities, in particular how users of such communities behave and what roles they take.

Wie finde ich eine zu mir passende Stelle?
Du weißt, dass du im IT Bereich arbeiten möchtest, fragst dich aber, wie du eine Stelle findest, bei der du glücklich wirst?
Genau diese Frage hat mich vor einem Jahr beschäftigt. Nach einem Quereinstieg als Software Entwicklerin stellte ich nach einem guten Jahr Berufserfahrung Unzufriedenheit fest. Um der Ursache auf den Grund zu gehen, befasste ich mich damit, was mir in meinem Job eigentlich wichtig ist -- basierend auf meinen bisherigen Erfahrungen in Studium, Praktika und Beruf.

Realtime Data Integration mit Azure Service Bus & Azure Logic Apps & Dataverse
Realtime Data Integration mit Azure Service us & Azure Logic Apps & Dataverse

Application Lifecycle Management in der Azure Data Factory
Vorstellung von Methoden, Technologien und Best Practices wie man in der Azure Data Factory strukturiert und sicher entwickeln kann, in dem man die Integration und Dienste von Azure DevOps nutzt

Künstliche Intelligenz in der Betriebsoptimierung von erneuerbaren Erzeugungsanlagen bei der EnBW
Die Künstliche Intelligenz und das Maschinelle Lernen wird immer mehr zu einem alltäglichen Begleiter und hält somit auch Einzug in die Energie-Branche. Im Rahmen eines Projekts bei der EnBW stellten wir Untersuchungen zu dem bereits implementiertem Predictive Maintenance System, das Schäden in Erzeugungsanlagen rechtzeitig erkennen soll, an und testeten zusätzlich neuere Algorithmen zur rechtzeitigen Schadenserkennung in Windkraftanlagen.

Advanced security of PaaS based Azure data applications – from setup to ALM
I want to share my experience from my projects of creating data applications from a security perspective, covering cloud infrastructure and application parts, as well as application lifecycle challenges during CI/CD. We‘ll go through examples how to handle secrets savely and manageable and configure Azure resources with diverse security concepts.

Data engineering pattern in der Azure Data Factory
In dem Vortrag werden die typischen Muster für Datenverarbeitung in der Azure Data Factory aufgezeigt und verglichen. Das wird abgerundet mit best practices zum Application Lifecylce Management.

Microsoft Certified Data Monster
In der Aufzeichnung sprechen MVP Frank Geisler und Stefan Kirner über Microsoft Zertifizierungen im Allgemeinen und insbesondere für die Data Platform.
Warum sollte ich mich damit beschäftigen?
Was gibt es für Zertifizierungen von MS im Data Bereich?
Wie geht das mit der Anmeldung?
Wie bereite ich mich darauf vor?
Wie läuft so eine Prüfung ab?

Professionelles Arbeiten mit Jupyter Notebooks/Lab
Materialien zum Vortrag Professionelles Arbeiten mit Jupyter Notebooks/Lab von Nico Kreiling

Five shades of dataflow
Talk is an overview of the "shades" of data flows in Power Platform and Azure Data Factory, their purpose and of course the technologies

Daten-Grundlagenarbeit in Python
Die erfolgreiche Umsetzung von Daten-Projekten erfodert einen gekonnten Umgang mit den elementaren Werkzeugen. Für das Heise Machine Learning Sonderheft haben wir eine Einführung in PyData Tools wie NumPy, Pandas und Scikit-Learn geschrieben.

Micrososft BI Consultants (w/m/d)
Kannst Du die Dinge tun, die Du für richtig hältst? Oder musst Du darauf warten, dass irgendjemand sein o.k gibt?

Ein kurzer Blick zurück
Ein turbulentes Jahr neigt sich dem Ende entgegen. Ein Jahr, in dem Corona praktisch alles überschattet hat. Dennoch können wir voller Dankbarkeit auf ein sehr erfolgreiches erstes Geschäftsjahr zurückblicken.

The political discourse on discrimination – how to use natural language processing for good
At this year’s CorrelCon, we presented our work in the OpenDiscourse project. Leveraging techniques from natural language processing, we analyzed the speeches held in the Bundestag.

Data Science and Agile in harmony – presenting the Agile Data Science Workflow
Building on practical experience, we developed an Agile Data Science Workflow that can be seamlessly integrated into different Agile frameworks. The workflow aims at fulfilling the needs of data scientists, scrum masters, product owners, and other stakeholders.

AutoML – A Comparison of cloud offerings
AutoML is the process of automatically applying machine learning to real world problems, which includes the data preparation steps such as missing value imputation, feature encoding and feature generation, model selection and hyper parameter tuning. Even though the research field on AutoML exists at least since its first dedicated workshop at ICML in 2014, real world usage just got applicable recently. This blog post compares the AutoML offerings of AWS, Google and Microsoft in a qualitative fashion.

Die scieneers community wächst!
Wir freuen uns sehr, dass sich die ersten Kolleginnen und Kollegen für die scieneers begeistern konnten. Mit diesem Team stellen wir uns gerne jeder Herausforderung, die das Daten-Business für uns bereit hält! Wo ihre Schwerpunkte liegen und was sie antreibt können sie selbst am besten beschreiben:

Microsoft BI Consultants (m/w/d)
Kannst Du die Dinge tun, die Du für richtig hältst? Oder musst Du darauf warten, dass irgendjemand sein o.k gibt?

Was ist die Microsoft Data Platform?
Der Begriff steht im Allgemeinen für das Angebot an Data Management und Analytics Lösungen, die Microsoft klassisch für das Rechenzentrum des Kunden und in der Azure Cloud anbietet. Aber was beinhaltet das genau? Welche Tools sind gemeint und was gehört zusammen? Im Folgenden werden diese Möglichkeiten in drei verschiedene technologische Bereiche eingeteilt, inhaltlich beschrieben und grob abgegrenzt.

Der Anfang ist gemacht.
Nach den ersten Wochen am Markt ziehen wir schon mal ein erstes positives Fazit: Die ersten Kunden und Partner konnten wir für uns gewinnen.

Hello World, wir sind die scieneers! Wir sind “driven by data”.
Zugegeben, es ist nicht die beste Zeit, um mit einem neu gegründeten Unternehmen an den Markt zu gehen. Wir haben uns entschieden es trotzdem zu tun. Warum wir überzeugt sind, dass es trotz oder gerade wegen Corona der richtige Schritt ist, möchten wir Euch mit diesem Blogpost kurz erklären.