Professionelles Arbeiten mit Jupyter Notebooks/Lab
Materialien zum Vortrag Professionelles Arbeiten mit Jupyter Notebooks/Lab von Nico Kreiling
Five shades of dataflow
Talk is an overview of the "shades" of data flows in Power Platform and Azure Data Factory, their purpose and of course the technologies
Daten-Grundlagenarbeit in Python
Die erfolgreiche Umsetzung von Daten-Projekten erfodert einen gekonnten Umgang mit den elementaren Werkzeugen. Für das Heise Machine Learning Sonderheft haben wir eine Einführung in PyData Tools wie NumPy, Pandas und Scikit-Learn geschrieben.
Ein kurzer Blick zurück
Ein turbulentes Jahr neigt sich dem Ende entgegen. Ein Jahr, in dem Corona praktisch alles überschattet hat. Dennoch können wir voller Dankbarkeit auf ein sehr erfolgreiches erstes Geschäftsjahr zurückblicken.
The political discourse on discrimination – how to use natural language processing for good
At this year’s CorrelCon, we presented our work in the OpenDiscourse project. Leveraging techniques from natural language processing, we analyzed the speeches held in the Bundestag.
Data Science and Agile in harmony – presenting the Agile Data Science Workflow
Building on practical experience, we developed an Agile Data Science Workflow that can be seamlessly integrated into different Agile frameworks. The workflow aims at fulfilling the needs of data scientists, scrum masters, product owners, and other stakeholders.
AutoML – A Comparison of cloud offerings
AutoML is the process of automatically applying machine learning to real world problems, which includes the data preparation steps such as missing value imputation, feature encoding and feature generation, model selection and hyper parameter tuning. Even though the research field on AutoML exists at least since its first dedicated workshop at ICML in 2014, real world usage just got applicable recently. This blog post compares the AutoML offerings of AWS, Google and Microsoft in a qualitative fashion.
Die scieneers community wächst!
Wir freuen uns sehr, dass sich die ersten Kolleginnen und Kollegen für die scieneers begeistern konnten. Mit diesem Team stellen wir uns gerne jeder Herausforderung, die das Daten-Business für uns bereit hält! Wo ihre Schwerpunkte liegen und was sie antreibt können sie selbst am besten beschreiben:
Was ist die Microsoft Data Platform?
Der Begriff steht im Allgemeinen für das Angebot an Data Management und Analytics Lösungen, die Microsoft klassisch für das Rechenzentrum des Kunden und in der Azure Cloud anbietet. Aber was beinhaltet das genau? Welche Tools sind gemeint und was gehört zusammen? Im Folgenden werden diese Möglichkeiten in drei verschiedene technologische Bereiche eingeteilt, inhaltlich beschrieben und grob abgegrenzt.
Der Anfang ist gemacht.
Nach den ersten Wochen am Markt ziehen wir schon mal ein erstes positives Fazit: Die ersten Kunden und Partner konnten wir für uns gewinnen.
Hello World, wir sind die scieneers! Wir sind “driven by data”.
Zugegeben, es ist nicht die beste Zeit, um mit einem neu gegründeten Unternehmen an den Markt zu gehen. Wir haben uns entschieden es trotzdem zu tun. Warum wir überzeugt sind, dass es trotz oder gerade wegen Corona der richtige Schritt ist, möchten wir Euch mit diesem Blogpost kurz erklären.