data2day 2023
Auf der data2day 2023 im Oktober in Karlsruhe wurden die neuesten Datenanalyse-Technologien anhand von Datenprojekten diskutiert. Neben Data Mesh und großen Sprachmodellen (LLMs) stellten Martin Danner und Jan Höllmer scieneers-Projekte mit Temporal Fusion Transformer (TFT) zu Prognose und Anomalie-Erkennung bei Iqony vor.
Individualisierung von Konferenz-Programmen durch LLMs
Vor einem Jahr wurde ChatGPT vorgestellt, seitdem sind Sprachmodelle das mit Abstand am meisten diskutierte Thema der IT-Geschäftswelt. Große Sprachmodelle wie ChatGPT haben zahllose Anwendungsfälle, eines davon ist die Verwendung um Texte personalisiert, also an den Präferenzen der Nutzer orientiert, wiederzugeben. Ein Beispiel hierfür ist die Erstellung von individuellen Programmplänen. Wir haben eine Anwendung implementiert, die basierend auf einem User-Input und einer Vektordatenbank individuelle Programmpläne für die IT-Tage 2023 in Frankfurt am Main erstellt. Hier geben wir einen kurzen Einblick in die Implementierung.
Data Platform auf Azure – aber bitte sicher!
Viele Unternehmen nutzen inzwischen die Azure Data Services für Data Management und Analytics Aufgaben oder planen den Umstieg auf Microsofts Cloud Platform. Viele Gründe wie Betriebskosten und Skalierbarkeit sprechen dafür, aber wie ist es um die Sicherheit bestellt? In dem Vortrag schauen wir uns an, welche Mechanismen auf Azure zum sicheren Datenaustausch genutzt werden können. wie der Datenzugriff von Dienste- bis bis auf Datenebene für Endbenutzer konfiguriert werden kann und welche Möglichkeiten es gibt, die Services netzwerktechnisch sicher zu verbinden und gleichzeitig vor unerwünschten Besuchern abzuschotten.
Optimize an AI Powered Recommendation Engine
scieneers, Intel Corporation, and Von Rundstedt joined forces to optimize an AI powered recommendation engine solution that leverages the Intel® AI Analytics Toolkit and 4th Generation Intel® Xeon® Scalable Processors. In this brief experience report we demonstrate how we managed to achieve up to 9.3X speedup when running on 4th Generation Intel® Xeon® Scalable Processors compared to the baseline configuration. This means that the solution can process more data faster, generate more accurate recommendations, and serve more users with lower latency and cost.
LLMs und Cloud-Technologien zur Vernetzung von Onlineshops der Otto-Gruppe
Large Language Models (LLMs) sind wegen ihrer vielfältigen Anwendungen in aller Munde. Auch im E-Commerce Bereich ist diese Technologie sehr nützlich. Zusammen mit der data.works GmbH haben wir sogenannte Embedding-Modelle aus dem LLM-Bereich mit der Vertex AI Matching Engine in der Google Cloud für mehrere Onlineshops der Otto-Gruppe eingesetzt, um kundenspezifische Produktempfehlungen aus einem Shop auf viele andere Shops übertragen zu können. Und das, obwohl sich die Sortimente und Kataloge dieser Shops stark unterscheiden.
Wärmebedarf prognostizieren mit Temporal Fusion Transformern
Zusammen mit Iqony haben wir den Einsatz von Temporal Fusion Transformern zur Bedarfsprognose in der Fernwärme getestet. Durch Data Fusion können die Vorhersagen von mehreren Standorten in einem Modell vereint und vor allem die Vorhersagegenauigkeit von Standorten mit wenig Daten gesteigert werden. Die Quantisierung von Vorhersageunsicherheiten und die Interpretierbarkeit des Modells schaffen Vertrauen und unterstützen die Entscheidungsfindung.
Moodle Chatbot – KI als persönlicher Uni-Dozent
Zusammen mit der RWTH Aachen haben wir einen Chatbot entwickelt, der einen nahtlosen Zugang zu Vorlesungsinhalten für Studierende und Mitarbeitende direkt in der Lernplattform Moodle ermöglicht. Somit können themenspezifische Fragen mit Inhalten aus einer Vorlesung beantwortet werden. Eine zusätzliche Quellenangabe erlaubt außerdem das schnelle Finden der relevanten Vorlesungsinhalte in den Unterlagen.
KI-basierte Textanalyse für die Energiewirtschaft
Künstliche Intelligenz (KI) erfährt durch ChatGPT derzeit enorme Aufmerksamkeit. Abseits vom Hype haben die aktuellsten Entwicklungen die Verarbeitung von Sprache und Texten auf ein neues Niveau gehoben. In diesem Artikel wollen wir Ihnen zeigen, was ChatGPT & Co. im Kontext der Energiewirtschaft wirklich leisten können, was das Neue daran ist und wie man diese Tools in der Praxis einsetzen kann.
Anomalieerkennung bei Windkraftanlagen mit Temporal Fusion Transformern für Iqony
Transformer-Architekturen haben sich als bahnbrechend im Bereich des Natural Language Processing erwiesen. Temporal Fusion Transformer nutzen diese Architektur für die Prognose von Zeitreihen und bieten dabei gegenüber klassischen Modellen Vorteile wie z.B. hohe Interpretierbarkeit und Data Fusion. Mit iqony hatten wir nun die Möglichkeit dieses Modell in der Praxis für die Anomalieerkennung bei Windkraftanlagen zu testen.
Mit scikit-learn Modelle erstellen
Um Einsteiger:innen einen Überblick über die Möglichkeiten von scikit-learn zu geben, haben wir im kürzlichen erschienenen ix-Sonderheft "Künstliche Intelligenz" einen Artikel zum Thema "Mit scikit-learn Modelle erstellen" veröffentlicht.
Minds Mastering Machines 2023
Auf der diesjährigen M3-Konferenz haben wir in drei Vorträgen unsere Erkenntnisse und Erfahrungen präsentiert: Polars, eine alternative Datenbearbeitungs-Bibliothek zur bekannten Pandas-Bibliothek, sowie Einblicke, in die Realisierung präziser Wärmebedarfsprognosen mit Transformer-Modellen und die Optimierung Neuronaler Netze mit Open-Source-Bibliotheken.
scieneers at PyCon DE & PyData Berlin 2023
At this year’s PyCon DE & PyData Berlin, we presented our learnings and experiences in two talks: Polars, an alternative data-wrangling library to the well-known Pandas library and in a second talk insights we gained from building an internal QA-Chat system, even before ChatGPT and it's buzz started.
Eine Untersuchung des Lebenszyklus von Produkteigenschaften in Kundenrezensionen
Das Kano-Modell ist ein weitverbreitetes Modell im Bereich Produktmanagement. Statt die notwendigen Daten aufwendig in Umfragen zu erheben, wurde mithilfe von NLP ein Verfahren entwickelt, um die Kano-Kategorien aus existierenden Amazon-Bewertungen abzuleiten. Zudem bietet der Ansatz erstmalig die Möglichkeit, diese Produkteigenschaften auch quantitativ über die Zeithistorie mehrere Produktgenerationen nach zu verfolgen.
Einführung in Microsofts Power BI Plattform
Power BI ist ein fester Bestandteil unseres Technologiestacks, weshalb wir in diesem Artikel eine kurze Power BI Einführung geben wollen.
Kooperation SCHOTT AG – scieneers: MIP Reporting mit Power BI
Kooperation Schott AG mit scieneers shopfloor Daten Reporting in Power BI auf Basis der MIP Platform von MPDV
Wie implementiere ich einen “Question Answering”-Bot für Slack in Python?
Basierend auf unseren internen Dokumenten und Chat-Gesprächen haben wir mit open-source Technologien ein System gebaut, welches den Zugriff auf internes Wissen vereinfacht. Hier geben wir einen detailierten Einblick im die Implementierung.
Einführung in Unittesting mit Python für Data Scientists
Unittests können in Data-Science-Projekten sehr sinnvoll sein, um eine hohe Codequalität sicherzustellen. Um den Einstieg in das Unittesten mit Python für Data Scientists zu erleichtern, haben wir einen Artikel zu diesem Thema geschrieben, der auf Informatik Aktuell veröffentlicht wurde.
Explorative Geodaten-Analyse mit Power BI bei Ämtern und Behörden
Gemeinsame Entwicklung eines vollständig nutzbaren Prototypen zur ansprechenden Visualisierung von Daten aus verschiedenen Fachverfahren des öffentlichen Dienstes auf Landkarten. Die Dashboards ermöglichen es, schnell und interaktiv Zusammenhänge zu erkennen, aus denen sich mögliche Maßnahmen daten- und faktenbasiert ableiten und begründen lassen.
Entwicklung nach SCRUM und CRISP-DM am Fallbeispiel Wärmeprognose bei STEAG New Energies
Am Fallbeispiel der Wärmeprognose bei STEAG New Energies wird die Entwicklung und das Projektvorgehen nach SCRUM und CRISP-DM skizziert. Neben der detaillierten Beschreibung der einzelnen Schritte einer Entwicklungsiteration, liegt ein weiterer Fokus des Blog-Artikels auf dem im Einsatz befindlichen Technologie-Stack.
Effektive Code Reviews für Data-Science-Projekte
Code Reviews sind eine gängige Praxis in der Softwareentwicklung, doch sie sind auch in Data-Science-Projekten relevant und sinnvoll. Der Artikel beleuchtet die Gründe dafür und gibt Hinweise darauf, wie Code Reviews in Data-Science-Projekten effektiv gestaltet werden können.
SQLDays – Vortrag Azure Data Factory 2022 – whats new?
SQLDays 2022 - Folien zum Vortrag von Stefan Kirner zu Neuigikeiten in der Azure Data Factory und Synapse Pipelines und ein Vergleich der Technologien.
Kooperation mit Intel®: Quantisierung von ML-Modellen und Performance-Boost im Pre-Processing
scieneers sind AI Specialist Partner des Halbleiterhersteller Intel®. Wir erproben in realen Einsatzszenarien, wie durch Intels neueste Technologien und Tools die Performance analytischer Modelle und Berechnungen auf großen Datenmengen weiter gesteigert werden können
Tipps & Tricks bei der Entwicklung eines Dashboards mit Streamlit & Plotly
Wir haben mit Streamlit und plotly.express ein web-basiertes Dashboard für die Übersicht über CO2-Emissionen gebaut. Dieser Blogeintrag zeigt einige Tipps und Tricks, die wir bei der Implementierung und dem Deployment des Dashboards gelernt haben.
informatica feminale Baden-Württemberg 2022 – ein Rückblick
Dieses Jahr fand die informatica feminale Baden-Württemberg an der technischen Fakultät der Universität in Freiburg statt, und wir scieneers durften dort mit einem Kurs zum Thema "Visualisierungsframeworks in Python" das Angebot für die Teilnehmerinnen mitgestalten.
Konferenz-Rückblick: DataLift Summit
Rückblick zur Konferenz DataLift Summit und Informationen zum dort gehaltenen Workshop zu visueller Datenexploration mit Python
Partnerschaft MPDV – scieneers: MIP smart factory Daten in Power BI
Wir ergänzen die smart factory Plattform MIP unseres Partners MPDV um ein Basis-Lösungspaket in Power BI und der Expertise, auch kundenspezfische Anforderungen sehr schnell in KPIs und Visuals umzusetzen.
PASS Camp 2022 – Ein Einblick
Das PASS Camp fand nach zweijähriger Corona-Pause endlich wieder statt und auch wir waren dabei. In unserem Blog geben wir Euch einen kurzen Einblick.
Voll auf Kurs: optimierte Energieerzeugung dank KI
Datenoptimierte Wärmeprognosen und Fahrplanerzeugung bei KWK-Anlagen - unser spannendes Azure-Daten-Projekt mit Steag New Energies wird hier vorgestellt
Frühlingserwachen 2022
Zwei Tage lang haben wir uns in unserem Kölner Office zusammengefunden, um uns in vier Formaten über fachliche und persönliche Themen auszutauschen und das bisher Erreichte bis in die Abendstunden zu feiern.