Minds Mastering Machines 2025
Die Fachkonferenz zum Thema Machine Learning (ML) und Künstliche Intelligenz (KI)
Jedes Frühjahr ist scieneers mit mehreren Vorträgen auf der Konferenz „Minds Mastering Machines“ (M3) vertreten. Die diesjährige Konferenz zu den Themen Data Science, Data Engineering und Generative KI fand in Karlsruhe statt. Im Zentrum der Konferenz standen natürlich LLMs mit zahlreichen Fortschritten rund um Agenten, RAG, MCP und LLMOps. Daneben spielen aber auch klassisches Machine Learning und Datenmanagement nach wie vor eine Rolle. Zurecht, denn auch im GenAI-Zeitalter ist eine solide Datengrundlage entscheidend.
Wir durften in diesem Jahr gleich drei Vorträge zu unterschiedlichen Bereichen beisteuern. Zunächst gab Martin Danner am Dienstag neue Einblicke in die klinische Entscheidungsfindung. Am Mittwoch hielten Alina Dallmann und Arne Grobrügge einen Vortrag über die Entwicklung von robusten und skalierbaren RAG Systemen, gefolgt von einem Vortrag von Arne Grobrügge und Nico Kreiling über Autonomes Browsing mit Large Action Models.
Klinische Entscheidungsfindung
mit AlphaFold und Graph Neuronalen Netzen
Martin beim Vortrag über Klinische Entscheidungsfindung mit AlphaFold und Graph Neuronalen Netzen
Genetische Veränderungen, wie Missense-Varianten, können schwerwiegende Krankheiten verursachen und sind oft schwer einzuschätzen. Martin Danner von scieneers in Kooperation mit der Uniklinik RWTH Aachen beleuchtete in seinem Vortrag, wie moderne KI-Methoden helfen, diese Herausforderung zu meistern – die Suche nach der krankheitsverursachenden „Nadel im Heuhaufen“.
Moderne KI-Modelle wie AlphaFold, das 2024 mit dem Chemie-Nobelpreis ausgezeichnet wurde, ermöglichen eine präzise Vorhersage von Proteinstrukturen, auch bei Varianten. Martin zeigte, wie diese strukturellen Informationen in Kombination mit Graph Neuronalen Netzen verarbeitet werden, um aussagekräftige Embeddings zu erzeugen. Diese Embeddings fließen als wichtige Features in Modelle zur Pathogenitätsvorhersage ein und verbessern so die Priorisierung von genetischen Varianten.
Dieser Ansatz zur „Structure Enriched Pathogenicity Prediction“ zeigte, wie die Integration struktureller Informationen – ermöglicht durch Modelle wie AlphaFold und Graphen-KI – die Vorhersage der Pathogenität signifikant verbessern kann. Anhand konkreter Ergebnisse wurde demonstriert, dass dies die Priorisierung relevanter Varianten verbessert. Diese Fortschritte sind entscheidend für die schnellere und präzisere Diagnose seltener Erkrankungen und einen wichtigen Schritt in Richtung personalisierter Medizin.
Der Vortrag zum Durchblättern
Entwicklung robuster & skalierbarer RAG-Systeme
Lessons Learned aus fünf Anwendungsfällen
Alina und Arne beim Vortrag über die Entwicklung robuster & skalierbarer RAG-Systeme
Retrieval Augmented Generation (RAG) ist das wohl beliebteste Verfahren, um Sprachmodellen in Unternehmen einzusetzen und vielfältigen Anwendungsmöglichkeiten zu erschließen. In ihrem Vortrag teilten Alina Dallmann und Arne Grobrügge ihre Erkenntnisse aus der Entwicklung und dem Betrieb von RAG-Systemen in fünf unterschiedlichen Anwendungsfällen. Der Fokus lag dabei auf den technischen und anwendungsbezogenen Herausforderungen bei der Schaffung robuster und skalierbarer Systeme.
Sie präsentierten die Entwicklung eines modularen Kernsystems auf Basis von Open-Source-Bibliotheken, das flexibel an verschiedene Use Cases angepasst werden kann. Ein Kernthema war dabei die skalierbare Bereitstellung mittels Infrastructure-as-Code (IaC), wie beispielsweise Terraform, um eine effiziente und reproduzierbare Infrastruktur zu gewährleisten, die mit wachsenden Datenmengen und Lastspitzen umgehen kann.
Der Vortrag beleuchtete auch praktische Herausforderungen und „Lessons Learned“, wie die Generalisierbarkeit von Prompts über verschiedene Modelle hinweg, die Wichtigkeit einer Relevanzprüfung der Retrieval-Ergebnisse zur Vermeidung von Halluzinationen sowie die Schwierigkeit, korrekte Zitationen der Quellen zu implementieren. Zudem wurden Methoden zur Evaluation vorgestellt, um die Qualität der Antworten quantitativ und qualitativ zu bewerten. Ziel war es, praxisnahe Einblicke und Lösungsansätze für eine effiziente, robuste und zukunftssichere Implementierung von RAG-Systemen in Unternehmen zu vermitteln.
Der Vortrag zum Durchblättern
Autonomes Browsen
mit Large Action Models aka LLM-Agents
Arne und Nico beim Vortrag über die Autonomes Browsen mit Large Action Models
Kann KI den Browser selbstständig bedienen? Einblicke in die Automatisierung komplexer Web-Aufgaben
Der Browser ist unser Tor zum Internet, dem größten Wissensspeicher und Marktplatz der Menschheitsgeschichte. Doch können Large Language Models (LLMs) wirklich selbstständig mit ihm arbeiten und komplexe Prozesse online abwickeln? In ihrem Vortrag gaben Nico Kreiling und Arne Grobrügge von Scieneers Einblicke in die Welt des autonomen Browsens und die Möglichkeiten von LLM-Agenten, Aufgaben durch direkte Computerinteraktion zu lösen.
Im Zentrum stand die Vorstellung eines Projekts zur Automatisierung eines komplexen Online-Prozesses. Ziel ist es, eine Funktionalität zu schaffen, die Agenten ermöglicht, sich auf beliebigen Webseiten zurechtzufinden und notwendige Schritte auszuführen – komplett autonom und mit hoher Qualität. Um dies zu realisieren, sind technische Zugänge zum Browser nötig, sei es über das Betriebssystem (basierend auf Screenshots) oder direkt über Browser-Automatisierungs-Frameworks wie Selenium oder Playwright, die auf den HTML-Code der Seite zugreifen können. Scieneers setzte dabei auf einen Open-Source-Ansatz basierend auf Frameworks wie LaVague und Browser-Use. Ein entscheidender Faktor war das sorgfältige Prompt Engineering für die steuernde Engine, um dem Agenten klare Leitlinien und Kontext für die Web-Interaktion zu geben.
In der abschließenden Live-Demo konnten die Zuschauer dann selbst beobachten, wie der Agent selbstständig auf der Website navigierte, Eingabefelder befüllte, den Dateiupload nutzte und Elemente in Drop-Downs auswählte, um schließlich nach 50 Iterationen an sein Ziel zu gelangen.
Der Vortrag zum Durchblättern
Unsere Eindrücke zur M3 2025
Auch dieses Jahr war die M3 wieder ein spannende Mischung aus GenAI- und klassischen ML-Themen. Während es bei den LLM-Vorträgen viel um Best-Practices bezüglich Engineering, Security und Maintance ging, gab es gerade im klassischen ML-Bereich eine Vielzahl an Beispielen aus der Praxis: Von der Medizin-Technik über Sport-Analysen bis hin zur Erfassung von Erkennung von Straßenschäden.
Wir bedanken uns bei allen Teilnehmer:innen für ihre spannenden Vorträge und Anregungen und freuen uns bereits auf das nächste Jahr!
Autoren
Martin Danner, Data Scientist bei scieneers GmbH
martin.danner@scieneers.de
Alina Dallmann, Data Scieneer bei scieneers GmbH
alina.dallmann@scieneers.de
Arne Grobrügge, Data Scientist bei scieneers GmbH
arne.grobruegge@scieneers.de
Nico Kreiling, Data Scientist bei scieneers GmbH
nico.kreiling@scieneers.de