Im Rahmen meiner Masterarbeit wurde die Generalisierungsfähigkeit dieser modernen Modelle anhand realer Daten aus verschiedenen Fernwärmesystemen getestet. Dabei wurde sowohl die interne Generalisierung (die Leistung auf neuen Daten aus Systemen, die im Trainingssatz enthalten waren) als auch die externe Generalisierung (die Leistung auf neuen, nicht gesehenen Systemen) bewertet.
Die Ergebnisse der Tests zur internen Generalisierung haben gezeigt, dass das TFT-Modell als globales multivariates Modell die Leistungsfähigkeit der bisherigen lokalen Modelle signifikant übertreffen kann. Besonders hervorzuheben ist, dass das TFT-Modell in der Lage ist, eine Vielzahl zusätzlicher Datenquellen zu integrieren, was zu einer Verbesserung der Vorhersagegenauigkeit führt. Das TimesFM-Modell, das auf ein umfangreiches Pretraining zurückgreifen kann, schnitt in diesem Fall schlechter ab. Eine mögliche Erklärung hierfür könnte sein, dass das TimesFM als univariates Modell keine externen Kovariaten wie Wetterdaten oder Systemgrößen berücksichtigt. Diese zusätzlichen Informationen, die das TFT-Modell aufgrund seiner multivariaten Architektur einbeziehen kann, ermöglichen eine präzisere Erfassung der Wärmebedarfsmuster und führen zu verlässlicheren Vorhersagen.
Im Test zur externen Generalisierung, bei dem das Cold-Start-Problem simuliert wurde, zeigte sich der Vorteil der globalen Modelle besonders deutlich. Mit nur vier Tagen historischer Daten konnten sowohl das TFT als auch das TimesFM-Modell deutlich präzisere Vorhersagen treffen als ein traditionelles lokales Modell, das nur auf den begrenzten Daten eines einzelnen Systems basiert. Auch hierzeigte sich das TFT-Modell als überlegen und lieferte etwas genauere Vorhersagen als das TimesFM-Modell.
Die Ergebnisse der Evaluierung bestätigen, dass insbesondere globale multivariate Modelle wie der Temporal Fusion Transformer (TFT) signifikante Vorteile in der Vorhersagegenauigkeit bieten, vor allem in komplexen und heterogenen Fernwärmesystemen. Durch die Fähigkeit, Synergien zwischen verschiedenen Systemen zu nutzen, bieten diese Modelle eine deutliche Verbesserung gegenüber traditionellen lokalen Modellen. Darüber hinaus zeigen sie ihre Stärke insbesondere beim Umgang mit Cold-Start-Problemen, indem sie auch bei begrenzten historischen Daten zuverlässige Vorhersagen liefern können.