GenAI für Finanzprognosen
und Handel
Empirischer Vergleich promptbasierter Architekturen am Beispiel XAU/USD mit News-Signalen und Backtests
Eingereicht
31. Januar 2026
Betreuer
Prof. Dr. M. Spehr
Zweitbetreuer
Prof. Dr. V. Herwig
Datenbasis
XAU/USD, 4h-Auflösung
Zusammenfassung
Diese Arbeit untersucht den Einsatz von Large Language Models (LLMs) zur Prognose und zum algorithmischen Handel von XAU/USD (Gold/US-Dollar) auf 4-Stunden-Basis. Im Mittelpunkt steht ein empirischer Vergleich fünf verschiedener promptbasierter Architekturen, die OHLCV-Zeitreihendaten mit einem Nachrichtenkorpus kombinieren.
Als Benchmark dient ein klassisches ARIMA-Modell. Der Prognosehorizont beträgt 30×4h (5 Handelstage). Alle Architekturen wurden mit einem Wissensschnitt vom 01.06.2024 evaluiert, um Generalisierbarkeit jenseits des Trainingszeitraums zu prüfen.
Die Ergebnisse zeigen: LLMs können ARIMA in der Preisprognose leicht übertreffen (Arch 3: MAE 42,54 vs. 43,86) und erzielen im Backtest starke Handelsrenditen (Return 237,85 %, CAGR 50,21 %). Prompt-Chaining durch Chart-Voranalyse liefert dabei keinen konsistenten Mehrwert gegenüber direkten Ansätzen.
Kernergebnisse
237,85 %
Gesamtrendite
Bestes Trading
50,21 %
CAGR
Jährl. Wachstum
2,61
Calmar Ratio
Risikoadjustiert
57,60 %
Win Rate
Trefferquote
1,86
Profit Factor
Gewinn/Verlust
~3 %
MAE Verbesserung
vs. ARIMA
Methodik
Datenbasis
- XAU/USD OHLCV, 4-Stunden-Kerzen
- Wissensschnitt: 01.06.2024
- Nachrichtenkorpus (News-Signale)
- Prognosehorizont: 30×4h (5 Tage)
Evaluation
- Prognose: MAE & RMSE vs. ARIMA
- Trading: Return, CAGR, Calmar
- Win Rate & Profit Factor
- Post-Cutoff-Generalisierung
Technologie
- Python (Datenverarbeitung)
- LLM-API (promptbasiert)
- Backtesting-Framework
- ARIMA als Benchmark
[ Workflow-Diagramm: Datenpipeline & Architekturübersicht ]
Die 5 Architekturen
Arch 1: Baseline Trading
Direktes Handelssignal (Long/Short/Hold) aus Roh-OHLCV-Daten und News via einfachem Prompt.
Arch 2: Optimierter Trading-Prompt
Überarbeiteter Prompt mit strukturierter Ausgabe und verbesserter Kontextvermittlung.
Arch 3: Direkte Prognose
Numerische Preisvorhersage (MAE/RMSE) ohne Chart-Vorverarbeitung – beste Forecast-Ergebnisse.
Arch 4: Chart-gestütztes Trading
Vorgeschaltete Chart-Analyse extrahiert technische Signale, die dann als Kontext für Handelsentscheidungen dienen.
Arch 5: Chart-gestützte Prognose
Kombination aus Chart-Pre-Analysis und numerischer Preisprognose (Prompt-Chaining).
Architekturvergleich
[ Balkendiagramm: MAE/RMSE & Tradingmetriken je Architektur ]
Ergebnisse im Detail
Prognose-Ergebnisse (vs. ARIMA)
[ MAE-Vergleich: LLM-Architekturen vs. ARIMA ]
Trading-Ergebnisse (Bestes Backtest)
[ Equity Curve: Backtestergebnis bestes Trading-Modell ]
Fazit
Die Arbeit zeigt, dass Large Language Models ein praktisches Potenzial für Finanzzeitreihen besitzen: Arch 3 übertrifft ARIMA konsistent in der Prognose, und die besten Trading-Architekturen erzielen im Backtest attraktive Renditen bei moderatem Risiko.
Prompt-Chaining durch Chart-Voranalyse verbessert die Ergebnisse nicht konsistent – der direkte Ansatz bleibt konkurrenzfähig. Die Resultate sind stark von der Prompt-Gestaltung abhängig, was sowohl Chance als auch Herausforderung für die praktische Anwendung darstellt.