Bachelorarbeit · AI-2025-BA-022 · Januar 2026

GenAI für Finanzprognosen
und Handel

Empirischer Vergleich promptbasierter Architekturen am Beispiel XAU/USD mit News-Signalen und Backtests

AbgeschlossenFH ErfurtAngewandte Informatik

Eingereicht

31. Januar 2026

Betreuer

Prof. Dr. M. Spehr

Zweitbetreuer

Prof. Dr. V. Herwig

Datenbasis

XAU/USD, 4h-Auflösung

Zusammenfassung

Diese Arbeit untersucht den Einsatz von Large Language Models (LLMs) zur Prognose und zum algorithmischen Handel von XAU/USD (Gold/US-Dollar) auf 4-Stunden-Basis. Im Mittelpunkt steht ein empirischer Vergleich fünf verschiedener promptbasierter Architekturen, die OHLCV-Zeitreihendaten mit einem Nachrichtenkorpus kombinieren.

Als Benchmark dient ein klassisches ARIMA-Modell. Der Prognosehorizont beträgt 30×4h (5 Handelstage). Alle Architekturen wurden mit einem Wissensschnitt vom 01.06.2024 evaluiert, um Generalisierbarkeit jenseits des Trainingszeitraums zu prüfen.

Die Ergebnisse zeigen: LLMs können ARIMA in der Preisprognose leicht übertreffen (Arch 3: MAE 42,54 vs. 43,86) und erzielen im Backtest starke Handelsrenditen (Return 237,85 %, CAGR 50,21 %). Prompt-Chaining durch Chart-Voranalyse liefert dabei keinen konsistenten Mehrwert gegenüber direkten Ansätzen.

Kernergebnisse

237,85 %

Gesamtrendite

Bestes Trading

50,21 %

CAGR

Jährl. Wachstum

2,61

Calmar Ratio

Risikoadjustiert

57,60 %

Win Rate

Trefferquote

1,86

Profit Factor

Gewinn/Verlust

~3 %

MAE Verbesserung

vs. ARIMA

Methodik

Datenbasis

  • XAU/USD OHLCV, 4-Stunden-Kerzen
  • Wissensschnitt: 01.06.2024
  • Nachrichtenkorpus (News-Signale)
  • Prognosehorizont: 30×4h (5 Tage)

Evaluation

  • Prognose: MAE & RMSE vs. ARIMA
  • Trading: Return, CAGR, Calmar
  • Win Rate & Profit Factor
  • Post-Cutoff-Generalisierung

Technologie

  • Python (Datenverarbeitung)
  • LLM-API (promptbasiert)
  • Backtesting-Framework
  • ARIMA als Benchmark

[ Workflow-Diagramm: Datenpipeline & Architekturübersicht ]

Die 5 Architekturen

1
Trading

Arch 1: Baseline Trading

Direktes Handelssignal (Long/Short/Hold) aus Roh-OHLCV-Daten und News via einfachem Prompt.

2
Trading

Arch 2: Optimierter Trading-Prompt

Überarbeiteter Prompt mit strukturierter Ausgabe und verbesserter Kontextvermittlung.

3
Forecasting

Arch 3: Direkte Prognose

Numerische Preisvorhersage (MAE/RMSE) ohne Chart-Vorverarbeitung – beste Forecast-Ergebnisse.

4
Trading

Arch 4: Chart-gestütztes Trading

Vorgeschaltete Chart-Analyse extrahiert technische Signale, die dann als Kontext für Handelsentscheidungen dienen.

5
Forecasting

Arch 5: Chart-gestützte Prognose

Kombination aus Chart-Pre-Analysis und numerischer Preisprognose (Prompt-Chaining).

Architekturvergleich

[ Balkendiagramm: MAE/RMSE & Tradingmetriken je Architektur ]

Ergebnisse im Detail

Prognose-Ergebnisse (vs. ARIMA)

ARIMA (Benchmark)
MAE 43,86RMSE 62,80
Arch 3 – Beste LLM
MAE 42,54RMSE 60,59
Arch 5 – Chart+Prognose
MAE 44,12RMSE 63,11

[ MAE-Vergleich: LLM-Architekturen vs. ARIMA ]

Trading-Ergebnisse (Bestes Backtest)

Gesamtrendite237,85 %
CAGR50,21 %
Calmar Ratio2,61
Win Rate57,60 %
Profit Factor1,86

[ Equity Curve: Backtestergebnis bestes Trading-Modell ]

Fazit

Die Arbeit zeigt, dass Large Language Models ein praktisches Potenzial für Finanzzeitreihen besitzen: Arch 3 übertrifft ARIMA konsistent in der Prognose, und die besten Trading-Architekturen erzielen im Backtest attraktive Renditen bei moderatem Risiko.

Prompt-Chaining durch Chart-Voranalyse verbessert die Ergebnisse nicht konsistent – der direkte Ansatz bleibt konkurrenzfähig. Die Resultate sind stark von der Prompt-Gestaltung abhängig, was sowohl Chance als auch Herausforderung für die praktische Anwendung darstellt.