KI bei Inflationsprognose besser als der Mensch?
In einem Modellversuch der FRB gab es dabei zwei bedeutende Ergebnisse:
- Künstliche Intelligenz macht offenbar bessere und deutlich kostengünstigere Inflationsprognosen als menschliche Profis.
- Und diese Prognosen zeigen eine langsamere Rückkehr zum Inflationsanker von 2% als dies von der US-Zentralbank bzw. dem „Survey of Professional Forecasters“ (SPF) der Philadelphia Fed, der wichtigsten US-Institution zur Inflationsvorhersage, bislang angenommen wird.
Google-KI offenbar besser geeignet als GPT-4
Die FRB verwendet dazu ein führendes Large Language Model (LLM, hier: PaLM von Google AI). PaLM verfügt über zwei Hauptmerkmale, die es für diese Zwecke besser erscheinen lässt als GPT-4.
- PaLM wird auf einem großen Korpus von Token trainiert, die regelmäßig aktualisiert werden.
- Der Informationssatz von PaLM ist normalerweise nur wenige Tage alt.
Weniger fehleranfällig als menschliche Prognosen
Ergebnis der Untersuchung über einen Vier-Jahres-Zeitraum: „LLM-Prognosen (verursachen) in den meisten Jahren und bei fast allen Zeithorizonten insgesamt geringere mittlere quadratische Fehler. Technologische Verbesserungen bei Hardware und Software würden die Kosten für die Entwicklung und Schulung dieser Modelle wahrscheinlich noch erheblich senken. LLMs könnten dann zu einem zugänglichen Mittel zur Erstellung von Prognosen werden, insbesondere im Vergleich zu potenziell kostspieligeren Befragungen von Experten und Haushalten.
Ersatz oder nur Ergänzung?
LLMs könnten besonders nützlich sein, um Arbeitskräfteindikatoren für bestimmte Bevölkerungsgruppen oder verfügbares Haushaltseinkommen für bestimmte geografische Regionen einzuschätzen. Für diese Prognosevariablen würden entweder keine Umfragen durchgeführt bzw. seien diese zu teuer und kompliziert in der Konzeption und Implementierung.
Die Vorgehensweise der FRB zur Bewertung des Potenzials des Modells zur Generierung genauer Inflationsprognosen: Die Wissenschaftler im Research-Team der FRB haben die Google-KI absichtlich „getäuscht“. Sie wurde veranlasst, so zu tun, als ob das aktuelle Tagesdatum an einem bestimmten Punkt in der Vergangenheit liege. Dann sollte das LLM Inflationsprognosen für die folgenden Quartale erstellen.
Ergebnisse mit Fragezeichen behaftet
Allerdings brächten LLMs auch ihre eigenen Herausforderungen mit sich: Sie fungieren als „Blackbox“, was es schwierig macht, die Mechanismen zu verstehen, die den von ihnen generierten Ergebnissen zugrunde liegen. Und: Die Ergebnisse sind auch nicht eindeutig. PaLM schneidet im Vergleich zum SPF in den Jahren 2019 und 2023 schlechter ab. In den Jahren 2020–22 sind die Ergebnisse wiederum „deutlich überdurchschnittlich“.