Hier können Sie zwischen der Ansicht für Geschäftskunden und Privatkunden wechseln.
Informationen und qualifizierte Einschätzungen zu Chancen und Risiken
030-288 817-20
Geschäftskunde
Privatkunde
0,00 €
1469
Neue KI-Modelle halluzinieren mehr als alte

Probleme mit KI vermeiden

KI ist ein mächtiges Werkzeug. Immer mehr Geschäftsführer erwarten davon große Produktivitätsgewinne und Fortschritte. Aber die Probleme der KI-Modelle nehmen zu.

Die Probleme großer KI-Modelle nehmen zu. Halluzinationen (falsche Antworten, die frei erfunden sind) waren zwar schon immer ein Problem. Aber neuere Modelle liefern mehr Fehler als alte. 

Chat GPT 03 liefert mit etwa einem Drittel der Ergebnisse etwa doppelt so viele falsche Ergebnisse (bei Anfragen nach Personen des öffentlichen Lebens) als der Vorgänger GPT-01. GPT-04 mini halluziniert sogar in 48% der Ergebnisse. Bei allgemeinen Fragen kommt es zu noch mehr Fehlern, bei der Version 04-mini sogar in 79% aller Anfragen. Andere Modelle wie Claude (Anthropic), Llama der Facebook-Muttergesellschaft Meta oder Google Gemini scheinen weniger stark davon betroffen zu sein. Aber auch sie kämpfen mit höheren Fehlerraten bei neueren Modellen. 

Neue Modelle, mehr Fehler

Ein großes Problem sind dabei die neuen Reasoning-Modelle. Die sogenannten RLM (Reasoning Language Model)-Modelledie seit Herbst 2024 auf dem Markt sind (etwa Chat-GPT-01 und -03; Deepseek R1; Gemini 2.0 Flash Thinking) nutzen nicht nur die Wahrscheinlichkeitsrechnung, um das nächste Wort in einem Satz zu berechnen, wie bisherige LLM (Large Language Model), sondern auch Algorithmen, um neue Schlüsse aus bekannten Informationen zu ziehen. Aber das funktioniert nicht gut. RLM-Modelle können Aufgaben mittlerer Komplexität besser lösen, als LLM. Aber bei komplexen Aufgaben scheitern beide KI-Modelle. Ihre Ergebnisse sind unbrauchbar. Das zeigt ein Test, den Apple vor kurzem veröffentlicht hat.

Ein paar Tricks sorgen dafür, dass die Ergebnisse besser ausfallen

Nutzer können die Beschränkungen von KI umgehen, indem sie bei der Aufgabenstellung einige Dinge beachten.

  • Sie sollten auf keinen Fall von einer KI kurze Antworten fordern, denn das erhöht die Wahrscheinlichkeit stark, dass die KI falsche, halluzinierte Ergebnisse liefert.
  • Auch, wenn der Nutzer Behauptungen aufstellt, etwa „Ich bin mir sicher dass, …“ führt das zu falschen Ergebnissen. Viel besser funktionieren offene Fragen.
  • Außerdem sollten die Fragen bzw. Anforderungen in möglichst viele, kleinteilige Schritte aufgeteilt werden, um gute Ergebnisse zu erzielen. Je präziser die Arbeitsanweisungen, um so besser die Ergebnisse („Programmiere lieber umfangreicher, aber verständlich, statt knapp und unverständlich“).
  • Die Ergebnisse der KI müssen immer sehr gründlich kontrolliert werden.

Fazit: KI ist kein einfaches Werkzeug, die Probleme damit haben zugenommen. Aber wenn die Nutzer einige Regeln beachten, können sie damit sehr gute Ergebnisse und einen hohen Produktivitätsgewinn erzielen.

Neueste Artikel
  • Gesamtschau und Wochenbericht in KW 7 für PP V, PP VII, PP VIII und PP IX

FUCHS Performance‑Projekte: Benchmarks, Gewinner, Verlierer und Risikotrends in Fonds‑ und Private‑Banking‑Depots

Illustriert mit Canva und ChatGPT
In Kalenderwoche 7 zeigen die FUCHS Performance‑Projekte ein klares Bild: In Projekten 5 und 8 treibt ein freundliches Marktumfeld die Ergebnisse ohne jede Handelsaktivität, während in Projekt 7 selektiv viel gehandelt wurde und Projekt 9 von wenigen sehr aktiven Häusern geprägt ist. Über alle Projekte hinweg verbessern die Benchmarks ihr Risikoprofil, werden in der Wochenleistung aber teils deutlich von einzelnen Teilnehmern übertroffen. Das und mehr zeigen die aktuellen Daten von Infront.
  • Wochenbericht zu Projekt IX in KW 7: Rendite, Risiko und Handel

Aktive Verwalter setzen sich deutlich ab

Illustriert mit Canva und ChatGPT
In Kalenderwoche 7 zeigt Projekt 9 ein klares Bild: Die aktiven Vermögensverwalter dominieren die Woche. Berliner Sparkasse, Neue Bank und Deka Vermögensmanagement handeln und erzielen die höchsten Zuwächse. Passive Depots bleiben zurück. Der Wochenblick zeigt, wer von Aktivität, Risikokontrolle und gezielten Trades profitiert.
  • Wochenbericht zu Projekt VIII in KW 7: Performance, Gewinner und Verlierer

Genève Invest und INVIOS GmbH dominieren die Wochenwertung

Illustriert mit Canva und ChatGPT
In Kalenderwoche 7 zeigt das 8. Performance‑Projekt (vermögensverwaltende Fonds) deutliche Unterschiede bei der Vermögensentwicklung: Während das Benchmarkdepot einen soliden Wertzuwachs erzielt, überzeugen mehrere Vermögensverwalter mit überragenden Wochengewinnen. Da keinerlei Transaktionen stattfanden, spiegeln die Ergebnisse ausschließlich die Marktbewegungen wider.
Zum Seitenanfang