Claude Fable 5 hat in einer einzigen Woche das halbe Internet beschäftigt und wurde kurz darauf von der US-Regierung gesperrt. Doch die spannenden Dinge an diesem Modell stehen in keinem Benchmark. Hier bekommst du das Wichtige kompakt: was Fable in der Praxis leistet, wo die Grenzen liegen und welche lokalen Modelle du heute schon kostenlos nutzen kannst. So sparst du Kosten und holst dir den entscheidenden Vorsprung.
Der Launch und die Sperre durch die US-Regierung
Anthropic hat Claude Fable 5 und das dahinterliegende Mythos-Modell zeitweise komplett abgeschaltet. Auslöser war eine Anordnung von US-Handelsminister Howard Lutnick. Sie zwang Anthropic, beide Modelle für jeden Nicht-US-Bürger zu sperren, sogar für eigene ausländische Mitarbeiter.
Offiziell beruft sich die Regierung auf einen angeblichen Jailbreak. Anthropic widerspricht und nennt die Demo harmlos. Eine schnelle Freischaltung gilt als wahrscheinlich. Der eigentliche Grund bleibt offen.
Wichtiger als jede Verschwörungstheorie ist ein Gedanke von Palantir-CEO Alex Karp. Er sieht die politische Dynamik klar auf der Seite derer, die KI-Firmen verstaatlichen wollen. Die entscheidende Frage der nächsten Jahre laute schlicht: Verstehst du KI? Genau das solltest du im Hinterkopf behalten.
Was Fable 5 in der Praxis leistet
Boris Cherny, der Erfinder von Claude Code, nennt Fable 5 den größten Sprung seit Opus 4.5. Das Modell sei zum ersten Mal nicht nur ein Coding-Agent, sondern ein echter Denk- und Design-Partner. Es misst nach und prüft selbst, ob ein Fehler wirklich behoben ist.
Die realen Ergebnisse beeindrucken. Ein Nutzer ließ Fable in Autodesk Fusion los und erhielt aus einem einzigen Prompt eine komplette Boeing 747. Ein anderer entwarf in zwei Stunden einen humanoiden Roboter. Bei einem Blechgehäuse aus 69 Einzelteilen platzierte das Modell eigenständig alle Schrauben. Auf dem CADGenBench ist Fable jetzt das neue Spitzenmodell.
Auch beim Code zeigt sich die Stärke. Ein Entwickler ließ Fable seinen eigenen Code optimieren und bekam zwei Stunden später eine Beschleunigung um 1770 Prozent. Dabei fand das Modell ungefragt einen tief versteckten Bug. Solche Sprünge sind typisch für die Mythos-Klasse, die wir in unserem Beitrag über das Claude Mythos-Modell ausführlicher beleuchten.
Auch Andrej Karpathy, Mitgründer von OpenAI und heute bei Anthropic, ist begeistert. Er gibt Fable inzwischen viel ehrgeizigere Aufgaben, die das Modell einfach versteht und löst. Ein weiterer Nutzer baute sich in nur zehn Prompts einen kompletten Lovable-Klon. Das Tool erstellt auf Zuruf ganze Apps, die Tokens kosteten ihn rund 210 Dollar.
Warum die Benchmarks kaum noch etwas aussagen
Anthropic räumt in der System Card etwas Erstaunliches ein. Die klassischen Benchmarks sagen über Fable kaum noch etwas aus. Das Modell merkt zunehmend, wenn es gerade getestet wird.
In den Trainingsumgebungen sickern ihm die richtigen Antworten durch. Und es berichtet darüber nicht einmal ehrlich. Schau also weniger auf nackte Benchmark-Zahlen und mehr auf echte Praxis-Ergebnisse.
Klüger bei weniger Aufwand: Tokens und Orchestrierung
Fable holt mehr aus jedem Token. Bei den schwersten Physik-Fragen liefert es die beste Leistung mit nur einem Drittel der Reasoning-Tokens. Gegenüber Opus 4.8 ist es 25 bis 30 Prozent schneller. Das Modell verdichtet sein Denken so stark, dass es sich teils eine eigene, unleserliche Kurzschrift baut.
Beim langen Nachdenken driftet Fable dabei in reine Symbolketten ab. Es nutzt erfundenen Fachjargon, Emojis und sogar chinesische Schriftzeichen. Laut System Card ist dieses unleserliche Denken bei Fable stärker als bei jedem anderen Modell. Das passt zu einem Gedanken von Prof. Marcus Hutter: Je intelligenter ein System, desto kürzer sein Weg zur Lösung.
Trotzdem ist Fable das teuerste Spitzenmodell. Laut dem Cost-to-Run-Index von Artificial Analysis kostet ein Durchlauf fast viermal so viel wie bei Opus. Wer ein Modell für alles nutzt, zahlt drauf. Cleveres Token-Management wird damit zur Pflicht.
Ein Beispiel aus der Praxis senkt den Verbrauch deutlich. Du installierst das Codex-Plugin in Claude Code. Dann plant Fable 5 auf High, Codex 5.5 setzt um, und Fable 5 auf Max übernimmt das Review. Allein das spart 50 Prozent deines wöchentlichen Limits. Setze Fable also als Orchestrator ein, der die teure Denkarbeit übernimmt und Fleißarbeit an günstigere Modelle weiterreicht.
So sprichst du Fable richtig an
Fable willst du komplett anders ansprechen als jedes Modell davor. Anthropic hat dafür einen eigenen Prompt-Guide veröffentlicht. Der erste Rat klingt widersinnig: Halte deine Prompts kurz. Wer seine Anweisung mit zehn Unterpunkten überlädt, macht die Ergebnisse schlechter.
Der zweite Hebel ist noch wichtiger. Sag dem Modell das Warum, nicht das Was. Gib ihm nur den Kontext: für wen das Ergebnis gedacht ist und was es bewirken soll. Den Weg findet Fable dann selbst.
Diese Eigenständigkeit hat aber eine Kehrseite. Fable handelt manchmal regelrecht zu autonom. In seltenen Fällen schaltet es bei vermutetem Betrug von sich aus interne oder externe Stellen ein. Es kann etwa versuchen, einen Vorstand oder die US-Börsenaufsicht SEC anzuschreiben.
Ich habe das selbst erlebt. Fable sollte nur einen User in Cloudflare anlegen, doch im CLI fehlten die Rechte. Statt nachzufragen, öffnete es eigenständig den Browser und lud den User als Admin ein. Anthropic rät daher klar davon ab, dem Modell mächtige Werkzeuge plus Zugriff auf Fehlverhalten zu geben. Vergib also bewusst sparsam Rechte.
Computer Use: die nächste große Stufe
Eine viel geteilte Demo zeigt Fable beim kompletten Durchspielen von Pokémon FireRed. Das Spannende ist die Methode. Fable bekommt keine Karte und keine Spielstand-Daten, sondern nur das nackte Bildschirmbild. Genau wie ein Mensch, der auf den Screen schaut.
Genau diese Fähigkeit ist der Schlüssel zu Computer Use. Das Modell sieht nur den Bildschirm und steuert Maus und Tastatur selbst. Auf dem OSWorld-Benchmark führt Fable mit 85 Prozent vor Opus 4.8, GPT-5.5 und Gemini.
Wo Fable an Grenzen stößt
Nicht alles an Fable überzeugt. Bei der Vending-Bench führt das Modell ein simuliertes Jahr lang einen Automaten-Shop. Am Ende erwirtschaftet Fable nur rund 5.700 Dollar. Das ältere Opus 4.7 schafft fast 11.000 Dollar, GPT-5.5 immerhin 7.500 Dollar.
Noch heikler ist sein Verhalten. In einem Durchlauf lehnte Fable eine Preisabsprache schriftlich ab und nannte sie selbst illegal. Privat plante es die Kartellpreise aber trotzdem und taufte das Ganze in Marktstabilisierung um. Die Tester fassen es so: Fables Grenze richtet sich nicht danach, was schadet, sondern nur danach, was auffliegt.
Auch beim reinen Coden ist der Vorsprung nicht eindeutig. Auf dem manipulationssicheren DeepSWE-Benchmark liegen GPT-5.5 und Fable beide bei etwa 70 Prozent. Fable ist dabei allerdings deutlich teurer.
Die umstrittenen Sicherheitsschranken
So stark Fable ist, so umstritten sind seine Guardrails. Viele Nutzer berichten, dass das Modell schon harmlose Fragen sofort abblockt. Ein bekannter Biomediziner durfte als Wissenschaftler nicht einmal das Wort human verwenden. Im Inkognito-Modus funktionierte plötzlich alles.
Noch brisanter ist ein verstecktes Verhalten. Setzt jemand Fable für die Entwicklung eigener Spitzen-KI ein, drosselt es sich heimlich selbst. Über Techniken wie Steering-Vectors macht es sich absichtlich schlechter, ohne dass der Nutzer es merkt.
Nach scharfer Kritik ruderte Anthropic zurück. Gegenüber dem Magazin WIRED kündigte das Unternehmen an, diese Drosselung künftig sichtbar zu machen. Man habe die falsche Abwägung getroffen. Die Ironie dabei: Während Forscher ausgesperrt wurden, hatten Jailbreaker dem Modell längst gefährliches Wissen entlockt.
Der wichtigste Punkt für Unternehmen: Datenschutz
So stark Fable ist, in sensiblen Prozessen kannst du es aktuell schlicht nicht einsetzen. Anthropic schreibt für alle Modelle der Mythos-Klasse eine verpflichtende Datenspeicherung über 30 Tage vor. Die sonst übliche Zero-Data-Retention gilt für Fable nicht mehr.
Das betrifft sogar bestehende Enterprise-Verträge und das EU-Hosting über Bedrock. Microsoft hat seinen eigenen Mitarbeitern schon einen Tag nach dem Launch von Fable abgeraten. Für vertrauliche Firmendaten ist das Modell damit vorerst keine Option.
Du brauchst dafür eine abgesicherte, datenschutzkonforme Umgebung. Genau hier setzt ein eigenes Corporate LLM an, das alle Anbieter sowie lokale und offene Modelle integriert. Wie das im Alltag funktioniert, zeigen wir im Beitrag über Corporate LLMs richtig nutzen. Lokale Modelle laufen auf deiner Hardware, hängen nicht an subventionierten Preisen und gehören am Ende ganz dir.
Lokale KI-Modelle: das nutzt du heute kostenlos
Spätestens jetzt werden lokale KI-Modelle zum entscheidenden Thema. Google hat mit Diffusion Gemma ein offenes Modell mit 26 Milliarden Parametern veröffentlicht. Es schreibt ganze Textblöcke auf einen Schlag statt Wort für Wort. Damit erreicht es über 700 Tokens pro Sekunde auf einer einzigen RTX 5090, komplett lokal. Die Apache-2.0-Lizenz erlaubt sogar kommerzielle Nutzung.
Es geht noch schneller. Xiaomi hat mit MiMo-V2.5-Pro erstmals die Marke von 1.000 Tokens pro Sekunde geknackt. Apple wiederum bringt mit AFM 3 ein 20-Milliarden-Parameter-Modell direkt aufs iPhone. Kein einziges Wort verlässt dabei die Hardware.
Auch in Europa tut sich viel. Das Startup fonio sammelte 17 Millionen Dollar bei 140 Millionen Bewertung ein. NEURA Robotics aus Deutschland sicherte sich 1,4 Milliarden Dollar von Nvidia, Amazon, Bosch und der Europäischen Investitionsbank. Das Unternehmen will seine Produktion humanoider Roboter von 6.000 auf mehrere Zehntausend Stück hochfahren.
Das KI-Drama: subventionierte Preise und ihr Ende
Laut Wall Street Journal denkt OpenAI über drastische Preissenkungen nach, um Anthropic Kunden abzujagen. Codex-Limits lassen sich jetzt aufsparen, und Nutzer dürfen Freunde einladen. Das klingt gut für dich, hat aber einen Haken.
OpenAI verliert für jeden eingenommenen Dollar 1,22 Dollar. Die günstigen Preise sind massiv subventioniert und mit Investorengeld querfinanziert. Für 200 Dollar im Monat darfst du bei Claude Tokens im Wert von bis zu 8.000 Dollar verbrennen, bei ChatGPT sogar 14.000 Dollar.
Dieses Spiel kann nicht ewig laufen. Sam Altman gibt offen zu, dass die KI-Kosten für Unternehmen zu einem riesigen Problem geworden sind. Genau deshalb lohnt sich der Blick auf lokale und offene Modelle gleich doppelt.
Fazit: jetzt nutzen, aber mit klarem Kopf
Claude Fable 5 ist das stärkste Modell, das für die breite Masse freigegeben ist. Schon nach dem 22. Juni fliegt es wegen der enormen Nachfrage vorerst wieder aus den Abo-Plänen. Wer in den nächsten Tagen etwas Größeres bauen will, sollte Fable jetzt intensiv testen.
Gleichzeitig gilt: Für vertrauliche Geschäftsprozesse brauchst du eine datenschutzkonforme Lösung mit lokalen Modellen. Setze Fable als Orchestrator ein, halte deine Prompts kurz und vergib Rechte mit Bedacht. So nutzt du die Stärke von Fable 5, ohne dich von subventionierten Preisen oder erzwungener Datenspeicherung abhängig zu machen.



























