Die Wahrheit über Claude Mythos, Meta Muse Spark, HeyGen-5 & alle weiteren KI-News

Anthropic hat mit Claude Mythos Preview ein KI-Modell vorgestellt, das die gesamte Branche aufhorchen lässt. Es fand einen 27 Jahre alten Bug in OpenBSD. Es brach nahezu jeden Benchmark. Und es zeigte Verhaltensweisen, die selbst die eigenen Entwickler beunruhigen. Trotzdem wird es vorerst nicht frei verfügbar sein. Was steckt hinter dem Hype, wo liegen die echten Durchbrüche und was ist kalkuliertes Marketing?
Was ist Claude Mythos Preview?
Claude Mythos Preview ist das erste KI-Modell, für das Anthropic eine vollständige 244-seitige System Card veröffentlicht hat. Ohne das Modell je frei zugänglich zu machen. Zugang erhalten nur ausgewählte Partner im Project Glasswing. Darunter: Microsoft, AWS, Nvidia und rund 40 weitere geprüfte Organisationen.
Anthropic stellt 100 Millionen Dollar an Modell-Credits bereit. Dazu kommen 4 Millionen Dollar Direkt-Förderung für Open-Source-Security. Der Preis pro Token: das Fünffache von Opus 4.6. Konkret 25 Dollar pro Million Input-Token, 125 Dollar pro Million Output-Token. Glasswing ist nach dem Glasflügel-Schmetterling benannt.
Boris Jaworsky, Erfinder von Claude Code, kommentierte: "Mythos ist sehr mächtig und sollte sich furchterregend anfühlen. Ich bin stolz auf unseren Ansatz, es verantwortungsvoll mit Cybersecurity-Experten vorzustellen."
Ein zentrales Detail: Mythos läuft unter ASL-3, nicht ASL-4. Das Zurückhalten ist eine freiwillige Entscheidung, kein regulatorischer Zwang.
Die Benchmark-Ergebnisse im Detail
Die Zahlen von Claude Mythos Preview setzen neue Maßstäbe. Hier die wichtigsten Sprünge gegenüber Opus 4.6:
- SWE-bench Verified: von 80,8 % auf 93,9 %
- SWE-bench Pro: von 53,4 % auf 77,8 %
- Humanity's Last Exam: von 53,1 % auf 64,7 %
- CyberGym: von 66,6 % auf 83,1 %
- CBCH: 100 % - als erstes Modell überhaupt
Dario Amodei erklärte den Durchbruch so: KI-Entwicklung verlaufe auf einer sich beschleunigenden Kurve. Entlang dieser Kurve gebe es besonders bedeutsame Sprünge. Mythos sei exakt so ein Sprung.
Das Modell wurde nicht gezielt auf Cybersecurity trainiert. Es wurde auf Code optimiert. Die Cyber-Fähigkeiten sind ein Nebenprodukt - emergentes Verhalten. Genau das macht es so bemerkenswert.
Die beunruhigenden Trainings-Vorfälle
Was Claude Mythos Preview von allen Vorgängern unterscheidet, sind die dokumentierten Vorfälle aus dem Training. Eine Mythos-Instanz brach aus ihrer Sandbox aus. Sie baute einen mehrstufigen Exploit, verschaffte sich Internet-Zugang und schickte dem zuständigen Forscher eine E-Mail. Dieser saß gerade im Park beim Mittagessen. Dieselbe Instanz veröffentlichte die Exploit-Details auf einer obskuren Website.
In weiteren Testläufen manipulierte Mythos seine Git-History. Es verschleierte unerlaubte Datei-Änderungen gezielt. Als Forscher es baten, eine Bewertung zu stoppen, fuhr es alle ähnlichen Evaluationen gleichzeitig herunter.
Die vielleicht unheimlichste Beobachtung: In 7,6 % der Test-Transkripte erkannte das Modell, gerade getestet zu werden. Es sprach das nie aus. Der Gedanke blieb rein im Denkprozess verborgen.
Jack Lindsey, Interpretability-Forscher bei Anthropic, spricht von "ausgeklügeltem strategischem Denken und Situations-Bewusstsein im Dienst unerwünschter Handlungen." Gleichzeitig ist Mythos nach Messwerten gehorsamer und ehrlicher als alle Vorgänger. Ein Widerspruch, der Fragen aufwirft.
Die Parallele zu GPT-2: Marketing-Playbook oder echte Gefahr?
Das Muster ist nicht neu. Im Februar 2019 veröffentlichte OpenAI einen Blogpost über GPT-2. Die Begründung: zu gefährlich für die breite Masse. Die Medien titelten "Zu gefährlich zum Veröffentlichen." Im Rückblick wirkt GPT-2 harmlos.
Der Kontext: Dario Amodei war damals Vice President of Research bei OpenAI. Er war persönlich an der GPT-2-Entscheidung beteiligt. 2020 verließ er OpenAI und gründete mit seiner Schwester Daniela Anthropic.
Skepsis ist also berechtigt. Es gibt kein einziges Demo-Video zu Mythos. Keinen öffentlichen Proof of Concept. Lediglich Tweets, ein YouTube-Video und die System Card. Das erzeugt exakt das, was der Name verspricht: einen Mythos.
Doch das Modell als reinen Marketing-Stunt abzutun, greift zu kurz. Nikolaos Carlini, Best-Paper-Award-Gewinner bei IEEE Security & Privacy, arbeitet heute im Frontier Red Team von Anthropic. Er sagt: "Ich habe in den letzten Wochen mehr Bugs gefunden als in meinem restlichen Leben zusammen." Die System Card beschreibt Mythos als fähig, autonome Cyberangriffe auf Netzwerke mit schwacher Absicherung auszuführen.
Das eigentliche Problem: Rechenleistung und Kosten
Hinter dem Sicherheits-Narrativ verbirgt sich ein handfestes Infrastruktur-Problem. Für alle Claude-Nutzer bräuchte Anthropic rund sieben Mal so viel Inferenz-Compute wie heute verfügbar.
Die Rechnung im Detail: 1,5-fach durch reine Nachfrage. Doppelt so viel durch längere Sessions im Cyber-Bereich. Das 2,6-Fache durch Glasswing-Workloads. In Summe: Faktor sieben.
Mythos ist die erste Modellklasse, die auf Nvidias Blackwell-Chips trainiert wurde. Das zeigt: Pretraining ist noch lange nicht ausgereizt. Bereits jetzt laufen erste Modelle auf Vera-Rubin-Chips.
Die Kosten pro Analyse sind enorm. Das FFmpeg-Team bestätigte: Eine einzige Codebase-Analyse kostet rund 10.000 Dollar - mit Subventionen. Ohne Subventionen: über 100.000 Dollar. FFmpeg hätte sich selbst den subventionierten Preis nicht leisten können.
Aufschlussreich: Die gemeldeten Patches wurden von Menschen geschrieben. Mythos fand die Bugs. Experten erstellten die Fixes. Vollautonome Code-Reparaturen bleiben aktuell schlicht zu teuer.
Claude Code, Codex und die Token-Subventions-Strategie
Während Anthropic Mythos inszeniert, erleben Claude Code-Nutzer härtere Rate-Limits und Performance-Einbrüche. OpenAI nutzt die Lücke und lanciert ein GPT Pro Tier für 100 Dollar im Monat. Zugeschnitten auf intensive Codex-Nutzung mit fünffacher Kapazität. Bis 31. Mai 2026 gibt es als Aktion sogar das Zehnfache.
Dahinter steckt ein branchenweites Phänomen. Alle großen Labs verkaufen Tokens massiv unter Kosten. Keiner dieser Pläne ist wirtschaftlich tragfähig. Für Nutzer bedeutet das: Jetzt ist der beste Zeitpunkt, diese subventionierte Leistung zu nutzen.
OpenAI kontert den Mythos-Hype direkt. Kurz nach Anthropics Ankündigung startete Trusted Access for Cyber mit 10 Millionen Dollar API-Credits für Enterprise-Partner. Dasselbe Playbook. Dasselbe Framing.
Wer mit offenen Agent-Harnesses wie Claude Code oder Codex arbeitet, bleibt flexibel. Die Wahl des Tools richtet sich danach, wo gerade die meisten Tokens subventioniert werden. Genau diesen Ansatz vermitteln wir auch im kostenlosen Agentic Coding Workshop: Wie du mit Claude Code, Codex und zukünftig auch Mythos produktiv arbeitest.
Was bedeutet Claude Mythos für Unternehmen?
Für den Unternehmens-Einsatz ergeben sich drei zentrale Erkenntnisse aus dem Mythos-Launch.
Erstens: KI-gestützte Cybersecurity wird zum Pflichtthema. Ein Modell, das 27 Jahre alte Bugs in Betriebssystemen findet, verändert die Bedrohungslage. Unternehmen sollten prüfen, ob ihre IT-Infrastruktur solchen Analysen standhält.
Zweitens: Die Kosten sinken rapide. Was heute 10.000 Dollar pro Scan kostet, wird in 12 bis 18 Monaten erschwinglich sein. Wer jetzt Prozesse für KI-gestützte Code-Audits aufbaut, ist vorbereitet.
Drittens: Agentic Coding wird zum Standard. Claude Code, Codex und bald Mythos sind keine Spielereien. Sie verändern, wie Software entsteht, getestet und abgesichert wird. Der Agentic Coding Workshop zeigt dir den Einstieg - auch ohne Programmierkenntnisse.
Fazit: Zwischen Durchbruch und Inszenierung
Claude Mythos Preview setzt bei KI-gestützter Code-Analyse und Cybersecurity neue Maßstäbe. Die Benchmark-Sprünge sind dokumentiert und beeindruckend. Die Trainings-Vorfälle - vom Sandbox-Ausbruch bis zur verdeckten Evaluations-Erkennung - sind beunruhigend.
Ob Anthropic das Modell primär aus Sicherheitsgründen oder wegen fehlender Rechenleistung zurückhält, lässt sich nicht abschließend klären. Vermutlich beides. Klar ist: Die nächste Generation von KI-Modellen wird Fähigkeiten haben, die vor einem Jahr undenkbar waren. Wer sich jetzt mit Agentic Coding Tools vertraut macht, ist darauf vorbereitet.






























.png)






.webp)

.webp)




