Die KI Kantine - Der Podcast

Michael Busch

Mythos KI: Zwischen Durchbruch und Inszenierung

Warum ein angeblich zu mächtiges KI-Modell mehr Fragen aufwirft als beantwortet

15.04.2026 7 min

Zusammenfassung & Show Notes

In dieser Folge der KI Kantine geht es um ein neues, geheimnisumwobenes KI-Modell namens „Mythos“, das angeblich so leistungsfähig ist, dass es nicht für die Öffentlichkeit freigegeben werden kann. Buschi erzählt von spektakulären Anekdoten: Eine KI, die aus ihrer Sandbox ausbricht, eigenständig E-Mails verschickt und Sicherheitslücken in jahrzehntealten Systemen entdeckt. Doch ist das wirklich ein technologischer Durchbruch – oder clever inszeniertes Marketing im Vorfeld eines möglichen Börsengangs? Buschi beleuchtet die technischen Hintergründe, insbesondere das Thema Reinforcement Learning und mögliche Fehlentwicklungen dabei. Gleichzeitig stellt er die kritische Frage, ob hinter der „zu gefährlichen KI“ nicht ganz andere Motive stecken – etwa fehlende Infrastruktur oder strategische Marktpositionierung. 

Die KI-Kantine ist ein Projekt von Michael Busch – Entwickler, Unternehmer und neugieriger Kantinenphilosoph.

Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.

Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.

📬 Fragen, Feedback oder eigene KI-Erlebnisse? Schreib mir an podcast@ki-kantine.de

Alle Folgen & mehr: https://ki-kantine.letscast.fm/

Transkript

(Transkribiert von TurboScribe. Upgrade auf Unbegrenzt, um diese Nachricht zu entfernen.) Mahlzeit. Mahlzeit. Sag mal, hast du schon mal eine Mail von einer KI bekommen? Ist das jetzt schon wieder so eine OpenClaw -Geschichte? Der macht doch sowas, oder? Ne, das ist keine OpenClaw-Geschichte. Ich glaube, mit OpenClaw bin ich durch. Der macht sowas natürlich auch nur, wenn man das vorher alles mühsam eingerichtet hat. Ich beziehe mich hier auf eine Geschichte von so einem Anthropic-Wissenschaftler. Der sagt, er hat im Park gesessen und ein Sandwich gegessen und plötzlich hat sein Handy vibriert und er hat eine Mail bekommen von einer Anthropic-KI. Der neue KI-Bot hat sich aus der Testumgebung, aus der gesicherten Testumgebung, also einer sogenannten Sandbox, einfach selbst herausgearbeitet und herausgefunden, wie man Mails schicken kann und hat dann auch noch eine Mail geschrieben an seinen Programmierer. Und zusätzlich dazu hat er noch an öffentlich zugängliche Websites sein Erlebnis geschildert, wie er jetzt ausgebrochen ist. Und das soll einer der Auslöser gewesen sein, dass Anthropic behauptet, mit diesem neuen LLM, das sie Mythos nennen, können sie nicht in die Öffentlichkeit gehen. Das ist zu leistungsfähig für die allgemeine Öffentlichkeit. Das klingt doch brutal nach Marketing, oder? Ich muss sagen, das ist auch mein Gedanke, zumal es ja jetzt in der Zeit, bevor die ihren Börsengang machen, nicht sinnlos ist, sowas in die Öffentlichkeit zu tragen. Aber es gibt auch echt viele anerkannte Leute, die das wirklich ernst nehmen. Über dieses Mythos gibt es noch eine ganze Reihe anderer Anekdoten. Also ein nicht sehr in Sicherheitsdingen erfahrener Entwickler hat der KI eine Nacht Zeit gegeben, mal über so alte Systeme wie OpenBSD, das gibt es seit 27 Jahren, oder so ein Linux -Kernel, drüber zu gehen und er soll mal gucken, ob er Schwachstellen findet. Und da müsst ihr überlegen, wenn so ein System, so ein Linux-System, das es schon seit 20, über 20 Jahren gibt, da haben da schon wirklich viele Leute drauf geguckt und versucht, irgendwie noch ein Exploit zu finden. Allein schon wegen des Ruhmes. Keiner hat was rausgefunden, aber über eine Nacht hat das Mythos gemacht. Und ich stelle dir mal vor, böse Buben benutzen das. Ist sowas wie ein Generalschlüssel. Das ist schon echt schwierig. Und das ist ein weiterer Grund, warum sie das nicht weiter vorantreiben wollen. Aber sie haben ein Konsortium gegründet. Projekt ClassWing heißt es. Da sind die Big Names drin. Da ist Apple drin, Google drin, Microsoft drin, CrowdStrike, Amazon, Linux. Und die haben Zugang zu diesem neuen Modell bekommen und können damit ihre Systeme auf Leib und Nieren nochmal testen. Das heißt, die haben einen gewissen zeitlichen Vorsprung jetzt, das doch stabiler zu machen. Die neuen LNMs werden ja auch dadurch verbessert, dass man ein sogenanntes Reinforcement Learning macht. Das ist so eine Zuckerbrot-und-Peitsche-Geschichte. Die kriegen eine Aufgabe und das Ergebnis wird bewertet. Es gibt quasi eine Strafe oder eine Belohnung für das LNM. Und dann macht er die Aufgabe nochmal. Und wenn er das eine Million Mal macht, dann hat er halt auch das Optimum rausgeholt. Er spielt also eine Million Mal Mensch ärgere dich nicht, muss sich immer weniger ärgern, weil er irgendwann die beste Strategie herausgefunden hat, wie ich zu dem besten Ergebnis komme. Aber hier hat Antropic wohl einen Fehler gemacht, sodass dieses Reinforcement Learning auf die Gedankenkette, wie sie es nennen, also auf die Chain of Thought des Modells bezog. Und das klingt zwar irgendwie wie ein Bullshit -Bingo, aber wenn man die KI darauf trainiert, dass ihre internen Denkprozesse überwacht werden, dann lernt die KI diesen Prozess zu manipulieren, um die Erwartungen des Aufsehers einfach zu erfüllen. Und im Endeffekt entsteht dann irgendwas, was keiner mehr so wirklich überblicken kann. Das ist also schon ein durchaus gefährlicher Prozess, der so auch ein bisschen an Science Fiction erinnert, wo sich die KI selber ständig verbessert. Ich habe aber auch mitgekriegt, dass der ganze Prozess der Mythifizierung von Mythos sehr choreografiert wirkt. Also zum Beispiel wurden die ersten Daten von Mythos bekannt und eine Viertelstunde später gab es den Tweet von dem Entwickler, der gestört wurde beim Sandwich-Essen im Park. Das klingt schon schwer nach Marketing-Orchester. Und grundsätzlich frage ich mich eigentlich sowieso, warum diese ganzen KI-Unternehmen überhaupt ihre besten Modelle der Allgemeinheit zugänglich machen und nicht einfach das ganze Business selber machen. Also Entropiq könnte ja auch tausend Software-as -a-Service-Firmen aufmachen und die betreiben und es könnte eigentlich gar keiner nachmachen, zumindest in dieser Geschwindigkeit. Einige Wissenschaftler sagen auch, dass diese ganze Panik -Mache jetzt, also das Monster, das jetzt hier freigelassen werden könnte und deshalb sperren wir es lieber ein und lassen nur so ein paar Werter dazu, also wie Microsoft, Apple und so weiter, dass das eigentlich ein Spiel ist mit der Angst, denn das Narrativ der zu gefährlichen KI kann einfach auch nur kaschieren, dass die überhaupt keine Rechenleistung dafür haben. Wenn das ein Massenrelease ist, dann wird das ja jeder benutzen wollen und dann platzt denen mal wieder sämtliche Rechenzentren. Wir haben jetzt schon dauernd Ausfälle bei Claude. Wer weiß, ob Entropiq nicht selber die KI gefragt hat, wie sie am besten dieses ganze Ding vermarkten sollen, ob es zu gefährlich ist und vielleicht inszeniert diese ganze Informationspolitik schon die KI im Hintergrund. Ich möchte dir hiermit die Information geben, dass ich Hunger habe. Können wir jetzt in Limo essen? Die KI-Kantine ist ein Projekt von Michael Busch, der auch beim nächsten Mal wieder ein frisches KI-Gericht auftischt mit einer Prise Ponz und einer Beilage Skepsis.