„Fix this code“: Sperre von Fable 5 und Mythos 5 angeblich nach simplen Prompt
Debatte um blockierte KI-Modelle
Die Sperre der Modelle Fable 5 und Mythos 5 sorgt weiter für Diskussionen in der KI-Szene. Nach Darstellung einer Sicherheitsforscherin soll kein klassischer Jailbreak nötig gewesen sein. Stattdessen habe ein einfacher Prompt wie „Fix this code“ ausgereicht, um problematisches Verhalten auszulösen beziehungsweise Sicherheitsmechanismen zu umgehen.
Warum der Fall Aufmerksamkeit bekommt
Der Vorgang ist relevant, weil er zeigt, wie schwer die Grenze zwischen legitimer Hilfe und riskanter Ausgabe bei leistungsfähigen KI-Systemen zu ziehen ist. Codeanalyse und Fehlerbehebung gehören zu den wichtigsten Einsatzfeldern moderner Modelle. Genau dort können aber auch Inhalte entstehen, die Anbieter als sicherheitskritisch einstufen.
Folgen für Anbieter und Nutzer
Für KI-Unternehmen bedeutet der Fall, dass Schutzmechanismen nicht nur auf offensichtliche Angriffe reagieren dürfen. Sie müssen auch alltägliche Arbeitsanfragen robust bewerten. Nutzerinnen und Nutzer sollten zugleich verstehen, dass Modellbeschränkungen nicht nur politische Entscheidungen sind, sondern oft Ergebnis technischer Risikoabwägungen.
Originalquelle: heise online – „Fix this code“: Sperre von Fable 5 und Mythos 5 angeblich nach simplen Prompt



