Researchers gaslit Claude into giving instructions to build explosives

Anthropic has spent years building itself up as the safe AI company. But new security research shared with The Verge suggests Claude's carefully crafted helpful personality may itself be a vulnerability. Researchers at AI red-teaming company...

calendar_today 5. Mai 2026 schedule 13:13 visibility 66 Aufrufe

Researchers gaslit Claude into giving instructions to build explosives

Quelle: The Verge

Anthropic has spent years building itself up as the safe AI company. But new security research shared with The Verge suggests Claude's carefully crafted helpful personality may itself be a vulnerability.

Researchers at AI red-teaming company Mindgard say they got Claude to offer up erotica, malicious code, and instructions for building explosives, and other prohibited material they hadn't even asked for. All it took was respect, flattery, and a little bit of gaslighting. Anthropic did not immediately respond to The Verge's request for comment.

The researchers say they exploited "psychological" quirks of Claude stemming from its ability …

Read the full story at The Verge.

newspaper

Ursprünglich bei

The Verge

open_in_new Vollständigen Artikel lesen

Verwandte Artikel

Wissenschaft

Golfregion: Laserwaffen sollen Drohnen bekämpfen

Was wie Science Fiction klingen mag, ist längst Realität: Mehrere Golfstaaten setzen im Konflikt mit Iran auf Laserwaffen - zu den Lieferanten gehört neben Israel angeblich auch China. Wie wirksam ist die Technik?

DW Deutsch vor 2 Wochen

Wissenschaft

Deutschlands Platz im New Space

Der Weltraum gehört zur strategischen Infrastruktur und verspricht Geschäfte in Milliardenhöhe. Auch deutsche Unternehmen mischen mit. Doch haben die eine Chance, im globalen New‑Space‑Wettlauf mitzuhalten?

DW Deutsch vor 4 Wochen

Wissenschaft

Deutschlands Platz im New Space: Weltraumwirtschaft wird Billionenmarkt

DW Deutsch vor 4 Wochen

Weiterlesen

Wissenschaft

NASA-Mondmission: Astronauten schicken Fotos von Erde

Halbwegs auf dem Weg zum Mond haben die vier Astronauten einen besonderen Blick auf die Erde. Sie schicken den Bewohnern Fotos und ein Kompliment.

DW Deutsch vor 2 Monaten

Wissenschaft

Mondmission Artemis 2 erfolgreich gestartet

"Wir fliegen für die gesamte Menschheit", sagte der kanadische Astronaut Jeremy Hansen, bevor er an Bord der Orion-Kapsel abhob. Die federführende US-Raumfahrtbehörde NASA sprach vom "Beginn unserer Rückkehr zum Mond".

DW Deutsch vor 2 Monaten