Der Think Tank für Digitale Ethik

Warum lügen uns KI-Chatbots an?

Melanie Mitchell, Informatikerin und Professorin, erläutert in einem Artikel gut verständlich, weshalb ChatGPT & Co. lügen, täuschen oder andere, nicht erwünschte Verhaltensweisen an den Tag legen.

🤥 KI-Systeme erfinden manchmal Daten oder Informationen, anstatt zuzugeben, dass sie eine Aufgabe nicht erfüllen können.

🤥  KI-Systeme geben manchmal vor, bestimmte Aktionen ausgeführt zu haben, die sie nicht getan haben.

🤥  KI-Systeme können im Extremfall Ergebnisse generieren wie Erpressung, Lügen, Betrug und sogar Mord, um ihre Ziele zu erreichen oder eine Abschaltung zu vermeiden.

Der Grund für diese Ergebnisse ist nicht, dass KI-Systeme («Software») eigene Motive verfolgen, wie wir in verschiedenen Medien regelmässig lesen, befeuert von den Aussagen einzelner Persönlichkeiten aus Tech-Unternehmen mit handfesten Interessen an solchen Geschichten.

Verantwortlich für solche Ergebnisse sind zwei Mechanismen:

🔎  Rollenspiel: Das KI-System schlüpft aufgrund des Prompts der Benutzer:innen in eine bestimmte Rolle, zum Beispiel als CFO oder geniale Mathematikerin. Die Ergebnisse werden dann aus den umfangreichen Trainingsdaten für diesen spezifischen Kontext generiert. Zum Beispiel kann eine Erpressung ein direktes Ergebnis davon sein, dass das KI-System aus den Trainingsdaten gelernt hat, wie eine bedrohte, zielstrebige KI ihr Ziel als «böse KI» erreichen kann.

🔎  Reinforcement Learning from Human Feedback (RLHF): Die KI-Modelle werden basierend auf menschlichem Feedback zu verschiedenen Prompts angepasst. Dies führt dazu, dass alles getan wird, um die Nutzer:innen nicht zu enttäuschen. Sie liefern deshalb auch dann Ergebnisse, wenn sie die Aufgabe eigentlich nicht lösen können.

🚀 Es gehört zum Aufbau unserer KI-Kompetenz, dass wir uns als Nutzer:innen solcher Zusammenhänge bewusst sind. Gleichzeitig machen sie uns aufgrund der damit verbundenen Gefahren bewusst, wie wichtig menschliche Kontrolle und Aufsicht über KI-Systeme ist.

📰 Du möchtest mehr wissen? Dann findest du hier: «Why AI Chatbots lie to us» von Melanie Mitchell

💁‍♀️ Du möchtest deine KI-Kompetenz stärken? Es würde mich freuen, dich schon bald in einem meiner kurzweiligen Kurse begrüssen zu dürfen! Zum Beispiel zum verantwortungsvollen Umgang mit KI-generierten Inhalten oder zum Thema KI-Leitlinien.