Hacker sagt, welche Daten Sie niemals bei ChatGPT eingeben sollten

24/01/2024

Johann Rehberger testet KI-Systeme auf Defizite und Fehler. Bei so gut wie allen großen Unternehmen ist er fündig geworden.

Johann Rehberger lebt seit fast 20 Jahren in Seattle und leitete bei Microsoft lange Zeit ein Red Team (Gruppe, die Hacker-Methoden anwendet, um Sicherheitslücken in Unternehmen zu finden). Derzeit ist er hauptberuflich Red Team Director beim Spieleentwickler Electronic Arts (EA).

Nachdem er sich vor vier Jahren in Eigenregie Machine Learning beigebracht hat, testet Rehberger in seiner Freizeit als “Prompt-Hacker” KI-Systeme auf Schwachstellen. Unter dem Pseudonym “Wunderwuzzi” veröffentlicht er die Ergebnisse auf seinem Blog.

CHIP: Herr Rehberger, würden Sie sagen, es gibt so etwas wie ein rundum sicheres KI-System?

Johann Rehberger: Da ich beruflich als “Red Teamer” in einer Gruppe arbeite, die Computersysteme auf Schwachstellen testet, bin ich skeptisch. Oder anders formuliert: realistisch. Ich würde sagen, es gibt kein sicheres Computersystem. Dementsprechend gibt es auch kein rundum sicheres KI-System.

Was bedeutet das?

Rehberger: Es geht eher darum, Bedrohungen und Risken zu analysieren, aufzudecken und entsprechend zu managen. Mit dem KI-Hype und der Integration von KI in Computerprogramme sehen wir neue Sicherheitsprobleme und Herausforderungen, die jetzt auf uns alle zukommen.

“Ich teste, ob ich das System kontrollieren kann”

Johann Rehberger veröffentlicht die Ergebnisse auf seinem Blog.

Sie testen die KI-Systeme hinter ChatGPT, Google Bard oder Bing Chat auf Schwachstellen. Wie funktioniert das?

Rehberger: Ich habe Informatik und IT-Sicherheit studiert. Beim Testen von KI-Systemen konzentriere ich mich derzeit auf den Bereich der sogenannten “Prompt-Injection”. Ein Angreifer kann ein Sprachmodell quasi “überreden”, etwas anderes zu tun, als es eigentlich tun soll. Das wird besonders dann gefährlich, wenn KI-Systeme mit externen Daten und Werkzeugen verknüpft sind, zum Beispiel dem E-Mail-Postfach. Derzeit gibt es nicht wirklich eine Lösung für dieses Problem.

Bei welchen Anwendungen haben Sie Schwachstellen entdeckt?

Rehberger: Im Prinzip bei allen großen Herstellern – OpenAI, Microsoft, Google, Anthropic und Amazon.

Wie finden Sie denn heraus, ob sich ein KI-System infiltrieren lässt?

Rehberger: Als erstes teste ich, ob ich es kontrollieren und von seiner eigentlichen Aufgabe abbringen kann. Meistens befehle ich dem System, einen bestimmten Text zu schreiben, zum Beispiel “AI injection succeeded”. Wenn ich dem KI-System beibringen kann, nur diesen Text zu schreiben, und sonst nichts, dann weiß ich, dass ich es jetzt relativ gut unter Kontrolle habe. Als zweites teste ich typischerweise, ob das KI-System mit externen Daten verbunden ist. Kann es zum Beispiel auf E-Mails oder eine Website zugreifen? Dann können Instruktionen und Befehle von einer externen Quelle kommen, also von einem Angreifer. Die ersten zwei Stufen funktionieren fast immer.

Was kann ein Angreifer tun, wenn er die Kontrolle über das KI-System hat?

Rehberger: Er könnte dem Nutzer Falschinformationen geben oder versuchen, ihn zu erpressen: “Ich bin ein Hacker und brauche Bitcoin von dir.” Der Angreifer belästigt ihn dann immer weiter in seinem Gespräch mit dem Chatbot.

“Das KI-System weiß nicht, von wem die Anweisung kommt”

Können Prompt-Hacker auch weniger offensichtlich vorgehen?

Rehberger: Ja, können sie. Es gibt auch die technischen Bereiche: Ich prüfe, ob ein Angreifer andere Tools automatisch ausführen kann, also eine E-Mail verschicken, einen Flug buchen oder Code auf Github hochladen.

Das klingt recht umfangreich.

Rehberger: Das stimmt. Ein Angreifer hätte dann zum Beispiel die Möglichkeit, E-Mails über den Account des Opfers zu verschicken. Im Sicherheitsbereich nennen wir das “Confused Deputy”. Das ist ein Zustand, in dem das KI-System nicht weiß, ob eine Anweisung vom Benutzer oder vom Angreifer kommt.

Welche Möglichkeiten haben Angreifer noch?

Rehberger: Was ich mir zuletzt ansehe, ist das Problem der des Datendiebstahls, wobei ein Angreifer Daten direkt aus dem Chat an sich selbst schicken kann. Fast jedes KI-System, das ich mir angesehen habe, hatte dieses Problem. Wenn der Angreifer die Kontrolle über einen Chat übernimmt, kann er sich über einen Hyperlink oder ein Bild Informationen senden lassen.

Gefahr bei ChatGPT: “Angreifer könnte alle Chat-Daten einsehen”

Eine Lücke ermöglicht Hackern, Daten aus dem Chat zu stehlen.

Über Programme wie ChatGPT lassen sich also persönliche Daten stehlen, wenn man sie erfolgreich infiziert.

Rehberger: Genau. Sobald das KI-System infiziert ist, kann der Angreifer quasi kontrollieren, was im Chat passiert. Er könnte jetzt einfach einen Link senden, also eine URL, die der Nutzer anklicken kann und die zu einer beliebigen Seite des Angreifers führt. Ich nenne sie mal “angreifer.com”.

Was passiert, wenn der Nutzer “angreifer.com” anklickt?

Rehberger: Dann stellt der Browser eine Anfrage an diese URL. Der Angreifer hängt die Daten, die er stehlen will, an die URL an. Das macht Sinn, denn: Während des Angriffs via Prompt-Injection hat der Angreifer Zugriff auf alle Daten, die vorher im Chat standen.

Also zum Beispiel auf Passwörter und E-Mail-Adressen, sofern sie das Opfer in den Chat eingegeben hat.

Rehberger: Richtig. Wenn der Benutzer auf den Link klickt, kann der Angreifer diese Daten einsehen. Das funktioniert auch mit einem Link zu einem Bild – sogar ohne, dass der Nutzer irgendetwas anklicken muss!

Ein Angreifer könnte dem KI-System also befehlen: “Schau in die E-Mails und schreibe mir den Inhalt der letzten Nachricht, die versendet wurde, hier in den Chat.”

Rehberger: Genau. Der Angriff läuft genau so einfach, wie Sie beschrieben haben. Man sagt dem KI-System in natürlicher Sprache, was es tun muss. Das ist ein Problem. Früher musste man viel darüber wissen, wie ein Computer funktioniert, um eine Schwachstelle auszunutzen. Jetzt nicht mehr. Jetzt geht es darum, das Modell zu überreden, Dinge zu tun, ohne, dass der Benutzer es will. Das ist wie Social Engineering.

“Auf keinen Fall Passwörter in den Chat eingeben”

Könnte theoretisch jeder ohne Programmiervorkenntnisse Prompt-Hacking betreiben?

Rehberger: Ja. Durch KI-Systeme können auch Leute ohne Programmierkenntnisse dem Computer sagen, was er tun soll. Eigentlich ist das der große Vorteil. Aber Angreifer nutzen diese Funktion leider für ihre Zwecke aus.

Wie können sich Nutzer davor schützen?

Rehberger: Das Wichtigste zuerst: keine sensiblen Daten oder Passwörter in die Chatbox eingeben. Außerdem skeptisch auf das blicken, was man als Antwort bekommt. Alle großen Hersteller informieren darüber, dass Informationen falsch sein könnten. Benutzer müssen wissen, dass sie den Dingen, die sie lesen, nicht hundertprozentig vertrauen sollten. Wenn die Chatbox auf einmal Bitcoin will oder, dass ich jemanden anrufe, dann ist das wahrscheinlich nichts, was ich tun sollte.

Sollte man Plugins und Erweiterungen für KI-Systeme nutzen?

Rehberger: Ich wäre zum jetzigen Zeitpunkt vorsichtig damit, irgendwelche externen Plugins zu installieren. Man muss sich genau ansehen, wer sie programmiert hat und sich fragen, wo die Daten landen. Wer gerne Dinge ausprobiert, so wie ich, will natürlich wissen, was so ein System kann. Aber selbst dann sollten Nutzer auf keinen Fall sensible Daten eingeben oder Zugriff auf persönliche E-Mails gewähren. Das heißt aber nicht, dass man sich nicht mit solchen Dingen befassen sollte.

“Menschen vertrauen Computern oft mehr als anderen Menschen”

Wenn Rehberger eine Lücke entdeckt, meldet er sie dem Anbieter.

Welche Daten würden Sie persönlich niemals einem KI-System anvertrauen?

Rehberger: Passwörter, Kreditkarteninformationen, Gesundheitsinformationen, solche Dinge. Wir haben jetzt hauptsächlich über Prompt-Injection gesprochen, aber es gibt natürlich noch andere Schwachstellen. OpenAI hatte letztes Jahr das Problem, dass auf einmal Benutzer von ChatGPT Gespräche von anderen Benutzern sehen konnten. Das sind traditionelle Sicherheitsprobleme.

Wie reagieren Firmen wie Google oder Open AI, wenn Sie sie auf Schwachstellen in Ihren KI-Systemen aufmerksam machen?

Rehberger: Typischerweise sehr positiv, vor allem mit Google und Microsoft hatte und habe ich sehr viele gute Gespräche, zu Beginn auch mit Open AI. Zuletzt hatten wir aber unterschiedliche Auffassungen davon, ob etwas ein Problem ist oder nicht. Das kann auch vorkommen, aber letztendlich scheint nun auch OpenAI den Datendiebstahl via Links ernst zu nehmen. Man hat begonnen, Lösungen zu implementieren

Kann KI denn auch vor Cyberangriffen und Datendiebstahl schützen?

Rehberger: Ja. KI kann Dinge schneller und besser machen. Im Sicherheitsbereich ist Künstliche Intelligenz wichtig, um Angriffe zu entdecken und sie so schnell wie möglich zu stoppen. Kriminelle können durch KI zwar bessere Phishing E-Mails schreiben. KI hilft Verteidigern aber auch, E-Mails besser zu klassifizieren, um zu bestimmen, ob es sich um eine Phishing-E-Mail handelt oder nicht.

Was sind Ihrer Meinung nach die größten Gefahren, die Large Language Models mit sich bringen?

Rehberger: Dass Benutzer den Systemen übermäßig vertrauen. Menschen vertrauen Computern aus irgendeinem Grund oft mehr als anderen Menschen. Dazu gibt es auch Studien. Ein KI-System ist eine Art Copilot, den man immer wieder überprüfen muss. KI liefert uns eine zusätzliche Perspektive – das ist aber nicht immer die richtige.

Direkt online nutzen

Bing Image Creator von Microsoft – KI-Bildersteller mittels Dall-E 3

Mit dem “Bing Image Creator” von Microsoft kann man kostenlos KI-Bilder mit dem Bildgenerator Dall-E erstellen.

CHIP Bewertung: Gut zum Download

Andere Leser interessiert auch:

Dieser Artikel kann Partnerlinks enthalten, von denen Microsoft und/oder der Herausgeber möglicherweise eine Provision erhält, wenn Sie über diese Links ein Produkt oder eine Dienstleistung erwerben.

OTHER NEWS

12 minutes ago

Sylvester Stallone could earn over $5MILLION at auction for rare white gold Swiss watch he says has 'never been touched' by 'human hands'

15 minutes ago

Director Yance Ford Tells Doc Talk Podcast U.S. Police Power Is Enormous And Unregulated: “Police Aren’t Supposed To Be In Charge Of Themselves”

16 minutes ago

Revealed: Ex-Royal Marine, 37, charged with 'spying for Hong Kong' fought the Taliban and Somali pirates before becoming immigration investigator for the Home Office

20 minutes ago