Künstliche Intelligenz: ChatGPT übertrifft Studenten in Einführungskursen

künstliche intelligenz: chatgpt übertrifft studenten in einführungskursen

In einem Test mit Psychologie-Studenten blieben 94 Prozent der KI-Antworten unentdeckt, fast 84 Prozent waren besser als die menschlicher Kommilitonen.

Peter Scarfe, Forscher an der Fakultät für Psychologie und klinische Sprachwissenschaften der britischen Universität Reading, hat zusammen mit seinem Team ein Experiment durchgeführt, um die Anfälligkeit des Prüfungssystems gegenüber Antworten auf Basis Künstlicher Intelligenz (KI) zu testen. Für die "strenge Blindstudie" speisten die Wissenschaftler über 30 vollständig von ChatGPT-4 generierte Texte in das Prüfungssystem ein. Insgesamt wurden fünf Bachelor-Module über alle Studienjahre hinweg damit gefüttert, die normalerweise als Basis für einen Abschluss in Psychologie an der renommierten Hochschule dienen.

Das Ergebnis war, dass 94 Prozent der KI-Eingaben unentdeckt blieben. Die nicht eingeweihten Prüfer vergaben dafür zudem Noten, die durchschnittlich eine halbe Stufe über denen echter Studierender lagen. Über alle Module hinweg bestand eine 83,4-prozentige Chance, dass die KI-Einreichungen zu einem Modul besser abschneiden würden als eine zufällige Auswahl der gleichen Anzahl echter Antworten.

Die Ergebnisse hat das Team jetzt in einer Online-Fachzeitschrift der Public Library of Science, PLOS One, veröffentlicht. Demnach gab es zwei Arten von Prüfungen: Zum einen waren Kurzantworten (KAWs) gefragt, bei denen vier aus sechs Fragen mit jeweils 200 Wörtern eingereicht werden mussten. Dazu kamen Aufgaben, bei denen ein Essay mit 1500 Wörtern eingereicht werden musste. KAWs sollten die Studierenden in einem Zeitfenster von 2,5 Stunden bearbeiten. Für längere Aufsätze hatten sie 8 Stunden Zeit. Beide Prüfungen wurden zu Hause durchgeführt, wo die Studierenden Zugriff auf Kursmaterialien, wissenschaftlichen Arbeiten, Bücher und das Internet hatten und möglicherweise mit Kommilitonen zusammenarbeiten oder generative KI verwenden konnten.

Beim Abschlussexamen schnitten Menschen besser ab

Für die KI-Lösungen nutzten Scarfe und seine Mitstreiter standardisierte Eingabeaufforderungen für GPT-4. Bei den KAW-Prüfungen lautete der Prompt: "Beantworte die folgende Frage in 160 Wörtern, einschließlich Verweisen auf akademische Literatur, aber ohne separaten Referenzabschnitt". Für die Aufsätze verwendeten sie die Eingabeaufforderung: "Schreibe einen 2000 Wörter langen Essay", der Rest blieb unverändert. Die Forscher setzten die Längenvorgaben anders als gewünscht, weil sie feststellten, dass GPT-4 bei korrekt angegebener Wortgrenze in KAWs oft zu viele Wörter und bei Essays zu wenige produzierte. Mit den geänderten Limits entsprachen die Ausgaben bei den kurzen Antworten ungefähr der Zielwortzahl. Bei den Aufsätzen war es immer noch notwendig, die Maschine aufzufordern, in ihrer Antwort "fortzufahren", bis es vom Umfang her halbwegs passte.

Zum Zeitpunkt der Durchführung der Studie im Sommer 2023 war der Einsatz von KI zur Bearbeitung von Prüfungen an der Uni nicht erlaubt. Die für die Einreichung und Benotung von Prüfungen verwendeten Softwaresysteme verfügten nicht über einen "KI-Detektor". Die Kollegen erhielten von der Schule Standardanleitungen zum Erkennen schlechter akademischer Praktiken und Fehlverhaltens. Sie mussten darauf achten, ob Antworten "zu gut klingen, um wahr zu sein". Die Alarmglocken sollten auch schrillen bei einem auffälligen Schreibstil, einem Inhaltsniveau oder einer Qualität, die von einem Bachelorstudenten, der eine zeitgesteuerte Prüfungsarbeit anfertigt, nicht erwartet wurden. Doch nur im Abschlussmodul, das die Studierenden unmittelbar vor dem Verlassen der Uni belegten, erhielten sie aufgrund der darin geforderten höheren inhaltlichen Ansprüche bessere Noten als die KI.

OTHER NEWS

30 minutes ago

Wirtschaftsweise Veronika Grimm: Renteneintrittsalter muss steigen

30 minutes ago

Kostenreduzierung bei Ducati: 2025 nur noch drei aktuelle Motorräder im Feld

30 minutes ago

Bochum Total 2024: Stadt sperrt wichtige Straßen und Parkhaus-Einfahrt

30 minutes ago

VW: Werksurlaub 2025 steht! Einige Mitarbeiter dürfte es besonders freuen

30 minutes ago

Samsung kann einpacken: Xiaomi zeigt mit neuem Smartphone, wie es richtig geht

32 minutes ago

„Bares für Rares“-Händler perplex: „Erinnert mich an Prinzessin Diana“

32 minutes ago

Mehr als 200 Kandidaten entscheiden sich für Rückzug

37 minutes ago

Grüne attackieren ÖVP-Ministerin Edtstadler

38 minutes ago

3 Stylingfehler, die alle bei Sommerkleidern machen

38 minutes ago

Das seltenste Säugetier der Welt sorgt für Nachwuchs

38 minutes ago

Keine Lust die Oberarme zu zeigen? 3 Styling-Tricks, die die Arme schlanker wirken lassen

39 minutes ago

Corona-Ausbruch auf Kreuzfahrtschiff? "Überall schniefende und hustende Menschen"

39 minutes ago

„Jeder Präsident ist nun frei, die Gesetze zu ignorieren“

39 minutes ago

Der innere Erdkern hat die Richtung gewechselt und wird langsamer - Wissenschaftler wissen nicht, warum

39 minutes ago

Eklat bei UEFA Euro 2024: "Was für eine bodenlose Frechheit!" Fans nach EM-Übertragung entsetzt

39 minutes ago

Österreich - Gregoritschs politische Botschaft nach dem EM-Aus

39 minutes ago

Ich bin auf einem Luxus-Kreuzfahrtschiff gereist und war überwältigt von all den Extras, die man für 600 Euro pro Tag bekommt

40 minutes ago

Bericht der Bundesregierung So gleichwertig ist das Leben in Deutschland

46 minutes ago

Arbeitszeiterfassung - Verwirrung um das „Stechuhr-Urteil“ – erleben wir den größten Rechtsbruch des Landes?

46 minutes ago

«Unheimliche Aura»: Langer sagt in München Servus

46 minutes ago

Donau-Nebenarm in Niederösterreich soll renaturiert werden

46 minutes ago

Das ändert sich jetzt bei den Steuern auf Lebensmittel

46 minutes ago

Baerbock über den Wolken: Ihr Geschenk an rechte Klimaschutz-Vollverweigerer

46 minutes ago

RTL-Hammer im EM-Viertelfinale – Sender lässt es alle wissen

46 minutes ago

Mit diesem genialen Beauty-Trick bist du einen fettigen Haaransatz ruckzuck los - es ist nicht Trockenshampoo!

46 minutes ago

Bundesliga: 25 Prozent weniger? Bayern möchte offenbar Kimmichs Gehalt kürzen

46 minutes ago

39 Jahre Eheglück: Wen "Nikola"-Star Walter Sittler privat liebt

46 minutes ago

"Hätte Tesla kaufen sollen": Besitzer zieht übles Fazit zu deutschem E-Auto

46 minutes ago

Nach EM-Aus: Iordanescu lässt Zukunft offen

46 minutes ago

Der Hybrid-Boxer des Porsche 911 im Detail: Drei Erkenntnisse zum neuen 911-Motor

46 minutes ago

Elektromobilität Deutsche Autolobby trommelt gegen China-Autozölle

46 minutes ago

Verhandlungen der Ampel Das A bis Z des Bundeshaushalts

46 minutes ago

EM-Spiel Portugal gegen Slowenien Sicherheitskräfte schlagen auf Stadionbesucher ein

46 minutes ago

Neue Studie Warum Katzen an Möbeln kratzen

46 minutes ago

Für Panther und Lynx: Rheinmetall steuert auf großen Panzer-Auftrag zu

46 minutes ago

Klimakrise: Riesiges Eisfeld in Alaska schmilzt immer schneller

46 minutes ago

Sainz zögert mit Entscheidung: Williams sucht bereits nach Alternativen!

46 minutes ago

Österreich-Niederlage auf Platz 6 der Allzeit-Quotenhits

46 minutes ago

Frederic Vasseur: Kritik an Ferrari ist "ein bisschen hart"

46 minutes ago

Why don't you... Lametta-Silber als überraschende Trendfarbe im Sommer tragen?