Ein ungewollter Entdecker
Mathias Schindler, ein erfahrener Wikipedianer, wollte ursprünglich nur fehlerhafte ISBNs in Wikipedia korrigieren. Doch bei seiner Recherche stieß er auf ein besorgniserregendes Phänomen: KI-generierte Inhalte, die in der Enzyklopädie gefälschte Informationen verbreiten. Auf dem 39C3-Konferenz berichtete er von seinen Erfahrungen und dem Einfluss, den große Sprachmodelle wie ChatGPT auf Wikipedia und andere Informationsquellen haben können.
ISBNs als Schlüssel zur Wahrheit
Schindler erklärt, dass ISBNs eine wesentliche Rolle in Wikipedia spielen, um Bücher korrekt zu identifizieren. Indem er ein Skript entwickelte, das die gesamte deutschsprachige Wikipedia nach ISBNs mit fehlerhaften Prüfziffern durchsucht, konnte er nicht nur Fehler aufspüren, sondern auch auf eine alarmierende Anzahl von artikelartigen Einträgen stoßen, die anscheinend komplett erfunden waren. Diese Artikel enthielten fiktive Bücher mit plausiblen, jedoch nicht existierenden Titeln und Autoren.
Die dunkle Seite der künstlichen Intelligenz
Insgesamt fand Schindler rund 150 Artikel, die potenziell AI-generierte Inhalte enthielten. Obwohl dies lediglich 0,005 Prozent der mehr als drei Millionen Artikel ausmacht, wirft es ernsthafte Fragen zur Integrität der Wikipedia auf. Die Nutzung von KI, um vermeintlich valide Informationen zu generieren, könnte die Glaubwürdigkeit dieser Plattform gefährden.
Nicht nur KI als Verursacher
Es bleibt jedoch zu bedenken, dass nicht jedes Fehlerbild auf KI zurückzuführen ist; manche falschen ISBNs könnten auch fehlerhafte Eingaben oder Druckfehler in Verlagen sein. Schindler weist darauf hin, dass sein Entdeckungswerkzeug nicht alle halluzinierten Inhalte erfassen kann, und es fehlen umfassendere Methoden zur Identifizierung derartiger Manipulationen in Wikipedia. Beispielsweise könnte eine systematische Analyse der Satzstruktur oder exzessive Nutzung von Adjektiven auf KI-generierte Texte hinweisen.
Ein besorgniserregender Trend
Die von Schindler aufgedeckten Ergebnisse sind ein Weckruf für die Wikipedia-Community. Die Gefahr, dass sich falsche Informationen in dieser Märchenlandschaft verselbstständigen, ist real. Wenn Wikipedia als Faktenspeicher dient, können diese Falschmeldungen zu einer gefährlichen Verbreitung von Fehlinformationen führen. Schindler vergleicht die Situation mit einer „Anti-These“ zu dem, was Wikipedia erreichen möchte: eine verlässliche Sammlung von Wissen.