Wikipedia bittet KI-Entwickler:innen darum, auf Scraping zu verzichten und stattdessen für den Zugriff die bezahlte API zu verwenden. Die Wikimedia Foundation stellt damit klare Regeln für den Umgang mit ihren Inhalten auf.
Wikipedia setzt auf verantwortungsvollen Umgang mit Inhalten
Die Wikimedia Foundation, Betreiberin der bekannten Online-Enzyklopädie Wikipedia, hat am Montag einen Aufruf an KI-Unternehmen veröffentlicht. In einem Blogpost rief die Organisation dazu auf, Wikipedia-Inhalte “verantwortungsvoll” zu nutzen: Beiträge sollen ordnungsgemäß mit Quellenangabe versehen werden, und der Zugriff auf Inhalte soll über das kostenpflichtige Produkt Wikimedia Enterprise erfolgen.
Mit dieser bezahlten API können Unternehmen umfangreich auf Wikipedia-Inhalte zugreifen, ohne dass dabei die Server des Projektes stark belastet werden. Die Einnahmen aus dem Enterprise-Angebot helfen zudem, das gemeinnützige Ziel der Wikimedia Foundation weiterhin zu unterstützen.
Verstärkt Scraping durch KI-Bots festgestellt
Konkrete Strafen oder juristische Schritte gegen Scraping werden von der Wikimedia Foundation bislang nicht angedroht. In letzter Zeit stellte die Organisation jedoch fest, dass KI-Bots in großem Umfang Wikipedia-Daten sammelten und dabei versuchten, als normale Nutzer:innen zu erscheinen. Nachdem Wikipedia seine Erkennungsmechanismen für Bots verbessert hatte, zeigte sich, dass die auffälligen Zugriffsanstiege im Mai und Juni durch solche KI-Bots verursacht wurden, die eine Entdeckung vermeiden wollten.
Der Blogbeitrag berichtet außerdem, dass im selben Zeitraum die Seitenaufrufe durch echte Nutzer:innen um acht Prozent im Jahresvergleich gesunken sind. Hieraus ergibt sich eine besorgniserregende Entwicklung: Für den dauerhaften Ausbau des Wikipedia-Inhaltsprojekts sind freiwillige Beitragende und Spender:innen unverzichtbar – sinken die Zugriffe, schrumpft auch diese Basis.
Richtlinien für generative KI-Anbieter und Fokus auf Transparenz
In ihrem aktuellen Leitfaden richtet sich Wikipedia gezielt an Entwickler:innen generativer KI. Diese sollen bei der Nutzung von Wikipedia-Daten stets die Quelle angeben, um den Beitrag der menschlichen Autor:innen angemessen zu würdigen. Nach Ansicht der Wikimedia Foundation bleibt nur so das Vertrauen in digitale Informationen gewahrt, wenn Nutzer:innen erkennen können, woher die Inhalte stammen.
Die Organisation verweist darauf, dass ein Rückgang der Wikipedia-Besuche auch zu weniger ehrenamtlichen Beitragenden und damit zu weniger neuen oder erweiterten Artikeln führt. Auch finanzielle Unterstützung durch Einzelspenden könnte weiter zurückgehen, wenn weniger Menschen Wikipedia tatsächlich nutzen.
Bereits im vergangenen Jahr veröffentlichte Wikipedia eine KI-Strategie für die Community der Beitragenden. Die Plattform plant, KI-gestützte Tools zur Unterstützung bei Routineaufgaben, zur Automatisierung von Übersetzungen und für weitere Hilfsmittel einzusetzen. Dabei geht es darum, den Arbeitsalltag der ehrenamtlichen Editoren zu erleichtern, nicht darum, sie komplett durch KI zu ersetzen.