Es scheint, dass die Ära kostenloser Daten für das Training von KI-Modellen bald vorbei sein wird. Die Social-Media-Plattform Reddit kündigte an, Unternehmen für den Zugang zu ihren Daten im Rahmen eines neuen Premium-Angebots in Rechnung zu stellen. Große Player im KI-Rennen, wie OpenAI, Microsoft und Google, nutzen Reddits Daten zum Trainieren ihrer KI-Modelle, wie die New York Times berichtete. Reddit-CEO Steve Huffman sagte der Times, dass Reddit seine Daten nicht kostenlos an Tech-Giganten abgeben müsse.
Kostendiskussion und Wert der Reddit-Daten
Reddit führt einen neuen Premium-Zugang für Drittanbieter ein, die zusätzliche Funktionen, höhere Nutzungsbeschränkungen und umfassendere Nutzungsrechte benötigen. Ein Reddit-Sprecher sagte, dass das Unternehmen daran arbeite, eine nachhaltigere und gesündere Datenökosphäre zu schaffen. Das Unternehmen ist derzeit dabei, die Kosten für den Zugang zu seiner API (Application Programming Interface) festzulegen. Laut CEO Steve Huffman sind die Reddit-Daten sehr wertvoll, aber das Unternehmen müsse diesen Wert nicht kostenlos an die größten Unternehmen der Welt weitergeben.
Wichtige KI-Unternehmen, die Reddit nutzen
Unternehmen wie OpenAI, Microsoft und Google, die alle generative KI-Modelle entwickeln, haben bisher Reddits API zur Schulung ihrer großen Sprachmodelle (LLMs) genutzt, einschließlich ChatGPT. Huffman betonte, dass die Daten von Reddit ständig aktualisiert werden und somit für Modelle wertvoll sind, um bessere und relevantere Antworten zu liefern. Er beschrieb Reddit als Ort für authentische Gespräche im Internet und betonte, dass viele Inhalte der Plattform nur in vertraulichen Umgebungen wie Therapiesitzungen oder Selbsthilfegruppen geteilt würden.
Zugang für Entwickler und Forscher
Das Unternehmen betonte, dass seine Daten-API weiterhin für angemessene und geeignete Anwendungsfälle zugänglich sein wird und auch für Entwickler, die Anwendungen erstellen, um Menschen bei der Nutzung von Reddit zu unterstützen, weiterhin kostenlos ist. Auch Forscher, die Reddits Daten für Studien oder andere nicht-kommerzielle Zwecke nutzen, erhalten weiterhin kostenlosen Zugang.
Fazit
Die Entscheidung von Reddit zeigt, dass die kostenlose Nutzung von Daten zur KI-Entwicklung wohl bald der Vergangenheit angehören wird. Unternehmen, die auf solche Daten angewiesen sind, müssen sich auf neue Kostenstrukturen und Zugangsbeschränkungen einstellen.