Ja... wieder was über AI ¯\\(ツ)\/¯
Die Entwicklung des Internets hat schon mehrfach massive Probleme Herausforderungen mit dem Urheberrecht ausgelöst. Vor etwas mehr als 20 Jahren beispielsweise hat Napster der Welt vor Augen geführt, dass das Urheberrecht mit dem Internet völlig neue Aufgaben lösen muss. Und seit mittlerweile über zehn Jahren wird diskutiert, ob Suchmaschinen News-Publisher dafür bezahlen müssen, sie zu verlinken. Beides ist auch nach Jahren nur so leidlich geklärt, sowohl gesellschaftlich als auch juristisch...
Jetzt kommt das Thema AI-Modelle und Trainingsdaten noch dazu: Dürfen Inhalte ohne Zustimmung des Urhebers/Rechteinhabers genutzt werden, um KI zu trainieren?
Open AI und Co. sind davon wohl ausgegangen und haben ihre bahnbrechenden Modelle erstmal auf allem trainiert, was das Internet zu bieten hatte. Wir haben schon ein paar Beispiele dafür in unserem Newsletter erwähnt und das Thema wird auch außerhalb der Tech Bubble diskutiert.
Insbesondere für Bilder ist hier die Diskussion schon vor Gerichten gelandet. Ob ein konkreter Inhalt verwendet wurde, ist in der Regel schwer nachzuweisen. Das Wasserzeichen von Getty Images ist da eher die Ausnahme. Wie die Verarbeitung von Inhalten durch die KI, die den eigentlichen Inhalt nicht speichern, sondern lediglich das Modell davon beeinflussen lassen (so wie ein menschlicher Künstler sich von einem Inhalt inspirieren lassen würde?) bewertet wird, ist noch völlig offen.
Daher versuchen die Rechteinhaber, eher die Bereitstellung der Trainingsdaten anzugehen. Das Portal haveibeentrained.com gibt Dir die Möglichkeit herauszufinden, ob Deine Inhalte bereits in Trainingsdatensätzen Verwendung finden.
Der Fotograf Robert Kneschke hat sich auf der Basis mit dem LAION e.V. angelegt und berichtet über seine Sichtweise der Dinge. Interessant finde ich den Kniff von LAION, nicht die Bilder selbst bereitzustellen, sondern nur die URLs. Mein laienhaftes Rechtsverständnis befürchtet, dass entsprechende Urteile auch abseits von KI-Themen rechtliche Auswirkungen auf das Setzen von Links haben (gute oder schlechte).
Auf der anderen Seite versucht beispielsweise Shutterstock mit lizenzierten Trainingsdaten Geld zu verdienen, was mäßig gut bei den Inhalteerstellenden anzukommen scheint. Und auch wenn sich im deutschen Recht oder gar auf EU-Ebene ein Konsens findet, wie damit umgegangen wird, heißt das nicht, dass andere Teile der Welt dem folgen. Wenn sich beispielsweise El Salvador schon versucht, als KI-Steueroase zu positionieren, wäre es schließlich kontraproduktiv, das mit restriktiver Urheberrechtsauslegung zu torpedieren. Hier verbergen sich eine nicht definierte Zahl moralischer Dilemmata (Dilemmen? Dilemmas? Hey Bard, wie schreib ich das richtig?) zwischen den Chancen, die moderne AI-Modelle bieten, und den Rechten der genauso modernen Menschen, deren Arbeit geklaut, kopiert, überlagert oder lohngedumpt wird, weil AI so viel schneller skaliert.