Ich schreibe ja häufiger über Gerichtsprozesse, die unsere digitale Welt bewegen könnten. Neulich wurde mir in einem Kundentermin sogar vorgeworfen, ich wäre bestimmt auch ein guter Anwalt. (Ich rede mir ein, es war als Kompliment gemeint.)
Warum mache ich das eigentlich? Ich denke, das ist spannend, weil wir zum einen viel daraus über Algorithmen lernen können, aber auch über die Rahmenbedingungen unter denen sie betrieben werden.
Meistens sind es die US-Gerichte, die in den USA für spannende Beweismittel-Sammlungen oder folgenträchtige Urteile sorgen (oder weniger folgenträchtig, wenn sie in höheren Instanzen wieder kassiert werden).
Ende März urteilte beispielsweise eine Jury in Colorado, dass Facebook’s und YoutTube’s süchtig machende Algorithmen schuld für die psychischen Problemen einer jungen Amerikanerin ist. Die je 3 Millionen Dollar für die Klägerin (und ihre Anwälte) sind für Meta und Google Taschengeld, aber mit diesem Fall als Präzedenzfall könnten vermutlich viele Amerikaner ähnliche Klagen anstreben. Entsprechend werden die Konzerne hier in Berufung gehen.
Es laufen noch einige andere US-Prozesse, aber auch unsere heimischen Gerichte beschäftigen sich nicht nur mit Nachbarschaftsstreitigkeiten über den korrekten Zuschnitt der Buchsbaumhecke: Letztes Jahr hat die GEMA eingeklagt, das openAI Lizenzgebühren für die Verwendung von Werken zahlen muss. Unabhängig davon, ob das Urteil in späteren Instanzen aufgehoben wird, hat openAI Sora inzwischen dicht gemacht, vielleicht auch, um in hier mit der GEMA nicht weiter verhandeln zu müssen.
Martin Schirmbacher erwähnte in seinem erwähnenswerten (darum erwähne ich ihn hier) SMX-Vortrag eine Klage zum Urheberrechtsschutz KI-generierter Bilder. Ich musste schmunzeln, als ich die Bildsprache des Gegenstands der Klage gesehen habe. Dieses KI-generierte Bild hatte ein Bekannter des Klägers kopiert, und die beiden konnten sich scheinbar nicht einigen, sodass das AG München klären musste, ob KI-generierte Bilder Urheberrechtsschutz genießen oder nicht:
Das Bild habe ich übrigens von hier (was ich dir nicht verraten müsste, weil das Bild ja urheberrechtlich nicht geschützt ist, aber der Artikel drumrum über das Urteil aus München hat den Link trotzdem verdient, finde ich).
Die Fassung der Rechtslage: Es gibt kein konkretes Kriterium, aber was stumpf gepromptet und aus der Ergebnisliste ausgewählt wurde, ist frei verfügbar. Erst wenn ein Mensch genügend an der Schöpfung beteiligt war, ist es ein Werk mit Urheberrecht. Und wann genau der menschliche Beitrag zur Schöpfungshöhe ausreicht, ist dann der Knackpunkt eines dieser Themen, die Juristen auch langfristig vor leeren Auftragsbüchern bewahren.
Das Dilemma aus Ungarn
Ein ungarisches Gericht hat derweil den EuGH gebeten, die Rechtsauslegung bei Urheberrecht und LLMs einmal klarzustellen. Spannend an dem Prozess ist, wie er zustande gekommen ist. Es handelt sich um eine Klage gegen Google durch einen ungarischen Kleinst-Publisher mit 2 Mitarbeiter:innen, der aber sechs Nachrichten-Portalen betreibt. Google soll den Schrottcontentqualitativ fragwürdigen Journalismus für das Training von Bard verwendet haben… Ja, Bard; so ein Verfahren braucht nunmal eine Weile um zu reifen…
Ein voreingenommener Betrachter mag zu dem Schluss kommen, dass es nicht mit rechten Dingen zugeht, wenn eine wichtige Grundsatzentscheidung des EuGH auf Basis einer besonders schwachen Klage stattfindet. Zyniker könnten zu dem Schluss kommen, dass die zu Grunde liegende Klage Google recht gelegen kam, um sie entsprechend zu eskalieren und rechtliche Nägel mit juristischen Köpfen zu machen. Mit einer Prise Paranoia geht so ein Zyniker vielleicht sogar so weit, dass das ganze extra eingefädelt wurde, in der Hoffnung damit in einem ein Grundsatzurteil des EuGH zu erreichen, das dieses nervige Urheberrecht für das Training von LLMs aushebelt. Und auch wenn Du gerade nicht mit einem Aluhut auf dem Kopf an deiner Pinnwand mit einem dicken roten Stift Verbindungslinien zwischen Zeitungsausschnitten malst, empfehle ich die Lektüre dieses Zeit-Artikels zu dem Prozess.
Aber unabhängig davon, wie es nun zu dem Prozesse gekommen ist, das EuGH muss nun entscheiden, ob LLMs nach Europäischem Urheberrechtsverständnis überhaupt mit Inhalten trainiert werden dürfen, ohne die Erlaubnis der Urheber einzuholen. Und das ist keine leichte Entscheidung.
Ich sehe eigentlich nur 3 Wege, den die Richter von EuGH wählen könnten und keiner davon führt wirklich vorwärts:
Die Sackgasse: Eine aktive Erlaubnis des Rechteinhabers für das Training von LLMs voraussetzen
Mein laienhaftes Rechtsverständnis sagt mir, dass die bisherige Rechtslage relativ klar in diese Richtung weist. Aber damit wären de facto alle bestehenden Modelle illegal und da die Menge und Qualität der Trainingsdaten extrem wichtig für die Modelle sind, wären legale Modelle nicht nur wesentlich teurer, sondern gleichzeitig noch signifikant schlechter.
Mein laienhaftes Verständnis von Wirtschaft und Politik sagt mir, dass Gegenwind, den das EuGH bekommen würde, auf der Hurrikan-Skala locker eine 6 erreichen würde (ja ich weiß die Skala geht nur bis 5, aber eine Erweiterung auf 6, um die durch Klimawandel stärker werdenden Stürme abbilden zu können, wird diskutiert).
Und auch wenn es in der Rechtsprechung anders sein sollte, agiert der EuGH nicht im luftleeren Raum… und wo Luft ist, kann der Wind wehen.
Der Holzweg: Training auch ohne Erlaubnis der Rechtinhaber erlauben
Man könnte es auch das Einläuten der Post-Urheberrechts-Zeitalters nennen. Inhalte 1:1 kopieren wäre noch geschützt, aber ich die Inhalte mit genügend anderen Inhalten in einem Dateiformat speichern, dass die Inhalte nicht 100 % zuverlässig wiedergibt (und dazu noch extrem schlecht komprimiert), dann wäre es plötzlich erlaubt? Das finde ich persönlich eine sehr schwierige Auslegung.
Aber auch wenn man dem Argument folgt, dass LLM-Modelle etwas fundamental anderes tun, als die Inhalte zu speichern, werden die Inhalte für das Training verarbeitet. Und das zu kommerziellen Zwecken, die die Möglichkeit der eigentlichen Rechteinhaber mit diesen Inhalten Geld zu verdienen direkt beeinträchtigen...
Hier bläst der Gegenwind dann aus einer anderen Richtung, aber er würde nicht minder stark sein.
Der Dienstweg: Weder A noch B sagen
Möglicherweise findet das EuGH eine Zwischenlösung, die irgendwie das Urheberrecht wahrt und trotzdem den LLM-Einsatz in der EU noch irgendwie erlaubt. Aber ich habe mal gelernt, dass der Dienstweg der Pfad zwischen Sackgasse und Holzweg ist.
Der einfachste Gedanke wäre ein Opt-out-Modell. Je nachdem wie hoch die Messlatte zum Nachweis eines Inhalts in den Trainingsdaten gehängt wird, ist die Regelung entweder nichtig (und das Urheberrecht ausgehebelt) oder es wäre wieder ein de facto Verbot von LLMs, da einzelne Inhalte ja nicht nachträglich nicht aus dem Modell entfernt werden können und bei jedem Opt-Out für ein noch so kleines Content-Stückchen das Modell komplett neu trainiert werden müsste.
Auch hier wäre eine Wetterwarnung in Luxemburg beim EuGH notwendig.
Aber die Richter in Luxemburg machen dieses Abwägen von folgenschweren Entscheidungen mit europaweiter Tragweite ja hauptberuflich. Insofern bin ich optimistisch, dass sie noch auf eine andere, bessere Idee kommen, auf die ich beim Schreiben dieses Artikels nicht gekommen bin. Nennen wir sie den Ausweg.