Zum Hauptinhalt springen

TL:DR;

  • Viele US-Gerichtsprozesse zu Algorithmen und Urheberrechten liefern wichtige Erkenntnisse über deren Funktionsweise und rechtlichen Rahmenbedingungen.
  • Ein aktuelles Urteil in Colorado sieht süchtig machende Algorithmen von Facebook und YouTube als Ursache für psychische Probleme, was potenziell ähnliche Klagen nach sich ziehen könnte.
  • Die GEMA klagt gegen OpenAI wegen Urheberrechtsverletzungen, was zur Folge hatte, dass OpenAI Sora in Europa nicht veröffentlichte, um Auseinandersetzungen zu vermeiden.
  • Das AG München verhandelte über den Urheberrechtsschutz KI-generierter Bilder und entschied, dass diese nur bei ausreichend menschlichem Beitrag urheberrechtlich geschützt sind.
  • Ein ungarisches Gericht hat den EuGH um Klärung der Rechtsauslegung bei Urheberrecht und LLMs gebeten, nachdem ein Kleinst-Publisher Google wegen der Verwendung seiner Inhalte für das Training von Bard verklagt hatte.
  • Diese Fälle zeigen, dass die rechtliche Auseinandersetzung mit KI und Algorithmen erst am Anfang steht und noch viele offene Fragen zu klären sind.
Im Labyrinth der Rechtswege

Ich schreibe ja häufiger über Gerichtsprozesse, die unsere digitale Welt bewegen. Neulich wurde mir in einem Kundentermin sogar vorgeworfen, ich wäre bestimmt auch ein guter Anwalt. (Ich rede mir ein, es war als Kompliment gemeint.)

Warum mache ich das eigentlich? Ich denke, das ist spannend, weil wir zum einen viel über Algorithmen daraus lernen können, aber auch über die Rahmenbedingungen, unter denen sie betrieben werden.

Meistens sind es die US-Gerichte, die in den USA für spannende Beweismittelsammlungen oder folgenträchtige Urteile sorgen (oder weniger folgenträchtig, wenn sie in höheren Instanzen wieder kassiert werden).

Ende März urteilte beispielsweise eine Jury in Colorado, dass die süchtig machenden Algorithmen von Facebook und YouTube schuld an den psychischen Problemen einer jungen Amerikanerin sind. Die je 3 Millionen Dollar für die Klägerin (und ihre Anwälte) sind für Meta und Google Taschengeld, aber mit diesem Fall als Präzedenzfall könnten vermutlich viele Amerikaner ähnliche Klagen anstreben. Entsprechend werden die Konzerne hier in Berufung gehen.

Es laufen noch einige andere US-Prozesse, aber auch unsere heimischen Gerichte beschäftigen sich nicht nur mit Nachbarschaftsstreitigkeiten über den korrekten Zuschnitt der Buchsbaumhecke: Letztes Jahr hat die GEMA eingeklagt, dass OpenAI Lizenzgebühren für die Verwendung von Werken zahlen muss. Unabhängig davon, ob das Urteil in späteren Instanzen aufgehoben wird, hat OpenAI Sora inzwischen dichtgemacht, vielleicht auch, um hier mit der GEMA nicht weiter verhandeln zu müssen.

Martin Schirmbacher erwähnte in seinem erwähnenswerten (darum erwähne ich ihn hier) SMX-Vortrag eine Klage zum Urheberrechtsschutz KI-generierter Bilder. Ich musste schmunzeln, als ich die Bildsprache des Gegenstands der Klage gesehen habe. Dieses KI-generierte Bild hatte ein Bekannter des Klägers kopiert, und die beiden konnten sich scheinbar nicht einigen, sodass das AG München klären musste, ob KI-generierte Bilder Urheberrechtsschutz genießen oder nicht:

Drei Symbole nebeneinander: ein Händedruck mit einer kleinen Glocke darüber, eine blaue Säule mit einem Briefumschlag davor und ein Laptop mit einem geöffneten Gesetzbuch und Paragraphenzeichen auf dem Bildschirm.

Das Bild habe ich übrigens von hier (was ich Dir nicht verraten müsste, weil das Bild ja urheberrechtlich nicht geschützt ist, aber der Artikel drum herum über das Urteil aus München hat den Link trotzdem verdient, finde ich).

Die Fassung der Rechtslage: Es gibt kein konkretes Kriterium, aber was stumpf gepromptet und aus der Ergebnisliste ausgewählt wurde, ist frei verfügbar. Erst wenn ein Mensch genügend an der Schöpfung beteiligt war, ist es ein Werk mit Urheberrecht. Und wann genau der menschliche Beitrag zur Schöpfungshöhe ausreicht, ist dann der Knackpunkt – eines dieser Themen, die Juristen auch langfristig vor leeren Auftragsbüchern bewahren.

Das Dilemma aus Ungarn

Ein ungarisches Gericht hat derweil den EuGH gebeten, die Rechtsauslegung bei Urheberrecht und LLMs einmal klarzustellen. Spannend an dem Prozess ist, wie er zustande gekommen ist. Es handelt sich um eine Klage gegen Google durch einen ungarischen Kleinst-Publisher mit zwei Mitarbeiter:innen, der aber sechs Nachrichtenportale betreibt. Google soll den qualitativ fragwürdigen Journalismus für das Training von Bard verwendet haben … Ja, Bard; so ein Verfahren braucht nun mal eine Weile, um zu reifen …

Ein voreingenommener Betrachter mag zu dem Schluss kommen, dass es nicht mit rechten Dingen zugeht, wenn eine wichtige Grundsatzentscheidung des EuGH auf Basis einer besonders schwachen Klage stattfindet. Zyniker könnten zu dem Schluss kommen, dass die zugrunde liegende Klage Google recht gelegen kam, um sie entsprechend zu eskalieren und rechtliche Nägel mit juristischen Köpfen zu machen. Mit einer Prise Paranoia geht so ein Zyniker vielleicht sogar so weit, dass das Ganze extra eingefädelt wurde, in der Hoffnung, damit ein Grundsatzurteil des EuGH zu erreichen, das dieses nervige Urheberrecht für das Training von LLMs aushebelt. Und auch wenn Du gerade nicht mit einem Aluhut auf dem Kopf an deiner Pinnwand mit einem dicken roten Stift Verbindungslinien zwischen Zeitungsausschnitten malst, empfehle ich die Lektüre dieses Zeit-Artikels zu dem Prozess.

Aber unabhängig davon, wie es nun zu dem Prozess gekommen ist, der EuGH muss nun entscheiden, ob LLMs nach europäischem Urheberrechtsverständnis überhaupt mit Inhalten trainiert werden dürfen, ohne die Erlaubnis der Urheber einzuholen. Und das ist keine leichte Entscheidung.

Ich sehe eigentlich nur 3 Wege, die die Richter von EuGH wählen könnten und keiner davon führt wirklich vorwärts:

Die Sackgasse: Eine aktive Erlaubnis des Rechteinhabers für das Training von LLMs voraussetzen

Mein laienhaftes Rechtsverständnis sagt mir, dass die bisherige Rechtslage relativ klar in diese Richtung weist. Aber damit wären de facto alle bestehenden Modelle illegal und da die Menge und Qualität der Trainingsdaten extrem wichtig für die Modelle sind, wären legale Modelle nicht nur wesentlich teurer, sondern gleichzeitig noch signifikant schlechter.

Mein laienhaftes Verständnis von Wirtschaft und Politik sagt mir, dass der Gegenwind, den der EuGH bekommen würde, auf der Hurrikan-Skala locker eine 6 erreichen würde (ja, ich weiß, die Skala geht nur bis 5, aber eine Erweiterung auf 6, um die durch den Klimawandel stärker werdenden Stürme abbilden zu können, wird diskutiert).

Und auch wenn es in der Rechtsprechung anders sein sollte, agiert der EuGH nicht im luftleeren Raum… und wo Luft ist, kann der Wind wehen.

Der Holzweg: Training auch ohne Erlaubnis der Rechteinhaber erlauben

Man könnte es auch das Einläuten des Post-Urheberrechts-Zeitalters nennen. Inhalte 1:1 zu kopieren wäre noch geschützt, aber wenn ich die Inhalte mit genügend anderen Inhalten in einem Dateiformat speichere, das die Inhalte nicht 100 % zuverlässig wiedergibt (und dazu noch extrem schlecht komprimiert), dann wäre es plötzlich erlaubt? Das finde ich persönlich eine sehr schwierige Auslegung.

Aber auch wenn man dem Argument folgt, dass LLM-Modelle etwas fundamental anderes tun, als die Inhalte zu speichern, werden die Inhalte für das Training verarbeitet. Und das zu kommerziellen Zwecken, die die Möglichkeit der eigentlichen Rechteinhaber, mit diesen Inhalten Geld zu verdienen, direkt beeinträchtigen ...

Hier bläst der Gegenwind dann aus einer anderen Richtung, aber er würde nicht minder stark sein.

Der Dienstweg: Weder A noch B sagen

Möglicherweise findet der EuGH eine Zwischenlösung, die irgendwie das Urheberrecht wahrt und trotzdem den LLM-Einsatz in der EU noch irgendwie erlaubt. Aber ich habe mal gelernt, dass der Dienstweg der Pfad zwischen Sackgasse und Holzweg ist.

Der einfachste Gedanke wäre ein Opt-out-Modell. Je nachdem, wie hoch die Messlatte zum Nachweis eines Inhalts in den Trainingsdaten gehängt wird, ist die Regelung entweder nichtig (und das Urheberrecht ausgehebelt) oder es wäre wieder ein de facto Verbot von LLMs, da einzelne Inhalte ja nicht nachträglich aus dem Modell entfernt werden können und bei jedem Opt-out für ein noch so kleines Content-Stückchen das Modell komplett neu trainiert werden müsste.

Auch hier wäre eine Wetterwarnung in Luxemburg beim EuGH notwendig.

Aber die Richter in Luxemburg machen dieses Abwägen von folgenschweren Entscheidungen mit europaweiter Tragweite ja hauptberuflich. Insofern bin ich optimistisch, dass sie noch auf eine andere, bessere Idee kommen, auf die ich beim Schreiben dieses Artikels nicht gekommen bin. Nennen wir sie den Ausweg.

Du hast Fragen zum Artikel, zum Thema oder brauchst einen Tipp für Deine nächsten Schritte? Hier kannst Du Dir einen unverbindlichen Termin in meinem Kalender buchen. Ich freue mich auf Dich!
15-Minuten-Termin mit Behrend reservieren
Das ist ein Artikel aus unserem Newsletter. Wenn Du jeden Dienstag Morgen schlauer werden möchtest, melde jetzt kostenfrei für den SEO-Newsletter an

Kurze, praxisnahe SEO-Tipps – maximal 1× pro Woche. Keine Werbung, kein Spam.

Deine Daten sind bei uns in guten Händen und werden ausschließlich für diesen Newsletter genutzt.