Eigentlich wollte ich was ganz anderes schreiben, aber dann hat Behrend mir diese Headline hingelegt und ich habe daher Deine Aufmerksamkeit und die will ich für eine ganz wichtige Botschaft nutzen:
Structured Data bleibt wichtig!
Seit Jahren müssen wir uns anhören, dass die Maschinen das alles auch ohne Structured Data hinkriegen und man das nicht mehr braucht. Spätestens, wenn die Kids um die Ecke kommen, die cooler sind als Google.
Aber es könnte nicht falscher sein. In der letzten Woche haben Google und Bing erklärt, dass sie Structured Data brauchen.
Mark William Cook hat das noch mal ein wenig erläutert.
Am Ende sind mir die Details egal:
- Profitiert AI davon, dass das Schema der Suche hilft, besseren RAG-Input zu liefern?
- Wird Schema genutzt, um die Datenqualität des LLM zu validieren?
- Wird Dokumenten mit vernünftigem Schema ein höheres Vertrauen entgegengebracht und daher im Training höher gewichtet?
- Oder führt es einfach nur dazu, dass wichtige Dinge mehrfach im HTML stehen und höher gewichtet werden könnten?
Ehrlich: Es ist mir egal.
Fakt ist: Maschinen profitieren davon, wenn Menschen ihre Inhalte maschinenlesbar erklären.
Dies ist ein Artikel als Teil eines Newsletters der Firma Wingmen Online Marketing GmbH mit Sitz in der Stadt Hamburg, geschrieben von einem der Gründer und Geschäftsführer: Johan v. Hülsen. Johan hat einen Bruder Behrend, der ist nicht nur schlau, sondern auch lustig. Der Artikel, um den es geht, hat eine lustige Headline. Und einen Body-Text mit Links und Hervorhebungen und einem Zitat, zu dem keine Quelle angegeben ist (dieser Absatz hier). In dem Artikel geht es um LLMs und Structured Data. Es werden Google (Suchmaschine) und Bing (Suchmaschine) erwähnt. Außerdem Mark Williams Cook (Person).
Wenn wir Inhalte so erklären, dann können Maschinen sie besser lesen und sie können die Welt besser verstehen. Wenn wir mal aus den „großen“ Bereichen herausgehen, dann gibt es unfassbar viel Wissen, das Suchmaschinen und LLMs noch nicht haben: Google Knowledge Graph kennt 5 Mrd. Entitäten. Es leben aber wahrscheinlich deutlich mehr als 8 Mrd. Menschen auf diesem Planeten. Und dann haben wir noch nicht mal angefangen, über Staaten, Gebäude, Sehenswürdigkeiten, Produkte und Firmen zu reden, von abstrakteren Konzepten wie Krieg und Frieden ganz zu schweigen.
Wenn wir also eindeutiges Wissen eindeutig auszeichnen, um Fakten zu erklären, vor allem aber Beziehungen zwischen Entitäten deutlich zu machen, dann ist das nicht nur gut für die Suche, sondern auch für LLMs.
Also können wir daher bitte endlich aufhören, über den Sinn von Schema zu streiten und unsere Inhalte auszeichnen und lesbar machen? Und natürlich die Fehler korrigieren.
Ich bin mir sehr sicher: Wenn wir gutes Schema machen, dann ist das ein Thema, das uns deutlich in den Suchmaschinen und den LLMs hilft. Und auch wenn es schmerzhaft ist: Das Wissen über seine Inhalte und Produkte maschinenlesbar abzulegen, ist ein unfassbarer Wettbewerbsvorteil, weil man selbst ganz neue Produkte damit bauen kann.