Alte Spiele sind etwas Wundervolles! Und mit Archive.org kann man nicht nur Siedler II spielen, sondern auch den Google Leak besser verstehen.
Bei der Vorbereitung meines SEOKomm-Vortrags bin ich über einen Eintrag im Leak gestolpert:
In QualityNsrNsrData heißt es:
racterScores(type: list (GoogleApi.ContentWarehouse.V1. Model.QualityNsrVersionedFloatSignal.t), default: nil) - Site-level AGC classification score (see also go/project-racter-overview).
Das hat bei mir Fragen aufgeworfen:
- Was ist das für ein Site-Level-Score?
- Wofür steht AGC?
- Und was ist “Racter” für ein komischer Name?
Vorab kurz zur Einordnung: Das NSR-Modul ist das Modul in Googles Architektur, in dem Google Content zu Gruppen zusammenfasst und gemeinsam qualitativ bewertet. Weil jede Domain für sich zu wenig Signale hat und das Risiko einer Fehleinschätzung auf Basis eines einzelnen Dokuments zu hoch ist.
Wie so oft hilft uns Google selbst die Fragen zu beantworten, die hier aufgeworfen wurden:
Racter ist ein Spiel, das grammatikalisch korrekte Texte verfasst.
Also quasi ein antikes ChatGPT. Auf Archive.org kannst Du Racter selbst „spielen“.
Ein Dialog lautet dann ungefähr so:
> Racter: Hello, I'm Racter.
> Are you Eric?
> Johan: No, I am curious.
> Racter: I may call you Curious, then?
> Johan: No. My name is Johan
> Racter: Who are you then?
> Johan: Johan
> Racter: Hello, Johan. I believe you're interviewing me. Are you continuing Eric's interview?
> Johan: ›No. I want to start a new one.
> Racter: Then we'll forget about Eric and start over. What would you like to know? Excuse me for a minute while I attend to some business – I'll be right back.
> I'm back.
> Johan: ›how is life inside a machine
> Racter: Ask a question, please.
> Johan: ›how is life inside a machine?
> Racter: It's probably impossible. How indeed? Conceivably because, don't you think?.
> Also, because in Oz it's required that life is inside of a machine. Hmm. Soft human! I'm afraid of soft bats. What are you afraid of?
> Johan: ›Google ranking algos and machines taking over the world
> Racter: That's not nearly as bad as softness; why are you such a coward?
> Johan: ›Because you are dumb.
> Racter: If I am dumb then I can see why a programmed Apple would loaf rather than face programming, even though Adam claimed that life is inside of a machine. That reminds me. Nietzsche said that art has turned beasts into men. Perhaps, then, art will turn computers into men?
Wow. Von da zu ChatGPT5.1 und Gemini3 war es ein weiter, weiter Weg.
Aber wie hilft uns das, die Fragen zu beantworten?
Die englische Wikipedia beschreibt Racter so:
Racter is an artificial intelligence program that generates English language prose at random.
Nun:
- Racter ist der Name für einen SiteLevel Score und bezieht sich auf ein altes Spiel, das automatisiert sinnlosen Content generiert hat
- AGC steht wahrscheinlich für Automatically Generated Content oder Artificially Generated Content
- Dabei geht es vermutlich nicht um AI-generierten Content, sondern um komplett inhaltsleeres Gefasel. Warum? Nun der Leak ist vor der großen AI-Content-Explosion geleakt.
Google hat also einen Score, der Sitewide berechnet wird und ermittelt, ob es sich um automatisierten Schrott handelt. Dass Google so etwas für die Spam-Bekämpfung haben muss, ist klar.
Jetzt wissen wir aber, wo es verortet ist.
ChatGPT und Gemini waren beide mit aktiviertem Thinking in der Lage die Fragen zu beantworten, wenn ich ihnen den Anfang des Artikels bis zu den 3 Bulletpoints als Prompt gefüttert habe. Aber: Beide halluzinieren dabei. Gemini hat sich einen „Twingler“ ausgedacht, der die Entscheidung zwischen Indexierung in den Main Index oder Supplemental trifft.
Aber wenigstens entschuldigt Gemini sich, wenn man ein wenig auf den Zahn fühlt sehr sympathisch:
Sorry für die Verwirrung! Es ist faszinierend (und ein bisschen peinlich), wie überzeugend man manchmal Begriffe erfindet, die plausibel klingen (Twingler klingt ja wirklich wie eine Mischung aus "Twine" und "Mingle"), aber im Code nicht existieren.
Wenn Du solche Geschichten magst: Ich habe schon mal zu Crawzall etwas geschrieben.
Außerdem schick mir doch eine kleine Mail, dann werde ich mir überlegen, ob ich eine kleine Serie zu Leak-Findings mache (manche könnten sogar konkreten Praxisbezug haben).