Den wachsamen Augen der SEOs (und ihren Monitoring Tools) entgeht wohl kaum etwas, das seitens Google passiert.
So ist Barry Schwartz vergangene Woche eine Änderung in der "File types indexable by Google"-Doku aufgefallen: Unter "Text" wird als letzter Punkt folgendes aufgeführt:
"Comma-Separated Values (.csv)"
Da Google ja wirklich vieles frisst, hat Barry lieber nochmal bei John Mu nachgefragt, ob sich hier nur etwas in der Doku getan hat oder eben auch in der Suche. Der bestätigt im Thread:
"New new, not just new doc :)."
Bislang hat Google .csv Daten für strukturierte Daten im Rahmen von Datasearch Snippets genutzt. Dass .csv-Dateien nun direkt im Index landen sollen, ist neu. Wieso sie wohl dort aufgenommen werden? Google hat sich hierzu nicht geäußert, aber viele SEOs vermuten, dass es wohl etwas mit der AI-gestützten Suche zu tun haben wird und dass so in den AI-basierten Antworten in Zukunft auch .csv-Daten einfließen könnten.
Stand heute (28. August) konnte ich zwar noch kein Beispiel in der freien Wildbahn dafür entdecken. (Glenn Gabe hatte damit neulich auch keinen Erfolg.) Trotzdem sollten wir hier künftig alle ein Auge drauf haben. Denn einerseits bedeutet die Indexierung von .csv-Dateien, dass es weitere Möglichkeiten gibt, gecrawlt und gerankt zu werden - andererseits aber auch eine weitere Baustelle, für die wir Sorge tragen müssen. Denn womöglich wollen wir unsere .csv-Dateien gar nicht im Index haben und müssen dementsprechend Maßnahmen implementieren, die ihre Indexierung verhindern.
So findest Du heraus, ob Deine .csv-Dateien im Index sind
Es gibt verschiedene Wege, über die Du herausfinden kannst, ob .csv-Dateien Deiner Domain im Index gelandet sind. Diese beiden sollten unserer Meinung nach gut funktionieren:
- site:-Abfrage: mit einer site:-Abfrage nach dem Muster "site:domain.com filetype.csv" --> hier siehst Du .csv-Dateien, sofern sie im Index gelandet sind.

- GSC Performance Report: Filter nach URLs, die "csv" enthalten --> hier siehst Du .csv-Dateien, sofern sie im betrachteten Zeitraum Impressionen / Klicks erzeugt haben.

Um zu sehen, ob auf Deiner Domain .csv-Dateien gecrawlt werden, kannst Du in den Crawl Stats Report schauen.
- GSC Crawl Stats Report: Abschnitt "By file type" --> hier siehst Du .csv-Dateien, sofern der Googlebot sie gecrawlt hat.

So schützt Du Deine .csv-Dateien von der Indexierung
Die sicherste Option, Deine .csv-Dateien aus dem Index zu halten, ist der Einsatz von X-Robots im HTTP-Header. Damit kannst Du Google für alle Dateitypen klipp und klar mitteilen: Das hier soll nicht indexiert werden.
Die .csv-Dateien in der robots.txt aufzulisten, ist hingegen kein sicherer Weg, eine Indexierung zu verhindern. Wenn es Links gibt, die auf die Dateien verweisen, kann Google sie in den Index packen, ohne dass Google genau weiß, welchen Inhalt die .csv-Dateien haben. Also ist hier Vorsicht geboten.
Last but not least stellt sich die Frage, ob – und wenn ja, warum – .csv-Dateien auf Deiner Domain zugänglich rumfliegen. Soll das wirklich so sein? Gibt es gute Gründe, die dafür sprechen? Oder wäre es nicht sowieso besser, wenn diese Dateien (und auf sie verweisende Links) von der Bildfläche verschwänden?
Mal gucken, was passiert
Wir halten auf jeden Fall die Augen auf und sind gespannt, ob, wo und wann uns die ersten indexierten .csv-Dateien begegnen werden!
Bis dahin sei Dir (halbwegs passend zum Thema) Johans kleiner Recap zu Paul Schreibers letztjährigem Campixx-Vortrag zu Suchoperatoren ans Herz gelegt.