Zum Hauptinhalt springen
Junior Consultant

Passend zum Halloween-Anlass habe ich heute mal Regular Expressions mitgebracht. Oft helfen sie einem aus dem Horror-Datenhaus oder dem Keyword-Kerker zu entkommen.

Lass uns mal schauen, wofür RegEx gut sind:

Das Horrorhaus der Zeichenketten

Stell Dir ein altes, knarrendes Haus vor, das am Rande einer verlassenen Stadt liegt. Die Legende besagt, dass nur diejenigen, die die Zeichen kennen, aus diesem Horrorhaus entkommen können. Die Wände des Hauses sind mit rätselhaften Buchstaben und Symbolen bedeckt, und nur mit dem richtigen Zauberspruch -- dem Regex -- kannst Du fliehen.

1\. Das Zimmer der verlorenen Seelen

Du betrittst einen dunklen Raum, in dem leise Stimmen flüstern. An der Wand siehst Du mehrere Namen: anita, annemieke, bob, justus und jonas ... Du weißt, Du musst einen Namen finden, der mit einem "a" beginnt, um die Tür zum nächsten Raum zu öffnen.

Dein Regex-Zauberspruch: ^a.*

Mit diesem Zauberspruch leuchten die Namen anita und annemieke auf und zeigen Dir den Weg.

💡 ^ signalisiert in einer RegEx, dass dies der Anfang sein muss. Der Punkt . steht für irgendein Zeichen, egal welches. Das * signalisiert, dass irgendein Zeichen beliebig oft vorkommen kann. Wir suchen also alles, was mit a anfängt und egal, was darauf folgt.

2\. Der Korridor der Schatten

Ein langer, düsterer Korridor erstreckt sich vor Dir. Jede Tür hat eine Zahl: 13, 666, 77 und 999. Du hörst ein Flüstern, das Dir sagt, Du musst eine Tür mit einer dreistelligen Zahl wählen, um nicht in eine Falle zu geraten.

Dein Regex-Zauberspruch: ^\d{3}$

Dank des Zauberspruchs erkennst Du, dass die Türen 666 und 999 sicher sind.

💡 Erneut verwenden wir das Dach, um den Anfang zu signalisieren. \ ist ein Escape. Da das "d" ein normaler Buchstabe ist, wir ihn aber als einen Teil der RegEx verwenden wollen, müssen wir ihn "escapen". Das macht man mit dem Backslash \. Das kleine d mit dem \\ steht für eine Zahl. Die geschweifte Klammer {}, wenn nur eine Zahl darin vorkommt, symbolisiert, dass das vorangegangene Zeichen, irgendeine Zahl, dreimal vorkommen muss. Das $ signalisiert das Ende.

Wir schauen also nur auf Strings, die mit 3 Zahlen anfangen und nicht mehr enthalten.

3\. Das Labyrinth der Verwirrung

Nachdem Du den Korridor der Schatten verlassen hast, findest Du Dich in einem endlos scheinenden Labyrinth wieder. Wände aus Buchstaben und Symbolen erstrecken sich in alle Richtungen. In der Mitte des Labyrinths befindet sich eine riesige Steintafel.

Auf dieser Tafel sind Sätze eingraviert, die sowohl Buchstaben als auch Zahlen enthalten. Einige Sätze sind in Klammern, andere nicht. Du spürst, dass Du einen spezifischen Satz finden musst, der mit einem Wort beginnt.

Dieses Wort ist "wngmn". Darauf müssen ein Satzzeichen, ein Leerzeichen und eine vierstellige Zahl in Klammern folgen. Das ist eine Stufe schwieriger als vorher.

Dein Regex-Zauberspruch lautet: ^wngmn\w\s\(\d{4}\)$

💡 Was bedeutet das alles?

  1. ^wngmn = Wort, das mit "wngmn" beginnt

  2. \w = nicht-alphanumerisches Zeichen (z.B. ein Satzzeichen)

  3. \s = Leerzeichen 

  4. \( = Klammer auf, die wir mit \ escapen müssen, da Klammern normalerweise in einer RegEx für Capture Groups stehen

  5. \d = eine Zahl 

  6. {4} = das vorherige Zeichen (= eine Zahl) muss viermal vorkommen

  7. \) = Klammer zu, die wir mit \ escapen müssen

  8. $ = Ende unserer Abfrage

Auf der Steintafel leuchtet auf: "wngmn! (3110)". Ein Teil der Wand des Labyrinths schiebt sich zur Seite und enthüllt einen versteckten Gang. Juhuuuuu, Du hast es geschafft.

RegEx sind Dein Freund und Helfer, wenn es um Daten geht

RegEx einfach erklärt: Finde im Datenwust, was Du suchst. Das kann beispielsweise in Google Sheets, Knime, Sublime Text, Google Collab, Sistrix, Google Search Console und auch Google Analytics sein.

Du siehst, da sind viele Tools bei, die in der SEO-Welt häufig verwendet werden und darum lege ich Dir ans Herz, RegEx zu lernen. Ich bin auch noch ein Padawan und staune nicht schlecht, wenn manche meiner lieben Wingmenschen, ohne auch nur mit der Wimper zu zucken, den Avada Kedavra der RegEx raushauen, um die Daten zu bezwingen. 🪄

Wie kannst Du RegEx lernen? Sehr gut geeignet finde ich RegEx Learn. Dort findest Du zwei unterschiedliche Spiele. Eins davon hilft, RegEx kennenzulernen und die nächste Stufe ist auf SEO bezogen. Das hat mir gut gefallen.

Und weil Halloween ist, schlage ich Dir auch das Slash & Escape Game vor.

Ein Screenshot des Homepage Headers von Slash & Escape, dem RegEx Spiel. Zu sehen ist eine rot leuchtende Überschrift mit dem Text "Slash\Escape" und darunter ein Text "The first and only slasher themed text based RegEx learning game."

Bevor jetzt jemand um die Ecke kommt: ChatGPT kann Dir mit RegEx helfen. Ja, definitiv. Aber wenn Du nicht beurteilen kannst, ob die RegEx richtig ist, kannst Du am Ende Probleme bekommen. Weil Du den Fehler nicht findest. Oder die RegEx vielleicht falsch ist und Du es nicht erkennst.

Es kommt teilweise regexemplarischer Quatsch als Output heraus, wie Johan vor einigen Monaten feststellen musste.\ ChatGPT ist besser geworden. Allerdings nicht fehlerfrei. Also: Lerne RegEx zu verstehen und nutze ChatGPT & Co., um Deine Arbeitsabläufe zu beschleunigen, und nicht um Deinen Kopf abzustellen. Du bist kein Zombie! 🧟

Junior Consultant

Das ist ein Artikel aus unserem Newsletter. Wenn Du jeden Dienstag Morgen schlauer werden möchtest, melde jetzt kostenfrei für den SEO-Newsletter an

Kurze, praxisnahe SEO-Tipps – maximal 1× pro Woche. Keine Werbung, kein Spam.

Deine Daten sind bei uns in guten Händen und werden ausschließlich für diesen Newsletter genutzt.