R-Leuchtungen!

Teil 8: Google-Search-Console-Daten automatisch auswerten

Patrick Lürwer
Patrick Lürwer

Patrick Lürwer ist Senior Analyst bei get:traction GmbH und Partner. Seine Schwerpunkte sind die Umsetzung von ETL-Prozessen für die Beschaffung von Daten mittels APIs, Webscraping etc., ihre Speicherung in Datenbanken, Analysen von Crawls, Logfiles und Traffic-Daten sowie die Konzeption von Informationsarchitekturen.

Mehr von diesem AutorArtikel als PDF laden
Mario Fischer
Mario Fischer

Mario Fischer ist Herausgeber und Chefredakteur der Website Boosting und seit der ersten Stunde des Webs von Optimierungsmöglichkeiten fasziniert. Er berät namhafte Unternehmen aller Größen und Branchen und lehrt im neu gegründeten Studiengang E-Commerce an der Hochschule für angewandte Wissenschaften in Würzburg.

Mehr von diesem AutorArtikel als PDF laden

In den Ausgaben bis 54 bis 58 der Website Boosting konnten Sie in der Serie „R4SEO“ von Patrick Lürwer nachvollziehen, wie man die kostenlose Software R verwendet, was sie leistet und wie man sie nutzbringend für die eigene Arbeit für SEO bzw. die Aufklärung im Online-Marketing einsetzen kann. R wurde ja ursprünglich für Statistik entwickelt. Wer das bisher als Entschuldigung verwendet hat, es deswegen links liegen zu lassen, dem sei versichert, dass er damit komplett falschliegt. R kann für den Einsatz im Unternehmen, allen Bereichen voran „Online“, sehr viel mehr leisten, als statistische Berechnungen durchzuführen. Genau genommen ist es ein wirklich nützliches Helferlein bei allen Aufgaben im Umgang mit größeren Datenmengen, mit Daten, die man erst in eine gewisse Struktur bringen muss, und bei der automatischen oder halb automatischen Datenbeschaffung aus praktisch fast allen Quellen aus dem Web! Für die interessierten Einsteiger, aber auch für alle, die nach der Serie von Patrick Lürwer „R-Blut“ geleckt haben, startete in der Ausgabe 62 die neue anwendungsorientierte Serie „R-Leuchtungen“. Sie werden in jeder Ausgabe erfahren, wie Sie ohne Programmierkenntnisse jeweils ein definiertes und in der Online-Praxis häufiger auftretendes Problem rund um das Thema Daten und Auswertungen lösen können. Und keine Sorge, die kleinen Hilfe-Tutorials nehmen Sie Schritt für Schritt an der Hand, sodass Sie auch als Neuling von der Power von R profitieren können. Was hält Sie also ab, das einfach mal auszuprobieren? Die einzelnen Schritte müssen Sie übrigens nicht im Detail verstanden haben. Um an die hilfreichen Daten für ein besseres Ranking zu kommen, müssen Sie im Prinzip nur nachmachen, was Sie hier beschrieben finden. Für dieses Beispiel brauchen Sie übrigens keinerlei kostenpflichtige Tools.

Worum geht es diesmal?

Diesmal wird es wirklich deutlich einfacher. Einige Leser und Leserinnen haben uns geschrieben, dass sie (Verständnis-)Probleme mit der Anbindung an die API (Datenschnittstelle) von Google haben und daher einige der bisherigen Skripts nicht richtig nutzen können. Daher haben wir uns entschlossen, diesmal keinen API-Zugang vorauszusetzen, sondern die Daten zu verarbeiten, die Google in der Search Console zum Download anbietet. Unser Skript erzeugt praktisch vollautomatisch eine ganze Batterie an Auswertungen und legt alle bequem in ein selbst gewähltes Verzeichnis. Der Vorteil einer Nutzung der Daten von Google ist, dass Sie hier tatsächlich die Originaldaten bekommen. Natürlich gibt es bei diesem Vorgehen die bekannte Einschränkung, dass Google jeweils nur 1.000 Zeilen zum Download anbietet. Für kleinere Domains oder einen groben Überblick reicht das aber in der Regel aus. Wer mehr bzw. alles haben möchte, muss bzw. sollte dann doch darüber nachdenken, sich den kostenlosen API-Zugang bei Google abzuholen und damit sehr viel feingranularere Daten zu bekommen.

Schritt 1: Daten aus der Search Console downloaden

Sie müssen diesmal einfach nur in die Google Search Console gehen (https://search.google.com/search-console?hl=de) und im Menüpunkt „Leistung“ oben das gewünschte Datum für den Bezug der Daten auswählen, wie in Abbildung 1 zu sehen ist. Je nach Analysezweck können Sie dabei bekanntlich bis zu 16 Monate zurückgehen bzw. diesen Datenbezugszeitraum auswählen. Für die meisten Analysen ist sicherlich die Wahl eines Jahres zweckmäßig. Anschließend klicken Sie rechts oben auf „Exportieren“ und wählen das CSV-Format aus. Speichern Sie die Datei am besten gleich in ein gesondertes Verzeichnis und merken Sie sich dieses. Das war es auch schon.

Schritt 2. Die ZIP-Datei entpacken

Google übermittelt die angeforderten Daten immer in einer ZIP-Datei, in der dann mehrere CSV-Dateien liegen. Entpacken Sie einfach den Inhalt in das gleiche oder wahlweise ein anderes Verzeichnis. Sie müssen sich nur merken, wo die sieben entpackten Dateien liegen, damit Sie später das Arbeitsverzeichnis von R dorthin legen können.

Schritt 3: R-Studio starten und Skript laden

Starten Sie nun R-Studio und laden Sie sich über einfach.st/rcode6 das Skript in R bzw. kopieren Sie den Code des Skripts in R-Studio. Am einfachsten geht das, wenn Sie unter „File“ -> „new File“ -> R-Skript auswählen. Dann erscheint links oben ein leeres Fenster. Dort kopieren Sie dann den Code einfach hinein. Sie können dieses bzw. Ihre Modifikationen jederzeit unter einem beliebigen Namen speichern und später wieder aufrufen.

Wer die Serie „R-Leuchtungen“ bisher verfolgt hat, weiß mittlerweile, dass R durch viele nützliche Funktionsbibliotheken (Librarys) erweitert werden kann. Diesmal sind es sechs dieser Librarys. Solche Bibliotheken müssen nur erstmalig installiert werden, jeweils über den Befehl:

install.packages („name_der_library“)

Ersatzweise kann man das auch manuell mit Maushilfe unter dem Menüpunkt „Tools“ und dann „Install Packages“ in R-Studio machen. Beim Tippen in das Eingabefeld erscheinen dann bereits als Vorschlag die Namen dieser Librarys. Für Einsteiger ist dies wohl die einfachere Methode, obwohl es natürlich mit Befehlszeilen schneller ginge.

Wer die Erstinstallation der Librarys bequemer haben möchte, löscht einfach die vorstehenden Doppelkreuze „#“ vor dem install.packages … am Anfang des Skripts einmalig, positioniert den Cursor in der jeweiligen Zeile und drückt STRG und Return. Das löst die aktuelle Zeile als Befehl aus. Die „Reaktion“ sieht man unten links in der Console. Diesen Schritt führt man für alle sechs Zeilen aus und startet am Ende R bzw. R-Studio ggf. noch einmal neu, wenn das vom Programm verlangt wird. Die entsprechenden Zeilen im Skript sehen so aus:

# install.packages("tidyverse")
# install.packages("janitor")
# install.packages("cowplot")
# install.packages("santoku")
# install.packages("glue")
# install.packages("zoo")

Vergessen Sie nicht, nach dieser Erstinstallation wieder die Doppelkreuze vor die Befehlszeilen zu schreiben, sonst werden diese bei jedem Skriptlauf immer wieder unnötigerweise erneut installiert.

Jetzt müssen Sie nur noch zwei Angaben machen bzw. Änderungen vornehmen. Scrollen Sie im Skript etwas weiter nach unten und achten auf die Markierung # TODO. Hier sind Eingaben nötig. Für eine echte Beurteilung von SEO-Daten ist es essenziell, den eigenen Domainnamen oder die eigene Markenbezeichnung separat zu analysieren. Der Grund ist einfach einzusehen: Für den Domain-/Markennamen wird man in der Regel bei Google ohne große Anstrengung gefunden und rankt auch meist auf Platz 1 damit. Das verwässert natürlich die SEO-Leistung aller anderen Suchwörter in die oft zu positive Richtung. Geben Sie daher unter dem Punkt „Brand_Queries“ z. B. Ihren Domainnamen in den üblichen Schreibweisen ein, wie es als Beispiel in Abbildung 3, Ziffer 1 gezeigt wird. Nutzen Sie am besten Schreibweisen mit und ohne Leerzeichen, falls es mehr als ein Wort ist, und geben Sie auch solche Kombinationen mit der Domainendung wie .de oder .com ein. Überschreiben Sie einfach unser Beispiel. Wenn Sie mehr Zeilen brauchen, fügen Sie am besten in der Mitte eine Zeile ein mit gleichem Muster, also Anführungszeichen, das Wort oder die Wörter, Schlusszeichen und dann ein Komma. Wenn Sie hier nichts eintragen bzw. die Werte auf „Website Boosting“ stehen lassen würden, passiert kein Fehler – es wird nur später in einigen Auswertungen dann keine Unterscheidung zwischen Brand/Non-Brand zu sehen sein.

Das zweite # TODO ist, für Start_Date und End_Date in die Anführungszeichen eine Bezeichnung zu schreiben. Diese Werte werden dann später als Legende in den Abbildungen ausgegeben. Sie können also auch „Mai“ als Startwert und „April 2021“ als Endwert eintragen. Dann steht der Legende „Mai – April 2021“. Ebenso können Sie natürlich genaue Tageswerte verwenden.

Jetzt müssen Sie R-Studio nur noch mitteilen, wo das Arbeitsverzeichnis liegt bzw. in welchem Verzeichnis Sie die Dateien wie oben beschrieben abgelegt haben. Dazu suchen Sie im Fenster rechts unten unter „Files“ das Verzeichnis, in das Sie Ihre entpackten Daten aus der Search Console gespeichert haben, bzw. klicken Sie bis dorthin durch. Das funktioniert wie bei einem normalen Dateiexplorer. Sehen Sie die Daten bzw. sind im richtigen Verzeichnis, dann wählen Sie unter dem blauen Zahnrad „More“ den Punkt „Set As Working Directory“ aus, wie Abbildung 4 zeigt. Nun weiß R-Studio, wo gesucht werden muss und wohin die erzeugten Dateien gespeichert werden. Links unten im Fenster „Console“ wird eine Bestätigung nach folgendem Muster ausgegeben:

> setwd("~/a WSB Zeitschrift/Ausgabe 69/R Leuchtungen/GSC-Daten")

Natürlich sieht der Verzeichnispfad bei Ihnen dabei individuell anders aus.

Das war dann auch schon alles. Starten Sie jetzt einfach das gesamte Skript mit einem Klick auf „Source“ rechts oben im Skriptfenster (Abbildung 5). Das Skript wird abgearbeitet und alle erzeugten Grafiken und Tabellen werden automatisch in das festgelegte Arbeitsverzeichnis geschrieben. Das können Sie während des Skriptlaufes rechts unten beobachten – das Dateifenster füllt sich mit verschiedenen Dateien.

Wenn Sie jetzt über den Dateiexplorer in das Datenverzeichnis sehen, finden Sie dort alle erzeugten Grafiken und einige CSV-Dateien mit statistischen Kennwerten, die sich nicht als Grafik darstellen lassen, aber z. B. für die Beurteilung der Datenstreuung sehr nützlich sind.

Schritt 4: Sehen Sie sich die Auswertungen an

Je tiefer Sie mit dem Thema SEO vertraut sind, desto mehr werden Ihnen die aufbereiteten Daten nützen. Zudem finden Sie hier völlig kostenlos Auswertungen, die Sie selbst mit vielen kostenpflichtigen Tools nicht bekommen. Neben den zwölf Auswertungen wurden noch vier CSV-Dateien mit statistischen Werten zur Lageverteilung erzeugt. Ein letzter Hinweis noch zu einigen x-Achsen der Grafiken. Die Darstellung [1,2) bedeutet z. B., dass hier alle Werte einsortiert sind, die zwischen eins und bis unter zwei liegen. Eine Position 1,9 für ein Suchergebnis aus der Search Console würde also unter dieser Säule mit einsummiert. Diese Schreibweise sieht ungewohnt aus, ist aber exakter als die einfachen 1, 2, 3-Angaben unter vielen Histogrammen in Tools, weil man nie weiß, wie und ob gerundet wird. Mit anderen Worten kann es passieren, dass eine Position 1,6 unter 2 ausgewiesen wird, weil das Tool kaufmännisch rundet.

Als besonderes Schmankerl finden Sie auch eine Auswertung über Klicks, Impressions, CTR und Position jeweils nach einem gleitenden Sieben-Tages-Durchschnitt geglättet. Die Originaldaten stehen im Hintergrund in Grau und darüber in Schwarze. Das visualisiert Ihnen eine besser erkennbare Tendenzlinie, wie der Trend sich entwickelt.

Hier ist leider nicht der Platz, Ihnen tatsächlich alle Abbildungen zu zeigen, daher müssen wir mit einer Auswahl vorliebnehmen. Machen Sie sich am besten selbst gleich ein Bild, wie nützlich diese für Ihre SEO-Arbeit sind. Wenn Sie schon einmal mit R bzw. R-Studio gearbeitet haben, brauchen Sie keine fünf Minuten dazu.