SEO-Website-Texte mit einer Zeitersparnis von 40 bis 60 % zu erstellen, klingt verlockend. Aber was, wenn die dann nicht ranken? Erkennt Google KI-Inhalte auf Websites und straft sie ab? Oder lassen sich mit ihnen genauso gute oder sogar bessere Rankings erzielen? Dieser Frage ist die KI-Task-Force der eology GmbH um Dr. Beatrice Eiring nachgegangen. Die Autorin stellt die Ergebnisse des dreistufigen E-E-A-T-Checks vor, der empirische Analysen, Expertenmeinungen und die SEO-Performance einer Testdomain berücksichtigt. Unter die Lupe genommen hat sie Texte der Chatbots Claude 3.5 Sonnet und ChatGPT-4o – mit teilweise überraschenden Ergebnissen.
Sind KI-Website-Texte rankingfähig?
Die rasante Entwicklung der künstlichen Intelligenz (KI) hat die Welt der Content-Erstellung verändert. Insbesondere im Bereich der Website-Texte wird der Einsatz von KI-Tools immer populärer, da Unternehmen nach Wegen suchen, ihre Produktivität zu steigern und Kosten zu senken. Die Ziele sind grundsätzlich greifbar: KI kann die Textgenerierung erheblich beschleunigen. Sie unterstützt effizient bei verschiedenen Aufgaben der SEO-Texterstellung, darunter:
- Erstellung von Überschriften
- Textergänzungen
- Zusammenfassungen
- Brainstorming und Problemlösungsfindung
- Themenrecherche
- Generierung von Social-Media-Beiträgen
- Erstellung von FAQ
Diese Vorteile machen KI zu einer attraktiven Option für Unternehmen, die ihre Content-Strategie optimieren möchten. Es ist jedoch wichtig, die Grenzen und Herausforderungen bei der Verwendung von Chatbots zur Texterstellung zu verstehen. Denn was bringt am Ende die Produktivitätssteigerung, wenn die Website-Inhalte nicht ranken oder das Unternehmensimage leidet?
Ranking-Fähigkeit von Inhalten
Damit Inhalte gute Rankings erzielen, müssen sie die Content-Qualitätsrichtlinien von Google erfüllen. Seit dem Helpful Content Update im September 2022 gibt es ganz klare Aussagen seitens Google dazu, wie Website-Inhalte auszusehen haben. Eines der wichtigsten Kriterien dabei ist das E-E-A-T-Modell. Hinter den Buchstaben verstecken sich die englischen Begriffe Experience (Erfahrung), Expertise (Expertise), Authoritativeness (Autorität) und Trustworthiness (Vertrauenswürdigkeit). Diese muss der Inhalt erfüllen, ansonsten sieht es schlecht aus mit guten Rankings in den Google-Suchergebnissen. Im schlimmsten Fall wird eine ganze Domain abgestraft.
Die eo KI-Task-Force hat in ihrer aktuellen Studie den Fokus darauf gelegt, den Erfüllungsgrad von E-E-A-T bei KI-Texten zu bewerten. Die Bewertung erfolgte in drei Schritten:
- Schritt: Bewertung durch Online-Marketing-Experten
- Schritt: Bewertung durch Fachexperten
- Schritt: Realitycheck SEO-Performance
Bewertung durch Online-Marketing-Experten
Für ihre Studie verwendet die eo KI-Task-Force einen erprobten SEO-Qualitätsstandard. Mit diesem hat sie bereits 2023 Chatbots im ersten Teil der Studie bewertet, die Bewertung der KI-Texte von Claude 3.5 Sonnet und ChatGPT-4o erfolgte analog. Sie ergab, dass die neueren Chatbots eine deutliche Verbesserung in verschiedenen Kriterien erreichen.
- Sprachliche Qualität: KI-Texte sind sprachlich zufriedenstellend und für Websites geeignet. Dieses Ergebnis hatte Teil I der Studie bereits für die älteren Chatbots ergeben und wurde noch einmal bestätigt. GPT-4o und Claude 3.5 Sonnet produzieren darüber hinaus flüssigere Texte mit weniger Wortwiederholungen.
- SEO-Qualität: Hier zeigen sich deutliche Verbesserungen zu den älteren Modellen, was die Zuverlässigkeit der Keyword-Verwendung betrifft. Dennoch erfüllen KI-Systeme SEO-Kriterien immer noch nicht zu 100 %, es fehlen vor allem immer wieder wichtige Keywords. Fehlen Keywords, fehlen dem Text auch Inhalte, die man im Text haben möchte. Eine SEO-Nachkontrolle ist bei jedem KI-Text zwingend notwendig.
- Zielgruppenorientierung: Hier zeigen sich ebenfalls deutliche Verbesserungen zu den älteren Modellen. Letztere schnitten in diesem Kriterienbereich 2023 unzufriedenstellend ab. Es zeigten sich vor allem Schwierigkeiten bei der direkten Leseransprache und der Wortwahl. Auch wenn ChatGPT-4o und Claude 3.5 Sonnet einen ordentlichen Sprung nach oben gemacht haben, fehlt es trotzdem weiter an Vertrauenswürdigkeit: KI-Texte enthalten immer wieder falsche Informationen oder unpassende Beispiele oder geben Empfehlungen, die nicht zur Lebenswelt der Zielgruppe passen.
Abbildung 1 zeigt, wie alle Chatbots aus Teil I und Teil II der eo KI Content Studie in den Kriterien des SEO-Qualitätsstandards abgeschnitten haben.
Den E-E-A-T-Check hat die eo KI-Task-Force nur bei den neueren KI-Modellen durchgeführt. Für die Bewertung hat sie die Zielgruppenorientierungskriterien des SEO-Qualitätsstandards herangezogen. Diese Kriterien beschreiben sehr gut das E-E-A-T-Modell und machen es greifbarer für eine Bewertung. Claude 3.5 Sonnet und ChatGPT-4o haben in diesen Kriterien durchweg mindestens über 80 %, teilweise über 90 % erreicht. Das sind gute bis sehr gute Werte, die die KI-Texte im Durchschnitt über alle Themen hinweg erzielten. Die Themenbereiche umfassten softe Themen wie „Erster Kindergeburtstag“ oder „Weihnachten feiern“ und ebenso rechtliche, medizinische und finanzielle Fachthemen wie „Kündigungsschutz während der Schwangerschaft“, „Scharlach“ oder „Familienkrankenversicherung“. Abbildung 2 zeigt in einem Diagramm die Erfüllungsgrade für beide Chatbots.
Die Werte sind sehr hoch, aber sie erreichen nirgends 100 %. Es gibt Schwächen in der Vertrauenswürdigkeit, der Expertise, der Erfahrung und der Autorität, die die Textqualität schmälern. Bei soften Themen ist dies in der Regel unproblematisch. Bei sogenannten „Your Money Your Life“-Themen – Themen, die Finanzen und Gesundheit betreffen – kann es jedoch zu Abstrafungen kommen, wenn E-E-A-T nicht erfüllt ist. Bei diesen Themen „schaut“ Google genau hin und wertet qualitativ niedrigere Inhalte ab, teilweise mit Abstrafungen der gesamten Domain.
Bewertung durch Fachexperten
Aus diesem Grund will auch die Studie genau „hinsehen“ und so wurden im zweiten Schritt des E-E-A-T-Checks Fachexperten hinzugezogen. Diese bewerteten die KI-Texte aus den Themenbereichen Finanzen, Medizin, Erziehung und Recht aus jeweils fachlicher Sicht. Dabei waren sie sich sehr einig:
- Die KI-Texte sind an sich nicht schlecht.
- Sie geben einen guten Grobüberblick.
- Sie sind verständlich beschrieben.
Aber:
- Sie bleiben an der Oberfläche.
- Sie liefern keine tiefgreifenden Informationen.
- Sie pauschalisieren Aussagen.
- Sie wirken wie von einer PR-Abteilung geschrieben.
- Sie führen den Nutzer teilweise in die Irre.
- Sie sind redundant, wiederholen Inhalte teilweise wortwörtlich.
Zwei Schwächen fielen den Experten besonders kritisch auf: Die KI-Texte haben Schwächen in der Korrektheit von Fakten sowie dem Mehrwert der Inhalte. Manche inhaltlichen Fehler sind verschmerzbar, man könnte über sie hinwegsehen – auch der Mensch ist nicht fehlerfrei. Die KI macht jedoch auch Fehler, die zum Vertrauensverlust der Nutzer führen können. Hier einige typische Beispiele für Fehler:
- Die als aktuell (Stand: 2024) von der KI deklarierten Werte für die Einkommensgrenzen waren veraltet. KI-Werte: 485 Euro, bei Minijobs 520 Euro. Tatsächliche aktuelle Werte: 505 Euro, bei Minijobs 538 Euro.
- Die KI behauptet fälschlicherweise, die PDA wäre eine gängige Anästhesieform bei einem geplanten Kaiserschnitt.
- Laut der KI reicht es aus, Kinder abzulenken oder sichere Bereich zu markieren, um sie davor zu schützen, dass sie in einen Pool oder Gartenteich fallen. Sie empfiehlt – ohne weitere Sicherungsmaßnahmen –, Spielgeräte zu installieren, die ablenken, oder mit Mosaik und Bodenmalerei sichere Bereiche im Garten auszuweisen.
- Die KI empfiehlt, wenn ein an Scharlach erkranktes Kind einen Fieberkrampf hat, die Zeit des Krampfs zu stoppen und nach fünf Minuten den Notarzt zu rufen. Ärzte empfehlen, direkt den Notarzt zu rufen.
Die zweite Schwäche besteht in der fehlenden emotionalen Intelligenz der KI. Menschen möchten sich bei Fachthemen oft rückversichern und Sicherheit gewinnen. Die KI kann jedoch nicht, wie es ein Experte tun würde, auf Ängste oder Sorgen der Leser eingehen, die vor allem bei Gesundheitsthemen oft mitschwingen. Im Gegenteil: Einige Aussagen in den KI-Texten schüren diese noch. Sensible Themen sollten nicht nur einfach, sondern ebenso verständnisvoll erklärt werden, damit sich der Leser abgeholt fühlt. Aufgrund der Gefahr von Fehlern und der fehlenden emotionalen Intelligenz besteht keine tiefe Vertrauenswürdigkeit oder Verlässlichkeit der KI-Texte. Sie geben den Lesern nicht das Gefühl von Wissen, Sicherheit und Expertise. Als Basistexte ist der Output in Ordnung, sie sollten aber noch einmal von einem Menschen überarbeitet werden, so das klare Fazit der Experten.
Realitycheck SEO-Performance
Der dritte Schritt des E-E-A-T-Checks bestand aus der Analyse der SEO-Performance und der Keyword-Rankings der KI-Texte. Hierfür hat die eo KI-Task-Force die Texte auf eine Testdomain, die-familie.org, hochgeladen. Abbildung 3 zeigt die Domainstruktur.
Als Informationsportal für Familien aufgebaut decken die gelben Hauptkategorien die wichtigsten Abschnitte im Familienleben ab. Den Hauptkategorien sind mindestens zwei Unterkategorien in Verzeichnisstruktur untergeordnet. In einem Unterverzeichnis liegen immer nur Texte von einer Quelle. Drei Quellen gibt es für die Texte:
- ChatGPT-4o (blau)
- Claude 3.5 Sonnet (rosé)
- Mensch, Team aus SEO-Textern (grün)
Die Strukturierung soll die Analyse vereinfachen, indem man die Sichtbarkeitsentwicklung der Unterverzeichnisse und damit die Performance der verschiedenen „Autoren“ miteinander vergleichen kann.
Seit dem Launch der Testdomain am 02.09.2024 haben sich zunächst recht schnell Keyword-Rankings eingestellt. Mitte November 2024 sind einige davon wieder verloren gegangen oder auf schlechtere Positionen gerutscht, sodass die Sichtbarkeit nach unten ging. Zum Jahresende stieg die Sichtbarkeitskurve mit Schwankungen wieder an und befindet sich zum aktuellen Zeitpunkt (27.02.2025) auf einem Wert von 0,0009 laut dem Tool SISTRIX (siehe Abbildung 4). Schwankungen sind im täglichen und wöchentlichen Sichtbarkeitsindex weiter zu sehen, der allgemeine Trend geht aber nach oben. Die durchschnittliche Ranking-Position liegt laut der Google Search Console bei 33 (siehe Abbildung 5). Das sind die Kennzahlen, die allein der Content erreicht hat. Es wurden keine weiteren SEO-Maßnahmen getätigt wie beispielsweise Backlinkaufbau, außer die Suchmaschinenoptimierung aller Texte sicherzustellen und die technische Fehlerfreiheit der Domain zu prüfen.
Vergleicht man die Unterverzeichnisse, liegen momentan (27.02.2025) fast alle bei null, da noch zu wenige (gute) Keyword-Rankings bestehen und die Textmenge überschaubar ist. Lediglich bei drei Unterverzeichnissen mit menschlichen Texten (/schwangerschaft/gesundheit-und-vorsorge/, baby/ernaehrung/ und kleinkind/betreuung/) und ebenso drei Unterverzeichnissen mit Texten von Claude (schwangerschaft/rechtliches/, baby/entwicklung/ und kindergarten-und-schule/krippe-und-kindergarten/) ist ein geringer Sichtbarkeitswert von 0,0001 beziehungsweise 0,0003 zu verzeichnen. Die besten Keyword-Rankings erzielt aktuell allerdings ebenfalls Claude 3.5 Sonnet und nicht der Mensch, wie die Abbildungen 6 und 7 zeigen. Das Anthropic KI-System belegt die meisten Top-30-Keyword-Rankings, die die-familie.org erzielt hat. 87 % dieser Rankings entfallen auf Claude-Texte, nur 3 % auf menschliche.
Ranking-Fähigkeit von KI-Texten erwiesen
Die KI-Texte wurden nach einem erprobten SEO-Qualitätsstandard erstellt. In den Anweisungen für die Texterstellung sind alle Informationen enthalten, die menschliche Texter bekommen, um hochwertige SEO-Texte mit Mehrwert zu erstellen. Durch diese detaillierten Anweisungen können KI-Texte offensichtlich für Google die durch E-E-A-T erforderte Qualität erfüllen. Es ist damit erwiesen, dass hochwertige suchmaschinenoptimierte KI-Texte rankingfähig sind und nicht schlechter ranken als menschliche Texte – zumindest nach aktuellem Stand. Die Ranking-Entwicklung der Domain sollte weiter beobachtet werden. An den Schwankungen im Sichtbarkeitsverlauf ist abzulesen, dass die Suchmaschine die Inhalte der Domain testet. Es könnte mit einem zukünftigen Update zu Abstrafungen kommen. Was in der Studie nämlich Erstaunen verursacht hat: Der Text zur Kindersicherung an Pool und Gartenteich, der erhebliche Fachmängel bei den Empfehlungen enthält, erzielt aktuell (27.02.2025) vier der Top-30-Rankings von Claude 3.5 Sonnet.
Der Mensch als Kontrollinstanz
Suchmaschinen können solche fachlichen Defizite nicht erkennen. Falsche Daten lassen sich mit Vergleichswerten entlarven. Aber bei komplexeren Empfehlungen, für die Fachexpertise notwendig ist, ist der Mensch als Kontrollinstanz absolut erforderlich. Falsche Informationen können zu einem Vertrauensverlust bei den Nutzern führen, der einen dauerhaften Imageschaden nach sich ziehen kann. Darüber hinaus ist es eine ethisch-moralische Verpflichtung aller an der Content-Produktion Beteiligten, dafür zu sorgen, dass sich im Netz keine Falschinformationen verbreiten. Ohne menschliche Überprüfung und Nacharbeit sollten KI-Texte nie veröffentlicht werden. Dennoch bietet KI-Support bei der Texterstellung auch Chancen. Denn trotz der Notwendigkeit, die Inhalte noch einmal zu kontrollieren, ergibt sich bei der Content-Produktion eine erhebliche Zeitersparnis. Und diese können Content-Ersteller in die Qualität und in die Arbeit, eine Marke zu werden, stecken.
Mehr Zeit, eine Marke zu werden
Websites mit Inhalten zu befüllen, wurde in den vergangenen Jahren immer zeitaufwendiger und damit kostenintensiver. Die zunehmende Flut an Websites erschwerte Top-Rankings, sodass Unternehmen aufgrund der wachsenden Konkurrenz immer mehr Energie entweder in eine noch größere Anzahl an Inhalten (quantitativer Aufwand) oder in eine umso höhere Qualität (qualitativer Aufwand) investierten. KI ist eine ebenso logische wie willkommene Lösung für dieses Problem – wenn man sie richtig nutzt. Statt massenhaft Content ins Netz zu schießen, ist es an der Zeit, den Fokus auf die Zukunft zu richten. Wer Bastian Grimms Keynote auf der SEOkomm in Salzburg im November 2024 gesehen hat, hat hier einen guten Einblick bekommen. Das Suchverhalten wird sich immens verändern. Statt eine Seite zu sein, die gefunden wird, sollten Unternehmen daran arbeiten, eine Seite zu werden, die man sucht. Durch Branding: Eine Marke zu sein, wird immer wichtiger. Und dafür sollten Content-Ersteller die Energie, die durch den KI-Support frei wird, nutzen. Eine noch intensivere Beschäftigung mit den Wünschen und Bedürfnissen der Zielgruppen. Eine klare auf die Nutzer ausgerichtete dialogische Digital-Kommunikation. Eine Unternehmensphilosophie mit Wiedererkennungswert, die in den Köpfen bleibt. Das sind gute Investitionen der Zeitersparnis durch KI-Texterstellung.
Wie hoch sind die Zeitvorteile?
Diese Frage stellt sich berechtigterweise, da jeder KI-Text noch einmal überprüft und nachgebessert werden muss. Wie viel Zeitersparnis bleibt am Ende? Zeitmessungen, die während der KI-Content-Studie durchgeführt wurden, haben ergeben, dass eine Zeitersparnis bis 53 % gut erreichbar ist – allerdings in Abhängigkeit von verschiedenen Faktoren wie
- Textlänge,
- Projektanforderungen,
- Thema und
- Faktentiefe.
Längere Texte bedeuten in der Regel eine höhere Zeitersparnis, da der Mensch beim Schreiben längerer Texte länger braucht. Jedoch relativiert sich die Zeitersparnis bei Themen mit hoher Faktentiefe, da man bei diesen mehr nachprüfen muss. Zu berücksichtigen sind weiterhin die Qualitätsunterschiede: Eine KI hat „Tagesformen“, die Ergebnisse können variieren. Der Bearbeitungsaufwand ist maßgeblich abhängig von der bereits durch die KI erreichten Qualitätsstufe. Je höher die Anforderungen an einen Text sind, desto niedriger ist erfahrungsgemäß die erreichte Qualitätsstufe und desto größer ist der Nacharbeitsaufwand. Mithilfe von Beispieltexten und einem CustomGPT (nur bei OpenAI) kann man den Output verbessern. Über die Zeit lernt eine KI außerdem immer mehr, was man genau möchte, was den Output effizienter und die Zeitersparnis größer macht.
Best Practices für die Erstellung hochwertiger SEO-KI-Texte
Um qualitativ hochwertige KI-Texte zu erstellen und von einer möglichst hohen Zeitersparnis zu profitieren, ist ein strukturierter Ansatz erforderlich. Hier sind die wichtigsten Schritte:
- Briefing: Definieren aller Anforderungen an die Sprache, die SEO und die Zielgruppe für das Thema oder Projekt. Es ist bei ChatGPT empfehlenswert, einen CustomGPT für das Projekt anzulegen. Die KI erinnert sich an die Anforderungen bei jedem Auftrag, sodass man diese nicht jedes Mal neu eingeben muss. Der Output wird zudem schneller besser.
- Keyword-Recherche: Durchführung einer umfassenden Keyword-Recherche und Definition eines Keyword-Sets. Die Keyword-Recherche ist ein essenzieller Qualitätsfaktor. Aus dem Keyword-Set ergeben sich die Gliederung und damit die Inhalte eines Texts. Der Mensch sollte daher die Keywords selbst auswählen, um die Inhalte voll zu kontrollieren. Er kann so genau bestimmen, welche Themen der Text abdecken soll. Über die Keyword-Prüfung lässt sich dann einfach im Nachgang feststellen, ob alle gewünschten Inhalte im Text enthalten sind. Denn fehlen Keywords, fehlen auch immer die entsprechenden Inhalte.
- Prompting: Erstellung eines präzisen Prompts für die Texterstellung, der alle relevanten Informationen enthält. Arbeitet man mit einem CustomGPT, reichen als Informationen im Prompt Thema und Keyword-Set. Arbeitet man mit Claude, kann man die Projektanforderungen für sich speichern und per Copy-and-paste in den Chat geben (siehe Abbildung 7). Die KI fasst den Arbeitsauftrag zusammen, sodass man die Kontrolle hat, dass er verstanden wurde. Danach reicht ebenfalls ein kurzer Prompt wie bei CustomGPT.
- Lektorat: Gründliche Überprüfung des Texts auf alle Projektanforderungen, die man hinterlegt hat
- Nachbesserung: Passt der Output nicht, sollte man zunächst die Projektanforderungen überarbeiten, indem man sie schärft, ergänzt oder komplett anders formuliert. Gegebenenfalls ist es sinnvoll, weitere Informationen in den Prompt zu geben. Beispieltexte helfen der KI, den passenden Stil zu finden.
- Qualitätssicherung: Auch wenn der KI-Text grundsätzlich passt, muss immer eine menschliche Qualitätssicherung stattfinden. Gewisse Aspekte kann die KI auch nicht beim besten Prompting erfüllen, das hat die eo KI-Studie deutlich gezeigt. Die wichtigsten Aufgaben sind:
- Sicherstellung, dass die KI relevante Keywords korrekt verwendet
- Optimierung der Keyword-Verteilung, um Keyword-Spam zu vermeiden
- Einfügen fehlender Keywords und gegebenenfalls Korrektur des Keyword-Fokus
- Überprüfung und Korrektur von inhaltlichen Fehlern und Ungenauigkeiten
- Korrektur von Halluzinationen und erfundenen Inhalten
- Anpassung der Texte an die spezifische Zielgruppe, um eine vertrauensvolle Kommunikation zu gewährleisten
- Sicherstellung, dass die Texte relevant, ansprechend und emotional intelligent sind
- Beseitigung von Redundanzen, Wiederholungen und unklaren Formulierungen
- Sicherstellung eines flüssigen und verständlichen Textflusses
- Einbindung von Expertenwissen, um die Glaubwürdigkeit der Texte zu erhöhen
- Sicherstellung eines echten Mehrwerts für die Leser
- Einbringen von Kreativität und Empathie in die Texte
Die Zukunft der KI in der SEO-Texterstellung
KI-gestützte Website-Texte bieten ein enormes Potenzial zur Effizienz-und Produktivitätssteigerung in Unternehmen. KI übernimmt zeitintensive Aufgaben bei der Texterstellung und rückt die Zusammenarbeit zwischen Mensch und Maschine in den Vordergrund. Denn die Qualität von KI-Texten ist ohne menschliche Nacharbeit oft nicht ausreichend. Menschliches Lektorat spielt eine entscheidende Rolle, um sicherzustellen, dass die Texte suchmaschinenoptimiert, inhaltlich korrekt, zielgruppengerecht und glaubwürdig sind. Wo es in Prä-Panda-Update-Zeiten noch hieß, jeder könne SEO-Texte schreiben, wird 15 Jahre später unübersehbar deutlich, dass trotz innovativer KI die menschliche Expertise unerlässlich bleibt, um qualitativ hochwertige und relevante Inhalte zu schaffen und um im Online-Marketing-Wettbewerb vorne zu bleiben. Hierfür ist die Zusammenarbeit von Mensch und Maschine jedoch von großem Nutzen. Die durch den KI-Support bei der Texterstellung gewonnene Zeit kann in die Markenbildung und in die Arbeit an nutzwertigem Content investiert werden. Eine Kombination aus KI und menschlicher Expertise ist der Schlüssel, um hochwertige und effiziente Website-Texte zu erstellen. Es liegt an uns Menschen, die sich verändernden Bedingungen durch KI so zu nutzen, dass die Ergebnisse und Konsequenzen insgesamt zum Guten gereichen.








