Warum Sprach- und Bildsuche mehr als nur ein Hype sind

Kathleen Jaedtke
Kathleen Jaedtke

Kathleen Jaedtke leitet bei Zalando die Content-Marketing-Aktivitäten für Deutschland, Österreich und die Schweiz. Neben der inhaltlichen Optimierung faszinieren sie neue Technologien und künstliche Intelligenz. Aktuell beschäftigt sie sich intensiv mit dem Bereich der Sprachsuche und deren Einfluss auf das SEO von Morgen. Die Diplom-Volkswirtin ist Mitautorin des SEO-Fachbuchs -SEO mit Google Search Console-. Seit 2012 ist sie Teil des Inhouse-Teams von Zalando und hat mehrere internationale SEO-Teams erfolgreich aufgebaut und geleitet.

Mehr von diesem AutorArtikel als PDF laden
Tina Nord
Tina Nord

Tina Nord ist Content-Strategin, Sprecherin und Autorin. Die Kommunikationswirtin beschäftigt sich seit mehr als sieben Jahren mit Corporate Publishing und Performance-Content-Management. Ihr Arbeitsschwerpunkt liegt in der Leitung internationaler Redaktionsteams von E-Commerce-Unternehmen. Aktuell führt Tina das Content-Marketing-Strategie-Team bei Zalando. In diesem Rahmen erforscht sie die Auswirkungen neuer Technologien auf Content.

Mehr von diesem AutorArtikel als PDF laden

Das Thema Sprachsuche wird seit knapp zwei Jahren auf Konferenzen und in Fachartikeln zum neuen Marketing-Trend deklariert. Die einstimmige Botschaft: Unternehmen sollen ihre Online-Marketing-Strategie auf die neuen Technologien ausrichten, um bereit für die Zukunft zu sein. Doch die Kritik ließ nicht lange auf sich warten. Ein aktuelles Beispiel ist Bryson Meunier, SEO-Direktor beim Ticketing-Service VividSeats. Im Februar 2018 veröffentlichte er einen Artikel auf Searchengineland.com (http://einfach.st/sel23), in welchem er das Potenzial digitaler Sprachassistenten speziell für den Marketing-Bereich anzweifelt: Im täglichen Gebrauch seines Google-Home-Lautsprechers nutze er die Suchfunktion zu selten. Daher sieht er im sprachgesteuerten Finden für Unternehmen nur wenig Möglichkeiten, ihre Produkte oder Dienstleistungen sinnvoll zu bewerben. Meuniers Einschätzung deckt sich mit den Ergebnissen externer Studien (http://einfach.st/npm2): Intelligente Lautsprecher werden hauptsächlich genutzt, um Musik zu hören, das Licht an- und auszuschalten oder den Wecker zu stellen, jedoch weniger, um zu suchen oder zu shoppen. Ist Sprachsuche also nicht mehr als ein Hype mit eher beschränktem Marketing-Potenzial?

Das Potenzial liegt im Smartphone – nicht im Smartspeaker

Meuniers Resultate haben Gültigkeit in Bezug auf intelligente Lautsprecher, verlieren diese jedoch im Hinblick auf mobile Endgeräte: Google CEO Sundar Pichai ließ bereits im Mai 2016 verlauten, dass 20 Prozent der Suchanfragen auf Smartphones sprachgesteuert sind. Das Internet-Marktforschungsunternehmen Comscore erwartet, dass bis 2020 50 % aller Suchen durch das gesprochene Wort gesteuert werden (http://einfach.st/cpl3). Wenn sich Marketingexperten folglich auf die Sprachsuche einstellen wollen, müssen sie das mobile Suchverhalten betrachten. Das Potenzial für sprachgesteuerte Transaktionen liegt im Smartphone, (noch) nicht im Smartspeaker. Der Grund dafür wird deutlich, wenn wir uns das Nutzerverhalten auf mobilen Endgeräten ansehen.

Google veröffentlichte im Januar 2018 einen Artikel über mobiles Suchverhalten (http://einfach.st/twg1) und stellte eine direkte Verbindung zwischen dem Smartphone und einer veränderten Erwartungshaltung des Users her. Anders als beim smarten Lautsprecher steigt die Anzahl der transaktionsnahen Recherchen auf dem Handy an. Es wird nach Restaurants gesucht, nach Informationen sowie nach Produkten, und zwar bevorzugt Produkte, die perfekt zum Suchenden passen. Belegt wird dies durch einen Blick auf Google Trends: Suchanfragen wie „best” (am besten) oder „best for me” (am besten für mich) werden im englischen Sprachraum mit steigender Tendenz genutzt.

Solche Suchbegriffe legen nahe, dass der Nutzer von der Suchmaschine erwartet, dass diese Kontext und individuelle Bedürfnisse kennt und basierend auf dem Kontext wie beispielsweise Tageszeit, vorherigen Fragen und Standort personalisierte Empfehlungen geben kann. Alternative Informationen, die keine Relevanz für den Nutzer haben, sollen von vornherein ausgeschlossen werden, damit er beim Finden der passenden Antworten auf seine Fragen keine Zeit verliert. Der User will das für ihn beste Suchergebnis, und zwar sofort. Er möchte nicht mehr suchen, sondern finden.

Von Google Trends gelistete Keywords sind zum Beispiel „die beste Matratze für mich”, das „beste mexikanische Restaurant für mich” oder „die beste Diät für mich”. Studien von Google zeigen (https://www.thinkwithgoogle.com/consumer-insights/meetingconsumerexpectations/), dass die mobilen Suchanfragen nach dem Begriff „for me" (für mich) in den letzten zwei Jahren um über 60 % gewachsen sind. Diese „investigativen” Suchbegriffe dienen der Informationssuche, die unmittelbar vor einer Kaufentscheidung erfolgt. Sie mögen aktuell noch kein überwältigendes Suchvolumen aufweisen, dennoch besteht Potenzial und eine frühzeitige Content-Optimierung kann sich langfristig auszahlen.

Sprachsuche überwindet Schmerzpunkte in der Kundenreise

Eine Optimierung der eigenen Webseite für mobile Suchbedürfnisse macht also Sinn. Doch warum können Marketer sich sicher sein, dass in diesem Zusammenhang der Anteil der Sprachsuchanfragen steigt? Der Grund liegt im Komfort und der Schnelligkeit des gesprochenen Wortes. Im Vergleich zur herkömmlichen Suche via Texteingabe überbrückt Sprache elementare Schmerzpunkte in der Kundenreise. Ein Mensch kann durchschnittlich 150 Wörter pro Minute sprechen, aber nur 40 Wörter pro Minute tippen (http://einfach.st/purna) – und kleine Eingabe-Interfaces wie Smartphone-Tastaturen beschleunigen das Tippen nicht. Sprache ist natürlicher Bestandteil des Lebens und beansprucht weniger Hirnareale als das Tippen von Wörtern. Sprachgesteuerte Suche ist also rasanter, weniger anstrengend und intuitiver als (fast) jede andere Art der Online-Recherche. Sie unterstützt damit die Erwartungshaltung des Kunden, einfach personalisierte und relevante Antworten zu finden. Damit befriedigt Sprachsuche direkt mobile Suchbedürfnisse und wird sich daher mit hoher Wahrscheinlichkeit auf dem Smartphone durchsetzen. Es kann weiterhin davon ausgegangen werden, dass die Antizipation des Nutzers mit der Zeit steigt. Es wird die Aufgabe einer vorausschauenden Marketingstrategie sein, diese Bedürfnisse zu kennen und darauf zu reagieren.

Ein weiterer Baustein für den Erfolg der Sprachsuche sind aktuelle technische Fortschritte. Laut Google liegt die Fehlerrate seiner Spracherkennungssoftware bei 4,9 Prozent (http://einfach.st/speech2). Das bedeutet, der Sprachassistent versteht und interpretiert das gesprochene Wort ebenso gut wie ein Mensch. Die Fehlerrate ist entsprechend gering und das Nutzererlebnis qualitativ hoch. Experten ist jedoch selbst das noch nicht genug: Andrew Yan-Tak Ng, ehemaliger Chief Scientist beim chinesischen Suchgiganten Baidu, ist der Meinung, dass eine noch größere Genauigkeit der Spracherkennung ermöglichen wird, Spracherkennungssoftware vollwertig in den Lebensalltag zu integrieren (http://einfach.st/tweet6). Denkbar sind dann sprechende Haushaltsgeräte oder andere Alltagsgegenstände. Bereits jetzt wird die Technologie beispielsweise in Autos verwendet. Es ist somit wahrscheinlich, dass Nutzer in der nahen Zukunft hauptsächlich mit Sprache navigieren und mit ihrem Umfeld interagieren. Damit wächst die Anzahl der Kontexte, in denen Suchen oder Transaktionen sprachgesteuert ausgeführt werden können. Voraussetzung ist jedoch, dass technische Herausforderungen wie Hintergrundgeräusche, Akzente, Dialekte und interpretatives Zuhören überwunden werden.

So steigt die Sichtbarkeit in den Sprachsuchergebnissen

Doch wie sichern sich Unternehmen eine gute Sichtbarkeit in den Sprachsuchergebnissen? Im Dezember 2017 veröffentlichte Google erstmals Qualitätsrichtlinien für den Google Assistant (PDF unter einfach.st/gassi3) und Sprachsuchergebnisse auf seinem Research Blog. Demnach sollen Algorithmen Sprachantworten ausliefern, die „grammatikalisch, fließend und prägnant" sind. Erstklassiger Content ist also weiterhin entscheidend, die Lesbarkeit wird nun jedoch um die Sprechbarkeit ergänzt. Ist der Inhalt beim Zuhören verständlich? Kann die kürzere Aufmerksamkeitsspanne optimal genutzt werden, um alle entscheidenden Informationen zu vermitteln? Content-Marketing-Experten sollten diese Kriterien bei der inhaltlichen Gestaltung berücksichtigen. Durch die erhöhte Relevanz der mobilen Suche und den (Nutzer-)Wunsch nach Schnelligkeit sind außerdem ein responsives Design und optimale Ladezeiten (Stichwort Accelerated Mobile Pages) unverzichtbar.

4 Tipps zur Content-Optimierung für Sichtbarkeit in Sprachsuchergebnissen

  • Top-Rankings sind noch entscheidender für den Erfolg: Antwortboxen (Position 0) werden nicht nur durch den Sprachassistenten vorgelesen, sondern haben auch allgemein eine hohe Klickrate.
  • Long-Tail-Keywords entsprechen dem Nutzerverhalten: User interagieren mit Sprachassistenten wie mit einem Menschen. Die Folge sind längere Suchworte, die an eine Konversation erinnern. Auch W-Fragen werden vermehrt genutzt und sollten im Fokus jeder Content-Strategie stehen.
  • Der Nutzer ist König: Die Technologie ist neu und verändert die Erwartungshaltung des Nutzers rasant. Der Mangel an Erfahrungswerten kann durch kontinuierliche Benutzerforschung und Studien zur Kundenreise ausgeglichen werden. Es gilt, die Schmerzpunkte im Findungsprozess zu erkennen und die neuen Technologien zu nutzen, um die Schmerzpunkte zu überbrücken.
  • Personalisierte Inhalte gewinnen langfristig: Keywords wie „beste“ und „beste … für mich“ erfordern individuelle Inhalte, basierend auf dem Nutzerkontext. Die sogenannten Mikro-Momente der eigenen Kunden identifizieren und darauf zu reagieren, ist ausschlaggebend für Sichtbarkeit in den Sprach-SERPs. Ein Dialog mit dem Kunden – etwa durch ein Quiz – kann bereits zu individuellen Produktempfehlungen beitragen.

Neben Richtlinien zur Optimierung wird von vielen Marketers eine klare Erkennbarkeit der Sprachsuchanfragen innerhalb der Google Search Console herbeigesehnt. Bis jetzt hielt sich Google zu diesem Thema bedeckt. Ein einzelner Tweet von John Mueller, Webmaster Trend Analyst bei Google, eröffnete Anfang Dezember 2017 einen Austausch. Mueller fragte die SEO-Gemeinschaft, welche Art von Sprachsuchdaten sie sehen möchten und warum (http://einfach.st/johnmu5). Eine klare Antwort auf die zahlreich eingehenden Vorschläge blieb er jedoch schuldig. Auswertungsmöglichkeiten für die Performance von Sprachsuche sind daher weiterhin Unternehmen vorbehalten, die einen Drittanbieter-Dienst für den Google Assistant entwickelt haben und damit Daten im Analytics-Bereich der Dialogflow Console (analog zum Metrics Dashboard im Alexa Skills Kit) einsehen können.

Sprachsuche allein reicht nicht aus

Die fehlenden (SEO)-Analyse-Optionen beeinflussen die Beliebtheit der mobilen Sprachsuche nicht. Die Popularität liegt nicht nur an der ständigen Verfügbarkeit des Smartphones: Gerade beim Einkaufen per Sprachbefehl brauchen Nutzer Produktbilder, um eine Entscheidung treffen zu können. Der Bildschirm des Handys ist daher im Vergleich zu den Smartspeakern der ersten Generation ein entscheidender Vorteil. Nicht nur Amazon erweiterte seine sprachgesteuerte Echo-Lautsprecher-Serie deshalb um den Echo Show und den Echo Spot. Beide Produkte weisen ein integriertes Display auf und umgehen damit Unsicherheiten des Nutzers beim Shoppen. Die Antworten des digitalen Assistenten wurden also durch visuelle Ergebnisse ergänzt. Auch Google und Facebook orientieren sich am Amazon Echo. Beide wollen im Laufe des Jahres smarte Lautsprecher mit eingebautem Display auf den Markt bringen. Im Hinblick auf Transaktionen macht dieses Vorgehen Sinn: Fast die Hälfte aller US-Kunden sucht vor dem Kauf immer nach Bildern. Im Schnitt werden drei bis vier Produktbilder benötigt (https://www.emarketer.com/Report/Visual-Commerce-2017-How-Image-Recognition-Augmentation-Changing-Retail/20020599), um etwas in den Warenkorb zu legen. Fotos helfen dem Nutzer folglich, Inspiration in eine Kaufentscheidung zu übersetzen. Sprache allein reicht also nicht immer aus – insbesondere dann, wenn es ums Einkaufen geht.

Noch schneller finden mit visueller Suche

Der Einsatz von Bildern macht aus einem weiteren Grund Sinn: Das menschliche Gehirn kann visuelle Informationen 60.000-mal schneller verarbeiten als Text. Damit haben Bilder das Potenzial, die Kommunikation sogar noch mehr zu beschleunigen als Sprache. Und warum nicht auch die Suche? Statt der mühseligen Eingabe langer Text-Kolonnen wird das Bild selbst zum Suchwort. Der Anwender kann dank visueller Suchfunktionen ein Foto von einem Gegenstand machen, es hochladen und bekommt ähnliche Fotos oder passende Informationen geliefert.

Ähnlich wie Smartspeaker erlebte die Bildsuche in den letzten zwei Jahren einen Durchbruch. Anfang 2017 führte etwa die weltweit größte Bildsuchmaschine Pinterest die visuelle Suchfunktion „Lens“ ein. Über die Smartphone-Kamera kann die App-Funktion basierend auf maschinellem Sehen Bildinhalte wie etwa eine Jacke erkennen und ähnliche Kleidung finden. Diese Technologie machen sich bereits verschiedene Online-Anbieter aus den USA und Europa zunutze und erleichtern damit ihren Kunden das Finden von Produkten. Schlagzeilen machte etwa die Zusammenarbeit von Pinterest mit der amerikanischen Supermarktkette Target und in Deutschland bieten beispielsweise Lidl, Asos und Zalando eine visuelle Suchfunktion innerhalb ihrer Apps an.

Pinterest Lens – verfügbar auf Smartphones mit englischen Spracheinstellungen, in der Pinterest-App
Google Lens – verfügbar in der „Google Fotos“-App im Pixel 1 und 2
Vivino – App zur Suche und dem Vergleich von Wein, z. B. im Supermarkt
Blippar – visuelle Suchmaschine in Echtzeit (App)

Google hat mit Google Lens ein ganz ähnliches Suchwerkzeug auf den Markt gebracht. Dieses erkennt über die Smartphone-Kamera Objekte in Echtzeit und liefert dem Nutzer z. B. beim Erkennen eines Restaurants entsprechende Kundenbewertungen gleich mit aus. So kann er auf einen Blick erfassen, um welches Restaurant es sich handelt und welche Bewertungen andere Restaurantbesucher abgegeben haben. Das beschleunigt den Findungs- und Entscheidungsprozess des Nutzers erheblich. Lokale Unternehmen sollten sich deshalb um eine gute Reputation bemühen und ihren Eintrag bei Google My Business entsprechend optimieren.

Fazit

Der Anspruch der Nutzer an die Online-Suche wächst unabhängig von neuen Technologien. Suchende möchten schnell die besten Informationen finden, und zwar bevorzugt auf ihrem Smartphone. Dabei kommen Sprach- und Bildsuche diesem Bedürfnis entscheidend entgegen und beschleunigen den Rechercheprozess. Beide Arten des Findens können Schmerzpunkte in der mobilen Kundenreise eliminieren: Der Nutzer findet bequemer und intuitiver als mit der Textsuche personalisierte und relevante Antworten auf seine Fragen und Bedürfnisse.

Mit einer niedrigen Fehlerrate in der Spracherkennung und der Integration von Displays und Kameras in intelligente Lautsprecher werden sich beide Methoden langfristig durchsetzen. Es handelt sich demnach weniger um einen Hype, als vielmehr um eine Ermächtigung des Suchenden, der durch seine steigende Erwartungshaltung ein Umdenken im Marketing erzwingt. Suchmaschinen- und Content-Marketing-Experten, die sich dieses Trends bewusst sind, können frühzeitig Potenziale identifizieren. Dabei sollte die Optimierung der eigenen Webseite unter Berücksichtigung der Kundenbedürfnisse im Fokus stehen. Zum einen, indem die Probleme der Nutzer identifiziert und Sprach- und Bildsuche zu der Lösung genutzt werden. Zum anderen durch die kontinuierliche Optimierung von Inhalten, um der wachsenden Erwartungshaltung zu entsprechen. All dies sollte mit dem Ziel verbunden werden, Produkte oder Dienstleistungen an den passenden Punkten in der Kundenreise zu platzieren und diese reibungsloser zugänglich zu machen.