Die Liebe zur eigenen Webseitensuche (neu) entdecken

Tipps und Tricks um die Suche auf der eigenen Webseite besser zu verstehen (und auszubauen)

|Florian Keitgen
Beitragsbild für Artikel How to fall in love with your on-site search (again)

In diesem Artikel sehen wir uns an, wie man mit Solr eine großartige Websitesuche für Besucher konfiguriert. Die relevanten Website-Inhalte mit einem guten Sucherlebnis zugänglich zu machen, hilft den Benutzern, genau das zu finden, was sie brauchen. Wenn man versteht, wer sucht und wonach, kann man durch eine Feinabstimmung des Index sicherstellen, dass Besucher auch die relevantesten Ergebnisse erhalten. Wir arbeiten daran sehr gerne, da die Auswirkungen hier unmittelbar und eindrucksvoll sind. Kontaktiere uns, wenn Du mit Deiner Webseite-Suche Hilfe benötigst!

Die Liebe zur eigenen Webseitensuche (neu) entdecken

Google ist zum Synonym und Standard für Suchen im Web geworden. Suchen wir was im Netz, ist die erste Anlaufstelle für die meisten von uns Google und wir erwarten, dass wir das was wir suchen auf der ersten Suchergebnisseite finden. Suchen im Netz ist einfach, schnell und oft sehr zielgerichtet.

Schaut man auf die eigene Webseite, fühlt man von der Magie, die man von Google gewohnt ist, oft recht wenig. Oft erzielen wir nicht die Suchergebnisse, die wir erwarten. Das kann viele Gründe haben:

  • Inhalte werden schlichtweg nicht gefunden.
  • Inhalte die älter und weniger relevant sind, werden oft vor neueren, relevanten Inhalten angezeigt
  • Metadaten werden von der Suche nicht indiziert und Suchergebnisse werden dadurch sehr unpräzise.
  • Die Suche kann keine Synonyme verwerten oder kennt keine alternativen Schreibweisen für die Suchanfrage.
  • Bestimmte Wörter der Suchanfrage werden nicht ausgewertet.

Wenn deine Suche ähnliche Ergebnisse liefert, führt das bei den Benutzern zu Frust-Erlebnissen. Oft kann es vorkommen, dass Nutzer dann die Seite einfach verlassen und eben nicht bei dir kaufen oder lesen. Die Erwartungen von Nutzern im Internet sind hoch und umso größer Webseiten werden, umso wichtiger ist es, dass Nutzer schnell und präzise Dinge finden. Umso schockierender, dass „84 Prozent aller Firmen ihre Websuchen weder auswerten noch optimieren.“

Was allerdings, wenn die eigene Suche auf der Webseite so gut werden könnte wie die von Google? Völlig unmöglich ist das nicht. Um das zu erreichen, musst du etwas Zeit in deine Suchmaschine investieren. Denn eine Suche in nur so gut, wie der Index auf dem sie aufgebaut wurde.

Eine Suche in nur so gut, wie der Index auf dem sie aufgebaut wurde.
—  Flix

Die Intelligenz der eigenen Suche kann man selbst beeinflussen

Einen Suchindex kann man mit einem Gehirn vergleichen. Es ist ein Wissensspeicher, der trainiert werden muss. Damit der Index die relevantesten Informationen ausgeben kann, muss er regelmäßig kuratiert und trainiert werden.

Nun ist Suche nicht gleich Suche. Es gibt auf dem Markt unterschiedliche Methoden, auf denen eine Suche aufgebaut werden kann. Dabei gibt es von sehr einfachen Suchmaschinen bis hin zu hochkomplexen Algorithmen fast alles. In diesem Blogbeitrag wollen wir unseren Fokus auf die Suchmaschine „Solr“ legen, eine Open-Source Suchmaschine, die wir sehr gerne in TYPO3 Projekten nutzen, da sie schnell, effizient und sehr anpassungsfähig ist. Solr liefert „out of the box“ bereits gute Ergebnisse. Aber gut soll uns in diesem Blogpost nicht gut genug sein.

Solr bietet von sich aus bereits einige Funktionen, die einfache Suchmaschinen von sich aus nicht mitbringen. Sucht man in einer Solr-Suche nach etwas, dann nutzt Solr seine eingebaute Logiken und Wörterbücher und ordnet dem beispielhaften Suchbegriff „arbeiten“ auch die Wörter „Arbeit“ sowie andere Wortzusammensetzungen wie „Arbeitsleben“, „Mitarbeiter“ oder „Sachbearbeiter“ zu. Damit ist Solr mit seinen Logiken wesentlich intelligenter als eine einfach Wortsuche, die rein nach „arbeiten“ suchen würde.

Der Index von Solr beinhaltet zusätzlich ein Bewertungssystem und schaut wie wichtig verschiedene Inhalte der Seiten zu bewerten sind. Noch mal zur Suchanfrage mit dem Beispiel „arbeiten“. Bei der Suchanfrage schaut Solr auch, ob der Begriff nur im Fließtext und/oder auch in H1- oder H2-Überschriften vorkommt. Seiten, bei denen das Suchwort bereits in einer Überschrift steht, sind wahrscheinlich relevanter als wenn das Wort nur im Fließtext auftaucht. Dementsprechend werden die Treffer auf der Suchergebnissseite nach Relevant sortiert ausgegeben.

An diesen Bewertung-Logiken und Synonym- und Stoppwortlisten können Anpassungen gemacht werden, um die Suche auf Ihre Bedürfnisse anzupassen. Aber man muss vorsichtig sein: bereits kleinere Anpassungen können große Auswirkungen haben.

Wie kann man die Relevanz der Suchergebnisse beeinflussen?

Damit die eigenen Suchergebnisse besser werden und man weiß an welchen Stellschrauben seiner Suche man (fein)justieren muss, sollte man sich ein paar konzeptionelle Fragen stellen:

  • Wer nutzt eigentlich meine Suche?
  • Wie wird meine Suche genutzt?
  • Was wird eigentlich gesucht? 

Nimmt man die daraus gewonnen Erkenntnisse und kombiniert sie mit den Themen:

  • Wie ist ein Suchindex aufgebaut
  • Wie kann ich die Bewertung in Solr beeinflussen, um meine Suchergebnisse zu verbessern

ist man auf einem guten Weg die eigene Suche zu verbessern. Das klingt nach einigem an Arbeit. Ehrlicherweise ist es das auch. Aber eine gute Suche zahlt sich unmittelbar aus. Denn eine gute Suche entscheidet darüber, ob deine Kunden auf deiner Seite verweilen oder sie verlassen. Und da jeder von uns selbst andere Webseiten nutzt, wissen wir wie es sein kann, wenn man etwas sucht und nicht findet. Umso wichtiger ist es sich diesen konzeptionellen Fragen zu stellen und die eigene Suche aktiv zu gestalten:

Das Wer: Wer nutzt meine Suche eigentlich?

Starten wir mit der Zielgruppe-Frage: Welche unterschiedlichen Zielgruppen gibt es auf der Webseite und was erwarten diesen an Suchergebnissen?

Dazu ist es wichtig, seine Nutzer zu kennen (oder von diesen Stimmen einzuholen), denn oft prägt unser interner Blick auf die eigene Seite die Erwartung an die Suchergebnisse. Wir selbst kennen die Inhalte unserer Seite gut. Haben uns über den Aufbau Gedanken gemacht und finden die Sortierung von Themen und Stichwörtern logisch. Dabei macht es durchaus auch einen Unterschied, ob die eigene Webseite aus dem Bereich IT oder dem Bereich Marketing oder Öffentlichkeitsarbeit entstanden ist. Alle drei Bereiche würden Inhalte anders priorisieren, im Seitenbaum anordnen und jeder hat ein anderes Verständnis dafür welche der Inhalte auf einer Suchergebnisseite weiter oben stehen müssten. Diese internen Vorstellungen eines Suchergebnisses sind aber oft nicht das, wonach unterschiedliche externe Zielgruppen suchen.

Beispiel aus der Praxis: auf einer Magazinseite suchten die internen Redakteure oft nach Ihren eigenen Namen und waren irritiert, dass nicht alle Ihre Artikel an oberster Stelle der Suchergebnisse auftauchen. Schaute man sich aber die Anfragen der externen Leser an wurde klar: diese suchten praktisch nie nach einzelnen Autoren sondern immer nur nach Artikelnamen.

Der Fall zeigt, dass es wichtig ist:

  • sich seines internen Blicks bewusst zu werden
  • zu wissen wer die eigene Seite nutzt
  • die Suchergebnisse zwischen internen und externen Erwartungen auszubalancieren

Das Wie: Wie wird die Suche genutzt?

Das gerade erwähnte Beispiel zeigt: Das Wer und das Wie sind bei der Suche eng miteinander verwoben. Der Blick (extern oder intern) auf eine Suche steuert auch immer das eigene Herangehen an eine Suche.

Ein weiterer Fall aus der Praxis: Wenn ich im internen Produktkatalog Produkte nur nach Produktnummern suche, kann es frustrierend sein, wenn die eigene Websuche hierzu keinerlei oder falsche Treffer liefert. Von der Tatsache, dass hier im Index der Suche vielleicht Daten fehlen, stellt sich auch die Frage: Nutzen meine Kunden die Suche genauso und suchen nach internen Produktnummern? Ist es nicht wahrscheinlicher, dass der externe Nutzer viel eher nach Stichwörtern oder Titel von Produkten sucht?

  • Der eigene Blick auf die Suche bestimmt nicht nur, was wir an Suchergebnissen erwarten, es bestimmt auch, nach welchen Daten wir in einer Suche suchen.
  • Für uns als Agentur ist es wichtig zu verstehen, was unsere Kunden für eine Erwartung an die Suchergebnisse habe. Wir haben automatisch den externen Blick auf das Projekt. Umso wichtiger ist es, diesen mit ihrem internen Blick abzugleichen.

Das Was: Was wird eigentlich gesucht?

Ebenso wichtig wie die Zielgruppe und ihre Herangehensweise zu kennen, ist zu untersuchen, was auf der eigenen Suche eigentlich gesucht wird. Die Suchmaschine Solr bietet dazu ein internes Tool im Backend von TYPO3 an, mit dem man gezielt sehen kann, nach welchen Suchanfragen gesucht wird, wie oft nach diesen gesucht wurde und wie viele Suchergebnisse daraus resultieren.

Beispiele für search queries

Behält man dieses Tool regelmäßig im Auge, kann man sich gezielt an Änderungen machen. 

Beispiel: Sehe ich in der Auswertung, dass bestimmte Suchbegriffs nicht mit Ergebnissen bedient werden gibt es mehrere Optionen:* 

  1. Man ordnet bestehenden Produkten diese Suchbegriffe in Metadaten wie Beschreibungstext, Keywords etc. zu*
  2. Man ordnet in einem anderen Modul der Solr-Suche dem gesuchten Produkt Synonyme zu und schaffe es so, dass einem Suchbegriff mehr Ergebnisse zugeordnet werden (Beispiel: gesuchtes Wort ist „iPhone“ zugeordnet wird „smartphone“, „cellphone“…)

Es ist wichtig in regelmäßigen Abständen zu überwachen nach was User eigentlich suchen und daraus im Zweifel manuelle Maßnahmen wie das Ergänzen von Stichwörtern oder Synonymen abzuleiten.

Denn: der Suchindex deiner Suche ist nur so intelligent wie die Informationen, die du ihm zur Verfügung stellst.

Das Chaos ordnen

Eine Unterseite der eigenen Webseite ist meist oft mehr als nur eine klassische Seite mit Content. In unseren Projekten setzen wir oft News, Veranstaltungen, Produkte und andere Seiten als einzelne Seitentypen um.
Diese unterschiedlichen Seitentypen können auf einer Suchergebnisseite genutzt werden, um gruppierte Suchergebnisse angezeigt zu bekommen. So würde bei der Suche nach „TYPO3 Version 10“ nicht nur Inhaltsseiten aufgeführt, sondern extra ausgezeichnet auch „News“-Seiten oder Veranstaltungen zu diesem Thema. Diese unterschiedlichen Gruppen können dann z.B. auch über Filter ausgeschlossen werden.

Diesen unterschiedlichen Seitentypen können zusätzlich Zusatzinformationen zugeordnet werden. So erhalten Produktseiten z.B. zusätzliche Produktdaten in die Seiteneigenschaften wie eine EAN-Nummer, Preis, Verfügbarkeit usw. Diese Daten helfen dem Suchindex der eigenen Webseite, um mehr Informationen über ein Produkt zu haben (Beispielsweise werden Produkte ohne Verfügbarkeit nicht oder nachrangig angezeigt). Diese Metainformationen helfen nicht nur der eigenen Suche, sondern bieten als strukturierte Daten auch externen Suchmaschinen wie Google einen Mehrwert.

Kann Solr auch PDFs durchsuchen? Natürlich. Mit einer konfigurierbaren Erweiterung kann Solr auch Dateien indizieren und die Inhalte dieser PDF Dokumente in die Bewertung seiner Suchergebnisse aufnehmen. Ob dabei die gesamte Dateiliste der eigenen Webseite oder nur spezifische Ordner durchsucht werden, ist jeweils konfigurierbar.

Wie bewertet Solr Suchergebnisse?

Nachdem nun klar ist Wer, Was Wie auf unserer Seite sucht und wir Ordnung ins Chaos gebracht haben, ist es noch wichtig zu wissen nach welchen Kriterien eine Suchmaschine eigentlich welche Informationen bewertet. Dies gilt für Google genauso wie für eine Solr-Suche. Bei Google werden immer wieder wichtige technische Veränderungen eine wichtige Bewertungsgrundlage. So werden Webseiten ohne SSL-Zertifikat oder ohne responsive Anpassungen für Mobilgeräte abgewertet.

Im Falle von Solr sieht der voreingestellte Bewertungsalgorhytmus folgendermaßen aus:

queryFields = content^40.0, title^5.0, keywords^2.0, tagsH1^5.0, tagsH2H3^3.0, tagsH4H5H6^2.0, tagsInline^1.0, description^4.0, abstract^1.0, subtitle^1.0, navtitle^1.0, author^1.0

Übersetzt: Der Inhalt einer Seite wird mit 40 Punkten bewertet, der Titel der Seite hingen mit 5 Punkten. Der Inhalt einer Seite wird als immer höher bewertet als der eigentliche Seitentitel. Das kann für bestimmte Seitentypen wie Produktseiten eines Shops vielleicht nicht unbedingt sinnvoll sein.
Passt man diese Kennziffern an, kann entsprechender Inhalte auf- oder abgewertet werden. Dies kann auch für unterschiedliche Seitentypen unterschiedlich eingestellt werden. Zusätzlich können weitere Metainformationen wie z.B. „Erscheinungsdatum“ mit in die Berechnung einbezogen und entsprechend einer Kennziffer bewertet werden.

Wir helfen gerne!

Wir hatten es zu Beginn dieses Artikels über die Magie von Googles Suchergebnissen. Diese sind aber nur so gut, weil sich bei Google mehrere Teams rund um die Uhr um die Ergebnisse kümmern und der Index ständig mit neuen Datenmodellen gefüttert wird.

Mit Magie hat das also alles eher wenig zu tun. Es ist eigentlich nur Mathematik und ein gut durchdachtes Konzept, was eine exzellente Suche ausmacht. Wir helfen dir gerne bei beidem: Konzeptentwicklung und Mathematik.

Du brauchst Unterstützung?

Let’s connect