Aufbau und Funktion einer Suchmaschine

Eine Suchmaschine ist ein komplexes System, das aus vielen einzelnen Bausteinen besteht:

Crawler

Der Crawler ist ein Programm welches Links auf Webseiten findet und diesen folgen kann. Der Crawler hat die Aufgabe, neue Seiten und Links für die Suchmaschine zu finden. Die gecrawlten Seiten werden an den Spider weitergegeben.

Spider

Ein Spider ist ein Webbrowser-ähnliches Programm, welches vom Crawler gefundene Webseiten herunterlädt. Bei vielen Suchmaschinen bilden Crawler und Spider eine Einheit.

Indexer

Der Indexer analysiert die vom Spider heruntergeladenen Seiten und bestimmt, welche Keywords wo (z.B. Titel oder Bodytext) und wie häufig auf der Seite vorkommen. Die ermittelten Daten gehen in den Index der Suchmaschine ein.

Index

Der Index ist eine Datenbank, in welcher die vom Indexer über die Webseiten gelieferten Daten gespeichert werden.

Suchengine

Die Suchengine nimmt Suchanfragen vom Benutzer entgegen, und entscheidet anhand der im Index gespeicherten Daten, welche Seiten relevant für die entsprechende Suche sind. Diese Seiten werden dem Benutzer als Suchergebnisse zurückgeliefert.