Logfile Analyse: Von SEO-Experten vernachlässigt

In Zeiten von Google Analytics und Co wird die klassische Logfile-Analyse zunehmend vernachlässigt. Diese stiefmütterliche Behandlung ist schade und sehr nachlässig. Dabei bieten Logfiles hochwertiges Datenmaterial.

Jede Kommunikation mit dem Server wird in Logfiles protokolliert. Jede Interaktion erzeugt eine Zeile in der Datei. In der Logfile sehen Sie ALLES, was auf Ihrem Server passiert. Neben dem Abruf von HTML-Seiten werden alle Bestandteile einer Webseite einzeln aufgeführt (Bilder, Skripte, CSS, Flash,…). Fehlerhafte Aufrufe und Aufrufe von Bots werden ebenfalls protokolliert.

Die Logfile Analyse und der Datenschutz

Im Zuge der Diskussion über den Datenschutz haben sich die Provider dazu entschieden, in Logfiles IP-Adressen zu anonymisieren. Das ist erst mal eine schlechte Nachricht. Die gute Nachricht: Diese Anonymisierung wird meistens nachträglich in den Wochenarchiven vorgenommen. Sowohl die Tagesarchive und die laufende Logfile sind davon ausgenommen. Für eine umfassende und vollständige Analyse müssen Sie also die Tagesarchive verwenden.

Vorteile der Logfile-Analyse

Jede Kommunikation mit dem Server wird protokolliert. Der Eintrag ist unabhängig von Javascript oder Cookies, anders als bei anderen Tracking-Tools. Bedenken Sie: Das Blockieren von Tracking-Methoden (Google Analytics und Co) wird von einer immer größer werdenden Surfgemeinde gezielt eingesetzt.

Nachteile der Logfile-Analyse

Das Hauptproblem der Logdateianalyse bei Webserver-Logdateien, ist die Tatsache, dass HTTP ein zustandsloses Protokoll ist. Das heißt, jede Anfrage eines Clients nach einer Webseite (oder jeder einzelnen darin vorkommenden Grafik usw.), ist für den Webserver eine eigenständige Aktion. Klickt sich der Benutzer durch eine Website, hat der Webserver keinerlei Kenntnis, dass der Benutzer gerade schon eine Seite abgerufen hat.
[Wikipedia.de]

Logfiles enthalten deutlich weniger Informationen, als Sie mit Google Analytics in Erfahrung bringen können. Zudem sind die Daten nur zeitlich organisiert. Für spannende Analysen ist daher einiges an Aufwand nötig.

Arbeiten mit den Logfiles

Logfiles werden serverseitig komprimiert gespeichert. Sollten Sie den Inhalt betrachten wollen, müssen Sie das Archiv entpacken. Hier bietet sich das Open-Source Programm 7-Zip an [http://www.7-zip.org].

Aufbau der Logfile

 65.52.110.54 - - [19/May/2011:00:00:50 +0200] "GET /robots.txt HTTP/1.1" 200 91 www.wildner.de "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)" "-"

  • IP-Adresse
  • Besucher, sonst "-"
  • Passwort, sonst "-"
  • Datum des Abrufs
  • Pfad (Bsp: "GET /images/head-fortbildung-weiterbildung-wildner.jpg HTTP/1.1")
  • HTTP-Statuscode (zum Beispiel 200 für OK)
  • Dateigröße in Bytes (Sofern vorhanden)
  • Domain (bei mehreren Domains unter derselben IP-Adresse)
  • Referrer oder "-": Woher kommt der Besucher?
    Hier können Sie auch die Suchbegriffe einsehen,
    wenn der Besucher von einer Suchmaschine kommt.
  • Engine – Informationen über die verwendeten Mittel
    (Browser, OS, aber auch Botinfo)

Eine einfache Logfile-Analyse mit Excel

Erste Schritte in der Logfile-Analyse können Sie recht einfach mit Excel machen. Hier können Sie bereits wertvolle Informationen erhalten.

  1. Entpacken Sie dazu zum Beispiel ein Tagesarchiv.
  2. Geben Sie der Datei die Dateiendung .txt.
  3. Öffnen Sie eine neue (leere) Arbeitsmappe in Excel.
  4. Gehen Sie auf Daten > aus Text und importieren die Datei
  5. Als Trennung geben Sie das Leerzeichen an
  6. Löschen Sie nicht benötigte (leere) Spalten
  7. Fügen Sie ganz oben eine neue Zeile hinzu
  8. Benennen Sie die Spalten (IP-Adresse, Datum, …)
  9. Gehen Sie jetzt auf Start > benutzerdefiniertes Sortieren…
  10. Sortieren Sie nach Belieben (Insbesondere mehrstufig)

Tipps zur Logfile-Analyse mit Excel

  • Sortieren Sie nach IP-Adresse:
    Entfernen Sie alle Zeilen mit der eigenen IP-Adresse. So können Sie eigene Besuche ausschließen. Dafür sollten Sie eine feste IP-Adresse haben.
  • Sortieren Sie nach Status-Codes:
    Hier können Sie 404 Fehler aufspüren und ggf. reagieren bzw. korrigieren.
  • Sortieren Sie nach Referrer:
    Hier sehen Sie Backlinks, welche Traffic bringen. Außerdem können Sie Suchbegriffe aus den Suchmaschinen extrahieren.
  • Sortieren Sie nach Domains:
    (sofern zutreffend) Entfernen Sie nicht zu untersuchende Domains.
  • Sortieren Sie nach Ziel-Adresse:
    Entfernen Sie unnötige Bereiche. Hier zahlt es sich aus, wenn Sie einen zentralen Bilder-Ordner haben (siehe Artikel zur perfekten Website-Struktur).
  • Sortieren Sie nach Engine:
    Hier sehen Sie welche Rechner auf Sie zugreifen. Nachdem Sie den Anteil der Suchmaschinen berechnet haben, können Sie alle Zeilen entfernen, die einen automatisierten Zugriff darstellen.
  • Sortieren nach IP-Adresse und Datum:
    Letzter Feinschliff. Im Ergebnis sehen Sie jetzt Zugriffe von unterschiedlichen IP-Adressen, nach Datum sortiert. In den meisten Fällen wird es sich um einen Zusammenhängenden Besuch handeln.

Beispiel Logfile-Analyse Ergebnis für einen echten Besuch

Besucher x mit IP-Adresse y kam via Google.de (organische Suche) mit der Suchkombination "online marketing manager". Der Besucher hat 8 Seiten besucht. Die Besuchszeit betrug knapp 5 Minuten. Er (oder Sie) hat ein Formular ausgefüllt und abgeschickt. Zum Einsatz kam Safari 5.03 unter Mac OS X 10.6.5.

Trafficdetails aus den Logfiles

  • ?q= Verwendete Wörter in der Suchmaschine
  • ?gclid= Click auf AdWords-Anzeige

Selbstverständlich kann und sollte die Analyse noch weiter gehen. Mit entsprechenden Formeln und Charts können Sie spannende Daten visualisieren und wichtige Metriken für Ihr Marketing ermitteln.

Fragen im Zusammenhang mit der Nutzung der Website

  • Wie lauten IP-Adresse und Hostname des Nutzers?
  • Welchen Browser hat er genutzt?
  • Welches Betriebssystem nutzt er?
  • Von wo Seite kommt der User (Direkt, SE, AdWords, Backlink)?
  • Welche Suchmaschine und welche Suchwörter hat er genutzt?
  • Wie lange blieb er auf der Website?
  • Wie viele Seiten ruft er dabei auf?
  • Auf welcher Seite hat er die Website verlassen?
  • Woher kommt der Nutzer (Land | geografische Daten)?

Weitere Informationen zur Logfile-Analyse

Die Logfile-Analyse geht auch anders…

Selbstverständlich gibt es zahlreiche Möglichkeiten der Analyse. Ihr Provider wird auf der Basis vordefinierter Filter Charts erstellen. Deren Aussagekraft wage ich aber zu bezweifeln.

"Schöne", fertige oder gar intuitive Programme sucht man leider recht erfolglos. Webalizer, Xlogan, HTTPLogStat, Mescalero, und und und. Alle sind insgesamt nur befriedigend in der Handhabe.

Zu guter Letzt empfehle ich eine maßgeschneiderte Lösung: Wahlweise Excel aufbohren, oder mit Hilfe von PHP eine ganz eigene Analyse programmieren. Hier können dann alle Kundenwünsche berücksichtigt werden:

  • Flexible Untersuchungszeiträume
  • DNS-Auflösung
  • Individuelle Suchmöglichkeiten (z.B. Error 404)

Veröffentlicht von

Philip Hoevels

Akademieleitung Wildner AG Qualitätsmanagement Online Marketing

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.