Kapitel 1. Überblick

Dieser FileHandler erlaubt die Analyse von WebServer Log-Dateien im Apache Common oder Combined Format.

Er verfügt über einen Mechanismus zum Absuchen eines Verzeichnisses nach neuen und veränderten Log-Dateien. Die darin enthaltenen Informationen werden dann in einer kompakten Form in den Arbeitsspeicher geladen.

Nach dem Laden der Daten können diese für die Anzeige gefiltert werden. Dies kann über eine XML-Datei mit den Filterkriterien konfiguriert werden. (Ein solcher Filter kann auch beim Laden angegeben werden, um die Einträge zu verwerfen, welche nicht in den Arbeitsspeicher geladen werden sollen).

Basierend auf diesen Informationen können nun verschiedene Reports mit den aggregierten Statistiken der interessantesten Bereiche angesehen werden. In diesen Reports können die interessierenden Bereiche aus der Tabelle aller Log-Einträge ausgewählt werden. Dies erlaubt das Verständnis dieser Client-Requests im Kontext.

Ein Auffrischungs-Algorithmus kann auf veränderte und neue Log-Dateien auf Disk prüfen und wird dann nur die notwendigsten Teile neue laden müssen, womit der Analyse-Overhead auf ein Minimum reduziert wird.

Falls die Log-Dateien nur die IP-Adressen der anfragenden Clients enthalten, so wird ein Weg unterstützt, diese auf DNS Host-Namen aufzulösen. Dazu wird nach einer Datei mit dem gleichen Namen wie die Log-Datei gesucht, die jedoch um den suffix .dns erweitert ist. In dieser Neben-Datei sollte die DNS-Lookup-Tabelle gespeichert sein und folgendermassen aufgebaut sein:

Jede Zeile repräsentiert eine Zuordnung von einer IP-Adresse auf einen DNS Host-Namen (auch als Reverse DNS Lookup Mapping bekannt). Eine solche Zeile beginnt mit der IP-Adresse gefolgt von einem Doppelpunkt und dem Host-Namen.