vi Zusammenfassung
Heuristik von linearer Komplexit ¨
at zu entwickeln, die bei realen Daten sehr gute Re-
sultate erzielt. Wir leiten zus¨
atzlich eine obere Schranke f ¨
ur die Zielfunktion her, die
ebenfalls in linearer Zeit berechenbar ist, und mit der sich die Ergebnisse der Heuristik
quantitativ bewerten lassen.
Wenn das Herz der Website einmal kartiert ist, stellt sich die Frage, auf welche Art
und Weise sich die Besucher in der Website bewegen. Gibt es typische Laufbahnen
der Navigation? Im mathematischen Sinn geht as darum, wiederkehrende Muster in
einer Besuchsmenge ausfindig zu machen, was oft mit Algorithmen aus dem Bereich
Data-Mining angegangen wird. Letztere Algorithmen entdecken jedoch tendenziell sehr
viele Muster. Daher ist es hilfreich, eine Rangliste zu erstellen, welche diese Muster
nach absteigendender Wichtigkeit oder Bedeutung sortiert darstellt. Wir entwickeln
eine solche Methode f¨
ur den Mustertyp partielle Ordnung. Sie basiert auf der statis-
tischen Signifikanz der Muster mit Bezug auf eine Markov-Kette, welche ein probabilis-
tisches Modell ist, das im Bereich des Webs wiederholt mit grossem Erfolg eingesetzt
wurde. Unsere Methode erfordert die F¨
ahigkeit, die Wahrscheinlichkeit, ein gegebenes
Muster unter der Dynamik einer gegebenen Markov-Kette zu beobachten, auszurech-
nen. Wir entwickeln einen Algorithmus der diese Aufgabe erf ¨
ullt, und zeigen zus¨
atzlich
wie man grosse Markov-Ketten mit Zensurverfahren transformieren kann, um einzelne
Wahrscheinlichkeitsberechnungen viel effizienter durchf¨
uhren zu k¨
onnen.
Der letzte Beitrag dieser Dissertation liegt in der Charakterisierung von typischen Struk-
turen einzelner Besuche. Insbesondere belegen wir, dass viele Besuchsdatens¨
atze
einen hohen Anteil an verschachtelten Palindromen enthalten, d.h. dass Besuche
oft symmetrische St ¨
ucke aufweisen. Dies kann durch die Anwesenheit der Kn¨
opfe
“Zur¨
uck” und “Erneut laden” in praktisch jedem Web-Browser erkl ¨
art werden. Wir
zeigen, wie solche Strukturen effizient aus einem Datensatz extrahiert werden k¨
onnen,
und wie man die daraus resultierenden Messungen direkt interpretieren kann, um
gewisse Aspekte der Dynamik der Website zu verstehen. Weiter schlagen wir
M¨
oglichkeiten vor, die Daten mit diesen Strukturen explizit zu bereichern, um aus-
sagekr¨
aftigere Ergebnisse aus herk ¨
ommlichen oder zuk¨
unftigen Data-Mining Algorith-
men zu gewinnen.
Mit unseren Methoden kann der Online-Verkehr besser erfasst und interpretiert werden.
Damit kann die zugrunde liegende Informationsnachfrage besser verstanden werden,
und eine verbesserte Struktur der Website kann erzielt werden, um diese Nachfrage
genauer zu erf¨
ullen.