Ich hatte mich vor einigen Wochen schon gewundert, warum die „rohen“ Zugriffszahlen für meine Liste der Musikzitate so in die Höhe geschossen sind (und die Usage-Statistiken unübliche Änderungen verzeichnet hatten), ohne dass es sich in den „echten“ Besucherzahlen widerspiegelte, hatte es aber zunächst nicht weiter verfolgt. Anfang des Monats hat dann ein Artikel zur Spam-Abwehr auf Holy Shmoly! (dessen Feed auch im WordPress-Dashboard eingebunden wird) auch auf Zusatz-Traffic durch den AVG LinkScanner hingewiesen – ein Zusatzprogramm des Antivirenprogramms von AVG, das alle Links auf Suchmaschinen-Ergebnisseiten vorab lädt und auf schädlichen Code und Skripte überprüft. Bei AVG Watch gibt’s die ganzen weiterführenden Informationen dazu (engl.).
An sich klingt das nicht wie eine schlechte Idee, doch wird dadurch viel Traffic erzeugt, auch ohne dass tatsächlich jemand die gefundenen Seiten liest – es würde nun wirklich reichen, die Seiten direkt beim Aufruf zu überprüfen… Und genau dieser Zusatztraffic und die damit verbundenen Verfälschungen der Statistiken (die bei professionellen Seiten ja auch verschiedene finanzielle Auswirkungen haben), deren Auswerter bestenfalls mit einiger Verzögerung auf diese Umstände reagieren können, waren es, die viele Webmaster auf die Palme gebracht haben.
Nun hab ich bei meinem kleinen Shared-Hosting-Paket ja eigentlich unbegrenzten Traffic inklusive (wobei ich aber nicht unbedingt austesten muss, wie unbegrenzt das wirklich ist), der Server scheint auch nicht unter der Last zusammengebrochen zu sein und ich war auch auf keiner Palme – aber ich wollte mir das schon genauer anschauen und natürlich sehen, ob tatsächlich dieser AVG-LinkScanner dahintersteckt. Also hab ich mir meine Logfiles geschnappt und auf die vier verschiedenen für AVG charakteristischen Referrer untersucht – das folgende Diagramm zeigt das Ergebnis für die o.a. Musikzitat-Liste, also den Beitrag, der mit Abstand am (relativ) häufigsten über die Suchmaschinen aufgerufen wird, vor allem auch bei englischen Sätzen (anklicken für größere Version mit längerem Zeitraum):
■ Aufrufe laut WordPress.com-Statistik (Besucher mit JavaScript)*
■ Alle anderen normalen Aufrufe (Suchmaschinen, Besucher ohne JavaScriipt)*
■ ■ ■ ■ Verschiedene Referrer des LinkScanners
■ Umleitungen via .htaccess
* jeweils ohne meine eigenen Zugriffe
Bedeutung der markierten Tage:
1: Veröffentlichung der neuen AVG-Version mit LinkScanner am 23.4.
2: Holy Shmoly! berichtet, und ich baue die Umleitung in die .htaccess ein.
3: Kleine Änderung in der Umleitung, dadurch wieder ein paar, die durchkommen.
Wir sehen also: Der LinkScanner hat in seiner Hochzeit fast 1000 zusätzliche Zugriffe pro Tag auf diesen Beitrag verursacht, bis zum 7-fachen der echten Besucherzahlen. Abgerufen wurden übrigens jeweils die Seite an sich (PHP- und Datenbankzugriffe) und alle darin verlinkten JavaScript-Dateien (und öfters ein bestimmtes GIF-Bild, warum auch immer).
Mittlerweile – AVG hat das LinkScanner-Verhalten nun ja auch geändert – ist der „falsche Traffic“ aber auch schon wieder deutlich zurückgegangen.
Aber einen positiven Nebeneffekt hatte das ganze auch: Man kann einen kleinen, groben Eindruck davon gewinnen, wie oft die eigene Seite in den Suchergebnissen auftaucht, ohne dass die Suchenden darauf klicken…