Schlagwort-Archiv:

Statistik

Prozentrechenprobleme oder Die geschrumpften Körper

Statista ist immer wieder mal einen Blick wert, wenn man Statistiken nicht ganz abgeneigt ist. Die heutige Statistik des Tages ist zur Frage „Wie groß sind Sie?“ (» nach Geschlecht gefiltert), befragt wurden 22358 erwachsene Deutsche.

Die ungefilterte Übersicht zeigt 2,9% für die ganz Großen (zu denen ich mit 190 cm auch gehöre), auf den Balken der Übersicht wegen gerundet:

Statista Körpergröße 1

Man kann auch eine Vergleichsgröße eingeben – und was kommt dabei raus?

Statista Körpergröße 2

Hoppla, sind 0,9% der Befragten auf einmal geschrumpft? Oder wie kann das Ergebnis von 98,0% / 2,0% sonst erklärt werden? Und wieso „sind wie Sie größer als 190 cm“?

Gebe ich testweise 189 cm ein, kommt:

96,8% sind kleiner als Sie.
3,2% sind größer als Sie.

Ist also niemand 189 cm groß? Sind 0,3% 189 cm groß und 2,9% größer, oder 1,2% 189 cm und 2,0% größer? Bei 154 cm kommt an sich passend zur Balkengrafik „2,2%/97,8%“ heraus, aber auch mit den Formulierungen „kleiner“ und „größer“, ohne die genau 154 cm Großen zu nennen.

Tja, irgendwie verbesserungswürdig… aber es steht ja auch noch „BETA“ im Titel. Mal sehen, ob sich auf den Fehlerbericht, den man dort senden kann, etwas tut.
:bigsmile:

Falscher Traffic

Traffic Ich hatte mich vor einigen Wochen schon gewundert, warum die „rohen“ Zugriffszahlen für meine Liste der Musikzitate so in die Höhe geschossen sind (und die Usage-Statistiken unübliche Änderungen verzeichnet hatten), ohne dass es sich in den „echten“ Besucherzahlen widerspiegelte, hatte es aber zunächst nicht weiter verfolgt. Anfang des Monats hat dann ein Artikel zur Spam-Abwehr auf Holy Shmoly! (dessen Feed auch im WordPress-Dashboard eingebunden wird) auch auf Zusatz-Traffic durch den AVG LinkScanner hingewiesen – ein Zusatzprogramm des Antivirenprogramms von AVG, das alle Links auf Suchmaschinen-Ergebnisseiten vorab lädt und auf schädlichen Code und Skripte überprüft. Bei AVG Watch gibt’s die ganzen weiterführenden Informationen dazu (engl.).

An sich klingt das nicht wie eine schlechte Idee, doch wird dadurch viel Traffic erzeugt, auch ohne dass tatsächlich jemand die gefundenen Seiten liest – es würde nun wirklich reichen, die Seiten direkt beim Aufruf zu überprüfen… Und genau dieser Zusatztraffic und die damit verbundenen Verfälschungen der Statistiken (die bei professionellen Seiten ja auch verschiedene finanzielle Auswirkungen haben), deren Auswerter bestenfalls mit einiger Verzögerung auf diese Umstände reagieren können, waren es, die viele Webmaster auf die Palme gebracht haben.

Nun hab ich bei meinem kleinen Shared-Hosting-Paket ja eigentlich unbegrenzten Traffic inklusive (wobei ich aber nicht unbedingt austesten muss, wie unbegrenzt das wirklich ist), der Server scheint auch nicht unter der Last zusammengebrochen zu sein und ich war auch auf keiner Palme – aber ich wollte mir das schon genauer anschauen und natürlich sehen, ob tatsächlich dieser AVG-LinkScanner dahintersteckt. Also hab ich mir meine Logfiles geschnappt und auf die vier verschiedenen für AVG charakteristischen Referrer untersucht – das folgende Diagramm zeigt das Ergebnis für die o.a. Musikzitat-Liste, also den Beitrag, der mit Abstand am (relativ) häufigsten über die Suchmaschinen aufgerufen wird, vor allem auch bei englischen Sätzen (anklicken für größere Version mit längerem Zeitraum):

AVG LinkScanner Traffic

Aufrufe laut WordPress.com-Statistik (Besucher mit JavaScript)*
Alle anderen normalen Aufrufe (Suchmaschinen, Besucher ohne JavaScriipt)*
Verschiedene Referrer des LinkScanners
Umleitungen via .htaccess
* jeweils ohne meine eigenen Zugriffe

Bedeutung der markierten Tage:
1: Veröffentlichung der neuen AVG-Version mit LinkScanner am 23.4.
2: Holy Shmoly! berichtet, und ich baue die Umleitung in die .htaccess ein.
3: Kleine Änderung in der Umleitung, dadurch wieder ein paar, die durchkommen.

Wir sehen also: Der LinkScanner hat in seiner Hochzeit fast 1000 zusätzliche Zugriffe pro Tag auf diesen Beitrag verursacht, bis zum 7-fachen der echten Besucherzahlen. Abgerufen wurden übrigens jeweils die Seite an sich (PHP- und Datenbankzugriffe) und alle darin verlinkten JavaScript-Dateien (und öfters ein bestimmtes GIF-Bild, warum auch immer).

Mittlerweile – AVG hat das LinkScanner-Verhalten nun ja auch geändert – ist der „falsche Traffic“ aber auch schon wieder deutlich zurückgegangen.

Aber einen positiven Nebeneffekt hatte das ganze auch: Man kann einen kleinen, groben Eindruck davon gewinnen, wie oft die eigene Seite in den Suchergebnissen auftaucht, ohne dass die Suchenden darauf klicken…

Browser-Statistik und mehr

Ich weiß nicht mehr genau, wie ich darauf aufmerksam geworden bin – Anfang des Monats hab ich mein Blog jedenfalls bei browser-statistik.de angemeldet; wie der Name schon sagt, wird dort in erster Linie eine Statistik über die verwendeten Browser erstellt, und das nicht nur für die eigene Website, sondern auch insgesamt für alle angemeldeten.

In der Kurzfassung sieht das dann so aus:
Browser-Statistik insg.
und auf der Detailseite gibt’s auch einen Verlauf über die letzten 30 Tage, wo sich Firefox und Internet Explorer ein Kopf-an-Kopf-Rennen zu liefern scheinen und heute der feurige Fuchs wieder die Nase vorn hat. Im Gegensatz zu meinen Besuchern, da führt der IE mit 56% zu 37%, und immerhin 4,6% landen hier mit Safari (den übrigens blogcounter.de1 gar nicht als solchen erkennt und anscheinend nur als „Netscape“ führt), ein etwa dreimal so hoher Anteil wie insgesamt – muss ich mir jetzt Sorgen machen? ;)

Für die eigene Seite gibt’s außerdem die „obligatorischen“ Besucher- und Seitenaufrufzahlen inkl. Balkengrafik. Und eine Hitliste der „besonders fleißigen Sammler“ gibt’s auch, in die ich mich schnell in die Top 10 reingesetzt habe:
Browser-Statistik 10
Vorübergehend gar auf Platz 9 – deshalb meine Aufforderung an euch: Macht auch mit bei browser-statistik.de, helft, die Statistik repräsentativer zu machen (derzeit sind nur knapp über 100 mehr oder weniger aktive Sammler dabei) – und verdrängt mein Blog aus den Top 10! :mrgreen:

Das ganze funktioniert durch Einbinden eines einfachen (bei Bedarf auch unsichtbaren) Bildes (bei mir ganz unten zu sehen) ohne JavaScript, und mir sind bisher noch keine Performance-Probleme aufgefallen.


Apropos Performance-Probleme: Die BLOGmachine von BLOGtotal leidet leider immer wieder unter solchen – nicht nur zu Zeiten des unflexiblen automatischen Backups, mir ist auch zu anderen Zeiten immer wieder aufgefallen, dass Bild, Statistik- oder Aktuelle-Beiträge-Script einfach nicht kamen, und auch wenn das den eigentlichen Inhalt nicht behindert hat, da ich sie erst am Ende laden lasse, wurden doch auch andere Skripte, z.B. die Kommentarvorschau, bis zum Timeout behindert.

Deshalb ist die Blogmachine vorerst rausgeflogen – die Statistik war mir dank anderer Quellen eh nicht so wichtig, schade finde ich es allerdings wegen der aktuellen Beiträge aus anderen Blogs, wo ich immer wieder mal was Interessantes entdeckt habe und was mir auch schon den einen oder anderen Besucher gebracht hat (und was immer irgendwie aktueller war als das, was Blogfever liefert). Naja, ich werd’s weiter beobachten, mal sehen, was die Zukunft bringt…

Update: Am 15.7. abends, nach BLOGtotals Serverumzug, hab ich sie wieder eingebaut, es scheint soweit wieder rund zu laufen.

  1. auf das ich evtl. in Zukunft werde verzichten können – zumindest dann, wenn browser-statistik.de mal die Gesamt-Besucherzahl des letzten (Kalender-)Monats anzeigen kann ← mal so als Idee, Jan :) []

Fast jeder zweite Deutsche ist abergläubisch


Und fast jedem fünften ist heute, an einem Freitag, dem 13., mulmig zumute.

Dies kann auch als ein nettes Beispiel für tendenziöse Wortwahlen herhalten :mrgreen: – denn Statista titelt „Freitag der 13. verbreitet kaum Schrecken“, basierend auf derselben Zahl von 17,9% (siehe hier; 22,3% der Frauen seien übrigens „besonders achtsam“).

Wobei letztere Zahlen aus einer anderen Umfrage (2007 Deutsche ab 14 Jahren, GfK, Juni 2008) stammt als die, die nach den einzelnen Objekten bzw. Situationen des Aberglaubens gefragt hat und dem Titel dieses Beitrags zugrundeliegt (2000 Deutsche ab 16, Allensbach, Nov. 2000):

statista-aber

Es lässt sich so natürlich schlecht sagen, wie viele nicht an die Kleeblätter glauben, aber an andere Dinge, sodass es durchaus mehr als 43% geben mag, die entschieden haben, für Ihren Aberglauben ihrem Verstand mal eine Pause zu gönnen.

Nachtrag: Julia hat mich daran erinnert, dass Aberglaube auch vor US-Präsidentschaftskandidaten nicht Halt macht, wie der Misanthrop (weitgehend) auf deutsch zusammenfasst (englische Quellen bei BA: McCain (extrem), Obama (weit weniger oder gar nicht)).

Statistiken!!!

Bei Statista.org.com gibt’s Unmengen an Statistikdaten von unzähligen Umfragen, „über 1 Million“ laut eigener Aussage – und nicht einfach so kleinen, wie sie manchmal in Blogs auftauchen, sondern richtigen repräsentativen von großen Instituten.

Wobei die Server anscheinend derzeit mit einem Besucheransturm zu kämpfen haben…

Man kann die Statistiken auch schön selbst einbinden – ich hab mir mal exemplarisch diese hier rausgepickt:

Betreiben Sie ein eigenes Web-Blog (Online-Tagebuch)?

Dabei sind Ledige größere Blogger als andere Familienstände, und, wen wundert’s, Jüngere mehr als Ältere:

statista-blog

Außerdem sind vor allem Saarländer, Berliner und Mecklenburg-Vorpommer besonders fleißig – beim Kommentieren anderer Blogs hingegen vertreiben die Schleswig-Holsteiner die Saarländer aus der „Top 3“.

Die Unterschiede zwischen den Geschlechtern sind dabei eher gering und verlieren sich fast in Rundungsfehlern (Männer geringfügig häufiger), ähnlich beim Einkommen pro Monat, wo nur die mittleren Einkommen etwas weniger bloggen.

Erhebung durch: Institut für Demoskopie Allensbach, Januar bis August 2007, veröffentlicht am 16.10.2007. 7594 deutsche Internetnutzer von 14-64 Jahren wurden befragt.

(via Golem)