Namics Weblog
Namics Weblog.
Persönliche Stimmen und Meinungen von Mitarbeiterinnen und Mitarbeitern.
namics @ www.flickr.com

Links

  • Sharepoint Weblog
  • about:Namics
  • Accessibility & Barrierefreiheit
  • Namics Website

AKTUELLE ARTIKEL

  • Rapid Development am (im) schnellen Zug
  • IAConference - oder eine spannende Reise
  • Clevere Wettbewerbsanalyse der Webdienstleister als Kommunikationsinstrument
  • die ICT Dauer-Party der Ü-30er
  • Twitter für Firmen? Die Antwort für namics.
  • Vom Massenprodukt zur Profianwendung [Vortrag]
  • Yahoo! bringt den Google Analytics Rivalen in Stellung
  • Next Generation Web Analytics [Vortrag]
  • Rapid Development [Vortrag]
  • Top 10 Internet-Trends 2009 [Vortrag]

Kategorien

  • Blogging
  • Business
  • CEO-Post
  • Collaboration
  • Conversion Rate Optimization
  • Design
  • Fehlermeldungen
  • Gesellschaft
  • Information Retrieval
  • Lotusphere
  • Mobile
  • Online Marketing
  • Orbit-iEX
  • Project Management
  • SEO+SEM
  • Technologie
  • Vorträge
  • Web Analytics

Archive

  • Mai 2009
  • April 2009
  • März 2009
  • Februar 2009
  • Januar 2009
  • Dezember 2008
  • November 2008
  • Oktober 2008
  • September 2008
  • August 2008
  • Juli 2008
  • Juni 2008
  • Mai 2008
  • April 2008
  • März 2008
  • Februar 2008
  • Januar 2008
  • Dezember 2007
  • November 2007
  • Oktober 2007
  • September 2007
  • August 2007
  • Juli 2007
  • Juni 2007
  • Mai 2007
  • April 2007
  • März 2007
  • Februar 2007
  • Januar 2007
  • Dezember 2006
  • November 2006
  • Oktober 2006
  • September 2006
  • August 2006
  • Juli 2006
  • Juni 2006
  • Mai 2006
  • April 2006
  • März 2006
  • Februar 2006
  • Januar 2006
  • Dezember 2005
  • November 2005
  • Oktober 2005
  • September 2005
  • August 2005
  • Juli 2005
  • Juni 2005
  • Mai 2005
  • April 2005
  • März 2005
  • Februar 2005
  • Januar 2005
  • September 2004
  • August 2004
  • Juli 2004
  • Juni 2004
  • Mai 2004
  • April 2004
  • Februar 2004
  • Februar 2003

XML und Mumbo Jumbo

  • namics ag
  • namics ag
  • namics ag
  • Atom Feed
  • RSS 2.0 Feed
  • Creative Commons License
    Dieses Weblog untersteht der Creative Commons Lizenz
  • Powered by Movable Type 3.35
« Mal wieder in der Presse erscheinen? Secondlife hilft. | Übersicht | Ich staune: Yahoo! Pipes »
08
Feb
Web Statistik: Begriffe, Kennzahlen und Lügen (aka Web Analytics oder Online Business Intelligence) – Teil 1 von 3
gepostet von Jürg Stuker am 08.02.2007 um 23:04

Erfolgsmessung für Webanwendungen resp. für Kampagnen im Internet ist sehr effizient und auch wichtig. Bei uns ist dies Teil von fast allen Projekten und heisst dann Web Analytics oder Online Business Intelligence.

Gründe für den Posts: Heute sagt Daniel Rico in einem Interview er habe 100′000 Hits im Monat und seit deshalb erfolgreich. Oder vor ein paar Tagen bekam eine Gruppe Blogger die Anfrage „Wie häufig wird dein Blog heute schon frequentiert (Visits, Page Impressions)?“ und alle mischelten nichtssagend andere Zahlen zusammen. Oder bei einem Kunden brach von einem Tag auf den anderen (der mit Webtrend serverseitig gemessene Traffic) um mehr als den Faktor 10 zusammen... was geschah da wohl?

Teil 1: Begriffe und deren Probleme

Sicherlich gibt es noch 314'159'265 Begriffe mehr, doch hier mal die häufigsten

Plakatbild des Films Usual Suspects bei welchem jeder der Personen eine tafel in der Hand hält auf der je einer der Begriffe unten draufsteht


>> Eine „Page View“ (PV) ist eine Seitenansicht. Also eine im Browser vollständig geladene und durch den User „nutzbare“ Seite. Der Begriff ist Synonym mit Page Impression (PI) oder Impression. Das kleine Geheimnis ist wohl, dass technisch gesehen ein PV weder garantiert dass die Seite auch visuell dargestellt wurde (geredendert wurde), noch dass der User genügend Zeit hatte die Seite auch zu lesen und mit dieser zu interagieren. So ist ein Redirect (automatische Weiterleitung) auch ein PV, aber ein nutzloser. Nicht allzu selten klicken User auch auf den Backbutton, weil sie gar nicht auf die Seite wollten; der PV ist aber schon gezählt... Das erleben wir, wenn wir die für Kunden erstellten Statistiken zur Prüfung mit den von Werbeschaltern gemeldeten Zahlen vergleichen. Heikel sind PV-Messung insb. auch bei einem HTML Frameset, da meist jeder Frame als PV gezählt wird.

>> Ein Unique Visit ist ein einmaliger Besuch. Da das Kommunikationsprotokoll zwischen Browser und Webserver bewusst zustandslos ausgestaltet wurde (d.h. jeder Klick könnte auch Serversicht auch ein neuer User sein), ist es technisch nur möglich, einen einzelnen Besuch zeitlich abzugrenzen. D.h. ein Unique Visit ist korrekterweise ein User am selben Computer, der mit demselben Browser mehrere Klicks gemacht hat die nicht mehr als x Minuten auseinander liegen (typischerweise 20 oder 30 Minuten). Wechsle ich den Computer, lösche ich die Cookies oder tue ich 21 Minuten (etc.) etwas anderes, so zählt es zwei Visits u.s.w.

>> Beim Unique Visitor, dem eineindeutigen User, wird es noch schwieriger. Korrekterweise heisst es: Ein User am selben Computer mit demselben Browser (weil dieser die Cookies speichert), der weder die IP-Adresse wechselt (je nach Messart) und der die Cookies in der Zwischenzeit nicht löscht. Aber einfache Definitionen sind halt lustiger. Wenn ich beispielsweise noch auf dem Handy browse, so bin ich real ein Unique Visitor (immer noch Jürg), aber in der Statistik zähle ich doppelt. Bei mir ist das noch mehrfach schlimm, da ich an und an mehrere Computer und Browser im Minutentakt nutze... aber ich bin ja kein normaler User -- Sie schon? ;-)

>> Die Session, ein Besuchprozess einer Website, ist nun eine rein zeitliche Abgrenzung und macht keine inhaltliche Aussage. Also wieder die 20 oder 30 Minuten und auch hier darf ich weder die IP-Adresse wechseln (je nach Messart), noch die Cookies löschen. Technisch wird je nach Messverfahren korrekterweise auch von einer Pseudosession gesprochen... Darunter wird die Kombination IP-Adresse und Port (der sog. Socket) verstanden: Da diese Kombination pro einzelnen Aufruf gemäss Kommunikationsprotokoll eindeutig ist kann damit unabhängig eines Cookies eine Session gezählt werden. Die zeitliche Demarkation und die Annahme dass ich die IP-Adresse oder der Browser nicht ändert bleibt. Reales Verhakten hin oder her.

>> Und nun zum „lieben“ Hit, der aus der Sicht der Erfolgsmessung nichts aussagt. Eine Website besteht technisch aus mehreren Elementen. Eine durch den ersten Aufruf / Klick geladenen HTML-Code ( „base page request“)vom Server gelieferten HTML-Grundseite (base page). Darin finden sich Referenzen auf weitere Elemente so wie beispielsweise Graphiken (gif, png, jps u.a.), CSS-Sytlesheet(s) und möglicherweise Java Script-Bibliotheken. Je nachdem wie eine Seite codiert ist können das mehrere Dutzend Elemente sein. Ältere Seiten haben in der Tendenz mehr Elemente („page elements“). Je nach Codierung, Einstellungen vom Browser / Server (caching), Typ des Browsers und von Aktivkomponenten auf dem Transportweg (z.B. Proxy) werden die Seitenelemente geladen oder halt nicht... Die Zahl Hits macht somit eine Aussage über die Belastung des Servers und ist von sehr vielen Sachen beeinflusst. Insb. auch die Art der Codierung mit AJAX (asynchrones Nachladen von Seitenelementen) verändert das Hit-Verhalten stark.


So und nun wird der Post zu lang. In der Folge spreche ich noch von geeignete Erfolgskennzahlen (Teil 2) sowie von den Lügen (Teil 3).


TRACKBACK

TrackBack URL for this entry:
http://blog.namics.com/mt/mt-tb.cgi/778

KOMMENTARE

Danke, Jürg, dass du in dieser Geschichte einmal Licht ins Dunkle bringst.

gepostet von Christian Schenkel am 09.02.07 09:44

Wie erwartet bringt Jürg endlich einmal strahlendes Licht in die dunklen Räume der Webstatistiken. Ein herzliches Dankeschön an Jürg! Ich freu mich schon auf Teil zwei und drei!

gepostet von Renato am 09.02.07 10:32

Was für Auswirkungen haben eigentlich die verschiedenen Feedreader auf die Webstatistik? Falls die Frage erlaubt ist ;-)

gepostet von Christian Schenkel am 09.02.07 11:26

@Christian. Die Antwort kommt in Kapitel "Lügen"... der Einfluss ist tatsächlich SEHR gross.

gepostet von Jürg Stuker am 09.02.07 11:33

servus jürg, danke! basics, aber schon lange nicht mehr soo klar gefunden - und zur klarheit dann eben noch dein wertvolles techie-zusatzwissen.

gepostet von marcel bernet am 10.02.07 20:59

Herzlichen Dank für die Klärung. Allerdings: Warum nur bin ich felsenfest davon überzeugt, dass Du diesen Text einer Spracherkennung diktiert hast ;-)?

gepostet von Peter Sennhasuer am 22.02.07 03:39

@Peter. Hi hi... ich schreibe halt wie ich spreche (nur viiiiiiel langsamer beim Schreiben ;-)

gepostet von Jürg Stuker am 22.02.07 09:02

Jürg, super vielen Dank für die tolle Erläuterung der doch so schwierigen Thematik..

gepostet von SW Trading Blog am 25.02.07 22:32

hi hi,
bin über google hier drauf gestoßen. würde gern über google analytics meinen blog "analysieren". ich benutze wordpress. habe schon auf mehreren seiten versucht, das analytics-skript einzufügen, aber es klappt net. weiß einer von euch, wie das am besten funktioniert?

gepostet von uwe am 02.03.07 21:04

KOMMENTAR SCHREIBEN

Name:

E-Mail Adresse:

URL:

Bitte das Ergebnis von 1 + 2 als Ziffer (Spamschutz):