Aufsitzen auf den Google-Brand

Zugegeben: Autoverkauf in den USA funktioniert anders als bei uns. Dort werden selbst Gebrauchtwagen online gekauft. In 2004 gemäss Economist allein auf eBay Motors für USD 8 Mia. Und nun macht Pontiac eine Fernsehwerbung die schliesst mit:

Don’t take our word for it, google pontiac and discover for yourself

Wow. Wenn sie uns nicht glauben, so fragen die doch bitte [den Megabrand] google.

Hier der Post mit dem Trailer auf http://localzing.com. Jemand der sicht traut, die Realität mal vorzuholen. Und wer sagt Suchmaschinen-Marketing sei nicht wichtig, trete bitte einen Schritt vor.

PS: Falls eine Google Bomb hinter der Tür lauert bitte ducken (Community, wo seit ihr :-)

Veröffentlicht unter Allgemein | Verschlagwortet mit

Wissen Sie: Auf die Relevanz kommt es an!

Ein bisschen verzweifelt werde ich schon, wenn in einer Präsentation das Wort zu häufig vorkommt. “Die Ergebnisse sind nach Relevanz gewichtet”, “…unser Relevanz-Algorithmus stellt sicher…”, oder “…links aussen sehen Sie den Relevanz-Wert”. Eine kurze Übersicht und (hoffentlich) einen Beitrag zur Realität.

Relevant heisst schlussendlich bedeutsam oder wichtig. Aber für wen und im welchen Kontext?

Die Frage nach dem Kontext der Interpretation stellt sich massiv. So erwartet ein Sportfan eine andere Antwort auf die Anfrage “schwarzer Läufer”, als wie eine Person die das Schachspiel lernt oder jemand, der eine Wohnung einrichtet. Oder dieselbe Person zu unterschiedlichen Zeiten. Entschuldigen sie mir das doofe Beispiel, aber der Läufer eignet sich gut, weil er sehr viele unterschiedliche Bedeutungen auf sich vereinigt.

Meist wird Relevanz aber im Zusammenhang mit Suchtechnologie genutzt. Dort gilt es meist einer grosse Menge unstrukturierten Dokumenten zu einer kurzen Anfrage so zu rangieren, dass das wichtigste oben ist. Nach Relevanz für den konkreten User mit einem konkreten Bedürfnis in einem konkreten Kontext. Und all das “konkrete” kennt die Suchmaschine nicht. Deshalb rangiert Google Desktop Search beispielsweise standardmässig nach Datum…

So und nun zur Sachlichkeit mit der folgenden Abbildung (aus dem Buch Informationsbeschaffung im Internet):

i-53d4094696ac75f2a0f81e6208a93dd2-was_ist_relevanz-thumb.gif

1) Die subjektive Relevanz. Bezüglich meiner Anfrage hier und jetzt an ein Suchsystem habe ich eine klare Erwartung, was relevant ist. So suche ich beispielsweise die Homepage von namics. Ab und zu kann ich diese Erwartung zwar nicht textuell in Form einer Suchmaschinenquery ausdrücken. Bei “namics” ist das wohl einfach.

2) Die geschätzte Relevanz. Das Suchsystem versucht mit Hilfe eines (meist statistischen) Verfahrens zu schätzen, was für mich relevant ist. Dies ist ein bleibt immer eine Schätzung, da das System nicht im mich reinsehen kann. Viele der Suchsystem arbeiten hier sehr simpel. Neuste Ansätze sammeln historische Suchanfragen von mir sowie besuchte Webseiten und versuchen daraus meine Präferenzen zusätzlich in meine Anfrage einzubeziehen. Die Schätzung wird besser, bleibt aber eine Schätzung. So gebe ich (wieder) “namics” in das Suchfeld ein und die Maschine schätzt nun — wegen häufig besuchter Seiten — den namics Weblog als relevanter ein als die Homepage.

3) Die objektive Relevanz ist ein Konstrukt, welches bei der Evaluation von Suchmaschinen benötigt wird. Je nach Ansatz bewertet hier eine Fachjury was relevant sein muss. So könnte sie bei “namics” beschliessen, es sei die Firma in Japan (weil die sicher mehr Umsatz hat ;-)

Abschliessend. Eine Rangierung nach Relevanz tönt gut, gehört aber mächtig hinterfragt. Die Rechenregeln mit welchen ein System Relevanz schätzen kann, können beliebig unterschiedlich sein. Oder: Bei News kann eine Datumsrangierung immer besser sein… Keine Wundermedizin aber eine Formel die schätzt…

Stichprobe: 1 Milliarde

Wichtig? Nützlich? Na ja, zumindest kurz spannend. Die Web Hypertext Application Technology- Gruppe befasst sich mit möglichen Weiterentwicklungen von HTML. Mitglied ist Piaw Na, der in seiner 20% “Freizeit” als Google-Techie sich rund 1’000’000’000 Webseiten auf dem Repository für eine kleine Analyse unter den Nagel gerissen hat.

Resultate: Web Authoring Statistics. Dabei wurden (nur) Dokumente mit dem Content-Type header “text/html” mit einen einfachen Tokenizer Fragen analysiert und Antworten beispielweise auf die folgenden Fragen gefunden:

- Wie viele unterschiedliche HTML-Elemente haben Webseiten
- Welche Tags sind die häufigsten?
- Wie viele CSS Klassen werden auf einer Seite genutzt und wie heissen die häufigsten
etc.

Na ja. Die graphische Darstellung der Statistiken halte ich für sehr schwach (dafür schön mit SVG codiert). Fast überall Prozentangaben oder Mengen… Hier als Kostprobe die Anzahl Elemente auf einer Webseite:

i-15d30514e133b4bdf725ebb8780bd329-element_on_web_page-thumb.gif

Veröffentlicht unter Allgemein | Verschlagwortet mit

Nette Umfrage bei Swisscom Directories

Jetzt werden die Fragen bei SD aber ziemlich direkt ;-). Ein Beispiel gefällig?

“1. Verfügen Sie über eine Kamera, die Ihrem Computer angehängt ist ?”

–> Natürlich! Ich hänge auch meine Kleider an den Computer ;-)
“4. Haben Sie schon von “Skype” gehört ?”
–> Hä? Kann man das essen? Aha. VoIP. Brauch ich nicht. Ich hab ja mein Festnetz-Telefon.

Bemerkung am Rande: SkypeIn-Nummern kann man vorläufig noch nicht bei SD eintragen lassen. Bei tel.search.ch schon.

i-4a6fa038b99eb73584e5e3724f7648ad-SD_Umfrage_Teaser.jpg

Weitere amüsante Fragen sind unter http://193.138.29.112/d/ zu finden.

Veröffentlicht unter Allgemein | Verschlagwortet mit

Updatehemmung (Benchmark)?

So und nun auch bei sunrise (ich könnte eine Kategorie machen :-)

i-3a86e26db4a265589b1c8885723c4692-tdc_wer_ist_ceo-thumb.png

[Es steht schon im Comment ca. 15:50 Uhr war der Update da]

PS: Swisscom war um diese Zeit schon “geupdated”

Veröffentlicht unter Allgemein | Verschlagwortet mit