Unzufrieden mit der Suche auf Ihrem Internet-Auftritt? Google Mini hilft!

Ich ertappe mich oft, wie ich bei einer Website-Suche das Vorurteil hege, ohnehin nicht auf die gewünschten Informationen zu stossen – und daher die öffentliche Google Websuche verwende. Wahrscheinlich bin ich nicht der Einzige, der sich an Google gewöhnt hat und daher erwartet, dass jede Suche so zu funktionieren hat. Diese Annahme bestätigt sich denn auch in von uns durchgeführten Usability Tests und Analytics-Daten: Immer mehr User suchen bestimmte Inhalte auf einer Seite über die angebotene Suchfunktion. Häufig finden sie aber die gewünschten Inhalte nicht, da die eingesetzten Suchmaschinen schlicht und einfach entweder nichts taugen oder schlecht konfiguriert sind. Die Lösung? Google Mini ;)

Was kann denn eine Google Mini?

i-19be7abadec11c149159bdb2dc4c5bca-google-mini.jpg

Die Google Mini ist ein 19 Zoll Hard- und Softwarebundle und bietet neben einer ausgereiften und vertrauten Volltextsuche einige weitere wirklich gute Funktionen:

  • Dank dem XML Suchinterface kann die Google Suche in beliebige bestehende Webseiten integriert werden, auch parallel in mehreren (beliebige Anzahl Kollektionen).
  • Mit Keymatches (eigenständig definierbare Treffer zu bestimmten Suchbegriffen) kann den Suchenden geholfen werden, die richtigen und wichtigen Informationen schnell zu finden. Beispiel: gibt jemand einen Produktenamen ein, erscheint der Keymatch dazu oberhalb der restlichen Treffer und ist optisch hervorgehoben.
  • Die Google Mini durchsucht mehr als 200 Dateiformate und bietet eine Textvariante des jeweiligen Inhalts an.
  • Eine Suchanwendung kann mittels Onebox Modulen ausgebaut werden. So können z.B. bei einem Treffer zu einer Produktseite detaillierte Informationen zu diesem Produkt bereits in der Resultatliste angezeigt werden. Beispiele zu Onebox Modulen auf der öffentlichen Google Suche: Lokale Wetterprognosen oder Treffer aus dem Branchenverzeichnis von Google.
  • Sofern notwendig kann die Google Mini in bestehende Sicherheitslösungen integriert werden.
  • Was kostet eine Google Mini?

    Eine Google Mini gibt es ab circa CHF 4’000.- inklusive Lizenz und Wartung für 2 Jahre, also für CHF 2’000.- pro Jahr. Der Aufwand für eine Integration in eine Webseite beläuft sich auf circa CHF 15’000-30’000. Darin eingeschlossen sind Design von Suchmaske und Resultateliste, Implementierung, initiale Konfiguration sowie Inbetriebnahme der Google Mini.

    Bei Interesse oder spezifischen Fragen einfach Kontakt aufnehmen, oder unten kommentieren. Gerne stelle ich die Google Mini (oder auch die grössere Google Search Appliance) auch im Live-Einsatz vor.

    Übrigens, Namics ist bereits seit 2005 zertifizierte Google Enterprise Professional Partnerin und in der Schweiz damit bislang alleine. Und natürlich machen wir Google Mini / Google Search Appliance Projekte auch in Deutschland :)

    i-2ea90484bc7cfd2118c62dc1b3335006-logo_gep.gif

    Evaluation der Suchinfrastruktur

    Nach der Präsentation der Studienergebnisse zu Enterprise Search haben wir uns überlegt, wie wir interessierten Unternehmen den Einstieg ins Thema vereinfachen können. Erster Ansatzpunkt sollte ja immer die Optimierung der Suche sein (sofern eine besteht). Wir bieten daher gratis eine Evaluation der Suchinfrastruktur an. Dazu brauchen wir Zugang zum Intranet (am besten vor Ort) und Informationen zu den wichtigsten User Szenarios. Im Anschluss nehmen wir die Analyse bzw. Evaluation der bestehenden Suchinfrastruktur vor, und zwar im Hinblick auf technische Qualität der Suche, Benutzerfreundlichkeit und Relevanz der Suchergebnisse. Die erarbeiteten Optimierungsvorschläge werden präsentiert und besprochen. Dasselbe ist möglich auch für die Sitesuche (im Internet). Sie können sich direkt an mich wenden oder einfach Mail an info@namics.com. Wir sind gespannt.

    Enterprise Search: Wie steht’s um die Unternehmens-interne Suche?

    Heute morgen werden die wichtigsten Ergebnisse der Studie „Enterprise Search – Katalysator für den internen Informations- und Wissensfluss“ im Hotel Schweizerhof in Zürich präsentiert. Worum geht’s?

    Während man die Site-Suche der Website eines Unternehmens ja gut von aussen bewerten kann, ist die Qualität einer Intranet- oder ausgewachsenen Enterprise Search naturgemäss von aussen nicht zu beurteilen und daher auch für uns oft nicht zugänglich. Da kam das Angebot von Sieber & Partners gerade recht, zusammen mit Eurospiderund Rolotec eine Studie zu Enterprise Search zu unterstützen. Zwar ist Suche fast immer Teil von Intranetprojekten, aber eine weiter gehende, zusätzliche Quellen und Systeme integrierende Enterprise Search ist oft schwer durchzusetzen, welche das Intranet als Portal zum Unternehmenswissen stärken könnte.

    Wir wollten also wissen, wie es in Schweizer Unternehmen (und Verwaltungen) um das Thema Enterprise Search steht. Um es vorweg zu nehmen: Nicht allzu gut, aber es besteht Grund zur Hoffnung.

    Die aktuelle Situation in den per Online-Fragebogen befragten 233 Unternehmen ist von recht heftigen Widersprüchlichkeiten geprägt:
    – Die befragten Unternehmensvertreter verbringen durchschnittlich 18% ihrer Arbeitszeit mit Suchen. Gefragt sind Suchlösungen, die eine Reihe von Quellsystemen abdecken. Über die Hälfte der befragten Unternehmen muss sich jedoch mit einfachen bis mässigen Lösungen zufrieden geben. Nur 12% verfügen über eine eigentliche Enterprise-Search-Lösung.
    – Die durch mangelhafte oder fehlende Suchmöglichkeiten hervorgerufenen Probleme wie Zeitverlust, Doppelarbeit und Qualitätseinbussen werden von Befragten bestätigt. Dennoch wird die Thematik in den Unternehmen nicht näher untersucht. 69% der befragten Unternehmen wissen nicht, wieviel Zeit ihre Mitarbeiter mit Suche verbringen; ca. die Hälfte weiss weder, wie stark vorhandene Suchfunktionen genutzt werden, noch ob sie relevante Suchantworten liefern.
    i-0f67d892d468b4cc2dcfabb736916db1-Suche-in-Unternehmen.jpg
    Sehr interessant waren für mich zwei sehr spezifische Ergebnisse der Befragung. So hat sich gezeigt: Je mächtiger die realisierte Lösung, desto geringer der Suchaufwand und desto lohnender werden die Investitionen eingeschätzt und zwar in finanzieller sowie nicht-finanzieller Hinsicht. Dass sich Investitionen in eine Entreprise-Search-Lösung lohnt, wird in der Studie auch anhand einer Modellrechnung aufgezeigt. Insgesamt bestätigen die Studienergebnisse unserer Erfahrungen in diesem Bereich.

    Wie wird es in Sachen Enterprise Search in den Unternehmen nun weitergehen? Zwar wirkt offenbar die Höhe der Investitionen immer noch als grösstes Hemmnis auf dem Weg zu leistungsfähigen Lösungen, dochfür drei Viertel der Studienteilnehmer ist das Fazit zum Thema Enterprise-Search positiv; 44 % geben an, das Potential erkannt zu haben, 61% gedenken in Enterprise-Search-Lösungen zu investieren. Die Aussagen der befragten Studienteilnehmer bieten daher Grund zur Annahme, dass in den nächsten Jahren zahlreiche Enterprise-Search-Projekte gestartet werden.

    Interessierte Unternehmen und Verwaltungen können die Studie „Enterprise Search – Katalysator für den internen Informations- und Wissensfluss“ bei uns bestellen entweder direkt bei mir oder: info@namics.com.

    Wolfram|Alpha: „ It is fact oriented and it computes things“

    Wolfram Alpha ist keine Suchmaschine, sieht aber auf den allerersten Blick aber so aus. Die Firma (und der Mensch: Stephan Wolfram) hinter der Mathematik-Software Mathematica bringt (nach Aussage von Stephen Wolfram) 33 Jahre Erfahrung mit. Und in einigen Wochen wollen sie mit http://www.wolframalpha.com/ eine öffentlichen „Antwortmaschine“ aufschalten.

    Wolfram|Alpha ist keine Anwendung, welche vorhandene Websites auffindbar macht, aber eine Anwendung, welche quantitative Daten im Internet sammelt und diese entlang von Anfragen zu Antworten verrechnet – Alles was Zahlen drin hat ist spannend. Geschrieben ist die Anwendung zur Zeit mit rund 5 Mio. Zeilen Mathematica Code. Also wenig erstaunlich, das mathematische Anfragen mit einer spannenden Antwort zurückkommen. Das kann der Online Integrator von Mathematica heute teilweise zwar auch schon.

    i-3ae440790aa546a5e13e81615fcfc54c-Wolfram-Alpha-1.jpg

    Spannender wird es, wenn sie die eruierten Quelldaten graphisch erklären lassen, wie beispielsweise das Verhältnis des Aktienkurses von Apple und Microsoft, ausgedrückt mit der Query „MSFT Apple“

    i-afe35f5b6e7b25ca43980eb1af6e3c97-Wolfram-Alpha-2-thumb.jpg

    Ich hätte noch Dutzende von Beispielen und alle sind ziemlich erstaunlich. Sowohl die Qualität der Kollektion von Daten (die Quellen sind auf den Antwortseiten angezeigt), wie auch die Erkennung der Entitäten (die wahrscheinlichste wird gewählt, der User kann aber ändern) und die Verrechnung gepaart mit verschiedensten graphischen Darstellungen sind eindrücklich. Hier die Query „life expectancy age 45 ireland“

    i-d1279bb818194336fe33ef143b4516ab-Wolfram-Alpha-3-thumb.jpg

    Und hier noch eines der Paradebeispiele nämlich eine Query mit Grösse, Gewicht und Alter (5’8’’ lbs age 40).

    i-5ac2f62a75779d77290315fc16bb9857-Wolfram-Alpha-4-thumb.png

    Kein Google-Killer, aber spannend wir die „im nächsten Monat“ lancierte „Maschine“ auf jeden Fall. Vorläiufig werden jedoch nur englischsprachige Anfragen bearbeitet. Man darf gepannt sein: http://www.wolframalpha.com/

    Kundendialog ohne Anwesenheit: Ihre Suchmaschine (Vortrag)

    Am Mittwoch war ich am Internet Briefing@Bern zugegen, um über das Thema “Kundendialog ohne Anwesenheit: Ihre Suchmaschine” zu sprechen. Im Folgenden eine Kurzfassung der Tonspur:

    In einem kurzen Intro habe ich aufgezeigt, dass der Dialog mit dem Kunden selbst an einem an sich einfachen Anwendungsfall – nämlich dem Suchen einer News bzw. Medienmitteilung – scheitern kann, nämlich dann, wenn Benutzer Suchbegriffe eingibt, mit denen das gesuchte Dokument nicht aufgefunden werden kann (weil einer der gewählten Begriffe im Dokument nicht vorkommt).

    Unter der Prämisse, dass ca. 50 % der Benutzer direkt die Suchfunktion einer Website ansteuern, statt über die Navigation zu gehen, kommt der Suchfunktion nicht nur eine wesentliche Rolle beim Erreichen der Kommunikationsziele der Website zu, sondern sie ist durch den Dialogcharakter (der User fragt – die Suche antwortet) auch geeignet, eine Menge Informationen über die Benutzer einer Website zu geben.

    Doch was kann getan werden, um die Suche zu verbessern? Aus unserer Sicht kann man auf 4 Ebenen ansetzen: Am Betrieb, der Implementierung, der Konzeption und schliesslich der Technologieauswahl.

    Meist vernächlässigt und dabei hoch interessant ist der Betrieb. Hier geht es darum, herauszufinden, was mit welchen Begriffen und welchem Erfolg gesucht wird. Mit verschiedenen Kennzahlen wie Auswählhäufigkeit, Abfragen mit 0 Treffern oder Suchabbrüchen kann die Suche optimiert und die Verbesserung nachvollzogen werden.

    Erst wenn die Verbesserungsmöglichkeiten im Rahmen des Betrieb ausgereizt sind, oder Schwächen in Implementierung bereits bekannt sind, sollte man sicherstellen, dass die Qualität des Suchindex, des Anfrage- und Dokumentenvergleichs, der Benutzerführung sowie der Suchergebnisse auch tatsächlich gegeben ist.

    Für bestimmte Anwendungsfälle muss allerdings ganz andere Art von Suchapplikation konzipiert werden: Für geographische Suchen (Filialen etc.) eignen sich kartenbasierte Suchapplikationen; Für die Suche nach Produkten eine separate Produktsuchen oder sogenannte Facettensuche, bei der eine Volltextsuche mit Filtermöglichkeiten nach Kategorien verbunden wird. Ein gutes Beispiel dafür und auch den Trend zur Suche als primärem Zugang ist www.vacando.ch.

    Erst am Schluss steht die Auswahl einer geeigneten Technologie.

    Für diejenigen, die die Tonspur gehört haben, aber gerne auch die Präsentation noch gesehen hätten (leider hat sich unterwegs nämlich der Beamer verabschiedet – Chapeau für die Geduld der Besucher) sowie für alle, die sich für’s Thema interessieren hier die Präsentation: “Kundendialog ohne Anwesenheit: Ihre Suchmaschine”

    Bildersuche nach Farbe (auf Basis von Flickr)

    Ich schreibe immer wieder mal über Informationssuche (Information Retrieval) und lande allzu häufig beim Sucheingabefeld als primäres Navigationselement und eine rafifnierten Trefferliste als Lösung aller Herausforderungen.

    Hier mal etwas ganz anderes. Technisch simpel aber von Anwendungsfall her sehr, sehr gut gemacht. Eine Bildersuche nach Farb(kombinationen): http://labs.ideeinc.com/multicolr

    1) Ich wähle bis zu zehn Farben auf einem definierten Farbraum
    2) Das System zeigt mir Flickr-Bilder welches die gewählte(n) Farbe(n) enthalten

    i-1239e62a97686da1ae6c0de0c58da282-Multicolr-Search-Lab-thumb.jpg

    Sehr cool! Hier geht es zu Multicolr Search Lab

    (Danke Felix für den Tipp)

    Virtual Google Search Appliance

    Ziemlich cool: Eine Google Search Appliance mit einem Dokumentlimit von 50’000 für Entwicklungs- und Testzwecke) lauffähig als VMware Image: Google Search Appliance virtual edition.

    Interessant ist, dass die Grösse der Anwendung und damit auch die Systemanforderungen dadurch transparenter werden. Nutze ich die Appliance, so brauche ich mich nicht um HW zu kümmern, stecke das Ding aber ein und los. Das Image des virtuellen Servers hingegen ist (entpackt) rund 40GB gross und benötigt zur Laufzeit mindestens 3 GB RAM plus CPU u.s.w

    Den Ansatz die Technologie damit breiter zu verteilen finde ich sehr lobenswert und für uns als Implementor (und Google Partner) macht es das Leben einfacher.

    Und hier gehts los mit der Google Search Appliance virtual edition:

    i-f1832d7055ea538c85191a9ad625f662-virtual-gsa-get-started.png

    Der Kleber der von der Konkurrenz kommt

    Yahoo bietet im indischen Markt mit Glue eine stratifizierte Trefferliste im Portallayout. Mit dem Ziel, die Relevanz der Ergebnisse in der Summe zu verbessern, werden unterschiedliche Kollektionen gleichzeitig, aber visuell getrennt angezeigt. Dazu kommen noch „Related Pages“ in der Kopfzeile und angepasste Trefferzitate.

    Zu dem Strati (stratus = Schicht) gehört die Yahoo Volltext-Trefferliste, Wikipedia, die Yahoo Bildersuche, die Yahoo News-Einträge, Yahoo Answers, eBay, YouTube-Videos und die Google Volltextsuche (siehe Pfeil). Noch erstaunlich, dass Yahoo mit zwei Bereichen Ergebnisse von der Konkurrenz zeigt und denen somit Reichweite erzielt. Zumindest bei der Volltextsuche müsste man meinen, dass sie eine gleiche Qualität bei sich selbst vermuten.

    i-45203e11562d3062e0c45be64611cd46-yahoo-glue-indien-thumb.png

    Der Ansatz der Stratifizierung ist schon lange bekannt. A9 (Udi Manber, Amazon) hatte das bereits 2004 mal im grossen Stil probiert und Google versucht mit Abschnitten in der Trefferliste sowie OneBox-Modulen dasselbe zu erreichen, visuell aber weniger deutlich.

    Zusätzlich zu Search Monkey zeigt sich Yahoo also sehr experimentierfreudig. Konkurrenz tut gut.

    Microsoft Enterprise Search: 100 % – Setup completed!

    News nicht von heute, sondern von gestern, aber noch länger relevant: Microsoft und Fast geben bekannt, dass Microsoft den Suchspezialisten Fast Search [dort könnte man sich vielleicht schon mal angewöhnen, etwas mehr im Bereich externe Kommunikation zu machen, die Akquisition durch Microsoft ist gut versteckt bloss auf der „Stock Exchange Announcements“ Seite erwähnt] kauft.

    Die Details, direkt ab Quelle, resp. von der Käuferseite liegen hier.

    Was heisst das nun? Der Produke Line Up im Enterprise Search Bereich bei Microsoft ist somit komplett. Lokal auf dem PC die Desktop Suche, für „normale / Standard“-Suchbedürfnisse der Search Server 2008 in 2 Varianten: einmal als Freebie zum ausprobieren und/oder für wirklich kleinere Einsätze und einmal fully blown als „normale/bezahlte“ Software, und, wie wir seit gestern wissen für High-End Einsätze die Fast Produktelinie. Die sich schon Einiges an Reputation und Markt erworben hat. Das sage nicht ich, sondern die üblichen Auguren, Gartner und Forrester.

    Das Ganze natürlich mit etwas Verzögerung: Search Server Release geplant im 1. Quartal 2008, Integration der Fast-Produkte im Lauf des Jahres [meine Schätzung], kann man davon ausgehen, dass der Enterprise Search Setup von Microsoft auf Ende 2008 richtig komplett sein wird. Womit sich das Bild im Enterprise Search Game wieder massiv verändert hat.

    Ich bin gespannt auf die Reaktion aus Mountain View.

    Lustige Begebenheit am Rande der Bekanntgabe der Fast-Akquisition: Microsoft Exec Jeff Raikes war sonntags etwas schusslig unterwegs: Er verschickte am Sonntag einen Media Alert an die geneigte Presse, in dem er „wichtige Neuigkeiten“ für Montagmorgen ankündigte; und zog den Alert schnell wieder zurück [aber nicht schnell genug, um ihn den Journalisten wirklich vorzuenthalten]. Was natürlich die Neugier massiv vergrösserte und die schreibende [US-]Zunft zu Spekulationen [„Geht Raikes?“] motivierte. Alles Nonsens, die Ankündigung am Montag war dann eben die Akquisition von Fast. Nachzulesen, nachzuvollziehen hier.

    Wer ist oben (am Beispiel des Rankings von Yahoo)?

    Die Position der Treffer in der organischen Rangliste einer Suchmaschine ist nicht nur ein sehr schwieriges Problem (und nur in Näherung zu lösen), aber auch ein sehr emotionales Thema von Wissenden und Halbwissenden (häufig emotional) „diskutiert“.

    Oder noch einfacher die Frage: Welche Einfluss hat mein Google Page Rank (genau) auf meine Ranglistenposition. Die Antwort wird zur Zeit, da Google grad wieder mal als Blogposts getarnte Werbung bestraft, besonders emotional diskutiert. Die Antwort heisst meist: Es werden über hundert Faktoren berücksichtigt…

    Erstaunlich offen war Dr. Jan Pedersen (Chief Scientist for the Search and Marketplace Division of Yahoo!) an einem Vortrag an der Uni Berkeley. Dort erklärte er 14 nach Wichtigkeit rangierte Faktoren zur Berechnung des Rangs in der Trefferliste bei Yahoo inkl. eine Entscheidungsbaum mit einigen Gewichtungsfaktoren (ermittelt über maschinelles Lernen). PageRank (bei Yahoo heisst das Analog Eigenrank) ist dabei „nur“ an Stelle 7.

    Die Faktoren (nach Wichtigkeit):

    > A0 – A4: anchor text score per term. In wie vielen eingehenden Links (Anker) findet sich der Suchterm resp. die Suchterme 1-4.
    > W0 – W4: term weights. Wie häufig/selten ist der Suchterm in der gesamten Kollektion.
    > L0 – L4: first occurrence location (encodes hostname and title match). Wie weit oben ist der Suchterm im Dokument inkl. Domänenname/URL und HTML Seitentitel.
    > SP: spam index: logistic regression of 85 spam filter variables (against relevance scores). Wie wahrscheinlich ist es, dass es sich beim Dokument um Spam handelt?
    > F0 – F4: term occurrence frequency within document. Termhäufigkeit im Dokument.
    > DCLN: document length (tokens). Anzahl ausgewertete Suchterme (Tokens) im Dokument.
    > ER: Eigenrank. Popularitätsindex, berechnet über externe Verlinkung (PageRank-Analog).
    > HB: Extra-host unique inlink count. Anzahl unterschiedliche Hosts mit Inlinks.
    > ERHB: ER*HB
    > A0W0 etc.: A0*W0
    > QA: Site factor – logistic regression of 5 site link and url count ratios
    > SPN: Proximity. Qualität der Nachbarschaft des Dokumentes bzgl. verlinkender Sites.
    > FF: family friendly rating. Yahoo Rating bezgl. Familientauglichkeit des Dokumentes.
    > UD: url depth. Klickpfadlänge der kürzestens Pfades ab Home innerhalb der Site.

    Und hier noch der Entscheidungsbaum:

    i-ebec26e6af003454f1fbb003d35c6d5e-yahoo-ranking-entscheidungsbaum.png

    In kurz: Qualität des Inhaltes (Terme), Platzierung im Dokument die sog. Auffälligkeit und die Qualität der Verlinkung sind massiv wichtig. Oder in kurz: Guter Inhalt wird gut gewichtet.

    Danke Jan Pedersen für diesen Einblick!