Big Data: Mit Google in die Zukunft blicken.

Sichtbarkeit in Suchmaschinen dürfte für die meisten Unternehmen weltweit kritisch für den Geschäftserfolg sein. Noch spannender wird es, wenn Unternehmen aktiv Daten aus Suchmaschinen anzapfen und diese für eigene Geschäftsentscheidungen nutzen können. Dass mit Hilfe von Suchanfragen Prognosen ansatzweise möglich sind, ist spätestens seit der Einfühung von Google Trends bekannt.

Allerdings handelt es sich hierbei gemeinhin um „Prognosen der Gegenwart“ (und weniger der Zukunft), da diese Previews vor allem dazu genutzt werden können, gegenwärtige oder sehr nah in der Zukunft liegende Phänomene zu erklären. Bekanntheit in der Öffentlichkeit erlangten insbesondere die Aussagen zur Verbreitung von Grippeviren auf Basis thematischer Suchanfragen (Vergleiche Ginsberg et al, Detecting Influenza Epidemics using Search Engine Query Data, 2009), welchen Google eine eigene Microsite gewidmet hat, die laufend Grippewahrscheinlichkeiten aktualisiert.

Schwieriger wird es, wenn das Erklärungsmodell komplexer wird (sei es, weil beeinflussende Determinanten zunehmen, oder sei es, dass die Prognose einen ferner in der Zukunft liegenden Punkt beschreiben soll).

Ein Beispiel:

Die Suchanfrage nach einer PKW- „Standheizung“ verläuft saisonal; Google kann also via Google Trends ein relativ „simples“ Modell generieren, welches diesen saisonalen Verlauf rückwirkend erklärt, diesen hinsichtlich von Wahrscheinlichkeiten verbreitert und für kommende „Saisons“ beschreibt. In Summe sieht das dann in etwa so aus:

Man kann davon ausgehen, dass mehr Nutzer den Kauf einer Standheizung in Betracht ziehen, je kälter und langwieriger die Wintermonate sind. Für ein besseres Wahrscheinlichkeitsmodell müssten also neben dem wiederkehrenden saisonalen Verlauf auch spezifische, nicht- saisonale Wettertrends abgefragt werden, welche wiederum in sich selbst durch bestimmte Suchanfragen erklärt werden müssten.

(Fiktives) Beispiel (eines Nicht-Metereologen):

Ein Wettertief in Neufundland führt zu einem Hoch in Deutschland. Werden in Neufundland verstärkt Regenschirme via Google nachgefragt, könnte dies ein Indikator dafür sein, dass in wenigen Tagen/Wochen die Temperaturen in Deutschland steigen und weniger Standheizungen verkauft werden. Unternehmen, die diese Daten sammeln können, könnten dann entsprechend reagieren und beispielsweise Marketingaktivitäten verstärken.

Die Probleme in den Prognosedaten der Suchmaschinen hierbei waren bislang:

  • Die Simplizität der Modelle verhindert aus Unsicherheit businesskritische Entscheidungen
  • Daten aus anderen Quellen waren weitaus verlässlicher
  • Die Verlässlichkeit der Daten war zu nah am Zeitpunkt des Phänomens, um überhaupt noch aktiv werden zu können
  • Nur Themen, die in Suchmaschinen diskutiert werden, können vorhergesagt werden
In diesen Tagen überrascht Google selbst mit einer Studie zum Thema, welches das letzte der vier Probleme umgeht, indem mit der Erklärung des Erfolgs von Kinofilmen ein Thema diskutiert wird, welches von den Konsumenten intensiv im Web recherchiert wird- ein Prozess, der erstaunlicherweise immer noch intensiver wird (Anstieg der Suchanfragen zu Kinofilmen im mittleren zweistelligen Prozentbereich im Vgl. zum Vorjahr angestiegen).
Zwar wird hier auch nur die nahe Zukunft vorhergesagt (< 4 Wochen), dennoch kommt das Whitepaper „Quantifying Movie Magic with Google Search“ zu erstaunlichen Ergebnissen.
Die Studie untersucht die Erklärbarkeit des Erfolgs von Kinofilmen durch Suchanfragen in der Google Websuche und kommt zu folgenden, wenig überraschenden Kernaussagen:
  • Das Suchvolumen in der organischen und bezahlten Suche erklärt den Kinoerfolg am besonders bedeutsamen ersten Wochenende mit einer Verlässlichkeit von 92%.
  • Der in weiteren Wochen nachfolgende Kinoerfolg wird nahezu identisch verlässlich vorhergesagt, sprich: die Prognosequalität nimmt in der Zukunft nicht derart ab, dass unzuverlässige Daten entstehen.
  • Das Nutzerverhalten gestaltet sich so, wie man es auch erwarten würde: potentielle Kinobesucher informieren sich zuerst unspezifisch über mehrere Filme und treffen (zumindest knapp jeder zweite) am Tag des Kinobesuchs die finale Entscheidung, welcher Film angesehen wird. Filmverleiher sollten also ihre werbliche Aufmerksamkeit so lange wie möglich aufrecht erhalten (wen wundert’s bei dem Auftraggeber der Studie?)
  • Zentral für den Erfolg von Kinofilmen ist das „Engagement“ der Nutzer in Bezug auf die Filmtrailer.
  • Die Studie ermittelte eine Verlaufsbetrachtung bei Kinofilmen für das Jahr 2012:
Auch dieses Ergebnis ist wenig überraschend: es gibt einen leicht ansteigenden Verlauf vor dem Kinostart (t-5 bis t-1), welcher dann sprunghaft ansteigt (t-1 bis release week) und halbwegs symmetrisch abflacht (ab release week).
  • Nach dem Modell führt ein Mehr an 10.000 bezahlten Klicks gegenüber einem kompetetiven Film zu einem besseren Ergebnis in Höhe von 1,9 bis 3,5 Millionen Dollar. Eine Verdopplung der Klicks führt nicht ganz zu einer Verdreifachung des Umsatzes („bis zu 7.5 Millionen Dollar“, was viel Spielraum überlässt)
Alles wenig überraschend. Betrachten wir die oben genannten Probleme mit solchen Daten:
  • Das Modell ist relativ simpel, was vermutlich nur wenige Filmverleiher zu einem Umdenken bewegen wird.
  • Daten aus anderen Quellen (wie zum Beispiel Marktforschung) sind hier vermutlich nicht besser. Die Prognosequalität ist sehr hoch. Zwischen den Zeilen kann man lesen, dass Google derzeit ebenfalls noch „Probleme“ mit der Datenqualität bei längerfristigen Prognosen hat- zwar nimmt die Qualität der Daten kaum ab, allerdings wird hier nur ein Zeitraum innerhalb eines Monats vorhergesagt, obwohl die Filme weit länger im Voraus kommuniziert werden.
  • Der Zeitraum, in dem Marketingaktvitäten noch platziert werden können, ist zwar kurz (< 4 Wochen), aber dennoch möglich. Für die Filmverleiher könnte die Spontanität des Einflusses zu einer Verschlankung der Marketingstruktur/- des Marketingsprozesses führen.
  • Filme werden online diskutiert. Der Einwand gegen diese Daten fällt weg.
Was bleibt?
Das monetäre Potenzial von Big Data-Analysen ist riesig und sollte von jedem ausgeschöpft werden, um effektiv im Markt agieren zu können (wer hier Hilfe braucht, wendet sich natürlich an Namics). Das war aber auch vor der Studie klar. Die Google-Studie zeigt auf Basis reiner Suchmaschinendaten, dass längerfristige Prognosen komplex sind und ggfs. die Aussagekraft massiv abnimmt; die Studie  kann im Gegenzug erneut beweisen, dass kurzfristige Vorhersagen eine enorm hohe Trefferwahrscheinlichkeit besitzen. Idealerweise kombinieren Unternehmen kurzfristige, mittelfristige und langfristige Indikatoren und generieren damit eigene Prediktoren. Die Zukunft kommt.

 

 

 

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*

*

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>