Recommendersysteme (Teil 2) – Erwartungen, Potenzial, Schwächen, Stärken.

Wie bereits in Teil 1 beschrieben, sollen Recommendersysteme dem Anwender helfen, aus einer grossen Menge an Informationen oder Produkten das herauszufiltern, was für ihn individuell von Nutzen ist. Genau dieser individuelle Nutzen ist jedoch nur schwer zu messen und nicht immer im gewünschten Ausmass zu erreichen.

Erwartungen. Potenziale.

Oft greift die Erwartungshaltung an ein Recommendersystem viel zu weit, weshalb man von vorne herein einen Punkt klarstellen sollte: Kein aktuelles Recommendersystem ist  in der Lage, zu 100% passende Empfehlungen auszusprechen, welche die persönliche Situation, die momentane Laune und alle entscheidungsrelevanten Rahmenbedingungen eines jeden Anwenders vollständig berücksichtigen. Diese Anforderung ist jedoch eh sehr hoch gegriffen – in vielen Fällen wird der Anwender bereits zufrieden sein, wenn z.B. eines von drei präsentierten Produkten dem eigenen Geschmack entspricht und auch die restlichen Empfehlungen halbwegs nachvollziehbar sind bzw. plausibel erscheinen. Führt auch nur ein geringer Prozentsatz der Empfehlungen zum Kauf, so kann dies bereits eine massive Umsatzsteigerung bedeuten. Mit einer gut durchdachten und attraktiv gestalteten GUI kann man an dieser Stelle sehr viel herausholen, aber massgebend bleibt dennoch die Qualität der Empfehlungen, weshalb man bei der Auswahl des Recommenders sorgfältig vorgehen sollte. Jedes Verfahren hat seine individuellen Stärken und Schwächen, auf die im Folgenden ein genauerer Blick geworfen wird.

Stärken und Schwächen.

Beim „Content Based Filtering“ ist ein Problem die Überspezialisierung: Da zu jedem Produkt nur eine bestimmte Anzahl an Eigenschaften berücksichtigt wird, werden die Empfehlungen umso einheitlicher, je mehr das System die individuellen Vorlieben lernt. Was dann in den Empfehlungen fehlt ist die sogenannte „serendipity“ – also etwas neues, das überrascht und einen Mehrwert generiert. Ein anderes Problem besteht im Umgang mit neuen Nutzern, da das System erst die jeweiligen Vorlieben kennen muss, bevor es Empfehlungen aussprechen kann („new-user-problem“). Auch wenn sich die Vorlieben ändern, steht man vor einem Problem, da die einzelnen Systeme einerseits stabil genug sein sollten, um das Nutzerverhalten nicht aufgrund einer kurzen Laune völlig über den Haufen zu werfen und andererseits flexibel genug sein müssten, um einen langfristigen Wandel der individuellen Interessen zu erkennen. Dennoch bringt der Inhaltsbezug von Content Based Filtering-Verfahren auch eine Reihe an Vorteilen mit sich, da transparent dargestellt werden kann, auf welchen Kriterien eine Empfehlung basiert. Ingesamt betrachtet sind diese Systeme zudem bereits in der Startphase relativ leistungsfähig, da sie keine Mindestanzahl an Nutzern benötigen und auch neue Produkte ohne Weiteres empfohlen werden können.

Genau an dieser Stelle kranken dagegen  „Collaborative Filtering“-Verfahren: Ein Produkt, das noch nicht bewertet wurde („new-item-problem“) oder auch ein Anwender, der noch nichts bewertet hat, kann nicht mit anderen verglichen werden, womit auch keine Empfehlungen im eigentlichen Sinn möglich sind. Selbst wenn (erste) Bewertungen vorhanden sind, ist das jedoch noch lange kein Garant für eine optimale Empfehlung, da – anders als in den oben aufgezeigten Beispielen – die Datenlage, was Bewertungen angeht, in der Regel recht lückenhaft ist („sparsity“). Eine Vorstellung von dieser Lückenhaftigkeit bekommt man, wenn man sich überlegt, wie viele Produkte beispielsweise auf Amazon angeboten werden und wie viele davon man selbst bewertet hat. Probleme treten umgekehrt aber auch bei zu vielen Bewertungen auf: Man spricht dann vom sogenannten „Lemming-Effekt“: Wird ein Produkt besonders oft positiv bewertet, so wird es auch besonders oft empfohlen, was dann wiederum zu noch mehr Bewertungen führt usw.. Trotz dieser Nachteile werden Collaborative Filtering Systeme sehr häufig eingesetzt, was daran liegt, dass sie sehr flexibel sind und – im Gegensatz zu Content-Based-Filtering-Systemen – Cross-Genre-Empfehlungen ermöglichen.

Hybride Verfahren wurden entwickelt, um die Schwächen dieser beiden Verfahren zu umgehen und die jeweiligen Stärken auszunutzen. Die Schwachstellen sind somit von der konkreten Implementierung abhängig: Während das eine Verfahren z.B. keine Probleme mit neuen Nutzern hat, ist das andere System besonders flexibel.

Was all diesen Verfahren jedoch fehlt, ist eine gewisse Intelligenz. So ist keines dieser Systeme in der Lage, zu berücksichtigen, dass man alleine vielleicht andere Filme sieht als gemeinsam mit Freunden oder dass Donnerstag Abend immer Pasta gekocht wird. Aus diesem Grund gibt es zahlreiche Ansätze, mit Hilfe von Regeln oder durch die Integration von zusätzlichem Wissen diesen Anforderungen („regel- oder wissenbasierte Recommender“) entgegenzutreten. Das Problem hierbei ist, dass das entsprechende Wissen expliziert und formalisiert werden muss,was in der Regel sehr kosten- und zeitaufwändig ist und zudem nur in einer begrenzten Domäne (z.B. Musik, Reisen) möglich ist.

Zu guter Letzt gibt es auch noch eine Reihe nutzerbezogenen Problemen, die von der Manipulation von Bewertungen bis hin zum Thema Privacy und Datenschutz reichen. Besonders wenn es um sensible oder wertvolle Daten geht, ist es oft unerwünscht, dass andere vom eigenen Wissen profitieren können, wenn auch nur indirekt über einen Empfehlungsdienst. Hier kann nur direkte Kommunikation und ein verantwortungsbewusster Umgang mit den entsprechenden Daten weiterhelfen.

Fazit

Welches Verfahren man nun wählen soll, hängt ganz von den jeweiligen Zielen und den vorhandenen Daten ab. Ein erster Schritt bei der Wahl eines Verfahren liegt also darin, zu überprüfen, wie vollständig Produkteigenschaften erfasst sind, ob Bewertungen jeglicher Art erfasst wurden bzw. erfasst werden können und wie eindeutig sich die Produkte letztendlich voneinander unterscheiden. Der zweite Schritt sollte darin liegen, die eigenen Ziele und somit die Anforderungen, die man an ein Recommendersystem stellt, genau zu definieren und letztendlich sollte man auch die Konzeption des UI als wesentlichen Einflussfaktor nicht aussen vor lassen.

 

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*

*

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>