Kathrin Passig schreibt in der Berliner Gazette über den Stand der Diskussion zum Einsatz von Algorithmen zur Personalisierung von Inhaltsangeboten.
Hier ein Auszug aus häufig geäußerten Vorwürfen, die sie widerlegt:
„Empfehlungs- und Filteralgorithmen verlängern auf langweilige Weise die Vergangenheit in die Zukunft hinein.“
„Durch das Ausblenden von unbekannten Variablen entsteht ein gleichförmiger Fluss von Mainstreaminhalten.“
„Computer werden uns immer nur mehr desselben empfehlen, anstatt uns – wie ein guter Freund oder Fachmann – auch mal an das heranzuführen, was unseren Horizont erweitern könnte.“
„Die Softwaremodelle, auf die wir uns beispielsweise bei der Erstellung von Klimamodellen verlassen, sind zu komplex, ihre Urteile für uns nicht nachvollziehbar.“
„Wer computergenerierte Empfehlungen verteidigt, der überschätzt die Fähigkeiten der Maschinen.“
„Algorithmen kommen aus Maschinen und sind deshalb unmenschlich.“
Sie listet sodann aus ihrer Sicht reale Probleme des Einsatzes von Filtern und Algorithmen auf, unter anderem:
Viele Empfehlungsalgorithmen sind einfach nicht besonders ausgefeilt,
Intransparente Filter wie bei Facebook sind zwar bequem und verwirren die Nutzer nicht durch komplexe Einstellungsmöglichkeiten, führen aber zu einem nicht unberechtigten Gefühl der fehlenden Nachvollziehbarkeit und Kontrolle.
Durch die fehlende Transparenz ist es zu leicht für Anbieter, ihre eigene Agenda in die Empfehlungsgestaltung einfließen zu lassen.
Kollaborative Filter können nur die Daten über beispielsweise Musikkonsumgewohnheiten verwenden, die unser Verhalten eben hergibt.
Der Artikel liefert einen guten Überblick, beschränkt sich aber im Wesentlichen auf den Stand der Diskussion in Deutschland. Darüber hinaus läßt er eine Systematik der Argumente vermissen (siehe hierzu den interessanten Kommentar von Sandor Ragaly).
Aus unserer Sicht hilfreich ist zunächst einmal eine Unterscheidung der Algorithmen nach Ihrer Grundlage:
Social Graph. Hier nutzt der Algorithmus die Beziehung zwischen Personen zur Relevanzbestimmung von Inhalten: der Leser bekommt Inhalte, die von mit ihm verbundenen Kontakten gelesen und bewertet wurden (Facebooks EdgeRank)
Interest Graph. Der Algorithmus nutzt die aus vergangenem Verhalten erkannte Beziehung zwischen Leser und Inhalten zur Bestimmung der Relevanz anderer Inhalte (Amazon)
Social Interest Graph. Hier verwendet der Algorithmus eine Kombination der beiden oben genannten Graphen (Twitter, Google+)
Die Wahl des Graphen als Grundlage eines Algorithmus bestimmt ganz wesentlich seine Leistungsfähigkeit.
In der Tat führt der Social Graph zu einer Art "Sozialer Blase": die Inhalte basieren auf dem Mainstream meiner Kontakte. Bereits im Kindesalter bestimmen so die Mitschüler eines Kindes dessen Inhaltsangebot.
Der Interest Graph führt - je nach Qualität der genutzten Ontologie - schnell zu einem Echo Chamber-Effekt, durch den sich das Inhaltsangebot ständig stärker fokussiert.
Die Nutzung des Social Interest Graph verspricht, die Nachteile der beiden vorgenannten Grundlagen zu kompensieren: Die (bekannten) Interessen des Lesers werden durch die Popularität von (unbekannten) Themen ergänzt. Hervorragende Beispiele für die Praxistauglichkeit dieses Ansatzes finden sich in Form der iPad-App Zite sowie des Online-Angebots Eqentia. Wer die Leistungsfähigkeit von Algorithmen beurteilen möchte, sollte dies unbedingt erst nach Verwendung dieser Systeme über mehrere Tage tun.