Das Semantic Web durch die Hintertür

Kurz nach der Jahrtausendwende schrieb Tim Berners-Lee einen vielbeachteten Artikel zum Semantic Web (und hier das PDF). Kurz zusammengefasst geht es beim Semantic Web darum, die Informationen im Internet so zu präsentieren, dass Maschinen sie interpretieren und deren Bedeutung verstehen können. Eine grosse Vision, die sich im Mainstream nicht durchgesetzt hat, aber auch nicht tot zu kriegen war.

Ich meine, das Thema nimmt jetzt endlich fahrt auf und wird in den nächsten Jahren wirklich relevant. Warum gerade jetzt? Dazu zuerst eine kleine Episode aus meiner Zeit an der HSG:

Rückblende ins Jahr 2002

Mit ein paar Komilitonen befasse ich mich in einem Projektseminar am MCM-Institut intensiv mit dem Semantic Web und trotzdem verstehe ich selbst nach Wochen nur Bahnhof.
XML, RDF, RDFS, OWL, DTD, XSD, 3-Tupel, DAML+OIL – Wir waren in Spähren unterwegs, die damals nur Geeks wie Tim Berners-Lee, Sprachwissenschafter mit drei Doktortiteln und der Seminarleiter Rolf Grütter verstanden haben.
Nur so als Schmankerl ein Zitat aus der Wikipedia-Einleitung zu RDF:

Im RDF-Modell besteht jede Aussage aus den drei Einheiten Subjekt, Prädikat und Objekt, wobei eine Ressource als Subjekt mit einer anderen Ressource oder lediglich einem Wert (Literal) als Objekt näher beschrieben wird.

Klar, oder? Meine Visualisierung von damals hilft auch nicht wirklich weiter:

RDF

Die unbewohnte „Kathedrale“

Die Vision des Semantic Web bekam viel Aufmerksamkeit, schaffte es 2001 und 2006 in die „Namics Top Ten Internet Standards der Zukunft“ und hat sich bis heute hartnäckig gehalten – und trotzdem ist es ein Nischenthema geblieben. Meine Hypothese ist, dass folgende zwei Faktoren schuld sind, weshalb die Rakete nicht gezündet hat:

  1. Der Nutzen war nicht unmittelbar greifbar: Es existierte keine Technologie respektive Applikation, mit der man die Szenarien von Tim Berners-Lee hätte erleben können
  2. Das Semantic Web ist mit den ursprünglichen Methoden sehr mühsam zu implementieren: Die Einarbeitung ist zeitintensiv und die Umsetzung alles andere als einfach.

Semantic Web light

Die Idee des Semantic Web hat trotz des ausbleibenden Momentums überlebt und viele nutzen resp. „füttern“ ein „Semantic Web light“ mit Daten, ohne es zu wissen. Im Zentrum dieser „light“ Version sind die Suchmaschinen, welche Semantik in Websites hineininterpretieren und die interpretierten Daten als Rich-Snippets in den Suchergebnissen oder in den Personal Assistants (Siri, Google Now) anbieten. Jeder Content-Anbieter will dort hin und dadurch haben sie nun plötzlich einen grossen Anreiz, Daten strukturiert zu liefern. Und dieser Anreiz wird mit Wearable Computing noch viel grösser werden, denn auf den kleinen Displays gibt es keinen Platz für unstrukturierten Content.

Zum Glück gibt es inzwischen auch sehr viel einfache Werkzeuge um Inhalte im Web mit Semantik zu versehen:

  • Die drei bekannten Formate Microdata, Microformats und RDFa sind einfach verständlich und der Zusatzaufwand ist minimal
  • Es gibt ein von Google, Bing, Yahoo und Yandex getragenes, einheitliches und pragmatisches Vokabular auf schema.org für die „elementaren“ (sprich häufig nachgefragten) Objekte im Web

Geht es jetzt los?

Meine Einschätzung, dass die Zeit für das Semantic Web (light) jetzt kommt, beruht auf zwei Beobachtungen

  1. Die Technologie ist reif – sowohl auf der Anbieter-Seite (Microdata und schema.org) als auch auf Konsumenten-Seite (Google Now, Siri, und später die Wearables wie Google Glass)
  2. Die Kunden wünschen in Projekten immer häufiger, dass ihre Websites gewisse Daten strukturiert anbieten. Und sie werden es noch viel mehr tun, falls sich Wearables durchsetzen (= Apple bringt die Smart-Watch). Wetten?

Was ist eure Einschätzung? Ist das Thema „Microdata“ im Kommen?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>