Wie das semantische Web Onlinejournalismus verändern wird

Bei diesem Beitrag handelt es sich um ein Blog aus der Freitag-Community

http://www.datenjournalist.de/wp-content/uploads/2011/06/elements_schema_org.jpg Ausschnitt aus der Liste mit Auszeichnungselementen von schema.org


Zeitungssterben ist mittlerweile ein alter Hut. Was aber auf uns zukommt ist Webseitensterben. Onlinemedien, Nachrichten- und Zeitungswebsites werden es zukünftig noch schwerer haben. Das faktische Ableben von netzeitung.de vor einiger Zeit war davon nur ein Vorbote. Die Zwickmühle, tragfähige Erlösmodelle zu entwickeln, bevor sie Ertrag bringen; die Notwendigkeit, in Vorleistung zu gehen, wird noch größer durch schema.org.

Diese neue Auszeichnungssprache haben Anfang Juni Google, Bing und Yahoo Anfang in ungewohnter Allianz etabliert. Sie besteht bislang aus rund 300 Elementen, mit denen sich im HTML-Code der Seite Informationen wie Orte, Personen, Veranstaltungen, Produkte auszeichnen lassen. Der Besucher der Website selbst sieht das nicht, aber die Suchmaschinen, die in regelmässigen Abständen große Teile des Internets immer wieder indexieren, kartieren, „crawlen“ - sie profitieren davon.

schema.org könnte sich als wirklicher Startschuss für das Semantic Web, das Web 3.0 erweisen, das der WWW-Entwickler Tim Berners-Lee bereits 2001 skizzierte. (Allerdings freuen sich Aktivisten des semantic web nur bedingt über schema.org, das neben RDFa und den Microformats von HTML5 einen weiteren Standard etabliert. Mehr dazu in dem lesenwerten Artikel What schema.org means for SEO and beyond. Übrigens gibt es für Online-News auch ein extra RDF-Gerüst: rNews)

Es ginge den Suchmaschinenbetreibern darum, bessere Ergebnisse zu liefern, verharmlosen sie selbst ihre Intention. Faktisch dürfte ihre Motivation aber sein, noch besser automatisiert Content aus Webseiten auslesen zu können und als eigenen Inhalt in den Suchergebnissen zu zeigen. Und damit die User auf ihrer eigenen Seite zu halten und ihnen so länger die Werbung der eigenen Anzeigenkunden präsentieren zu können. Eric Schmidt, mittlerweile im Verwaltungsrat von Google, sagte unlängst auf einer Konferenz: „Wir haben jetzt genug Künstliche-Intelligenz-Technologie und können ausreichend genug skalieren und so weiter, dass wir ihnen beispielsweise die richtige Antwort im wörtlichen Sinne berechnen können.“

In Ansätzen ist das seit einiger Zeit in den SERPs von Google schon zu erkennen (SERPS - Search Engine Result Pages). Suchen sie heute in einer großen Stadt nach „Kino & Stadtname“, bekommen sie bereits das Kinoprogramm angezeigt. Ähnliches gilt für Wetterinformationen, Wechselkurse oder Börsenkurse. Auch Preisvergleiche hat Google schon längst im Programm (Stichwort „rich snippets“). Auch wies der Kauf der Flugverbindungs-Website ITA Software durch Google im vergangen Jahr daraufhin, dass sie Flüge bald direkt in der Suchmaschine suchen können.

Was heißt das nun für den Onlinejournalismus? Wenn Google News demnächst nicht nur eine Übersicht über Nachrichtenartikel präsentiert, sondern automatisiert zusammengestellt die Nachricht selbst?

Für Medienanbieter bedeutet schema.org zuerst einmal mehr Arbeit und Kosten. Sie müssen ihre Webseiten und Redaktionssysteme (CMS) anpassen, damit diese möglichst automatisch diese Auszeichnungen á la schema.org der Artikel und anderer Inhalte vornehmen. SEO, Suchmaschinenoptimierung, von den großen Nachrichtenwebsites ohnehin betrieben, bekommt somit eine weitere Dimension. Letztlich sind die meisten Newsseiten klickabhängig, da sie einen Teil des Traffics ihrer Seite über die unmittelbaren Suchergebnisse von Suchmaschinen generieren (die so genannten „organischen“ Ergebnisse). Ihnen bleibt nichts anderes übrig, als bei schema.org mitzumachen, wenn ihnen die „Einschaltquoten“ wichtig sind. Denn ein gemeinsamer Boykott aller journalistischen Angebote von schema.org wird es wohl kaum geben: Fängt einer an mitzumachen, müssen die anderen folgen. Und wenn nicht: Das Netz ist vielfältig genug, die faktische Unsichtbarkeit eines Teils der bestehenden Onlinemedien zu verkraften.

Das Dilemma: Journalistische Angebote sägen damit an dem Ast, auf dem sie zur Zeit sitzen. Wenn die Suchmaschinen Informationen gleich in mundgerechten Stücken geliefert bekommen, warum sollte der User die ursprüngliche Website, die Quelle der Nachricht, dann überhaupt noch besuchen und dort auf Anzeigen klicken? Eine Folge könnte sein - vielleicht nicht die schlechteste -, dass Onlinejournalismus, wie er zur Zeit besteht, absehbar der Vergangenheit angehören wird. Das bloße Reinpumpen von Content, das einfache Wiedergeben von Beiträgen der Nachrichtenagenturen, mit dem das eigene Angebot aufgebläht werden soll, wird nichts mehr bringen. (Siehe dazu auch die Analyse von Stefan Niggemeier über die Inhalte von stern.de: "Anatomie einer Attrappe". Für diverse andere großen Nachrichtenseiten dürfte sich das ähnlich darstellen.)

Will man nun Suchmaschinen wie Google oder spezielle Angeboten wie Wolfram Alpha als Onlinemedium in Zukunft Paroli bieten, gibt es aber einen gangbaren Weg: Neben eigenem genuinen Content wie Reportagen, Analysen und Kommentaren gilt es, selber gute semantische Logiken zu entwickeln. Diese finden automatisiert neue Informationen, Wissen und Nachrichten auf anderen Seiten (auch in anderen Sprachen), bereiten diese auf und organisieren sie schlüssig. Es geht also um das derzeit gerne im Mund geführte „kuratieren“ von Informationen. Redakteure wird es weiterhin geben, aber ihre Arbeitsweise wird sich weiter verändern: Ihnen wird obliegen, die Parameter der Redaktionsrobotor zu justieren und die dann von Softwaremaschinen vorbereiteten Stücke mit einer eigenen Note zu versehen. (Siehe dazu auch: What does the journalist of the future look like?)

Dabei wird Datenjournalismus eine große Rolle spielen. Das junge Genre bringt die Werkzeuge und Methoden mit, um große Datenmenge zu erfassen, zu verknüpfen, zu filtern, zu strukturieren und in neuen Erzählformaten abzubilden. Das kommende Webseitensterben kann also zum Verschwinden der Dinosaurier des Internets führen. Schlimm für manches Geschäftsmodell. Der User aber kann dadurch gewinnen.

---

Zuerst erschienen auf datenjournalist.de

11:01 14.06.2011
Dieser Beitrag gibt die Meinung des Autors wieder, nicht notwendigerweise die der Redaktion des Freitag.
Geschrieben von

Datenblog

Es geht um Daten der öffentlichen Hand - sprich unserer aller Datensätze (OpenData) und der Berichterstattung mit ihnen und über sie (Datenjournalismus)
Schreiber 0 Leser 0
Avatar

Kommentare 4

Avatar
Ehemaliger Nutzer | Community
Avatar
sachichma | Community
Avatar
glaubdir | Community