Nandoo.net versteht Nachrichten-Texte

In Potsdam bastelt ein zehnköpfiges Team von Cyber Consult in Kooperation mit dem Linguistiker Manfred Stede an einer „Text-Verstehmaschine“ namens Nandoo.net. Sie soll selbständig relevante Nachrichten aufspüren – nur diejenigen Artikel zu einem bestimmten Thema, die einen bestimmten Nutzer interessieren. Dabei ist Nandoo.net lernfähig und erweitert sein Wissen hinsichtlich Sprache und Nutzerbedürfnis. Die erste, noch unfertige Version ist bereits online.

Anzeige

Suchmaschinen erfüllen eine wichtige Aufgabe, ohne sie wäre das Internet dunkel. Doch die Programme zur Orientierung im World Wide Web sind sehr unvollkommen. Die Ergebnislisten der Suche beinhalten viel unbrauchbare Informationen, der Nutzer selbst muss das Material interpretieren und auswählen. Maschinen sind immer noch alles andere als intelligent.

Nandoo will diesen Zustand überwinden. Das Versprechen: „…mit Unwichtigem werden Sie in Zukunft gar nicht mehr belästigt“. Produktmanager Bernd Mrohs bezeichnet Nandoo als „Text-Verstehmaschine“, deren Algorithmen in die Sinnebene von Texten dringen. Wenn man ihr den Begriff „Merkel“ eingibt, „weiß“ die Maschine, dass die Begriffe „Angela“ oder „Bundeskanzlerin“ dazugehören. „Die Maschine soll erkennen, worum sich der Text dreht“, sagt Mrohs.

Dazu bedienen sich die Potsdamer dreier Methoden: Statistisch wird ermittelt, wie oft einzigartige Wörter vorkommen; häufige besondere Begriffe kennzeichnen höchstwahrscheinlich einen Text. Darüber hinaus lernt die Maschine die Syntax der deutschen Sprache und kann somit bestimmten Worten im Satzgefüge einen besonderen Stellenwert beimessen. Und Nandoo überprüft die Relevanz bei den freien Dantenbanken Wikipedia und Wiktionary. Mrohs: „Die Kombination aus Statistik, Linguistik und Wissensportalen macht’s.“

Dass die Suche zur Zeit noch recht lange dauert, liegt allerdings nicht an diesen komplexen Operationen – „die Algorithmen sind millisekundenschnell“ –, sondern an der Hardware. Hier könnte leicht etwas verbessert werden, wenn mehr Mittel zur Verfügung stünden. Die Cyber Consult GmbH sucht nach Investoren.

Wie benutzt man die Nandoo-Maschine? – Der Nutzer erstellt ein Thema, indem er nach Beispiel-Artikeln sucht. Aus einem ständig wachsenden Pool von Quellen wählt Nandoo die passenden Texte aus. Die Trefferquote lässt sich durch Hinzufügen oder Entfernen von Artikeln verändern oder verbessern, dieser Teil arbeitet im Prinzip wie die Empfehlungsfunktion von Amazon. Das Thema wird auch durch eine Sammlung von Suchbegriffen im Stil von Tags umrissen. Auch diese Begriffs-Sammlung lässt sich direkt modifizieren. Zur Zeit durchforstet die Maschine rund 150.000 Nachrichten und 15 Quellen (Nachrichten-Portale und Blogs), darunter die dpa, Spiegel Online oder Heise Online.

Wie weit die Fähigkeit der Maschine entwickelt ist, Texte zu „verstehen“, zeigt ein ebenso seltenes wie merkwürdiges Feature von Nandoo: der Slider. Mit diesem virtuellen Schieberegler lassen sich Texte in Echtzeit beliebig schrumpfen. Zwar sind die Ergebnisse sprachlich nicht so grotesk, wie die der automatischen Übersetzung von Google. Aber das Tool entfernt keineswegs nur verzichtbare Informationen.

Das Projekt soll gleichzeitig wie ein Netzwerk funktionieren. Die Ergebnisse der Nutzer erscheinen öffentlich. Alle Themen sind für die anderen Nandoo-Nutzer einsehbar. Nicht nur das: „Mein Netzwerk – Live“ veröffentlicht die Aktionen der Teilnehmer und meldet etwa neue Mitglieder oder neue Themen.

Nandoo ist übrigens kein ein Hobbykeller für angewandte Wissenschaft; hinter dem Projekt stehen auch eindeutige finanzielle Interessen. „Aufmerksamkeit der Leser ist knapp und hat daher einen Geldwert“, heißt es im Flyer. „Mit Nandoo.net als Vertriebsplattform erhalten auch Anbieter von Nischenthemen über ein Revenue-Sharing attraktive Chancen zur Vermarktung ihres Content“. In der Sprache des Marketing dürften dies eindeutige Worte sein.

Das „Last.fm für News“ (Eigenbeschreibung von Nandoo.net) ist seit Ende Januar 2009 in einer unfertigen Version online. Die Maschine ist eine Kooperation des Software- und Internet-Dienstleisters Cyber Consult GmbH in Zusammenarbeit mit dem Professor für Angewandte Computerlinguistik an der Universität Potsdam, Manfred Stede.

Anzeige
Anzeige

Dein Kommentar

Deine E-Mailadresse wird nicht veröffentlicht.

*

Anzeige