Artikelname

Valence

Benjamin Fry

Wie kann man die Verwendung von Wörtern in einem Buch visualisieren? The Innocents Abroad von Mark Twain (dt.: "Die Arglosen im Ausland") enthält bei einem Wortschatz von 15.000 Wörtern insgesamt 200.000 Wörter. Ein Balkendiagramm mit so vielen Elementen wäre praktisch nutzlos. Es wäre entweder zu groß, um es auf einmal zu erfassen oder - würde man es entsprechend skalieren - zu klein, um aussagekräftig zu sein. Viele Techniken sind wegen der gewaltigen Unterschiede bei der Verwendung von Wörtern für eine Visualisierung ungeeignet: Von den 15.000 einzelnen Wörtern kommt die Hälfte nur einmal vor, und weniger als 25 Prozent der Daten würden sich überhaupt lohnen, wobei die interessantesten Details überhaupt nur 5 Prozent ausmachen. Selbst wenn man diese Schwierigkeiten mit einigen Statistiken und modifizierten Balkendiagrammen lösen könnte, wäre es fraglich, ob dies eine brauchbare Beschreibung der Daten wäre. Die Beziehungen der Wörter zueinander wird dabei überhaupt nicht berücksichtigt. Wie könnte man herauslesen, welche Wörter im Text nebeneinander stehen? Wie würden Änderungen des Wortgebrauchs im Text sichtbar gemacht? Um große Informationsmengen verstehen zu können, muss man sich fragen: "Wie *fühlt* sich die Information an?"

Das Projekt Valence setzt Eigenschaften organischer Systeme (wie Wachstum, Verfall, Anpassung und Stoffwechsel) als Konstruktionsmethode für Darstellungen ein, die auf der Interaktion vieler einfacher Regeln beruhen und damit die Darstellung aussagekräftiger machen. Diese Repräsentationen sollen Informationen so zum Sprechen bringen, wie Organismen Daten zu sich nehmen und verdauen, um ein qualitatives Gefühl für die dargestellten Informationen zu vermitteln.

In Valence bildet jedes einzelne Wort des Buchs einen Knoten. Im Text benachbarte Wörter werden miteinander verbunden. Werden neue Wörter im Raum hinzugefügt, werden mit der Zeit bestimmte Regeln, die auf diesen organischen Eigenschaften basieren, auf das System angewendet. Das daraus resultierende Programm liest das Buch linear und platziert jedes Wort dynamisch im dreidimensionalen Raum. Die am häufigsten gebrauchten Wörter finden sich in den Randschichten der Komposition, damit sie leichter zu sehen sind. Daher befinden sich die nicht so gängigen Wörter mehr im Zentrum. Stehen im Text zwei Wörter nebeneinander, werden sie in der Visualisierung durch eine Linie verbunden. Bei einer Wiederholung wird die verbindende Linie kürzer, wodurch die beiden Wörter im Raum enger beieinander stehen. Die Interaktionsstärke wird anhand der Häufigkeit des Wortgebrauchs in der jeweiligen Muttersprache gewichtet.

Durch die Reaktion auf die eingelesenen Daten verändert sich diese "organische Informationsvisualisierung" im Lauf der Zeit. Statt bloß die exakten Zahlen anzugeben (d. h. wie oft ein Wort vorkommt), vermittelt die Arbeit ein qualitatives Gefühl für die Störungen in den Daten - in diesem Fall die verschiedenen Wortarten und Sprachebenen des Buchs. Auf diese Weise wird ein qualitativer Schnitt durch die Informationsstruktur geboten. Für sich allein sind die Daten vielleicht nicht sehr nützlich. Werden die Datenpunkte jedoch zueinander in Beziehung gesetzt und diese Beziehungen mittels Bewegung und Strukturveränderungen direkt am Bildschirm dargestellt, erhält man eine sehr viel brauchbarere Sichtweise.

Die einzelnen Bewegungen der Wörter vereinen sich zu einer Symphonie der kleinen Teile: Einmal betrachtet man die Gestalt der Arbeit als Ganzes und einmal die Anomalien, die durch rasches Bewegen oder einen Farbwechsel auf sich aufmerksam machen. Verwandte Teile des Werks schließen sich zu Gruppen zusammen, was in den Bewegungsregeln nicht explizit festgelegt ist, sondern sich aus der Interaktion der Knoten bei der Ausführung der Interaktionsregeln ergibt. Die allmähliche Herausbildung von verwandten Gruppen erleichtert das Erfassen des Systems.