ANERKENNUNG
txtkit – Visual Text Mining Tool
Marcus Hauer, Anne Pascual
, schoenerwissen / OfCD
txtkit ist ein visuelles Open-Source-Text-Mining-Tool zum Durchforsten großer verschiedensprachiger Textmengen. Im Fokus der Multiuser-Applikation steht vor allem der Lese- und Denkprozess als eine Abfolge von Entscheidungen und Ereignissen. Um diese einperspektivische Aktivität zu erweitern, sammelt txtkit die Mining-Daten aller Nutzer und generiert mit ihrer Hilfe Inhaltsempfehlungen durch gemeinsames Filtern.
Die Hauptelemente von txtkit sind: ein integriertes ParsingProgramm, eine auf einem Server laufende MySQL-Datenbank und der txtkit-Client. Wenn Sie txtkit auf Ihrem Computer installiert haben, können Sie zwischen verschiedenen Texten, Sprachen und Servern wählen und werden danach automatisch mit der txtkit-Datenbank verbunden. Das txtkit-Interface besteht aus zwei Teilen: txtshell (ein Shell-Interface) und txtvbot (ein visueller Bot). Die txtshell stellt verschiedene Befehle zum Durchsuchen, Lesen und Auswählen von Texten zur Verfügung, während der txtvbot in Echtzeit die Nutzeraktivität abbildet. Die Visualisierung basiert auf den Aktivitäten der Nutzer, statistischen Informationen über den Inhalt sowie gemeinsamen Filtermethoden. Txtvbot und txtshell können einzeln verwendet werden, doch durch eine alternierende Verwendung verknüpfen Sie visuelle und textuelle Erkenntnisprozesse und nutzen so das Potenzial digitaler Hypothesenbildung und Entscheidungsfindung.
In Auftrag gegeben wurde txtkit von Prof. Hans Ulrich Reck, der auch Co-Autor des Konzepts ist und zusammen mit Prof. Georg Trogemann die Leitung von KIT, eines Forschungsprojekts der Kunsthochschule für Medien Köln, innehat. KIT ist Bestandteil des vom deutschen Bundesministerium für Bildung und Forschung und den Kultusministerien der Länder finanzierten KUBIM-Programms.
Konzept: Schoenerwissen / OfCD (Anne Pascual & Marcus Hauer), Hans Ulrich Reck; Entwicklung, Design and Programmierung: Schoenerwissen/OfCD; Mitarbeit Programmierung: Thomas Chille; Texte txtkit 1.0: Hans Ulrich Reck; Beratung: Hans Ulrich Reck, Georg Trogemann, Thomas Chille, Jochen Viehoff
|