Text - Information - Wissen: Domänenoffene Textprozessierung und Informationsextraktion
Umsetzung eines innovativen Ansatzes zur Informationsextraktion (IE) innerhalb von Tesla
Verwendet Technologie aus:
Beschreibung:Ziel des Projektes "Text – Information – Wissen" ist die Umsetzung eines innovativen Ansatzes zur Informationsextraktion (IE) innerhalb eines anwenderoffenen Prozessierungssystems, dem Text Engineering Software Laboratory Tesla. Der Ansatz basiert auf Verfahren zur Detektion und Relationierung von Mustern in Texten, die durch die Integration etablierter computerlinguistischer und bioinformatischer Komponenten realisiert werden. Zu diesem Zweck wurde das Projekt in zwei Phasen unterteilt: In der ersten Projektphase werden weitgehend generische, d.h. keiner spezifischen Anwendungsdomäne zugeordnete Komponenten für die Textprozessierung implementiert, die in der zweiten Projektphase in Tesla zu IE-spezifischen Verfahren kombiniert werden, so dass anhand konkreter Extraktionsprobleme eine vergleichende Evaluation der Komponenten vorgenommen werden kann. |