Dokumentenvergleich mit Annotationen

Problem: 

Text-Dokumente (reiner Text, HTML, XML, XHTML, etc.) werden oft zusätzlich annotiert, um weitere Informationen oder Notizen hinzuzufügen. Wenn es allerdings eine neue Version des ursprünglichen Textes gibt, möchte man dieser die Annotationen des alten Dokumentes hinzufügen und gleichzeitig wissen, wo genau Änderungen im Text stattgefunden haben.

Aim: 

Entwickeln und implementieren Sie ein Programm, das folgende Charakteristika aufweist:
Die unterschiedlichen Versionen der (HTML/XHTML-)Dokumente müssen miteinander verglichen werden. Dabei sollen einerseits Änderungen im Text erkannt und hervorgehoben werden und andererseits die Annotationen des alten Dokumentes in das neue Dokument übernommen werden. Falls Annotationen übernommen werden, wo es auch zu Änderungen im Text gekommen ist, soll dies extra hervorgehoben werden.

Topics: 
Dokumenten-Vergleich, diff
Other information: 

Entwicklungsumgebung: Java (Eclipse)

Das Thema kann auch im Team von 2 Personen bearbeitet werden.

Previous knowledge: 
Java, evtl. Eclipse RCP
Scope: 
BA
Scope: 
PR
Scope: 
MA
Assigned as: 
Bachelor thesis/Bakkalaureatsarbeit
Contact: 

Katharina Kaiser, by appointment, kaiser [at] ifs.tuwien.ac.at

Student(s): 

Bruno Pfeiffer
Philipp Waibel

Area: 
Information Extraction (IE) and Transformation
Status: 
closed