Dokumentenvergleich mit Annotationen

Problem

Text-Dokumente (reiner Text, HTML, XML, XHTML, etc.) werden oft zusätzlich annotiert, um weitere Informationen oder Notizen hinzuzufügen. Wenn es allerdings eine neue Version des ursprünglichen Textes gibt, möchte man dieser die Annotationen des alten Dokumentes hinzufügen und gleichzeitig wissen, wo genau Änderungen im Text stattgefunden haben.

Aim

Entwickeln und implementieren Sie ein Programm, das folgende Charakteristika aufweist:
Die unterschiedlichen Versionen der (HTML/XHTML-)Dokumente müssen miteinander verglichen werden. Dabei sollen einerseits Änderungen im Text erkannt und hervorgehoben werden und andererseits die Annotationen des alten Dokumentes in das neue Dokument übernommen werden. Falls Annotationen übernommen werden, wo es auch zu Änderungen im Text gekommen ist, soll dies extra hervorgehoben werden.

Other information

Entwicklungsumgebung: Java (Eclipse)

Das Thema kann auch im Team von 2 Personen bearbeitet werden.

Contact

Further information

Topics
Dokumenten-Vergleich, diff
Area
Information Extraction (IE) and Transformation
Previous knowledge
Java, evtl. Eclipse RCP
Deutsch
Scope
BA
PR
MA
Assigned as
Bachelor thesis/Bakkalaureatsarbeit
Student(s)

Bruno Pfeiffer
Philipp Waibel

Status
closed