@misc{640, keywords = {coreference relation, Clinical Practice Guidelines, hypernym, hyponym relation, UMLS, MMTx}, author = {Marco Romauch}, title = {Coreference resolution in clinical practice guidelines focusing on hypernym/hyponym relations}, abstract = {
Medizinisches Wissen steht oft nur in Form von natürlichsprachigen Textdokumenten zur Verfügung. Dieser Umstand macht eine automatisierte Verarbeitung dieser Informationen zu einer extrem kostspieligen, arbeitsintensiven und zeitaufwändigen Tätigkeit. Aus diesem Grund wurden vielfach Anstrengungen mit dem Ziel unternommen, ausgewählte medizinische Dokumente automatisch verarbeitbar zu machen. Diese Anstrengungen gelten besonders für medizinische Leitlinien (engl.:
clinical practice guidelines (CPGs)), da diese Dokumente das aktuell gültige Wissen in einem bestimmten medizinischen Bereich repräsentieren. Die Verwendung rechnergestützter CPGs bietet verschiedenste Vorteile, besonders im Bereich der patientenspezifischen Entscheidungsunterstützung. Mit ihrer Hilfe ist es möglich, individuelle, auf Patienten speziell zugeschnittene Behandlungsvorschläge automatisch zu erstellen. Die korrekte automatisierte Verarbeitung der Informationen in den CPGs beruht unter anderem auf der richtigen Interpretation eines speziellen semantischen Theorems, der so genannten Koreferenzbeziehung. Die Erkennung und Auflösung dieser Struktur ist eine wichtige Teilaufgabe im Bereich des Natural Language Processing (NLP). Zwei oder mehrere Ausdrücke in einem Text sind koreferent, wenn sie auf dasselbe reale Objekt referenzieren. Diese semantische Struktur wird oft zur Verhinderung von Wortwiederholungen eingesetzt. Eine korrekte Interpretation hilft dabei, den Inhalt eines Textes zu verstehen. Es existieren verschiedene Arten von Koreferenz in natürlichsprachigen Texten, wie zB Name-alias Koreferenz, Pronomen-Koreferenz und Definite-Description Koreferenz. Diese Arbeit fokussiert auf die Identifizierung des letzteren Typus. Nach der Vorstellung des theoretischen Hintergrundes zum Thema Auflösung von Koreferenzbeziehungen, die auch einen Überblick über existierende Ansätze und Systeme beinhaltet, präsentiert diese Arbeit unseren Korefernzidentifizierungsalgorithmus für CPGs. Ein Hauptaugenmerk liegt auf der Erkennung und Auflösung von Definite Description Koreferenz, und dabei speziell auf hypernymen/hyponymen Korefernzbeziehungen. Diese stellen den in CPGs am häufigsten auftretenden Typ dar. Eine hypernyme/hyponyme Korefernz liegt dann vor, wenn eine Koreferenzbeziehung zwischen einem generelleren Ausdruck (Hypernym) und einem spezielleren Ausdruck (Hyponym) besteht. Um diese Aufgabe erfüllen zu können, identifiziert unser Algorithmus zuerst alle möglichen Phrasen und selektiert die relevanten für die weitere Verarbeitung. Im zweiten Schritt werden alle Kandidaten identifizieren, die möglicherweise Teile einer Korefernzbeziehung sind. Dazu verwenden wir verschiedene Tests die Informationen von externen Informationen, nämlich MetaMap Transfer (MMTx) und dem Unified Medical Language System (UMLS) beziehen. Schließlich werden "Resolution Rules" eingesetzt um Koreferenzbeziehungen, die zwischen den Kandidaten existieren. Wir entwickelten einen Algorithmus, den wir prototypisch implementierten um ihn in weiterer Folge anhand von Trainingsdokumenten zu verbessern. Der endgültige Algorithmus wurde danach anhand von Testdokumenten evaluiert. Unser Algorithmus zur Identifizierung von Koreferenzen erreichte bei dieser Evaluierung Werte von 85,96% Vollständigkeit (Recall) und 68,49% Genauigkeit (Precision).}, year = {2009}, journal = {Institute of Visual Computing and Human-Centered Technology}, pages = {71}, publisher = {TU Wien}, address = {Vienna}, }