Projekt 1.3: Annotation Linking

Description

Dieses Projekt wird die im LHA gesammelten Daten mithilfe semi-automatischer Annotationsmethoden semantisch anreichern, um eine hohe Interoperabilität für die verschiedenen Datensätze und Anwendungen auf der Plattform zu gewährleisten (siehe Projekt 1.1). Trotz der bisherigen Forschungsarbeit auf dem Gebiet des Link Discovery existieren nur wenige Links bzw. Annotationen für biomedizinische Dokumente und Daten wie z.B. klinische Frage- und Untersuchungsbögen (engl.: case report forms, CRFs), Analyseergebnisse und komplexe Phänotypen. Da eine manuelle Annotation oft schwierig und zeitaufwendig ist, werden automatische Verfahren zur Vorschlagsgenerierung benötigt. Vorarbeiten aus dem Bereich des Link Discovery und Ontology Alignement müssen daher für die Verlinkung medizinischer Dokumente und Datensätze weiterentwickelt, optimiert und evaluiert werden.

Die automatische Annotation komplexer biomedizinischer Objekte und Dokumente wie CRFs oder Phänotypen gestaltet sich schwierig, bspw. aufgrund unstrukturierter Freitextangaben und domänenspezifischer Eigenschaften. Biomedizinische Datensätze sowie Ontologien können zudem sehr groß sein. Weiterhin muss aufgrund der zunehmenden Anzahl zu verknüpfender Quellen und Anwendungen im LHA sowie steigender Nutzerzahlen, eine effiziente Verlinkung der Daten im Framework gewährleistet werden. Für die semantische Anreicherung des LHA werden wir daher (semi-)automatische Linking Verfahren entwickeln, die qualitativ hochwertige Annotationen für biomedizinische Objekte und Dokumente sehr effizient generieren können. Die so erzeugten Annotationsvorschläge werden dann in Zusammenarbeit mit Experten (aus Projekt 1.4 + 2) verifiziert und iterativ verbessert, um eine hohe Datenqualität des LHA zu gewährleisten.

Annotation Linking

 

Work Program

Annotationsverwaltung und Datenintegration (in Kooperation mit Projekt 1.1)

  • Konzeptionelle und technische Planung zur Integration und Verwaltung semantischer Annotationen 
  • Vereinheitlichung und Integration der zu annotierenden Dokumente und Objekte z.B. CRFs, komplexe Phänotypen) in das LHA-Framework (mit Projekt 1.1)
  • Aufbereitung und Integration patientenbezogener Daten zur Verknüpfung mit geografischen (insb. für Leipziger Stadtteile) und statistischen Daten (z.B. Arbeitslosenquote, Sozial- und Prosperitätsindex)

Weiterentwicklung und Anwendung von Annotation Linking Verfahren für LHA-Daten (in Kooperation mit Projekt 1.2, 1.4, 2 und Big Data Zentrum ScaDS Dresden/Leipzig)

  • Adaption und Weiterentwicklung bestehender Linking-Methoden zur automatischen Vorschlagsgenerierung von qualitativ hochwertigen Links über mehrere Quellen
  • Wiederverwendung existierender Ontologie- und Annotationsmappings
  • Verwendung von Metadaten sowie interner und externer biomedizinischer Ontologien, Vokabulare und Standards z.b. BIO (mit Projekt 1.2), OMIM, CDISC, u.a.
  • Realisierung effizienter Annotationsverfahren für eine hohe Linking-Performanz (Kooperation ScaDS Dresden/Leipzig)
  • Nutzung der Verfahren zur Annotation von LHA-Daten (u.a. CRFs, Phänotypen aus Projekt 1.4 und Projektbereich 2)
     

Qualitätsanalyse und Verifikation der Annotationen (in Kooperation mit Projekt 1.4, Projektbereich 2)

  • Definition von Qualitätskriterien zur Unterstützung der Verifikation durch Nutzer
  • Vergleichende Evaluierung der generierten Annotationen (mit Projekt 1.4 und Projektbereich 2) 
  • Qualitätsanalyse, Verifikation und iterative Verbesserung der gerankten Annotationen durch Experten; Effizienzanalyse der Linking-Verfahren
Team
Erhard Rahm

 

Prof. Dr. Erhard Rahm

Universität Leipzig
Institut für Informatik
Abteilung Datenbanken
Augustusplatz 10
04109 Leipzig

rahm@informatik.uni-leipzig.de

Anika Groß

 

Dr. Anika Groß

Universität Leipzig
Institut für Informatik
Abteilung Datenbanken
Augustusplatz 10
04109 Leipzig

gross@informatik.uni-leipzig.de

Ying-Chi Lin

 

Dr. Ying-Chi Lin

Universität Leipzig
Institut für Informatik
Abteilung Datenbanken
Augustusplatz 10
04109 Leipzig

lin@informatik.uni-leipzig.de