Das Wissen der Welt organisieren: AAU arbeitet mit Stanford University an Wissensbasis für US-Krebsforschungsinstitut
Das National Cancer Institute in New York hat über 160.000 logische Sätze zu Krebserkrankungen gesammelt. Mit der Wissensbasis will man Zusammenhänge zwischen Symptomen, Genen und potenziellen Ursachen analysieren. Konstantin Schekotihin arbeitet gemeinsam mit Forschern der Stanford University an deren Verbesserung.
„Das Volumen von Wissen, das die Welt angehäuft hat, ist sehr groß. Wir brauchen Werkzeuge, die dabei helfen, dieses Wissen zu verarbeiten“, erklärt Konstantin Schekotihin (Institut für Angewandte Informatik). Er arbeitet nun in einem vom Kärntner Wirtschaftsförderungsfonds finanzierten Projekt an einer verbesserten Fehlersuche in großen Wissensbasen. Am Beispiel des US-National Cancer Institutes erläutert er: „Solche Wissensbasen sind sehr heterogen. Sie werden von vielen Forschungsstätten befüllt. Daraus ergeben sich Fehler durch die Zusammenführung von Datensätzen. Fehlerhafte Verknüpfungen führen dann auch zu fehlerhaften Konsequenzen, die insbesondere in medizinischen Anwendungen schwerwiegende Folgen haben können.“
Widersprüchliche Darstellungen eines Sachgebiets, so Schekotihin, ergeben sich häufig erst durch Integration des formulierten Wissens unterschiedlicher ExpertInnen. Aussagen wie „Diabetes ist eine Krankheit des Bauches.“, „Der Fuß ist im Becken platziert.“ oder “ Bluthochdruck ist eine Art Weichteilstörung.“ sind nur wenige Beispiele von logischen Ableitungen – in diesem Fall gefunden von Alan Rector und seinen Kollegen in einer medizinischen Ontologie –, die aus Fehlern in der Wissensbasis resultieren. Die Lokalisierung dieser Fehler nimmt beträchtliche Zeit in Anspruch.
Schekotihin und seine Kollegen arbeiten daher mit einem Algorithmus, der für die gesamte Wissensbasis Annahmen macht und diese überprüft. Das Verhalten dieses Programms erinnert an menschliches Verhalten: Wenn ein Auto beim Drehen des Zündschlüssels nicht startet, machen auch wir eine Annahme. Wir gehen zum Beispiel davon aus, dass die Batterie leer ist und überprüfen sie. Stimmt diese Annahme nicht, prüfen wir eine andere. „So geht auch der Computer vor. Er kann im Gegensatz zum Menschen Millionen Annahmen effizient vergleichen und die plausibelste auswählen“, so Schekotihin. Die Projektpartner der Stanford University entwickeln Protégé, das am häufigsten verwendete Open-Source-Ontologie-Entwicklungstool der Welt. Das Klagenfurter Team kümmert sich um das entsprechende Debugging Plug-In für Protégé. Schekotihin möchte im Frühjahr den Prototyp dafür präsentieren. Ende 2016 soll das Programm für das National Cancer Institute umgesetzt werden.