Schattenblick →INFOPOOL →MEDIZIN → TECHNIK

ENTWICKLUNG/658: Knowledge Computing - Neue Perspektive für das Wissenschaftliche Rechnen (idw)


Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI - 23.02.2010

Knowledge Computing

Eine neue Perspektive für das Wissenschaftliche Rechnen


Die Suche nach Informationen und Zusammenhängen in Zehntausenden pharmazeutischen Patenten war bislang extrem zeitaufwändig und damit nicht praktikabel. Durch den Einsatz einer neuen Software auf Grid-vernetzten Supercomputern erreichten Forscher jetzt eindrucksvolle Ergebnisse. High Performance Computing (HPC) eröffnet so neue Möglichkeiten für das Wissenschaftliche Rechnen.

Sankt Augustin / Jülich. Forscher des Fraunhofer-Instituts für Algorithmen und Wissenschaftliches Rechnen SCAI in Sankt Augustin und des Jülich Supercomputing Centre (JSC) haben ihre Supercomputer mit Grid-Technologie vernetzt, um biomedizinische sowie chemische Texte und Bilder in pharmazeutischen Patenten zu analysieren. Damit haben die Forscher eine neue Anwendung im Wissenschaftlichen Rechnen geschaffen, die das leistungsstarke Durchsuchen von Patenten ermöglicht. Durch den Einsatz einer am Fraunhofer SCAI entwickelten Software ist die gleichzeitige Untersuchung von Texten und Bildern in chemischen Patenten möglich. Die Datenanalysen liefern neue Erkenntnisse über die Zusammenhänge von Biologie und Chemie.

Die Forscher durchsuchten mehr als 50.000 Patente aus der pharmazeutischen Chemie mit Hilfe von Grid-Infrastrukturen. Solche Infrastrukturen bestehen aus vernetzten Computern, die zusammen einen virtuellen Supercomputer bilden und so aufwendige Berechnungen erledigen können. Bei ihrem Experiment haben die Forscher die am Fraunhofer SCAI entwickelte grafische Analyse-Software chemoCR mit einer automatisierten Eigennamenerkennung kombiniert und so folgende Daten in den Patenten identifiziert und annotiert, das heißt computerlesbar gemacht:

biologische Daten in Texten (z. B. Namen von Proteinen und Genen, Gen-Polymorphismen, Zelltypen)
medizinische Daten in Texten (z. B. Namen von Krankheiten, pathologische Begriffe, Bezeichnungen von Risikofaktoren)
chemische Informationen in Texten (z. B. Namen von Medikamenten, Termini aus den Benennungsnormen der International Union of Pure and Applied Chemistry (IUPAC))
Bilder (Darstellungen chemischer Strukturen)

"Dieses groß angelegte Experiment eröffnet neue Perspektiven für das Wissenschaftliche Rechnen", sagt Prof. Dr. Martin Hofmann-Apitius, Leiter der Abteilung Bioinformatik am Fraunhofer-Institut SCAI. Knowledge Computing, also die Datenverarbeitung von Wissensbeständen, ist ein neuer Weg, solche Bestände zu untersuchen. "Diese Art der Anwendung geht weit über die üblichen Simulationsanwendungen des Wissenschaftlichen Rechnens hinaus", so Hofmann-Apitius.

Bisher wurden Textanalyse-Technologien nur auf bibliografischen Datenbanken betrieben, die Informationen aus den Lebenswissenschaften und der Biomedizin enthalten (z. B. MEDLINE). Die Erweiterung hin zu einer gleichzeitigen Untersuchung von text- und bildbasierten Informationen in ganzen Textdokumenten mit Grid-Computern wurde jedoch noch nie zuvor umgesetzt.

"Wir sind froh darüber, dass unser Institut seinen Beitrag zur Erschließung eines neuen Anwendungsbereichs für Supercomputer leistet. Das so genannte Knowledge Computing kann zu einer neuen, eigenen Teildisziplin des Wissenschaftlichen Rechnens werden", betont Prof. Dr. Ulrich Trottenberg, Leiter des Fraunhofer-Instituts SCAI.

Eine zentrale Rolle in dem Experiment spielte die Grid-Middleware UNICORE (Uniform Interface to Computing Resources). Die Forscher benutzten dieses Werkzeug zur Steuerung der Annotationsprogramme, zur Kontrolle des Datenflusses zwischen Patent-Datenbank und Annotationsprogrammen sowie zur Überwachung des gesamten Prozesses.

"UNICORE hat es uns ermöglicht, dieses Experiment in solch großem Umfang auf der Grid-Infrastruktur zwischen SCAI und JSC durchzuführen," erklärt Dr. Achim Streit, Leiter der Abteilung "Verteilte Systeme und Grid Computing" am Jülich Supercomputing Centre. "Durch die leistungsfähigen Workflow- und Datenmanagement-Funktionalitäten von UNICORE konnten wir die Patente problemlos und automatisch annotieren."

"Dieses Projekt ist ein Beispiel dafür, wie leistungsstarke Supercomputer am JSC, die mit erstklassigen Grid-Technologien wie UNICORE ausgestattet sind, Synergien für die Entwicklung neuer Forschungsfelder schaffen können. Das JSC ist Mitglied der internationalen UNICORE Open Source Community und treibt die Entwicklung voran", erläutert Prof. Dr. Dr. Thomas Lippert, Leiter des Jülich Supercomputing Centre.

Das Team am Fraunhofer-Institut SCAI analysiert derzeit die Daten, die im Zuge des Experiments angefallen sind. Mathilde Romberg, Leiterin der Forschergruppe am JSC, freut sich darüber, dass nach Wochen intensiver Workflow-Modellierung die ersten Durchläufe der Patentsuche abgeschlossen sind. Die beiden Teams wissen jedoch, dass noch weitere 18 Millionen Patente auf sie warten.


Ansprechpartner:
Prof. Dr. Martin Hofmann-Apitius
Leiter der Abteilung Bioinformatik
Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI
53754 Sankt Augustin
martin.hofmann-apitius@scai.fraunhofer.de

Dr. Achim Streit
Jülich Supercomputing Centre
Forschungszentrum Jülich GmbH
A.Streit@fz-juelich.de

Kontaktdaten zum Absender der Pressemitteilung:
http://idw-online.de/pages/de/institution641


*


Quelle:
Informationsdienst Wissenschaft - idw - Pressemitteilung
Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI
Dipl.-Journalist (TU Dortmund) Michael Krapp, 23.02.2010
WWW: http://idw-online.de
E-Mail: service@idw-online.de


veröffentlicht im Schattenblick zum 25. Februar 2010