Sprungmarken

Servicenavigation

Hauptnavigation

Sie sind hier:

Hauptinhalt

PG 540: Semantic oDOBS

 

Erste PG-Sitzung

Montag, 13. Juli, 14-16 Uhr, OH14 - R. 105

 

Thema

Erweiterung von oDOBS, einer Webanwendung für Literaturrecherche, um Features des Web 2.0 und des Semantic Web

 

Aufgabe

odobs_screenshot

In Zeiten des „Web 2.0“ leben Anwendungen im World Wide Web zunehmend von der Beteiligung und dem Engagement ihrer Benutzer. Inhalte werden längst nicht mehr nur redaktionell aufbereitet, sondern können selbst gepflegt und angereichert werden, wie es z.B. die Wikipedia vormacht. Auch Mechanismen wie z.B. das Tagging von Inhalten leben von der Initiative und den subjektiven Meinungen der Benutzer.

Das Ergebnis wird oft auch als „Semantic Web“ [SemanticWeb1, SemanticWeb2, SemanticWeb3] bezeichnet - Informationen werden angereichert um Metadaten oder Annotationen, welche dann maschinell zueinander in Beziehung gesetzt werden können. So lassen sich z.B. durch „Nachbarschaften“ Benutzer mit ähnlichen Interessen finden. Bei der Musikplattform „last.fm“ etwa werden Songs mit Tags versehen und zusätzlich Daten über die musikalischen Vorlieben der Benutzer gesammelt. So kann man Benutzer mit ähnlichem Musikgeschmack finden und auf diese Weise neue Musik kennenlernen.

Diese Art der sozialen Vernetzung, die das Semantic Web ermöglicht, ist gerade in wissenschaftlichen Communities von großem Interesse. Die Möglichkeiten gehen dabei weit über eine herkömmliche Literaturrecherche hinaus: Welche Personen veröffentlichen zu ähnlichen Themen? Welche Veröffentlichungen sind wirklich relevant? Wie bleibt man ohne ständige neue Recherche über Veröffentlichungen und Erkenntnisse zu bestimmten Themen informiert?

Von der Literaturrecherche zum Semantic Web

Die PG Semantic oDOBS beschäftigt sich mit diesen Fragestellungen auf Basis des Dortmunder Online Bibliographieservices (oDOBS). oDOBS ermöglicht die Literaturrecherche in knapp 1 Millionen Publikationen aus dem Bereich der Informatik, und ist für Benutzer als Web-Applikation unter http://www.odobs.de zu erreichen.

Bereits zwei Projektgruppen haben sich mit der Entwicklung dieses Webdienstes beschäftigt. Die PG  494 L2EE [PG-L2EE] legte den Grundstein für das System auf Basis der JEE-Technologie (Java Enterprise Edition, [JEE]) und ausgehend vom Datenbestand der bekannten Literaturdatenbank DBLP [DBLP1, DBLP2]. Schon diese erste Version von oDOBS bot umfangreiche Funktionalitäten für die Literaturrecherche, wie etwa eine mächtige Suchfunktion. Die PG 513 DoPAC [PG-DoPAC] beschäftigte sich mit der Erweiterung des Funktionsumfanges, z.B. durch eine Anbindung an Dokumentenmanagementsysteme zur Speicherung der Publikationen, und eine grafische Visualisierung der Beziehungen zwischen Autoren („Koautor-Netzwerk“, siehe Screenshot auf der nächsten Seite).

Aus Entwicklersicht handelt es sich bei oDOBS um eine klassische Web-Applikation, die insbesondere auf Performanz und Skalierbarkeit ausgelegt ist und einfache Schnittstellen zur Pflege des Datenbestandes bietet. Bei der Entwicklung kommen moderne Technologien wie JEE, Java Server Faces (JSF), Hibernate, Web Services, JBoss und Apache Lucene zum Einsatz. Auf dieser Basis soll oDOBS nun um Features des Web 2.0 und des Semantic Web erweitert werden.

Semantic oDOBS

Um dies zu erreichen, ist Personalisierung eine zwingende Voraussetzung. oDOBS muss um eine Benutzerverwaltung erweitert werden, so dass Benutzer sich bei dem Dienst anmelden können. Hier gibt es schon entsprechende Dienste wie etwa OpenID oder OpenSocial, die für die Umsetzung genutzt werden können. Auf Basis der entstehenden Benutzerprofile können dann weitere Features realisiert werden. Diese Features sollen stets serviceorientiert umgesetzt werden, d.h. dass eine Realisierung stets auf schon existierenden Diensten, Systemen, Bibliotheken, etc. basiert und gleichzeitig maximal wiederverwendbar implementiert wird. Folgende Erweiterungen sollen in der PG  vorgenommen werden:

  • Anreicherung von Publikationen um Metadaten. Dies beinhaltet neben dem einfachen Kommentieren und Bewerten von Publikationen auch das Tagging. Hierbei werden Publikationen mit Schlagworten versehen, wie etwa „code generation“ oder „temporal logic“. Indem ein Benutzer bestimmte Tags favorisiert, können z.B. seine Interessen ermittelt werden.Gezielte Information basierend auf Benutzerinteressen. Ein Benutzer soll sich über Aktivitäten in seinen Interessensgebieten informieren lassen können, z.B. per RSS oder E-Mail. Hier ist auch die Anwendung von Semantic Emailing [SemEmail] denkbar, d.h. dass E-Mails nicht mehr an konkrete Adressaten, sondern an alle Benutzer mit bestimmten Interessen geschickt werden.
  • Erweiterte Suchfunktionen. Das Durchsuchen des Datenbestands soll auch tag-basiert möglich sein. Im einfachsten Fall bedeutet dies ein Durchblättern mittels sogenannter „Tag-Wolken“. Zudem soll der Benutzer ganze Suchanfragen speichern können, um sich dann über Änderungen in den Suchergebnissen (z.B. neue Publikationen in der Datenbank) informieren zu lassen (erneut über RSS/E-Mail).
  • Integration mit bestehenden Webanwendungen und Technologien. Über eine offene Schnittstelle sollen Funktionen von oDOBS (wie etwa die Suche) für andere Anwendungen und Dienste nutzbar werden. Teilweise bietet oDOBS bereits eine Web Service-Schnittstelle an, die ausgebaut werden muss. Neben der reinen Integration von oDOBS mit anderen Recherchediensten wie etwa Google Scholar, CiteULike oder Citeseer, die ebenfalls Web  Service- und/oder REST-Schnittstellen bieten, ist so auch eine Anbindung an soziale Netzwerke wie etwa Facebook denkbar. So können wissenschaftliche Aktivitäten oder die eigene Publikationsliste auf dem Facebook-Profil eines Benutzers oder in dessen privatem Blog sichtbar gemacht werden. Auch für die engere Vernetzung von Personen existieren bereits Projekte wie FOAF (Friend of a Friend) [FOAF], die oDOBS verwenden könnte. Diese bestehenden Anwendungen und Technologien sollen ebenfalls serviceorientiert in oDOBS integriert werden. Dazu müssen insbesondere die Schnittstellen solcher Dienste ermittelt und deren Anbindung an oDOBS konzipiert werden.

Darüber hinaus ermöglicht die Anreicherung der Datenbasis um Metainformationen deutlich bessere Analysen. Über Tags und Interessen lassen sich z.B. Interessensgemeinschaften („Nachbarschaften“) identifizieren. Benutzer können so leicht andere Benutzer finden, die in ähnlichen Themengebieten forschen. Zusätzlich können dem Benutzer Vorschläge gemacht werden: „Wer Paper X favorisiert hat, schaute sich auch Paper Y an.“
Weiterhin lassen sich Benutzerkommentare, Bewertungen und Tags dazu verwenden, besonders beliebte und relevante Themen zu identifizieren. Dies soll kombiniert werden mit aktuellen Forschungsergebnissen [PageRank], die eine Relevanzbewertung von Publikationen mittels einer erweiterten Version von Googles PageRank-Algorithmus vorgenommen haben.
Ebenfalls Gegenstand aktueller Forschung sind Techniken zur Erkennung sogenannter „Interessenskonflikte“ (Conflicts of Interest, [COI]). Die Autorennetzwerke in oDOBS sind gut geeignet, um solche Techniken praktisch anzuwenden und so eine Recherche nach potentiellen Interessenskonflikten zu ermöglichen.

Da alle Ergebnisse nach Abschluss der PG in die Live-Instanz von oDOBS einfließen sollen, liegt ein  besonderer Schwerpunkt auf der Stabilität und Präzision der Umsetzung. So erhalten insbesondere die Kompatibilitäts- und Integrationstests ein hohes Gewicht. Eine solide Dokumentation vervollständigt die Arbeit und ist Grundlage für weiterführende Arbeiten an dem Thema.

 

Teilnahmevoraussetzungen

Erforderlich

  • Fundierte Kenntnisse mindestens einer objektorientierten Programmiersprache wie beispielsweise Java, C++, o.ä.
  • Kenntnisse in dem Gebiet Software-Design/Implementierung, erworben durch erfolgreiche Teilnahme an mindestens einer entsprechenden Vorlesung wie „Web-Technologien“, „Darstellung, Verarbeitung und Erwerb von Wissen“, „Formale Methoden des Systementwurfs“

Wünschenswert

  • Erfolgreiche Teilnahme an: „Software-Konstruktion“, „Virtualisierung & Compilation“
  • Erfahrung mit der Java Enterprise Edition (JEE)
  • Erfahrung mit Web-Technologien (z.B. Java Server Faces, Struts, Spring)
  • Kenntnisse in SQL, JDBC und/oder Hibernate
  • Objektorientierte Modellierung (UML)
     

Minimalziele

  1. Erweiterung von oDOBS um eine Benutzerverwaltung mit persönlichem Profil für jeden Benutzer.
  2. Umsetzung einer Funktion zur Anreicherung von Publikationen um Metadaten, inklusive Kommentarfunktion, Bewertung und Tagging.
  3. Verbesserung der Suchfunktion, mindestens durch die Möglichkeit der Abspeicherung/des Abonnierens von Suchfragen.
  4. Umsetzung von Analysen auf dem angereicherten Datenbestand, mindestens die Ermittlung von Nachbarschaften und die Bewertung der Relevanz von Publikationen.
     

Zeitraum

Wintersemester 2009/2010 und Sommersemester 2010

 

Umfang

Jeweils 8 Semesterwochenstunden

 

Ansprechpartner

  • Dipl.-Inform. Sven Jörges
  • Dr. Ralf Nagel
  • Prof. Bernhard Steffen

 

Literatur

  • [SemanticWeb1] Tim Berners-Lee, James Hendler, Ora Lassila: "The Semantic Web". Scientific American, May 2001, p. 29-37.
  • [SemanticWeb2] Dieter Fensel, James A. Hendler, Henry Lieberman, Wolfgang Wahlster: Spinning the Semantic Web: bringing the World Wide Web to its full potential. Information Research 9(2): (2003).
  • [SemanticWeb3] Charles Petrie, Tiziana Margaria, Michal Zaremba, Holger Lausen (eds.): Semantic Web Services Challenge - Results from the First Year, Springer Verlag, 2008, ISBN: 978-0-387-72495-9.
  • [DBLP1] DBLP: http://www.informatik.uni-trier.de/~ley/db/
  • [DBLP2] Stefan Klink, Michael Ley, Emma Rabbidge, Patrick Reuther, Bernd Walter, Alexander Weber: Browsing and Visualizing Digital Bibliographic Data. VisSym 2004: 237-242
  • [PG-L2EE] PG L2EE: http://ls5-www.cs.tu-dortmund.de/opencms/de/lehre/pg/pg494.html
  • [JEE] Java Enterprise Edition (JEE), http://java.sun.com/javaee/
  • [PG-DoPAC] PG DoPAC: http://ls5-www.cs.tu-dortmund.de/opencms/de/lehre/pg/pg513_dopac.html
  • [SemEmail] Michael Kassoff, Charles Petrie, Lee-Ming Zen, Michael Genesereth: Semantic Email Addressing: The Semantic Web Killer App? IEEE Internet Computing, vol. 13, no. 1, pp. 48-55, Jan./Feb. 2009.
  • [FOAF] FOAF Project: http://www.foaf-project.org
  • [PageRank] Sergei Maslov, Sidney Redner : Promise and Pitfalls of Extending Google's PageRank Algorithm to Citation Networks. J. Neurosci., Vol. 28, No. 44. (29 October 2008), pp. 11103-11105.
  • [COI] Boanerges Aleman-Meza, Meenakshi Nagarajan, Li Ding, Amit P. Sheth, Ismailcem Budak Arpinar, Anupam Joshi, Timothy W. Finin: Scalable semantic analytics on social networks for addressing the problem of conflict of interest detection , TWEB 2 (1), 2008.


Nebeninhalt

 

Kontakt

Tel. (0231) 755-5801
Fax (0231) 755-5802