Vernetzungstage 2011 und IUWIS-Workshop „Urheberrecht und Repositorien“: Programm online und Registrierung offen

Ein Veranstaltungshinweis in eigener Sache:

Wir möchten Sie hiermit herzlich zu den Vernetzungstagen 2011 und dem IUWIS-Workshop „Urheberrecht und Repositorien“ vom 2. bis 4. März in Osnabrück einladen.

Sie finden die Tagungswebseite hier.

Dort finden Sie das Tagungsprogramm und alle notwendigen Informationen, einschließlich der Möglichkeit zur Anmeldung. Bitte registrieren Sie sich baldmöglichst, da wir nur eine begrenzte Anzahl an Teilnehmerplätzen zur Verfügung stellen können

Die Vernetzungstage 2011 werden vom DFG-Projekt „Open-Access-Netzwerk 2“ (OA-Netzwerk) in Zusammenarbeit mit Zusammenarbeit mit dem Projekt IUWIS und der Deutschen Initiative für Netzwerkinformation e. V. (DINI) gestaltet und an der Universität Osnabrück durch das Institut für wissenschaftliche Information Osnabrück e.V. (IWI) ausgerichtet.

Werbeanzeigen

IUWIS-Workshop „Urheberrecht und Repositorien“

Viele Repositorybetreiber sehen sich in der täglichen Arbeit mit Rechtsfragen konfrontiert. Die Vielfalt dieser Fragen, mögliche Konsequenzen und rechtlich einwandfreie Lösungen stellen eine erhebliche Herausforderung dar, schließlich hat nicht jeder einen in Urheberrechtsfragen versierten Juristen zur Hand.

Daher wird es zusammen mit den Vernetzungstagen am 2. März 2011 einen Workshop der Kollegen von „Infrastruktur Urheberrecht für Wissenschaft und Bildung (IUWIS) geben, der sich dieses Problemfelds annimmt. Aus dem Veranstaltungshinweis von IUWIS:

In den letzten Jahren haben sich viele Hochschulen und Forschungseinrichtungen Dokumenten- und Publikationsserver, sog. Repositories, eingerichtet. Bis Dezember 2010 sind allein bei der Deutschen Initiative für Netzwerkinformation e.V. (DINI) 144 Repositorien registriert. Die meisten dieser Einreichungen bekennen sich dazu, mit ihrem Angebot die Zugänglichkeit wissenschaftlicher Arbeiten – im Sinne der Open-Access-Bewegung – verbessern zu wollen.

Betreiber, Autoren und Nutzer werden dabei mit verschiedenen urheberrechtlichen Fragen konfrontiert, die nicht ohne weiteres zu beantworten sind.

In dem IUWIS-Workshop werden ausgewählte Problemstellungen in Vorträgen dargestellt und in Arbeitsgruppen diskutiert. Behandelte Themen sind unter anderem: Wie sollen Autorenverträge ausgestaltet werden? Wer haftet für rechtliche Verstöße? Welche Lizenzen sind sinnvoll? Was muss bei der Zweitveröffentlichung von bereits erschienenen Artikeln beachtet werden – national, und international?

Das Programm des Workshops ist auf den Seiten der Vernetzungstage zu finden. Die Anmeldung zur Veranstaltung wird in den nächsten Tagen freigeschaltet.

Distributed Open Access Reference and Citation Services

DOARC – Distributed Open Access Reference and Citation Services ist eines der DINI-Partnerprojekte von OA-Netzwerk. Im Folgenden stellt Michael Maune, Mitarbeiter bei DOARC, das Projekt vor.

Distributed Open Access Reference and Citation Services

Das DOARC-Projekt hat soeben die zweite Projektphase abgeschlossen und befindet sich auf dem Weg in die dritte Phase. Die Grundidee des Projekts ist im Portal des Cluster Science Network (CSN) illustriert. Dabei wurden die Metadaten des CSN in DOARC importiert. Dort wurden Zitationsgraphen erzeugt, welche die Ähnlichkeit zwischen unterschiedlichen Publikationen anhand der Co-Zitationen darstellen. Die so berechneten Daten werden anschließend an CSN exportiert. So wird die Suche nach interessanten und relevanten Publikationen um eine weitere Dimension ergänzt.

Vorgehen

Die Vorgehensweise, ist dabei in folgende Verarbeitungsschritte unterteilt:

  1. Import der Metadaten
  2. Aufbereitung der Metadaten
  3. Berechnung der Zitationsähnlichkeit
  4. Erzeugung von Zitationsgraphen
  5. Export der Ergebnisse
  6. Visualisierung der Ergebnisse

Die bei vielen Repositorien etablierte OAI-PMH Schnittstelle, welche in den meisten Fällen dc-simple übertragt, erwies sich hier für die Übertragung von komplexen Referenz- und Zitationsinformationen als nicht ausreichend. Aus diesem Grunde wurde in der jetzt abgeschlossenen Projektphase in Kooperation mit dem CSN, welches eine Datenbasis für die Cluster-Chemie darstellt und über ein vollständiges Set an Referenzdaten für jede dort verfügbare Publikation verfügt, ein Weg zum Datenaustausch über eine für diesen Zweck entwickelte REST-Schnittstelle etabliert.

Die Berechnung der Ähnlichkeiten zwischen den Publikationen wurde in dieser Projektphase ebenfalls erfolgreich implementiert und getestet. Dabei wird anhand der Co-Zitationen der Jaccard-Index berechnet und als Ähnlichkeitsmaß gespeichert. Dieses Ähnlichkeitsmaß wird dann genutzt, um einen Zitationsgraphen zu erzeugen, welcher die zu einem Dokument ähnlichsten anderen Publikationen in Graphenform darstellt. Ein Beispiel für einen solchen Graphen ist im Demonstrator zu sehen.

Herausforderungen

Bei der Betrachtung weiterer Repositorien wurde jedoch deutlich, dass nicht in allen Repositorien vollständige Metadatensets zu den einzelnen Publikationen vorliegen. In vielen Repositorien liegt nur ein minimales Set an Metadaten vor, meistens beschränkt auf Autor, Titel, Journal, manchmal sogar ohne einen Volltextlink. Dieses Set genügt jedoch nicht zur Erzeugung von Zitationsgraphen, da die Zitations- und Referenzinformationen nicht vorliegen. Somit war eines der zentralen Arbeitspakete die Suche nach Möglichkeiten, die Qualität und Vollständigkeit der Metadaten zu verbessern. Es wurden hier drei unterschiedliche Herangehensweisen identifiziert.

Metadatenextraktion aus Volltexten

Zum Einen kann mit Hilfe von Algorithmen zur Referenzextraktion, wie sie beispielsweise von CiteSeerX und Citebase eingesetzt werden, aus den vorliegenden Volltexten ein Set von Metadaten extrahiert werden.

Hierbei ergeben sich allerdings gleich wieder neue Hindernisse. Nicht jedes Dokument hat einen entsprechenden Volltextlink und nicht jeder Volltextlink verweist auch tatsächlich auf einen Volltext. So ist es oftmals der Fall, dass Volltextlinks auf eine beschreibende Seite führen, von der wiederum mehrere Links abgehen. Einer von diesen führt manchmal direkt zum gewünschten Dokument, manchmal muss man aber noch eine Ebene tiefer nach dem Volltext suchen.

Hat man diese Hürde jedoch überwunden und den Volltext eines Dokuments gefunden, so ist immer noch nicht gewährleistet, dass dieser auch verarbeitet werden kann. Manche PDF-Dokumente enthalten zum Beispiel keinen maschinenlesbaren Text, da es sich um Scans von Ausdrucken des Dokuments handelt.

In einem Test mit dem Citebase-Extraktor auf einer Testmenge von ca. 65.000 Dokumenten aus dem Citebase Datenbestand wurden so nur etwa 2.000 Dokumente mit einem herunterladbaren Volltext gefunden (ca. 3%). Von diesen 2.000 Volltexten konnten schließlich etwa 1.000 Dateien (ca. 1,5%) vom Extraktor verarbeitet werden.

Neben den Hürden der Verfügbarkeit und der maschinellen Lesbarkeit von Volltexten ist, insbesondere im Hinblick auf die Erfassung von Referenzinformationen, das nächste Problem die unterschiedliche Form von Zitierstilen in unterschiedlichen Disziplinen und Journalen, welche die Qualität der extrahierten Metadaten entscheidend beeinflusst.

Manuelle Ergänzung unvollständiger Metadatensätze

Eine weitere Möglichkeit die Vollständigkeit von Metadaten zu verbessern, liegt in der direkten Beteiligung der Autoren. Indem man ein Tool entwickelt, mit welchem die in Repositorien vorhandenen Metadaten editiert und vervollständigt werden können, hätte jeder Autor die Möglichkeit einen optimalen Satz an Metadaten zu jeder seiner Publikationen zu erstellen.

Upload von Publikation inklusive vollständiger Metadaten

Die dritte Alternative bezieht sich auf noch nicht publizierte Dokumente. Bei dieser Gruppe der zukünftigen Publikationen bietet sich die Möglichkeit an, ein Tool zu entwickeln, mit welchem direkt das komplette Set an Metadaten zum entsprechenden Repository mit übermittelt wird. Dabei kann eine solche Lösung eine Mischung aus den beiden vorher genannten Herangehensweisen darstellen.

So kann die Publikation zum einen durch Metadaten, welche bereits in BibTeX oder EndNote vorliegen, ergänzt werden. Zum zweiten kann der Volltext maschinell untersucht werden und so evtl. fehlende Daten nachgetragen werden. In einem letzten Schritt kann der Autor die so gesammelten Informationen manuell überarbeiten.

Ausblick und Vorhaben für die dritte Projektphase

In der bald beginnenden dritten Projektphase wird insbesondere das Problem der Anreicherung, Vervollständigung und Korrektur der Metadaten angegangen. Dabei wird eine Kombination der drei hier geschilderten Ansätze implementiert und getestet werden.

Des Weiteren wird die dritte Projektphase der massiven Erweiterung des Datenraumes dienen. Für diese Phase wurden mit dem Konrad-Zuse-Zentrum für Informationstechnik (ZIB), als Leiter der Zentrale des Kooperativen Bibliotheksverbund Berlin-Brandenburg (KOBV) und dem Konstanzer Online Publikationssystem (KOPS), weitere Partner hinzugewonnen, welche die Vernetzung von DOARC mit OPUS und DSpace-Repositorien vorantreiben werden und damit unter Anderem die Internationalisierung des Projekts unterstützen werden.

Da davon auszugehen ist, dass man einige Publikationen in mehreren Repositorien wiederfinden wird, stellt sich zusätzlich das Problem der Identifikation solcher Dubletten und die Frage der Zusammenführung der Datensätze. Hier geht DOARC mit zwei unterschiedlichen Strategien vor. Zum Einen wird mit der in OA-Netzwerk entwickelten Dublettenkontrolle auf Basis der Volltexte nach Dubletten gesucht. Zum Anderen wird, nach der positiven Erfahrung mit dem Autoridentifikationsdienst authorclaim, durch die Integration in das internationale ORCID-Projekt der Versuch unternommen, mittels Autoridentifizierungsdiensten Dubletten aufzufinden.

(Michael Maune, Januar 2011)

Erfahrungsberichte zum neuen DINI-Zertifikat 2010

Im Rahmen des vor kurzem in Berlin veranstalteten DINI-Helmholtz-Workshops zur „Praxis und Vision von Repositorien“ wurde auch eine Session zum neuen DINI-Zertifikat 2010 angeboten. Moderiert von Uwe Müller und auch unter Beteiligung einiger Zertifikatsgutachter diskutierten die Teilnehmer anhand konkreter Beispiele, Fragen und Problempunkte im Zertifizierungsprozess.

Über den damit – hoffentlich – verbundenen Erkenntnisgewinn hinaus, soll durch derartige Veranstaltungen bei den Teilnehmern, gerade auch bei Neulingen, ein Bewusstsein dafür geschaffen werden, dass auf beiden Seiten des Zertifizierungsprozesses Partner sitzen. Viele Einrichtungen haben mit ähnlichen Herausforderungen umzugehen und Vernetzung ist hilfreich.

Einleitend stellte Uwe Müller (Humboldt Universität zu Berlin) den Zertifizierungsprozess und die wesentlichen inhaltlichen Neuerungen des Zertifikats vor. Die Beantragung wurde vereinfacht, da der webbasierte Fragebogen nunmehr den Kriterien des Zertifikats entspricht. Durch Zwischenspeichern und eine verteilte Bearbeitung können Einrichtungen jetzt also ohne großen Aufwand anhand dieser Checkliste testen wie weit ihr Repository bereits mit den Zertifikatskriterien compliant ist.

Daran anschließend stellte Stefan Buddenbohm (Niedersächsische Staats- und Universitätsbibliothek Göttingen) das institutionelle Repository der Universität Göttingen, GoeScholar vor. Für den DSpace-basierten Dienst ist eine Zertifizierung geplant. Die noch offenen Punkte teilen sich in technische und organisatorische Fragen auf, wobei sich die zur Verfügung stehenden hausinternen Ressourcen erwartungsgemäß als Engpass erweisen. Insbesondere die erweiterten Anforderungen an die OAI-Schnittstelle und die damit zusammenhängenden Metadatenanforderungen sind bei GoeScholar noch nicht vollständig umgesetzt. Einzelheiten im hier verlinkten Vortrag.

Mit EconStor wurde danach ein anderer DSpace-basierter Dienst durch Jan Weiland (Deutsche Zentralbibliothek für Wirtschaftswissenschaften) vorgestellt. Bei EconStor handelt es sich allerdings um ein disziplinäres Repositorium für die Wirtschaftswissenschaften, das sich bereits in der Antragsphase befindet. Diskutiert wurden hier u.a. die Anforderungen des Zertifikats in Bezug auf Dokumentenerschließung, insb. die Abbildung der Nutzungsrechte in den Metadaten, das Gemeinsame Vokabular für Dokumententypen  sowie die Besonderheiten, die sich mit  Arbeits- und Konferenzpapieren verbinden, die oftmals Versionierungen unterliegen. Einzelheiten auch hier im verlinkten Vortrag.

Thoralf Klein (Konrad-Zuse-Zentrum für Informationstechnik) ging abschließend stellvertretend für die OPUS-4-Entwickler auf die Kompatibilität der überarbeiteten und frisch veröffentlichten Repository-Plattform mit dem DINI-Zertifikat ein. Die Anforderungen des Zertifikats wurden bei Entwicklung ausdrücklich berücksichtigt, so dass sich zumindest von technischer Seite her keine Schwierigkeiten bei der Zertifizierung ergeben sollten.

Resümierend wurde deutlich, dass die technischen Anforderungen an die Repository-Plattform nur eine – und oftmals lösbarere – Aufgabe bei der Zertifizierung stellen. Gerade bei weit verbreiteten und Open-Source-basierten Plattformen kann eine Weiterentwicklung oft recht schnell umgesetzt werden. Anders bei besonderen Anforderungen der Einrichtungen und dadurch vorgegebenen Standards. Hier sind Änderungen wesentlich schwieriger, bisweilen ungewünscht und vor allem stellt sich die Ressourcenfrage, da die betroffenen Einrichtungen selbst in der Verantwortung stehen. Das Dilemma aller Standardisierungsbemühungen: die notwendige Arbeit muss zu einem Gutteil lokal erbracht werden, die Vorteile stehen jedoch global allen Einrichtungen als Nutznießern zur Verfügung. Was aber – und das als versöhnliches Schlußwort – den Aufwand doch umso nutzbringender erscheinen lässt.

An dieser Stelle auch der Hinweis an interessierte Einrichtungen, dass sie bei der Zertifizierung ihrer Dienste auf die Unterstützung von OA-Netzwerk zurückgreifen können. Sie sind herzlich zur Zertifizierung eingeladen!

Vorträge der DINI-Jahrestagung online verfügbar

Am 22. und 23. September fand die DINI-Jahrestagung an der BTU Cottbus statt. Die Vortragsfolien sind nunmehr online zugänglich, die Mitschnitte der Vorträge sollen noch folgen.

Zu den Vorträgen hier entlang bitte.

DINI-Workshop „Das kleine 1×1 für Repositorien“ auf den OA-Tagen

OA-Tage 2010Die alljährlichen OA-Tage stehen vor der Tür! Dieses Jahr werden sie von der Niedersächsischen Staats- und Universitätsbibliothek Göttingen ausgerichtet und dabei von der Informationsplattform Open-Access.net unterstützt. Die OA-Tage finden am 4. und 5. Oktober statt.

Ein für Repositorienbetreiber besonders interessanter Programmpunkt ist der DINI-Workshop zum „Kleinen 1×1 für Repositorien“.  Das Angebot richtet sich dabei insbesondere auch an Einrichtungen, die den Aufbau eines Repositoriums noch planen und Unterstützung suchen:

Die Session richtet sich an Tagungsteilnehmer, die für ihre Institution oder für ein Fachgebiet den Aufbau eines Repositoriums planen bzw. ein bereits bestehendes Repositorium verbessern, neu ausrichten oder besser platzieren möchten. In insgesamt vier Teilen widmet sich der Workshop zunächst einer Einführung (grundsätzliche Fragestellungen und erste Schritte), der technischen und organisatorischen Realisierung (Auswahl von Software bzw. eines Hosting-Dienstes), relevanten rechtlichen Fragestellungen beim Betrieb (Autorenverträge, Lizenzen, Haftung) und schließlich dem DINI-Zertifikat (Anforderungen, Beantragung, Unterstützung und Hilfestellung).

Ein Besuch des Workshops setzt die Teilnahme an den OA-Tagen voraus. Eine Anmeldung ist hier möglich.

UPDATE: Hier sind die Vortragsfolien verfügbar.

Upload-Formulare in Repositorien

Eine interessante Artikelserie zu Upload-Formularen von Repositorien findet sich bei den Kollegen von Infobib. Ausgangspunkt ist die Erfahrung, die wohl die meisten Betreiber von Repositorien miteinander teilen, wenn ratlose oder überforderte Nutzer sie ansprechen (O-Ton Infobib):

  1. “Welche Lizenz wähle ich?”
  2. “Um Himmels Willen, muss ich das alles ausfüllen?”
  3. “Was ist SWD, warum sieht die aus wie eine Webseite von 2001 und vor allem: Was soll ich damit?”
  4. “Muss das wirklich so kompliziert sein?”

Diese und ähnliche Fragen kulminieren oft in: “Können Sie das vielleicht für mich übernehmen?”

Neben einer Erfassung und kritischen Bewertung des Status Quo finden sich auch eine Reihe von Anregungen, wie man es als Repositoriumsbetreiber besser machen kann.