OA-Tage 2011: Anmeldung ist freigeschaltet, Session zum DINI-Zertifikat

Die Anmeldung zu den diesjährigen Open-Access-Tagen in Regensburg ist freigeschaltet und die Teilnehmerliste beginnt sich auch bereits zu füllen. Das Programm ist ebenfalls bereits einzusehen und es wird – wie auch in den vergangenen Jahren – wieder eine Workshop-Session zum DINI-Zertifikat geben unter dem Motto: DINI-Zertifizierung von Repositorien – einfacher als gedacht.

Werbeanzeigen

Open Access und Elektronisches Publizieren auf dem Bibliothekartag

Vom 7. bis 10 Juni findet in Berlin der 100. Deutsche Bibliothekartag unter dem Motto „Bibliotheken für die Zukunft – Zukunft für die Bibliotheken“ statt. In Zeiten von Web 2.0 soll die Bibliothek als Ort des Bewahrens von Wissen und kulturellem Erbe geschützt und gefördert werden. Hierfür sind freier Zugang zu Wissen und Bildung, globaler Wissenstransfer, Exzellenzforschung, aber auch Leseförderung wichtige Bausteine um nur einige der genannten Forderungen zu nennen. Von der Forderung nach freiem Zugang zu Wissen und Bildung ist es nicht weit zu Open Access und Elektronischem Publizieren. Beide Begriffe klammern thematisch die Projekte ein, die sich auf dem Gemeinschaftsstand im Rahmen des Bibliothekartags interessierten Besuchern vorstellen. Der Gemeinschaftsstand ist eine Initiative der Arbeitsgruppe Elektronisches Publizieren der Deutschen Initiative für Netzwerkinformation e.V. (DINI) und OA-Netzwerk. Der Stand hat die Nummer H06 und befindet sich gegenüber des Vortragssaals A. Im Ausstellerverzeichnis ist er unter dem Titel „Open Access & Elektronisches Publizieren: Gemeinschaftsstand der OA-Projekte in Deutschland und der DINI-AG Elektronisches Publizieren“ verzeichnet. Folgende Projekte sind vertreten:

OA-Netzwerk

OA-Statistik

OA-Plagiatsuche

OA-Fachrepositorien

OA-Policies

OAPEN

DOARC

CARPET

OJS|de

Informationsplattform open-access.net

LuKII – LOCKSS und Kopal Infrastruktur und Interoperabilität

Was erwartet Sie am Stand?

Ansprechpartner der Projekte, eine anschauliche digitale Präsentation und zahlreiche Informationsmaterialien der einzelnen Projekte machen einen Besuch am Stand lohnenswert. Wir informieren über unsere Mehrwertdienste, über die individuellen Projekte, aber auch generell über Open Access und Elektronisches Publizieren. Auch das DINI-Zertifikat für Dokumenten- und Publikationsservices ist am Stand vertreten.

Welche Zielgruppe möchten wir erreichen?

Wir möchten mit dem Stand sowohl andere Projekte ansprechen, die sich mit uns austauschen wollen, aber auch Bibliotheken und Forschungseinrichtungen, die sich für die vorgestellten Mehrwertdienste und Technologien interessieren. Wenn Sie Fragen oder Wünsche haben, schreiben Sie uns oder hinterlassen Sie uns einen Kommentar hier im Blog. Wir freuen uns, Sie am Stand persönlich zu begrüßen.

DINI-Zertifikat 2010 in Version 3.1 veröffentlicht

Nach der Veröffentlichung der englischen Fassung des DINI-Zertifikats (siehe http://nbn-resolving.de/urn:nbn:de:kobv:11-100182800 und Nachricht vom 13.04.2011) gibt es nun auch eine neue Version der deutschen Fassung, in der einige Fehler und Mehrdeutigkeiten beseitigt sind (http://nbn-resolving.de/urn:nbn:de:kobv:11-100182794). Nach wie vor freut sich die DINI-AG Elektronisches Publizieren über kritische Kommentare oder Wünsche zum Zertifikat: Kontaktformular.

Außerdem möchten wir an dieser Stelle auf die überarbeitete DINI-Liste der elektronischen Repositorien hinweisen. Sie findet sich unter http://www.dini.de/dini-zertifikat/liste-der-repositorien/. Auf dieser Seite können auch Vorschläge für Ergänzungen der Liste gemacht werden.

English version of the DINI Certificate “Document and Publication Services” 2010 has been published

Download the certificate as PDF hereIn summer 2010 the DINI working group for Electronic Publishing released the third edition of the DINI Certificate “Document and Publication Services” and by this adapted the well-established criteria catalogue for scholarly repository services to current developments. Now, the English version of the DINI Certificate 2010 has been made available to the public.

The global scientific communication system is subject to a fundamental transition process. Due to new opportunities arising from the internet and other information and communication technologies and also to the changing requirements of scholars and scientists, new means and channels for scientific communication develop. A leading development is the global Open Access movement committed to the idea of freely available scientific and scholarly publications.

To support the numerous developments in Germany and to set common standards for publication infrastructures DINI’s Electronic Publishing working group embraced this topic early on and in 2002 published its first recommendations for “Electronic Publishing in Higher Education”. Based on these documents, the working group formulated criteria and formalized them in the DINI Certificate “Document and Publication Services”. Following the 2004 and 2007 editions, 2010 is the third version of the document. The certificate describes technical, organisational and legal aspects that should be considered in the process of setting up and operating a scholarly repository service and puts considerable interest in Open Access. The aim of DINI is to move forward towards a standardised and interoperable repository landscape to improve the visibility and linkages of scientific publications. During the years the DINI certificate has gained reputation as standard-setting authority for repositories.

The latest edition of the DINI certificate addresses particularly the following aspects:
• The growing importance of the “golden road” to Open Access.
• The increased demand for interoperability with comprehensive services.
• The growing technical virtualization of Document and Publication Services (hosting of services)..
• A comprehensive view of the scientific and scholarly research processes.

The new English version can be found at http://nbn-resolving.de/urn:nbn:de:kobv:11-100182800.

Today, there are about 140 OA repositories in Germany. A list of German repositories can be found here.

Different DINI projects such as OA Network and OA Statistics promote the further development of repositories in Germany. Please visit this site for an overview.

About DINI
The German Initiative for Network Information (DINI, Deutsche Initiative für Netzwerkinformation) is the most relevant organisation in Germany for supporting a national repository infrastructure. DINI is organised in working groups for thematic fields like IPR, Standards and Electronic Publishing. DINI regularly organises workshops and conferences for promoting the use and the quality of digital repositories. It has initiated several projects to support the technical development of a network of digital repositories and actively encourages the process of DINI certification. The DINI certificate was developed and is regularly updated by the Electronic Publishing working group. The certification process evaluates and improves the quality of publication services by referring to international standards and quality criteria. In consequence, the process improves data quality and conformity to enable services and the networking of repositories. Currently 37 German repositories have received the DINI certificate.

Contact:

Dr. Uwe Müller // u.mueller@dnb.de

Frank Scholze // frank.scholze@kit.edu

Vernetzungstage 2011 und IUWIS-Workshop „Urheberrecht und Repositorien“: Programm online und Registrierung offen

Ein Veranstaltungshinweis in eigener Sache:

Wir möchten Sie hiermit herzlich zu den Vernetzungstagen 2011 und dem IUWIS-Workshop „Urheberrecht und Repositorien“ vom 2. bis 4. März in Osnabrück einladen.

Sie finden die Tagungswebseite hier.

Dort finden Sie das Tagungsprogramm und alle notwendigen Informationen, einschließlich der Möglichkeit zur Anmeldung. Bitte registrieren Sie sich baldmöglichst, da wir nur eine begrenzte Anzahl an Teilnehmerplätzen zur Verfügung stellen können

Die Vernetzungstage 2011 werden vom DFG-Projekt „Open-Access-Netzwerk 2“ (OA-Netzwerk) in Zusammenarbeit mit Zusammenarbeit mit dem Projekt IUWIS und der Deutschen Initiative für Netzwerkinformation e. V. (DINI) gestaltet und an der Universität Osnabrück durch das Institut für wissenschaftliche Information Osnabrück e.V. (IWI) ausgerichtet.

Distributed Open Access Reference and Citation Services

DOARC – Distributed Open Access Reference and Citation Services ist eines der DINI-Partnerprojekte von OA-Netzwerk. Im Folgenden stellt Michael Maune, Mitarbeiter bei DOARC, das Projekt vor.

Distributed Open Access Reference and Citation Services

Das DOARC-Projekt hat soeben die zweite Projektphase abgeschlossen und befindet sich auf dem Weg in die dritte Phase. Die Grundidee des Projekts ist im Portal des Cluster Science Network (CSN) illustriert. Dabei wurden die Metadaten des CSN in DOARC importiert. Dort wurden Zitationsgraphen erzeugt, welche die Ähnlichkeit zwischen unterschiedlichen Publikationen anhand der Co-Zitationen darstellen. Die so berechneten Daten werden anschließend an CSN exportiert. So wird die Suche nach interessanten und relevanten Publikationen um eine weitere Dimension ergänzt.

Vorgehen

Die Vorgehensweise, ist dabei in folgende Verarbeitungsschritte unterteilt:

  1. Import der Metadaten
  2. Aufbereitung der Metadaten
  3. Berechnung der Zitationsähnlichkeit
  4. Erzeugung von Zitationsgraphen
  5. Export der Ergebnisse
  6. Visualisierung der Ergebnisse

Die bei vielen Repositorien etablierte OAI-PMH Schnittstelle, welche in den meisten Fällen dc-simple übertragt, erwies sich hier für die Übertragung von komplexen Referenz- und Zitationsinformationen als nicht ausreichend. Aus diesem Grunde wurde in der jetzt abgeschlossenen Projektphase in Kooperation mit dem CSN, welches eine Datenbasis für die Cluster-Chemie darstellt und über ein vollständiges Set an Referenzdaten für jede dort verfügbare Publikation verfügt, ein Weg zum Datenaustausch über eine für diesen Zweck entwickelte REST-Schnittstelle etabliert.

Die Berechnung der Ähnlichkeiten zwischen den Publikationen wurde in dieser Projektphase ebenfalls erfolgreich implementiert und getestet. Dabei wird anhand der Co-Zitationen der Jaccard-Index berechnet und als Ähnlichkeitsmaß gespeichert. Dieses Ähnlichkeitsmaß wird dann genutzt, um einen Zitationsgraphen zu erzeugen, welcher die zu einem Dokument ähnlichsten anderen Publikationen in Graphenform darstellt. Ein Beispiel für einen solchen Graphen ist im Demonstrator zu sehen.

Herausforderungen

Bei der Betrachtung weiterer Repositorien wurde jedoch deutlich, dass nicht in allen Repositorien vollständige Metadatensets zu den einzelnen Publikationen vorliegen. In vielen Repositorien liegt nur ein minimales Set an Metadaten vor, meistens beschränkt auf Autor, Titel, Journal, manchmal sogar ohne einen Volltextlink. Dieses Set genügt jedoch nicht zur Erzeugung von Zitationsgraphen, da die Zitations- und Referenzinformationen nicht vorliegen. Somit war eines der zentralen Arbeitspakete die Suche nach Möglichkeiten, die Qualität und Vollständigkeit der Metadaten zu verbessern. Es wurden hier drei unterschiedliche Herangehensweisen identifiziert.

Metadatenextraktion aus Volltexten

Zum Einen kann mit Hilfe von Algorithmen zur Referenzextraktion, wie sie beispielsweise von CiteSeerX und Citebase eingesetzt werden, aus den vorliegenden Volltexten ein Set von Metadaten extrahiert werden.

Hierbei ergeben sich allerdings gleich wieder neue Hindernisse. Nicht jedes Dokument hat einen entsprechenden Volltextlink und nicht jeder Volltextlink verweist auch tatsächlich auf einen Volltext. So ist es oftmals der Fall, dass Volltextlinks auf eine beschreibende Seite führen, von der wiederum mehrere Links abgehen. Einer von diesen führt manchmal direkt zum gewünschten Dokument, manchmal muss man aber noch eine Ebene tiefer nach dem Volltext suchen.

Hat man diese Hürde jedoch überwunden und den Volltext eines Dokuments gefunden, so ist immer noch nicht gewährleistet, dass dieser auch verarbeitet werden kann. Manche PDF-Dokumente enthalten zum Beispiel keinen maschinenlesbaren Text, da es sich um Scans von Ausdrucken des Dokuments handelt.

In einem Test mit dem Citebase-Extraktor auf einer Testmenge von ca. 65.000 Dokumenten aus dem Citebase Datenbestand wurden so nur etwa 2.000 Dokumente mit einem herunterladbaren Volltext gefunden (ca. 3%). Von diesen 2.000 Volltexten konnten schließlich etwa 1.000 Dateien (ca. 1,5%) vom Extraktor verarbeitet werden.

Neben den Hürden der Verfügbarkeit und der maschinellen Lesbarkeit von Volltexten ist, insbesondere im Hinblick auf die Erfassung von Referenzinformationen, das nächste Problem die unterschiedliche Form von Zitierstilen in unterschiedlichen Disziplinen und Journalen, welche die Qualität der extrahierten Metadaten entscheidend beeinflusst.

Manuelle Ergänzung unvollständiger Metadatensätze

Eine weitere Möglichkeit die Vollständigkeit von Metadaten zu verbessern, liegt in der direkten Beteiligung der Autoren. Indem man ein Tool entwickelt, mit welchem die in Repositorien vorhandenen Metadaten editiert und vervollständigt werden können, hätte jeder Autor die Möglichkeit einen optimalen Satz an Metadaten zu jeder seiner Publikationen zu erstellen.

Upload von Publikation inklusive vollständiger Metadaten

Die dritte Alternative bezieht sich auf noch nicht publizierte Dokumente. Bei dieser Gruppe der zukünftigen Publikationen bietet sich die Möglichkeit an, ein Tool zu entwickeln, mit welchem direkt das komplette Set an Metadaten zum entsprechenden Repository mit übermittelt wird. Dabei kann eine solche Lösung eine Mischung aus den beiden vorher genannten Herangehensweisen darstellen.

So kann die Publikation zum einen durch Metadaten, welche bereits in BibTeX oder EndNote vorliegen, ergänzt werden. Zum zweiten kann der Volltext maschinell untersucht werden und so evtl. fehlende Daten nachgetragen werden. In einem letzten Schritt kann der Autor die so gesammelten Informationen manuell überarbeiten.

Ausblick und Vorhaben für die dritte Projektphase

In der bald beginnenden dritten Projektphase wird insbesondere das Problem der Anreicherung, Vervollständigung und Korrektur der Metadaten angegangen. Dabei wird eine Kombination der drei hier geschilderten Ansätze implementiert und getestet werden.

Des Weiteren wird die dritte Projektphase der massiven Erweiterung des Datenraumes dienen. Für diese Phase wurden mit dem Konrad-Zuse-Zentrum für Informationstechnik (ZIB), als Leiter der Zentrale des Kooperativen Bibliotheksverbund Berlin-Brandenburg (KOBV) und dem Konstanzer Online Publikationssystem (KOPS), weitere Partner hinzugewonnen, welche die Vernetzung von DOARC mit OPUS und DSpace-Repositorien vorantreiben werden und damit unter Anderem die Internationalisierung des Projekts unterstützen werden.

Da davon auszugehen ist, dass man einige Publikationen in mehreren Repositorien wiederfinden wird, stellt sich zusätzlich das Problem der Identifikation solcher Dubletten und die Frage der Zusammenführung der Datensätze. Hier geht DOARC mit zwei unterschiedlichen Strategien vor. Zum Einen wird mit der in OA-Netzwerk entwickelten Dublettenkontrolle auf Basis der Volltexte nach Dubletten gesucht. Zum Anderen wird, nach der positiven Erfahrung mit dem Autoridentifikationsdienst authorclaim, durch die Integration in das internationale ORCID-Projekt der Versuch unternommen, mittels Autoridentifizierungsdiensten Dubletten aufzufinden.

(Michael Maune, Januar 2011)

Erfahrungsberichte zum neuen DINI-Zertifikat 2010

Im Rahmen des vor kurzem in Berlin veranstalteten DINI-Helmholtz-Workshops zur „Praxis und Vision von Repositorien“ wurde auch eine Session zum neuen DINI-Zertifikat 2010 angeboten. Moderiert von Uwe Müller und auch unter Beteiligung einiger Zertifikatsgutachter diskutierten die Teilnehmer anhand konkreter Beispiele, Fragen und Problempunkte im Zertifizierungsprozess.

Über den damit – hoffentlich – verbundenen Erkenntnisgewinn hinaus, soll durch derartige Veranstaltungen bei den Teilnehmern, gerade auch bei Neulingen, ein Bewusstsein dafür geschaffen werden, dass auf beiden Seiten des Zertifizierungsprozesses Partner sitzen. Viele Einrichtungen haben mit ähnlichen Herausforderungen umzugehen und Vernetzung ist hilfreich.

Einleitend stellte Uwe Müller (Humboldt Universität zu Berlin) den Zertifizierungsprozess und die wesentlichen inhaltlichen Neuerungen des Zertifikats vor. Die Beantragung wurde vereinfacht, da der webbasierte Fragebogen nunmehr den Kriterien des Zertifikats entspricht. Durch Zwischenspeichern und eine verteilte Bearbeitung können Einrichtungen jetzt also ohne großen Aufwand anhand dieser Checkliste testen wie weit ihr Repository bereits mit den Zertifikatskriterien compliant ist.

Daran anschließend stellte Stefan Buddenbohm (Niedersächsische Staats- und Universitätsbibliothek Göttingen) das institutionelle Repository der Universität Göttingen, GoeScholar vor. Für den DSpace-basierten Dienst ist eine Zertifizierung geplant. Die noch offenen Punkte teilen sich in technische und organisatorische Fragen auf, wobei sich die zur Verfügung stehenden hausinternen Ressourcen erwartungsgemäß als Engpass erweisen. Insbesondere die erweiterten Anforderungen an die OAI-Schnittstelle und die damit zusammenhängenden Metadatenanforderungen sind bei GoeScholar noch nicht vollständig umgesetzt. Einzelheiten im hier verlinkten Vortrag.

Mit EconStor wurde danach ein anderer DSpace-basierter Dienst durch Jan Weiland (Deutsche Zentralbibliothek für Wirtschaftswissenschaften) vorgestellt. Bei EconStor handelt es sich allerdings um ein disziplinäres Repositorium für die Wirtschaftswissenschaften, das sich bereits in der Antragsphase befindet. Diskutiert wurden hier u.a. die Anforderungen des Zertifikats in Bezug auf Dokumentenerschließung, insb. die Abbildung der Nutzungsrechte in den Metadaten, das Gemeinsame Vokabular für Dokumententypen  sowie die Besonderheiten, die sich mit  Arbeits- und Konferenzpapieren verbinden, die oftmals Versionierungen unterliegen. Einzelheiten auch hier im verlinkten Vortrag.

Thoralf Klein (Konrad-Zuse-Zentrum für Informationstechnik) ging abschließend stellvertretend für die OPUS-4-Entwickler auf die Kompatibilität der überarbeiteten und frisch veröffentlichten Repository-Plattform mit dem DINI-Zertifikat ein. Die Anforderungen des Zertifikats wurden bei Entwicklung ausdrücklich berücksichtigt, so dass sich zumindest von technischer Seite her keine Schwierigkeiten bei der Zertifizierung ergeben sollten.

Resümierend wurde deutlich, dass die technischen Anforderungen an die Repository-Plattform nur eine – und oftmals lösbarere – Aufgabe bei der Zertifizierung stellen. Gerade bei weit verbreiteten und Open-Source-basierten Plattformen kann eine Weiterentwicklung oft recht schnell umgesetzt werden. Anders bei besonderen Anforderungen der Einrichtungen und dadurch vorgegebenen Standards. Hier sind Änderungen wesentlich schwieriger, bisweilen ungewünscht und vor allem stellt sich die Ressourcenfrage, da die betroffenen Einrichtungen selbst in der Verantwortung stehen. Das Dilemma aller Standardisierungsbemühungen: die notwendige Arbeit muss zu einem Gutteil lokal erbracht werden, die Vorteile stehen jedoch global allen Einrichtungen als Nutznießern zur Verfügung. Was aber – und das als versöhnliches Schlußwort – den Aufwand doch umso nutzbringender erscheinen lässt.

An dieser Stelle auch der Hinweis an interessierte Einrichtungen, dass sie bei der Zertifizierung ihrer Dienste auf die Unterstützung von OA-Netzwerk zurückgreifen können. Sie sind herzlich zur Zertifizierung eingeladen!