Skip to content
Publicly Available Published by De Gruyter Saur January 8, 2021

Text und Data-Mining – juristische Fallstricke und bibliothekarische Handlungsfelder

Text and data mining – legal pitfalls and new fields of action for libraries
  • Peter Brettschneider

    Peter Brettschneider

    ORCID logo EMAIL logo
From the journal Bibliotheksdienst

Zusammenfassung

2018 wurde im deutschen Urheberrecht mit § 60d UrhG eine gesetzliche Erlaubnis für Text- und Data-Mining eingeführt. Inzwischen konnte praktische Erfahrung mit der Anwendung dieser Norm gesammelt werden. Der Aufsatz geht sowohl aus bibliothekarischer als auch juristischer Sicht auf die dabei aufgetauchten Hürden ein und bietet eine Vorschau auf die bevorstehende Novellierung der Norm im Zuge der EU-Richtlinie 2019/790.

Abstract

With § 60d UrhG, a legal permission for text and data mining was introduced in German copyright law in 2018. Meanwhile, practical experience with the new standard has been gained. The article addresses obstacles that arise from both a library and legal point of view, and looks ahead to the upcoming amendment of the standard in the course of EU Directive 2019/790.

Einleitung

Im Zuge des Urheberrechtswissens-Gesellschafts-Gesetzes wurde 2018 mit dem gesetzlichen Erlaubnistatbestand zum Text- und Data-Mining (TDM) in § 60d UrhG eine gänzlich neue Schrankenbestimmung ins Urheberrecht aufgenommen. Geradezu unausweichlich ist, dass die Anwendung einer noch unerprobten Norm praktisch mit Friktion einhergeht, während die verschiedenen Akteure versuchen, die Grenzen der Regelung auszuloten und ihre Positionen möglichst optimal durchzusetzen.

Dies war an der Universität Konstanz zu erleben, als mehrere Forschergruppen an das Kommunikations-, Informations- und Medienzentrum (KIM Konstanz) mit der Bitte um Unterstützung bei TDM-Projekten herantraten. Datenquellen sollten dabei die Online-Archive verschiedener Tageszeitungen und Nachrichtenagenturen sein. Teilweise waren diese an der Universität auf Basis von Campuslizenzen bereits verfügbar, teilweise waren mit den Anbietern aber Datenlieferungen erst noch auszuhandeln. Die dabei gemachten Erfahrungen werden im Folgenden geschildert; insbesondere soll aus einer praktischen Sicht auf Fallstricke bei der Anwendung von § 60d UrhG eingegangen werden.

Zugleich bietet der Beitrag eine Vorschau auf die Novellierung des TDM, die durch die EU-Richtlinie über das Urheberrecht und die verwandten Schutzrechte im digitalen Binnenmarkt – Richtlinie (EU) 2019/790 – die sogenannte Digital-Single-Market-Richtlinie (DSM-Richtlinie) notwendig und im Sommer 2021 in Kraft treten wird. Insbesondere wird hinterfragt, ob es gelungen ist, Abhilfe für die Schwachpunkte der bisherigen Regelung zu schaffen.

1 Rolle der Bibliothek bei TDM

§ 60d UrhG privilegiert die wissenschaftliche Forschung; TDM mag daher auf den ersten Blick nicht wie ein bibliothekarisches Betätigungsfeld wirken. Das Gegenteil ist der Fall: Bibliotheken sind gerade für Digital Humanities natürliche Partner beim TDM:

Erstens vermitteln Bibliotheken Zugang zu Ihren Beständen.[1] Bibliotheken halten als Resultat der Digitalisierungsanstrengungen der letzten Jahrzehnte einen riesigen Vorrat an digitalen Forschungsdaten vor, der aus den physischen Beständen bedarfsorientiert erweitert werden kann.[2] Hier eröffnen sich neue Geschäftsfelder für wissenschaftliche Bibliotheken – so präsentiert sich etwa die DNB mit dem Dienst DNBLab als Datenlieferant für die Forschung.[3] Andernorts bringen Forschungs- und Infrastruktureinrichtungen ihre jeweilige Expertise in gemeinsame Projekte ein. Spannend ist in diesem Kontext z. B. das Projekt MimoText, das geisteswissenschaftliches Quellenmaterial als Linked Open Data aufbereiten und zur Nachnutzung bereitstellen soll.[4] Darüber hinaus haben Bibliotheken jahrzehntelange Erfahrung im Lizenzieren digitaler Medien. Anders als für viele Forschende ist für Bibliothekare die Erwerbung von Datenbanken oder Datensätzen nicht Einzelfall, sondern standardisierter Geschäftsgang. Die Erfahrung im Hinblick auf Lizenzbedingungen, Preise und praktische Abwicklung prädestiniert Bibliotheken für eine Rolle als Partner der Wissenschaft bei der Datenlizenzierung.

Zweitens sind Bibliotheken Dienstleister bei der Datenarchivierung.[5] Ihre Rolle beschränkt sich aber keinesfalls auf die Bereitstellung von Datenrepositorien, vielmehr werden solche Infrastrukturangebote von begleitenden Diensten (z. B. Datenkuratierung, Vergabe persistenter Identifikatoren) und Beratungsangeboten flankiert.

Drittens führen Bibliotheken selbst wissenschaftliche Forschung durch. Dies betrifft keineswegs nur Forschungsbibliotheken; vielmehr eignen sich Mustererkennung und -vergleich auch für klassische bibliothekarische Aufgaben.[6] Zum Beispiel experimentiert die DNB seit mehr als zehn Jahren mit automatisierten Verfahren, die vorhandene Metadatenbestände zur automatisierten Erschließung und Metadatenanreicherung neuer Medien nutzen.[7] Inzwischen sind diese nicht unumstrittenen Verfahren längst im Produktivbetrieb.[8]

2 Rechtliche Regelungen zum TDM

Technisch ist TDM die Antwort auf die Herausforderung, aus den im Zuge der Digitalisierung von Gesellschaft und Forschung entstandenen riesigen Datenbeständen Informationen zu extrahieren.[9] Einer intellektuellen Auswertung sind diese oft nicht mehr zugänglich, stattdessen wird zunehmend auf softwaregestützte Methoden gesetzt. Raue definiert TDM dementsprechend als „Sammelbegriff für Analyseverfahren, mit denen große Mengen von Informationen automatisch durchsucht, in Beziehung zueinander gesetzt und so Trends und neue Zusammenhänge aufgezeigt werden“.[10]

2.1 Urheberrechtlicher Schutz von Daten

Nicht in allen Fällen, in denen Methoden des TDM angewandt werden, bedarf es freilich des Rückgriffs auf die gesetzliche Nutzungserlaubnis aus § 60d UrhG. Ausschlaggebend ist, ob die zu untersuchenden Daten überhaupt einem urheberrechtlichen Schutz unterliegen. Während dies bei literarischen, journalistischen oder wissenschaftlichen Texten angesichts vergleichsweise geringer Anforderungen an den Schutz von Schriftwerken i.S.v. § 2 Abs. 1 Nr. 1 UrhG i. d. R. der Fall ist,[11] fehlt es Datensätzen aus naturwissenschaftlicher oder quantitativer sozialwissenschaftlicher Forschung oftmals an der erforderlichen Schöpfungshöhe.[12] Diese Pauschalisierung kann aber keinesfalls eine Prüfung im Einzelfall ersetzen. Auch sind Leistungsschutzrechte wie das für Lichtbilder nach § 72 UrhG stets mit zu berücksichtigen. Heftig umstritten ist, ob und wie sich verbleibende Schutzlücken schließen lassen.[13] So wird z. B. ein Wissenschaftler-Persönlichkeitsrecht diskutiert, das Forschenden zumindest die Entscheidungsbefugnis hinsichtlich der Veröffentlichung von Daten gewähren soll.[14]

Außerdem ist zu beachten, dass nicht nur einzelne Daten geschützt sein können, sondern auch die Datenbanken, in denen diese enthalten sind. Dabei kommen sowohl ein Werkschutz nach § 4 Abs. 2 UrhG für die Kreativleistung der Datenbankkonzeption, als auch das investitionsbezogene Datenbankherstellerrecht nach §§ 87a ff UrhG in Betracht. Beide Rechte „bestehen unabhängig voneinander“[15] und können kumulativ bei ein und derselben Datenbank zusammentreffen.[16]

Nicht zuletzt sind datenrelevante Normen anderer Rechtsgebiete zu befolgen. Insbesondere müssen – sofern Forschungsdaten personenbezogene Informationen enthalten – die Bestimmungen des Datenschutzrechts eingehalten werden. Außerdem darf der Zugriff auf fremde Daten nicht in rechtswidriger Weise erfolgen; dabei sind nicht nur Eigentumsrechte an Datenträgern, sondern auch das strafrechtliche Verbot aus § 202a StGB zu beachten.

2.2 TDM nach dem Verständnis des Gesetzgebers

Der Gesetzgeber versteht TDM als „mehrstufigen Prozess“.[17] Vorbereitend wird das Ursprungsmaterial vervielfältigt und aufbereitet. In TDM-Projekten an der Universität Konstanz werden als Rohdaten z. B. Beiträge aus Tageszeitungen und Meldungen von Finanzdienstleistern untersucht. „Ziel dieser Aufbereitung ist es, die Inhalte maschinenlesbar zu machen.“[18] Dazu werden diese „z. B. normalisiert, strukturiert und kategorisiert und (ggf.) in andere technische Formate überführt“.[19] Das dadurch geschaffene Korpus besitzt dann die für eine automatisierte Auswertung erforderliche Einheitlichkeit der Datenstruktur. Dabei werden Softwaretools oder speziell programmierte Skripte eingesetzt. So werten Konstanzer Wissenschaftler etwa die statistische Häufigkeit bestimmter Schlüsselwörter in journalistischen Beiträgen aus, um Tendenzen in der Berichterstattung zu Migrationsthemen zu erforschen.

2.3 Erlaubte Nutzungshandlungen

§ 60d UrhG erlaubt drei Nutzungsszenarien. Diese gelten spezifisch auch für in Datenbanken enthaltene Inhalte (vgl. §§ 60d Abs. 2, 87c Abs. 1 Nr. 2UrhG):

Erstens darf das Ursprungsmaterial vervielfältigt werden, um daraus durch Normalisierung, Strukturierung und Kategorisierung ein Korpus zu erstellen (§ 60d Abs. 1 Nr. 1 UrhG). Insofern wird das Vervielfältigungsrecht aus § 16 UrhG beschränkt. Anders als z. B. bei § 60c UrhG ist beim TDM nicht nur die teilweise, sondern eine vollständige Vervielfältigung urheberrechtlich geschützten Materials erlaubt. Dies ist folgerichtig, denn eine unvollständige Datengrundlage impliziert fragwürdige Untersuchungsergebnisse.

Zweitens ist es zulässig, dieses Korpus – nicht hingegen das Ursprungsmaterial – in seiner Gesamtheit digital zu teilen (§ 60d Abs. 1 Nr. 2 UrhG). Damit wird in das Recht des Urhebers aus § 19a UrhG eingegriffen, über die öffentliche Zugänglichmachung seines Werkes zu entscheiden. Diese Erlaubnis gilt aber nicht gegenüber der Allgemeinheit, sondern ist auf zwei spezifische Personengruppen beschränkt: Einerseits darf das Korpus innerhalb eines abgrenzbaren Personenkreises zum Zweck der gemeinsamen wissenschaftlichen Forschung zugänglich gemacht werden. Darunter fallen z. B. Projektteams. Andererseits ist es zulässig, einzelnen Dritten zur Überprüfung der Qualität wissenschaftlicher Forschung Zugang zu gewähren. Dies betrifft insbesondere Gutachter und Reviewer.

Drittens dürfen Korpus und Ursprungsmaterial bei Bibliotheken und den in § 60 f UrhG genannten Gedächtnis- und Bildungseinrichtungen archiviert werden (§ 60d Abs. 3 S. 2 UrhG).[20]

Abbildung: TDM nach dem Verständnis des Gesetzgebers. Brettschneider, Peter: Text- und Data-Mining, https://www.forschungsdaten.info/themen/rechte-und-pflichten/text-und-data-mining [Zugriff: 16.09.2020].
Abbildung:

TDM nach dem Verständnis des Gesetzgebers.[21]

Erlaubnisfrei zulässig ist hingegen die automatisierte Auswertung. Nach Auffassung des Gesetzgebers stellt diese „keine urheberrechtlich relevante Handlung“ dar.[22] Zudem können weitergehende Nutzungen „durch andere Ausnahmevorschriften, erlaubt sein, insbesondere für Zitate nach § 51 UrhG“.[23]

2.4 Privilegierte Nutzer

„Der Kreis der nach § 60d Abs. 1 (UrhG) privilegierten Personen ist nicht anhand von deren Status bestimmt, sondern allein anhand der ausgeübten Tätigkeit.“[24] Ausschlaggebend ist, dass es sich um wissenschaftliche Forschung handelt und keine kommerziellen Zwecke verfolgt werden.

„Unter wissenschaftlicher Forschung ist eine methodische und auf Erkenntnisfindung ausgerichtete Tätigkeit zu verstehen. Dazu zählt die eigentliche forschende Tätigkeit ebenso wie das Darstellen von deren Ergebnissen.“[25] Eine institutionelle Zugehörigkeit zu einer Universität oder anderen Forschungseinrichtung ist nicht entscheidend,[26] vielmehr können sich auch Praktiker, Privatgelehrte und sogar Studierende auf die Norm berufen, sofern sie selbstständig wissenschaftlich arbeiten.[27]

Maßgeblich für die Beurteilung, ob kommerzielle Zwecke verfolgt werden, „ist die konkrete Forschungstätigkeit“; [28] auf die Quelle der Finanzierung oder die Ausrichtung der Institution, an der die Forschung durchgeführt wird, kommt es hingegen nicht an.[29] § 60d UrhG ist daher nur anwendbar, wenn die Forschungstätigkeit nicht gewinnorientiert ist.[30] Gewerbliche Forschung – z. B. Big Data-Analysen von Unternehmen – kann sich damit nicht auf die Norm berufen.[31] Problematisch und im Einzelfall zu prüfen sind über private Drittmittel finanzierte Forschung an öffentlichen Hochschulen sowie Private-Public-Partnerships.[32] Unbeachtlich ist hingegen, ob für eine spätere Publikation von Forschungsergebnissen aus TDM-Projekten ein Honorar gezahlt wird.[33]

3 Rechtsänderungen durch die DSM-Richtlinie

Bereits 2 Jahre nach Einführung der Schrankenbestimmungen für TDM ist gegenwärtig eine grundlegende Novellierung von § 60d UrhG in Arbeit. Notwendig wird dies durch die DSM-Richtlinie, die der deutsche Gesetzgeber bis zum 7. Juni 2021 ins nationale Recht umsetzen muss. Im Januar 2020 hat das Bundesministerium der Justiz und für Verbraucherschutz (BMJV) dazu den Diskussionsentwurf eines Ersten Gesetzes zur Anpassung des Urheberrechts an die Erfordernisse des digitalen Binnenmarkts (Disk-E) vorgelegt,[34] dem im September 2020 ein Referentenentwurf (UrhR-RefE) folgte.[35]

Die DSM-Richtlinie war aufgrund der hoch umstrittenen Regelung zu „Upload-Filtern“ über Monate hinweg Gegenstand der öffentlichen Debatte. Weitgehend unbeachtet und kaum debattiert blieben demgegenüber die Regelungen zum TDM. Dies mag auch dadurch bedingt gewesen sein, dass in Deutschland anders als in den meisten anderen EU-Mitgliedstaaten mit § 60d UrhG bereits eine Regelung zum TDM besteht. Gleichwohl bringt die Richtlinie substantielle Verbesserungen mit sich:

  • Zukünftig ist TDM nicht nur für die wissenschaftliche Forschung, sondern gemäß Art. 4 DSM-Richtlinie bzw. § 44b UrhG-E für jedermann – insbesondere auch Unternehmen, die Presse und Privatleute – erlaubt.[36] Forschungseinrichtungen und Einrichtungen des Kulturerbes bleiben aber privilegiert, da die Rechteinhaber ihnen TDM nicht durch einen Vorbehalt verbieten können.[37]

  • Für die Forschung werden die Regeln zur Speicherung und Archivierung großzügiger. Die bisherige Löschpflicht entfällt. Bei TDM dürfen nach Art. 3 Abs. 2 DSM-Richtlinie bzw. § 60d Abs. 5 UrhG-E urheberrechtlich geschützte Forschungsdaten zum Zwecke der wissenschaftlichen Forschung und der Überprüfung von Erkenntnissen aufbewahrt werden.

  • Darüber hinaus sind Vervielfältigungen zum Zweck des TDM zukünftig nicht zu vergüten. Eine entsprechende Ausnahme findet sich in § 60h Abs. 2 Nr. 3 UrhG-E. Davon ist aber nicht das Zugänglichmachen nach § 60d Abs. 4 UrhG-E erfasst.[38] Privilegiert wird beim wissenschaftlichen TDM also nur die Vervielfältigung der Forschungsmaterialien, nicht hingegen die kollaborative Arbeit mit diesen. Hier hätte man sich mehr gesetzgeberischen Mut gewünscht.[39]

Hingegen ließ die DSM-Richtlinie in zweierlei Hinsicht Verschlechterungen befürchten:

  • Art. 3 DSM-Richtlinie berechtigt ausschließlich Forschungsorganisationen und Einrichtungen des Kulturerbes.[40] Legaldefinitionen finden sich in Art. 2 Nr. 1 bzw. Nr. 3 DSM-Richtlinie. Das BMJV hat diese in § 60d Abs. 2 und Abs. 3 Nr. 1 UrhG-E nahezu wortgetreu übernommen.[41] Forschungsorganisationen dürfen demnach nicht gewinnorientiert bzw. müssen im öffentlichen Auftrag tätig sein.[42] Außerdem dürfen sie Unternehmen keinen bestimmenden Einfluss oder bevorzugten Zugang zu den Forschungsergebnissen einräumen. Überraschenderweise fehlen für Einrichtungen des kulturellen Erbes entsprechende Einschränkungen. In Bibliotheken, Museen oder Archiven dürften demnach im Rahmen von TDM Vervielfältigungen zukünftig auch zu kommerziellen Zwecken zulässig sein.[43] Indem Art. 3 Abs. 1 DSM-Richtlinie – anders als § 60d UrhG in seiner bisherigen Fassung – Institutionen und nicht die wissenschaftliche Forschung per se privilegiert, stand zu befürchten, dass die Affiliation zu einer Forschungs- oder Gedächtniseinrichtung zur Tatbestandsvoraussetzung würde.[44] Privatgelehrte hätten sich damit nur noch auf den restriktiveren Art. 4 DSM-Richtlinie berufen können. Mit § 60d Abs. 3 Nr. 2 UrhG-E hat der deutsche Gesetzgeber aber den Kreis der Berechtigten explizit auf einzelne Forscher ausgedehnt. Voraussetzung ist – entsprechend der aktuell gültigen Regelung – dass sie keine kommerziellen Zwecke verfolgen.

  • Der europäische Gesetzgeber scheint TDM lediglich als Einschränkung des Vervielfältigungsrechts zu verstehen. Das für kollaborativ arbeitende Forschung unverzichtbare Recht, Forschungsmaterial zu teilen, bleibt hingegen unberücksichtigt.[45] Der Gesetzesentwurf des BMJV schließt diese Lücke: Gemäß § 60d Abs. 4 UrhG-E dürfen zum Zweck des TDM erstellte Vervielfältigungen auch weiterhin in einem abgrenzten Personenkreis für die gemeinsame wissenschaftliche Forschung geteilt werden. Zur Überprüfung der Qualität gilt dies auch für Gutachter und Reviewer.

4 Rechtliche und praktische Fallstricke

Bei der praktischen Anwendung der seit 2018 gültigen Fassung von § 60d UrhG haben sich verschiedene Problemstellungen herauskristallisiert, die TDM-Projekte verkomplizieren bzw. in Verhandlungen mit Datengebern kostentreibend wirken:

  • Zugang und Lizenzierung

  • Systematischer Download aus Datenbanken

  • Technische Schutzmaßnahmen

  • Tatbestandsmerkmal „automatisiert“

  • Differenzierung zwischen Ursprungsmaterial und Korpus

  • Datenpublikation und -archivierung

4.1 Zugang und Lizenzierung

In der Praxis erweist es sich oftmals als größte Hürde für TDM-Vorhaben, überhaupt Zugriff auf die zu untersuchenden Texte oder Daten zu erhalten. § 60d UrhG schafft „keinen Anspruch auf Zugang zu geschütztem Ursprungsmaterial“.[46] Die Norm setzt den rechtmäßigen Zugang vielmehr voraus. Gleichwohl ist TDM nicht nur an lizenzierten Werken, sondern beispielsweise auch an in der Bibliothek vorhandenen, per Fernleihe beschafften oder im Internet allgemein zugänglichen Werken zulässig.[47] Nichtsdestotrotz eröffnen sich für Datenanbieter (z. B. Presse- oder Wissenschaftsverlage, Datenbank- oder Nachrichtendienstanbieter) Potentiale zur Monetarisierung ihrer Inhalte.

Zu beachten ist dabei, dass sich Rechteinhaber gemäß § 60g UrhG nicht auf Vereinbarungen berufen können, die eine nach § 60d UrhG erlaubte Nutzung beschränken oder untersagen.[48] Dies bedeutet jedoch nicht, dass ein Vertrag, der § 60d UrhG widerspricht, unwirksam wäre.[49] Vielmehr bleibt sogar ein Vertrag wirksam, der „zum Nachteil des Nutzungsberechtigten von einem gesetzlichen Erlaubnistatbestand abweicht“.[50] „Der Rechtsinhaber darf sich lediglich nicht auf diese Vereinbarung berufen, etwa wenn der Nutzer sich weigert, die vertraglich vereinbarte Vergütung zu entrichten.“[51] Abgesehen von der gesetzlich vorgesehenen Vergütung nach § 60h UrhG gegenüber den Verwertungsgesellschaften erfolgt für erlaubte Nutzungen daher keine Zahlung.[52] Im Ergebnis können Rechteinhaber also nur den Zugang, nicht aber die Nutzung monetarisieren. Gleichwohl ignorieren manche Anbieter diese Rechtslage und konfrontieren Forschende mit umfassenden Vergütungsforderungen.

Gerade in Bereichen, in denen Inhalte üblicherweise mit einer anderen Zielsetzung vertrieben werden (z. B. lesender Zugriff auf ein Zeitungsarchiv), müssen sich Preise und Konditionen für die Lizenzierung des Zugangs bei TDM zudem erst noch finden. So lagen die initialen Angebote, die verschiedene große deutsche Zeitungsverlage für Datenlieferungen im Umfang von fünf Jahrgängen einem Konstanzer Forschungsprojekt machten, preislich zwischen 1.000 und 15.000 Euro. Zum Teil war sogar eine Campuslizenz derselben Zeitungen, die nicht nur dem Forschungsprojekt, sondern der gesamten Universität Zugang zu den Inhalten verschafft hätte, deutlich günstiger. Allerdings hilft eine solche Campuslizenz nicht in allen Fällen, denn die Inhalte müssen erst mit Hilfe von Software-Tools aus den Datenbanken oder Online-Archiven der Anbieter extrahiert werden. Zudem lassen sich Inhalte vielfach nur in Formaten exportieren, die wie PDF für eine automatisierte Auswertung wenig geeignet sind.[53] § 60d UrhG löst dieses Problem nicht, denn die Vorschrift gewährt keinen Anspruch auf ein bestimmtes Dateiformat.[54] Vielmehr kann die missliche Situation entstehen, dass die gleichen Inhalte ein zweites Mal lizenziert werden müssen, um sie in einem maschinell auswertbarem Format wie XML bereitgestellt zu bekommen. Hier bekommt der aus dem Open Access-Bereich bekannte Begriff des „double dipping“ eine gänzlich neue Bedeutung.

Darüber hinaus sind aber auch die Vertragsbedingungen, die Anbieter für Datenlieferungen vorgeben, zum Teil derartig restriktiv, dass die Durchführbarkeit eines Forschungsprojektes an sich gefährdet sein kann. So wollte sich ein britischer Anbieter nicht nur Nutzungsrechte an aus der Forschung resultierenden wissenschaftlichen Veröffentlichungen einräumen lassen, sondern bestand auch darauf, diese vorab zu überprüfen. Darüber hinaus wurden jegliche Gewährleistungsrechte ausgeschlossen und regelmäßiger Zugriff auf die Systeme des Vertragspartners gefordert, um die Verwendung der Daten zu kontrollieren. Inwieweit diese Regelungen überhaupt wirksam gewesen wären, ließ sich bedingt durch eine Rechtswahl zugunsten des englischen und walisischen Rechts nur eingeschränkt überprüfen.[55]

Angesichts überzogener Preisvorstellungen und prohibitiv restriktiver Vertragskonditionen wäre es geradezu fahrlässig, nicht zu verhandeln. Während der erwähnte britische Anbieter hart blieb, konnten bei anderen Vertragspartnern umfangreiche Anpassungen an den Vertragskonditionen durchgesetzt werden. Auch wurden erhebliche Preisnachlässe gewährt. So mündete die erwähnte Anfangsforderung von 15.000 Euro letztlich in einer Zahlung von 3.500 Euro für die Datenlieferung. Ein Faktor für die Annahme dieses Angebots war, dass die Verhandlungen das durch Drittmittel finanzierte Forschungsprojekt schon um mehrere Monate verzögert hatten.

Die Urheberrechtsnovellierung im Zuge der DSM-Richtlinie wird daran nicht grundlegend etwas ändern – auch in seiner überarbeiteten Fassung setzt § 60d UrhG-E – ebenso wie § 44b UrhG – rechtmäßigen Zugang voraus.[56] Zu begrüßen sind aber zwei Klarstellungen in der Gesetzesbegründung: Zum einen wird das „right to read“ mit dem „right to mine“ gleichgesetzt.[57] Demnach dürfen von Universitäten im Rahmen der Literaturversorgung lizenzierte Inhalte stets auch für TDM-Vorhaben genutzt werden. Zum anderen ist es zulässig, analoge Werke zum Zweck des TDM zu digitalisieren.[58] Bibliotheksbestände sind damit – gleich ob analog oder digital – als Rohdaten für TDM-Vorhaben zu begreifen. Zudem wird § 60g UrhG nicht verändert, so dass zumindest das TDM-Recht für wissenschaftliche Forschung auch weiterhin nicht vertraglich abbedungen werden kann.[59]

4.2 Systematischer Download aus Datenbanken

In den Nutzungsbedingungen vieler Datenbankanbieter sind Klauseln enthalten, die den systematischen Download von Inhalten verbieten. Sich darauf berufend schreiten manche Datenbankhersteller ein, lange bevor ein Volumen erreicht ist, das in quantitativer[60] oder qualitativer[61] Hinsicht als wesentliche Datenbankteile i.S.v. § 87b Abs. 1 UrhG einzuordnen wäre.[62] Auch ohne den Einsatz von Crawlern oder Harvesting-Methoden sind die Grenzwerte mancher Anbieter zu überschreiten. Dann droht die Sperrung des Zugangs für einzelne Nutzer oder gar die ganze Institution. Dies entbehrt aber einer Rechtsgrundlage, soweit die Nutzung gesetzlich erlaubt ist. Insbesondere ist der systematische Download zum Zweck des TDM zulässig, sofern rechtmäßiger Zugang besteht. Die Schranke aus § 60d UrhG gilt wegen § 87c Abs. 1 Nr. 2 UrhG ausdrücklich auch für die Nutzung von wesentlichen Teilen einer Datenbank.[63] Da gemäß § 87c Abs. 1 S. 2 UrhG der Schrankenregelung entsprechend § 60g Abs. 1 UrhG Vorrang zukommt, ist zudem sichergestellt, „dass die Rechtsinhaber den automatisierten Abruf von Inhalten aus dem Datenbankwerk oder der Datenbank nicht vertraglich untersagen können“.[64]

Gleichwohl stehen berechtigte Interessen der Datenbankanbieter im Raum: Harvesting von Inhalten beansprucht ihre Server- und Verbindungskapazitäten in erheblicher Weise. Die Gesetzesbegründung erkennt dies an und fordert, dass der reguläre „Zugang zum Ursprungsmaterial für Dritte“ nicht beeinträchtigt werden dürfe.[65] Diese Einschränkung hat im Wortlaut von § 60d UrhG aber keinen Niederschlag gefunden – nach aktueller Rechtslage kommt ihr daher höchstens bei der Auslegung der Schrankenbestimmung Gewicht zu. Bullinger hält dies sogar für eine „gänzlich urheberrechtsfremde Überlegung“: Die Zulässigkeit einer urheberrechtlich relevanten Handlung könne nicht von Qualität und Auslastung der Netze der Anbieter abhängen.[66]

Leider hat der europäische Gesetzgeber diese Kritik nicht berücksichtigt – vielmehr dürfen Rechteinhaber zukünftig gemäß Art. 3 Abs. 3 DSM-Richtlinie (≈ § 60d Abs. 6 UrhG-E) Maßnahmen durchführen, um die Sicherheit und Integrität ihrer Netze und Datenbanken zu wahren. Allerdings muss dabei gemäß Art. 3 Abs. 3 S. 2 DSM-Richtlinie die Verhältnismäßigkeit berücksichtigt werden, d. h. die Maßnahmen dürfen nicht über das für die Wahrung von Sicherung und Integrität der Netze und Datenbanken notwendige Maß hinausgehen.[67] Faktisch werden damit Anbieter mit schlechter Server- und Netzinfrastruktur privilegiert. Ein fatales Signal, das nicht nur dem Ausbau leistungsfähiger digitaler Dienstleistungen abträglich ist, sondern die TDM-Schranke insgesamt auszuhebeln droht.

4.3 Technische Schutzmaßnahmen

Eng mit den Problematiken von Zugang und systematischem Download verknüpft ist die Frage, inwieweit die Schrankenbestimmung gegenüber technischen Schutzmaßnahmen wie DRM-Systemen oder Kopierschutz durchgesetzt werden kann. Nach § 95b Abs. 1 Nr. 11 UrhG darf die TDM-Schranke nicht durch technische Schutzmaßnahmen unterlaufen werden, sofern rechtmäßiger Zugang besteht. Dies ist folgerichtig, denn DRM schützt nicht nur den Rechteinhaber vor unerlaubtem Eingriff in seine ausschließliche Rechtsposition, sondern kann zugleich auch den „vom Gesetzgeber an sich gewollten freien Zugriff auf geschützte Werke und Leistungen im Rahmen von Schrankenbestimmungen“ verhindern.[68] Daher kann „zwar nicht der Zugang zu Datenbanken erzwungen werden […], wohl aber die Möglichkeit des Text und Data Mining in Bezug auf Material, zu dem derjenige, der das Text und Data Mining vornimmt, bereits Zugang hat.“[69] Allerdings gestattet die Norm keine Selbsthilfe – Kopierschutz darf also nicht einfach gehackt werden. Vielmehr besteht ein zivilrechtlicher Leistungsanspruch des durch die Schranke Begünstigten gegen den Rechteinhaber auf Zurverfügungstellung der zur Ausübung der nach § 60d Abs. 1 UrhG erlaubten Nutzungen notwendigen Mittel.[70] Geeignet können z. B. die Überlassung von Zugangsdaten oder die Bereitstellung von Vervielfältigungsstücken sein.[71]

Leider enthält § 95b Abs. 3 UrhG eine Ausnahme von dieser Regel: Danach setzen sich gesetzliche Schrankenbestimmungen gegenüber technischen Schutzmaßnahmen nicht durch, wenn Inhalte der Öffentlichkeit auf Grund einer vertraglichen Vereinbarung zugänglich gemacht werden und der Nutzer die individuelle Wahl bezüglich Zeit und Ort der Nutzung trifft. Dies betrifft u. a. On-Demand-Dienste und Online-Datenbanken.[72] Anders ausgedrückt: Bei einem großen Teil der von Bibliotheken lizenzierten Online-Inhalte können die Anbieter eine Nutzung zum TDM in legaler Weise durch DRM-Systeme unterbinden. „Die gesetzlichen Schrankenregelungen haben für diese Fälle also keine Wirkung“.[73] Dies steht in eklatantem Widerspruch zur Digitalstrategie des Bundesministeriums für Bildung und Forschung (BMBF), die den Einsatz innovativer Methoden fordert, um digitalen Daten, dem „Rohstoff des 21. Jahrhunderts“, neue Erkenntnisse zu entlocken.[74] Sogar der Gesetzgeber gesteht ein, dass § 95b Abs. 3 UrhG einen Anreiz dazu setze, Dienste „auf technisch geschützte Online-Angebote umzustellen“, um sich dem gesetzlichen Schrankenregime zu entziehen.[75]

Gemäß Art. 7 Abs. 2 DSM-Richtlinie setzt sich die TDM-Schranke zukünftig gegen technische Schutzmaßnahmen durch.[76] „Das gilt – anders als noch unter der InfoSoc-RL – angesichts des fehlenden Verweises auf deren Art. 6 IV UAbs. 4 auch dann, wenn die Inhalte online zugänglich gemacht werden.“[77] In § 95b Abs. 3 UrhG-E setzt das BMJV dies nunmehr um und fasst die Vorschrift zugleich verständlicher. Die Möglichkeit der Anbieter, sich im digitalen Raum der Schrankennutzung zu entziehen, entfällt damit.[78]

4.4 Tatbestandsmerkmal „automatisiert“

Manche Anbieter verfallen auf kreative Interpretationen des Gesetzestextes, um sich der TDM-Schranke zu entziehen. Ein deutscher Zeitungsverlag versuchte dazu den Begriff „automatisiert“ im ersten Halbsatz von § 60d Abs. 1 UrhG zu instrumentalisieren. Das Online-Archiv des Verlages war für die Universität lizenziert – ein rechtmäßiger Zugang zu den Daten bestand also. Unglücklicherweise hatte die betroffene Wissenschaftlerin dem Verlag aber mitgeteilt, dass neben der computerbasierten Analyse auch eine intellektuelle Untersuchung der Daten geplant sei. Daraufhin argumentierte der Zeitungsverlag, dies sei nicht durch § 60d UrhG gedeckt – die Analyse müsse ausschließlich automatisiert, nicht hingegen intellektuell erfolgen.

Im Ergebnis zielt diese Argumentation darauf ab, § 60d UrhG komplett seines Anwendungsbereiches zu berauben, denn jede Auswertung umfasst auch intellektuelle Arbeiten – und sei es nur die Programmierung der eingesetzten Skripte. Insofern ist die Gesetzesbegründung aber unmissverständlich: „Die automatisierte Auswertung selbst, der Kern des sogenannten Text und Data Mining, ist keine urheberrechtlich relevante Handlung.“[79] Nichts anderes gilt für das Lesen und Analysieren urheberrechtlich geschützter Daten, solange dies nicht mit weiteren Vervielfältigungen, die über das nach § 44a UrhG erlaubte Maß hinausgehen, verbunden sind.[80] Richtigerweise erlaubt § 60d UrhG daher nicht nur eine maschinelle, sondern auch eine – zumindest teilweise – manuelle Auswertung:[81] Wenn die intensivere Nutzung durch eine automatisierte Auswertung erlaubt ist, dann muss dies erst recht für eine manuelle Auswertung gelten. Im konkreten Fall war dies aber nicht ausschlaggebend, da aufgrund der vorhandenen Lizenzrechte den Forschenden ohnehin die intellektuelle Auswertung der Inhalte des Zeitungsarchivs erlaubt war.

Die neue Legaldefinition des TDM in § 44b Abs. 1 UrhG-E beschreibt TDM als „automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken“. Meines Erachtens impliziert das BMJV, indem es in § 44b Abs. 2 und § 60d Abs. 1 und 4 UrhG-E lediglich Vervielfältigung und Zugänglichmachen regelt, dass es die automatisierte Analyse auch weiterhin nicht als urheberrechtlich relevante Handlung bewertet.[82] Der Erst-recht-Schluss auf die Zulässigkeit einer (teilweise) intellektuellen Auswertung behält damit seine Gültigkeit.

4.5 Differenzierung zwischen Ursprungsmaterial und Korpus

Wenig praxistauglich ist zudem die Unterscheidung des Gesetzgebers zwischen Ursprungsmaterial und Korpus und die damit verbundenen Einschränkungen der Möglichkeiten, Forschungsdaten innerhalb einer abgrenzbaren Personengruppe zu teilen. So ist offen, in welchem Umfang das Ursprungsmaterial verarbeitet werden muss, damit ein Korpus entsteht. Reichen bereits minimale Veränderungen wie z. B. die Konvertierung in ein anderes Dateiformat? Und was gilt, wenn überhaupt keine Vorverarbeitung notwendig ist, weil die Daten aus einer einzigen Quelle stammen und in einem Format und einer Struktur vorliegen, das bereits für eine automatisierte Auswertung geeignet ist?

Wenn aber keine oder nur geringfügige Änderungen am Ursprungsmaterial notwendig sind, ist dessen Nutzung weniger intensiv. Deshalb wäre es meines Erachtens ein Wertungswiderspruch, in solchen Fällen das öffentliche Zugänglichmachen des Forschungsmaterials nach § 60c Abs. 1 Nr. 1 UrhG zu lösen und lediglich das Teilen von 15 Prozent eines Werkes zu erlauben. Bei vollständig aufbereiteten Datenlieferungen ließe sich zudem argumentieren, dass der Lieferant die Vorverarbeitung bereits für den Kunden vorgenommen hat, so dass ein Vertrag über die Lieferung eines Korpus geschlossen wurde, dessen Teilen dann konsequenterweise erlaubt sein muss.

Das Problem wird im Zuge der Umsetzung der DSM-Richtlinie[83] beseitigt. Mit seinem Entwurf gibt das BMJV die Unterscheidung zwischen Ursprungsmaterial und Korpus auf.[84] Das Erstellen eines Korpus bleibt aber weiterhin erlaubt.[85] Nachteile sind auch nicht im Hinblick auf das Teilen von aufbereiteten Daten zu befürchten: § 23 S. 3 UrhG stellt klar, dass lediglich technisch bedingte Änderungen keine Bearbeitungen eines Werkes darstellen, deren Teilen zustimmungspflichtig wäre.[86] Darüber hinaus sind auch unwesentliche Veränderungen der Vorlage keine Bearbeitungen, sondern Vervielfältigungen.[87]

4.6 Datenpublikation und -archivierung

Mit Abschluss der Forschungsarbeiten endet auch die gesetzliche Nutzungserlaubnis; Korpus und Vervielfältigungen des Ursprungsmaterials sind dann gemäß § 60d Abs. 3 S. 1 UrhG zu löschen – die öffentliche Zugänglichmachung ist zu beenden.[88] Immerhin ist der Begriff „Forschungsarbeiten“ weit auszulegen und umfasst auch Handlungen im Rahmen der Qualitätskontrolle wie z. B. ein Peer-Review-Verfahren.[89] Zulässig ist zudem die langfristige Archivierung bei Bibliotheken und Archiven und anderen in §§ 60e und 60 f UrhG genannten Bildungs- und Gedächtniseinrichtungen. Gemäß § 60d Abs. 3 S. 2 UrhG gilt das Recht zur dauerhaften Aufbewahrung sowohl für das Korpus als auch für Vervielfältigungen des Ursprungsmaterials.

Nicht von der Schrankenbestimmung gedeckt ist hingegen eine Publikation der Forschungsdaten. Soweit also Dritte Rechte an den genutzten Daten geltend machen können, bedarf eine Veröffentlichung ihrer Zustimmung. Praktisch wird daher in vielen Fällen eine Veröffentlichung nicht – oder nur unter hohen Kosten – möglich sein. Insofern besteht ein Wertungswiderspruch zu den Zielsetzungen von Wissenschaftspolitik und Forschungsförderern, die der Veröffentlichung und Nachnutzbarkeit von Forschungsdaten einen immer höheren Stellenwert einräumen.[90] So fordert etwa die Digitalstrategie des BMBF, dass „Wissenschaftlerinnen und Wissenschaftler […] ungehindert und einfach auf Daten aus bisheriger Forschung zugreifen und sie weiter nutzen können“ müssen.[91] Es drängt sich die Frage auf, ob ein Urheberrecht, das dem Leitbild einer offenen Wissenschaft Löschpflicht und ausschließliche Rechtspositionen gegenüberstellt, noch zeitgemäß ist.

Dieser Widerspruch lässt sich auch nicht durch das Recht aus § 60d Abs. 3 S. 2 UrhG, Forschungsdaten in Bibliotheken und anderen Bildungs- bzw. Gedächtniseinrichtungen zu archivieren, vollständig ausräumen.[92] Fatalerweise hat der Gesetzgeber nämlich nicht geregelt, ob und wie die archivierten Daten nachgenutzt werden dürfen. Nach der Gesetzesbegründung dient die Regelung dazu, „die Zitierbarkeit, Referenzierbarkeit und die Überprüfung der Einhaltung wissenschaftlicher Standards zu ermöglichen“.[93] Dies impliziert zwingend zumindest lesenden Zugang, denn ohne Einsicht in die archivierten Daten ist weder deren Zitierung noch Überprüfung möglich.[94] Als bloßer Werkgenuss stellt das Lesen ohnehin keinen urheberrechtlich relevanten Vorgang dar.[95] Hingegen widerspräche es dem gesetzgeberischen Ansinnen, das Entstehen paralleler Artikeldatenbanken zu verhindern,[96] wenn archivierende Einrichtungen ihren Nutzern auch das Vervielfältigen der Daten ermöglichen oder diese über das Internet öffentlich zugänglich machen dürften. Mit § 60d Abs. 3 S. 2 UrhG sollte keine Rechtsgrundlage für Open Data geschaffen werden. Damit greift die Regelung praktisch aber deutlich zu kurz. Die Überprüfung fremder Forschung ist mit bloßer Einsichtnahme in die zugrundeliegenden Daten oft nur eingeschränkt möglich. Insbesondere erfordert die Reproduktion fremder Forschung umfassenden Zugriff.

Wie bereits angeführt, entfällt mit der DSM-Richtlinie die aktuell in § 60d Abs. 3 S. 1 UrhG vorgesehene Löschpflicht. Zukünftig dürfen Berechtigte Vervielfältigungen gemäß § 60d Abs. 5 UrhG-E solange aufbewahren, wie dies für die Zwecke wissenschaftlicher Forschung oder zur Überprüfung der Erkenntnisse erforderlich ist. Bedauerlicher Weise ist § 60 Abs. 5 UrhG-E restriktiver als Art. 3 Abs. 2 DSM-Richtlinie und verlangt zusätzlich zur Zweckbindung auch die Erforderlichkeit der Aufbewahrung.[97] Soweit diese gegeben ist, ist nunmehr aber sogar eine zeitlich unbegrenzte Speicherung zulässig.[98]

Zur Speicherung berechtigt sind unter angemessenen Sicherheitsvorkehrungen gegen unbefugte Benutzung Forschungsorganisationen und Einrichtungen des Kulturerbes. Ausgenommen sind Forschende ohne institutionelle Affiliation. Unklar ist hingegen, welche Speicheroptionen den Forschenden an solchen Einrichtungen offenstehen: Einerseits scheint nicht zwingend ein dezidiertes Datenrepositorium notwendig zu sein; vielmehr könnten auch eine universitätseigene Cloud oder hinreichend geschützte Server an Lehrstühlen bzw. Instituten den Anforderungen von § 60d Abs. 5 UrhG-E genügen. Andererseits dürften private Rechner oder Laufwerke der Forschenden nicht ausreichen. Zur Beantwortung dieser Fragen plant die Bundesregierung einen Dialog zwischen Rechteinhabern, Forschungsorganisationen und Einrichtungen des Kulturerbes.[99]

Auch im Hinblick auf die Nachnutzung archivierter Daten lassen die Entwürfe des BMJV Fragen offen: Zwar wird nicht nur eine rechtliche Grundlage für spätere Anschlussforschung an in TDM-Projekten erstellten Datenkorpora eröffnet,[100] sondern auch klargestellt, dass berechtigten Interessenten Einsicht in Forschungsdaten gewährt werden darf.[101] Unklar ist hingegen, „welche Art der Verfügbarmachung für diese Zwecke erlaubt ist“.[102] Wünschenswert wäre zudem eine Klarstellung, dass Einsicht auch zum Zitieren zulässig bleibt. Darüber hinaus ist im Hinblick auf Anschlussforschung nicht geregelt, wer mit TDM-Korpora weiterarbeiten darf. Angesichts der restriktiven Regelung zum Teilen von Daten in § 60d Abs. 4 UrhG-E steht zu befürchten, dass nur die jeweilige Forschungsgruppe berechtigt ist. Nicht zuletzt erlaubt auch der novellierte § 60d UrhG-E keine Datenpublikation oder gar Open Data.

5 Fazit

§ 60d UrhG ist vielen Forschenden bislang gänzlich unbekannt. Einzelne Datenlieferanten nutzen dies leider aus und versuchen gesetzlich erlaubte Nutzungen zu monetarisieren. Dieses „double dipping“ ist zwar nicht verboten, moralisch aber fragwürdig. Gerade für Presseunternehmen sind solche Geschäftspraktiken meines Erachtens kontraproduktiv. In Zeiten, in denen sich Wissenschaft wie Presse gleichermaßen Angriffen ausgesetzt sehen, sollte allen Differenzen zum Trotz das gemeinsame Ziel überwiegen, „Erkenntnis auf Grundlage von überprüfbaren Fakten“ zu verbreiten.[103]

Umso mehr sind Erwerbungsspezialisten und Open Science-Experten in Bibliotheken aufgefordert, dieses Ungleichgewicht zu beheben. TDM als Aufgabenfeld für Bibliotheken geht daher über die Rolle als Vermittler von Zugang und Dienstleister bei der Archivierung hinaus. Vielmehr sollten sie gezielt auch ihre rechtliche Expertise in den Dienst der Forschenden stellen. Dies gilt umso mehr, als mit der DSM-Richtlinie neuer Informationsbedarf entsteht. Konkret geht es um Aufklärung und Beratung.[104] Impliziert ist damit, dass die bibliothekarische Urheberrechtskompetenz gestärkt werden muss.[105] Hier sind Aus- und Weiterbildungsanbieter gefordert.

Erfreulicher Weise stellen die Regelungen der DSM-Richtlinie zum TDM und ihre Umsetzung im Gesetzentwurf des BMJV einen Schritt in Richtung eines wissenschaftsfreundlicheren Urheberrechts dar. Trotzdem ist die Novellierung keineswegs uneingeschränkt eine Verbesserung. Insbesondere eröffnet § 60d Abs. 6 UrhG-E Anbietern Möglichkeiten, TDM unter Verweis auf ihre unzureichende IT-Infrastruktur zu unterbinden. Die Regelung ist nicht nur innovationshemmend, sondern könnte schlimmstenfalls gar dazu missbraucht werden, die Schrankenbestimmung gänzlich auszuhebeln. Die Lobbyarbeit von dbv und vdb im aktuellen Gesetzgebungsverfahren bleibt deshalb unverzichtbar und sollte unbedingt intensiviert werden.[106]

About the author

Peter Brettschneider

Peter Brettschneider

Published Online: 2021-01-08
Published in Print: 2021-01-27

© 2021 Walter de Gruyter GmbH, Berlin/Boston

Downloaded on 23.4.2024 from https://www.degruyter.com/document/doi/10.1515/bd-2021-0020/html
Scroll to top button