Das Archiv als virtualisierte Forschungsumgebung?

Aus HistnetWiki
Version vom 11. November 2009, 16:49 Uhr von Patrick Sahle (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu:Navigation, Suche

Auf dem Weg in eine digitale Forschung

Das Archiv im Web2.0 als virtualisierte Forschungsumgebung?

Vorbemerkungen

  • Dies ist eine Aussensicht. Diese Thesen ergeben sich nicht aus der Sicht eines Archivars, sondern aus der Schnittmenge zwischen Archiv, Archivbenutzung und den technischen Entwicklungen der letzten Jahre. Der Standpunkt lautet: "Digital Humanities".
  • Dies ist eine Momentaufnahme. Oktober 2009. Seitdem kontinuierlich veraltend.

Das Archiv in der Logik der Forschung

Das Archiv hat traditionell definierte Aufgaben, die sich aus bestimmten medialen, technischen und gesellschaftlichen Rahmenbedingungen ergeben haben. Verändern sich diese Rahmenbedingungen, dann verändern sich auch die Aufgaben des Archivs. Sie werden teilweise weiter entwickelt und teilweise neu bestimmt. Die Aufgaben des Archivs werden auch in der gesellschaftlichen Abstimmung über das bestimmt, was von den Archiven als Dienstleistung für die Forschung erwartet, was als selbstverständlich, was als wünschenswert und was als möglich betrachtet werden kann. Es folgen einige Kernbereich der Archivaufgaben, die auf ihre Veränderungen genauer zu untersuchen wären.

  • Überlieferung bilden
    • Veränderte Rahmenbedingungen in der Speicherung der Überlieferung (z.B. bei born digital documents)
    • Veränderungen im Bereich der Übernahme, Auswahl (Stichprobenbildung), Kassation?
    • Übernahme von amtlichen Stellen und von privatem Sammlungsgut
    • Überlieferungsbildung als Vorbereitung erwarteter Auswertungsinteressen in der Zukunft
  • Überlieferung bewahren und sichern
    • Neue Herausforderung durch digitale Daten
    • Chancen und Probleme digitaler Sicherungskopien
  • Überlieferung benutzbar machen
    • Traditionelle Basiserschließung: Vom Findmittel zum Online-Findmittel. Vom autonomen zum (z.B. über Schnittstellen) anschlussfähigen und (z.B. in Portalkontexten) integrierbaren Findmittel. Vom abgeschlossenen zum offenen (erweiterbaren) Findmittel. Vom monoauktoriellen zum kollaborativen Findmittel.
    • Tiefenerschließung. Erschließung als vertiefender Prozess. Von der Basiserschließung zur Annotation, zur Transkription und zur Edition?
    • Bereitstellung von Sekundärformen (mit Metainformationen) als Erschließungsleistung? Systematische Bereitstellung von digitalen Abbildungen.
  • Auswertung der Überlieferung begleiten
    • Traditionell: Das Archiv stellt (Benutzer-)Arbeitsplätze zur Verfügung, es unterstützt die Auswertung der Überlieferung durch Spezialwissen, es fördert die Vernetzung der Forschung zu den Beständen des Archivs und bindet die Ergebnisse an die Überlieferung zurück (Belegexemplarprinzip).
    • Entwicklungspotential: Unterstützung der Forschung durch virtuelle Arbeitsumgebungen; Aufnahme von Nutzerwissen in die archivischen Erschließungsmittel. Unmittelbare Verlinkung der Ergebnisse mit ihren Grundlagen (den überlieferten Dokumenten).
    • Das Archiv kann ein "Moderator der Forschung" sein. Diese traditionelle Aufgabe wäre jetzt weiter zu entwickelt und neu auszufüllen.

Archive im Web1.0

Die vergangenen 15 Jahre haben eine technische Entwicklung mit sich gebracht, die für die Archive nicht nur zu neuen Möglichkeiten geführt hat. Es haben sich dadurch auch die Vorstellung davon verändert, was von Archiven als "normale" Dienstleistung zu erwarten ist. Einige Beispiele ...

  • Institutionelle Präsentation.
    Basisinformationen zum Archiv (und seinen Beständen) und die Möglichkeit zur direkten Kontaktaufnahme dürften heute selbstverständlich sein.
  • Bereitstellung von Online-Findmitteln.
    Stabile, ausgereifte Standards (EAD und Co.) stehen zur Verfügung. In den wissenschaftlichen Bibliotheken sind die OPACs inzwischen fast vollständig online zugänglich. Diese Aufgabe besteht auch für die Archive und sollte in den nächsten Jahren zumindest zu einer selbstverständlichen Zielstellung werden.
  • Bereitstellung von digitalen Sekundärformen.
    In den Fällen, wo digitale Sekundärformen entweder im Benutzerauftrag, oder durch die Konversion bestehender analoger Sicherungsformen oder im Zuge der Erstellung neuer Sicherungsformen anfallen, sollten diese (soweit nicht rechtliche Schranken dies verhindern)allgemein über das Internet zugänglich gemacht werden. Das Selbstverständnis der Archive (und ihrer übergeordneten Stellen)ist hier noch zu entwickeln.
  • Schnittstellen.
    Wo in den Archiven digitale Erschließungsinformationen oder digitale Sekundärformen vorliegen, sollten sie auch über standardisierte Schnittstellen für eine allgemeine Nachnutzung bereitgestellt werden.
  • Portalbildung.
    Erschließungsinformationen aus Archiven sollten in übergreifenden Kontexten zusammengeführt werden. Diese können sowohl thematisch als auch geografisch (Länderebene, Bundesebene, Europaebene) organisiert sein.

Web2.0

Das Schlagwort "Web2.0" beschreibt sowohl technische Entwicklungen, als auch Veränderungen in der Art und Weise, wie "die Öffentlichkeit" oder "Benutzer" mit dem Internet umgehen. Einige dieser Entwicklungen können auch die Angebote der Archive und ihr Verhältnis zu ihren Benutzern beeinflussen. Zu den Herausforderungen des Web2.0 gehören ...

  • Neue Kommunikationsformen (Schlagworte: RSS, Blogs, Wikis, Twitter etc.).
  • Verstärkte Interaktion und Nutzerbeteiligung (Schlagwort: User Generated Content).
  • Prinzipien von Tagging und Annotation / Kommentierung.
  • Neue Werkzeuge zur Förderung der Beteiligung und Nachnutzung (Schlagwort: Social Software).
  • Nahtlose Integration verschiedener Inhalte in verschiedenen Nachnutzungsformen (Schlagwort: Mashup).
  • Soziale Netzwerke.

Archive im Web2.0

Es geht darum, die Zukunft zu gestalten. Beobachtbar sind nur erste Ansätze, die für eine Systematisierung, Verallgemeinerung oder gar Interpolation ein Fundament bilden, dessen Schwäche berücksichtigt werden muss.

  • Das Web2.0 als Hype oder als soziale Vernetzung auch der Archivare?
  • Das Archiv auf dem Weg zu seinen Benutzern?
    • Manche Archive sind in Facebook ... - und haben dort Fans, Nutzercommunites oder Fotoalben oder kommunizieren dort Neuigkeiten oder kündigen Veranstaltungen an. (siehe z.B. US National Archives oder UK National Archives)
    • Manche Archive bilden virtuelle Außenstellen, an denen die Bürger sich, ihre Geschichten und ihre Materialien einbringen können. Siehe z.B. das "Digitale Stadtgedächtnis der Stadt Coburg" ("Erforsche - Entdecke - Erzähle").
    • Manchmal müssen auch die Benutzer zum Archiv kommen, um bei der Bereiststellung digitalisierter Archivalien zu helfen. Siehe z.B. "[www.historischesarchivkoeln.de/ Das digitale Historische Archiv Köln]".
  • Archivbestände im Mashup?
    • Manche Archive nutzen allgemeine Plattformen zur Kommunikation mit den Benutzern, aber auch zur Bereitstellung von Archivmaterial. Es gibt archivische Fotosammlungen in Flickr (Beispiel der Douglas County Historical Society) - die durchaus auch mit ordentlichen Beschreibungsdaten versehen sein können. Aus solchen Plattformen ist dann eine weitere Einbindung in andere Verwendungs- und Präsentationsformenleicht möglich.
    • Wikipedia hat sich zu einer der zentralen Stellen der Informationsvermittlung im Netz entwickelt. Eine Einbeziehung und Nachnutzung z.B. von Bildmaterial aus Archiven ist naheliegend. In Deutschland bestehen zwei Kooperationen zwischen Wikipedia und Archiven.
      • 2007/2008 hat das Bundesarchiv 100.000 Fotos (mit Metadaten) für die Wikipedia bereit gestellt. Auf Seiten von Wikimedia ist dann eine Qualitätskontrolle erfolgt und die Bilder wurden nach Möglichkeit automatisch kategorisiert, d.h. Personen (mit PND), Artikeln oder Wikimedia-Kategorien zugeordnet. Eine Anreicherung mit Geokoordinaten ist geplant. Grundsätzlich können die Beschreibungsdaten annotiert, korrigiert und ergänzt werden. Interessant ist hier die Frage nach dem Rückspielen verbesserter Informationen zum Archiv. Dazu gibt es kein automatisches Verfahren, Mitarbeiter des Bundesarchivs haben aber entsprechende Kommentare aus der offenen Wikimedia-Diskussion für die eigenen Daten übernommen. Offen bleibt bei beiden Anbietern die (für die weitere Verwendung durch Dritte wichtige) Frage nach persistenten (und möglichst sprechenden) Adressen für die Bilder.
      • Seit 2009 besteht eine Kooperation zwischen Wikimedia und der Deutschen Fotothek zur Übernahme von 250.000 Bildern.
  • Offene, kollaborative Erschließung und Annotation?
    • Das Web2.0 ist geprägt von der Idee der Nutzerbeteiligung. Für Archive kann das bedeuten, die Öffentlichkeit an der fortschreitenden Erschließung und Annotation der Bestände zu beteiligen. Gerade bei sehr umfangreichen Dokumentsammlungen kann die scheinbare Unerschließbarkeit durch Konzepte des "crowdsourcing" überwunden werden. Dazu zwei Beispiele:
      • Im Projekt "Investigate your MP's expenses" können die Spesenrechnungen britischer Parlamentarier online kategorisiert, ausgewertet und transkribiert werden.
      • Im Projekt "Historic Australian Newspapers" wird die fehlerhafte automatische OCR durch Benutzer korrigiert und die Zeitungsartikel annotiert und verschlagwortet.
    • Archive können offene Plattformen bereitstellen, auf denen die eigenen Bestände durch die Benutzer Themen zugeordnet, transkribiert, kommentiert oder in eigene Beiträge (Artikel) eingebunden werden können.
      • Das britische Nationalarchiv stellt ein wiki "Your Archives" zur Verfügung, die eine solche Nutzerbeteiligung an der Erschließung erlaubt. Es handelt sich dabei aber um eine Parallelstruktur zu den eigentlichen Archivangeboten. Archivalien können (über ihre Katalogisate) daran angebunden werden, ein Rückfluss in die zentralen Erschließungsinformationen und Findmittel des Archivs scheint aber nicht stattzufinden.
  • Inkrementelle, kollaborative Transkription?
    • Bislang haben sich Archive hauptsächlich auf die Basiserschließung ihrer Bestände konzentriert. Im Konzept einer beständig vertiefenden Erschließung könnte sich daran die Transkription von Dokumenten anschließen, die im Endziel sogar kritische Editionsformen hervorbringen könnten.
      • Im Projekt "Monasterium" (MOM), einem umfangreichen virtuellen Urkundenarchiv, gibt es im Bereich "kollaboratives Archiv" einen speziellen Editor, mit dem angemeldete Benutzer digitalisierte Urkunden so transkribieren und erschließen können, dass im Hintergrund ausgezeichnete XML-Daten entstehen, die für weitere Präsentationsformen verwendet werden können.
  • Semantisierung?
    • In der Erschließung von Archivgut geht es um die Gewinnung semantischer Informationen. Diese sind aber bislang weitgehend implizit in Texten gegeben gewesen. Inzwischen gibt es aber erste Ansätze, semantisches Wissen auch explizit zu fassen. Solche Ansätze wären einerseits in der Wikimedia-Bilderschließung (durch Kategorisierung, PND-Verknüpfung, Geokoordinaten) und andererseits in der Tiefenerschließung durch Editoren wie bei MOM (Identifizierung von Personen, Orten, Sachen, Urkundenformularteilen und deren Verknüpfung mit Normdaten) zu beobachten.

Gegenläufige Entwicklungstendenzen im gegenwärtigen Web

Für die gegenwärtigen Entwicklungstendenzen im Internet lassen sich zwei Richtungen beschreiben.

  • Modularisierung. Der Arbeitsprozess fortschreitender Erschließung bis hin zur wissenschaftlichen Auswertung und der Veröffentlichung der Ergebnisse kann digital so abgebildet werden, dass verschiedene Akteure zu unterschiedlichen Zeiten an unterschiedlichen Orten aktiv sind. In einem gegliederten Bearbeitungsprozess geht es dann darum, dass die Daten wechselseitig ansprechbar und nutzbar sind und in immer wieder andere Zusammenhänge eingebunden werden können. Entscheidend hierfür ist die Verwendung allgemeiner Standards (zur Datenbeschreibung und zur Datenkommunikation) und die Bereitstellung von Schnittstellen).
  • Zentralisierung. Physische Dokumente als Gegenstände der archivischen Erschließung und der wissenschaftlichen Erforschung haben einen "Ort". Wenn die Beschäftigung damit als kontinuierlicher

Prozess der fortschreitenden Durchdringung betrachtet wird, dann erscheint eine Grenzziehung zwischen verschiedenen Bearbeitungsformen willkürlich. Naheliegend wäre dagegen ein Konzept, bei dem alle Informationen und derivativen Formen an die Originale zurückgebunden bleiben. Im Grunde wäre dies die konseuqente Weiterentwicklung des alten Belegexemplar-Prinzips. Entscheidend für eine sinnvolle Tiefenerschließung sind außerdem funktonierende fachliche "communities". Deren Zusammenhalt wird ebenfalls durch umfassende Portale und Arbeitsplattformen begünstigt. Die Bereitstellung konkurrierender Arbeitsumgebungen für die gleichen Aufgaben und die gleichen Inhalte scheint dagegen nicht sinnvoll. Schließlich spricht auch die anzustrebende Dauerhaftigkeit und Stabilität solcher Angebote für eine Zentralisierung und ggf. sogar für eine Anbindung an bestehende stabile Institutionen.

  • Synthese: Modularisierung der Arbeitsprozesse bei gleichzeitiger Zentralisierung der Arbeitsumgebung.

Das Konzept virtueller Forschungsumgebungen (= virtual research environments = VRE)

Virtuelle Forschungsumgebungen ... [to be continued]

  • Das Archiv als virtualisierte Forschungsumgebung?

Fazit: Baustellen