#problem #lösung: auto-archivierung von websites – offline, les- und durchsuchbar, für die wissenschaftliche analyse…

Zum jetzigen Zeitpunkt des stellt sich die vorbereitende Frage, welche Software wohl für die Analyse und noch(???) notwendige Archivierung von Websiten (in unserem Fall: weblogs) hilfreich, zuverlässig und kompatibel mit anderen Programmen wäre. Zwar ist die Forschung selbst noch weit von der Datenerhebungsphase entfernt, jedoch zeigt die Erfahrung (d.h. explizierbare Erwartungshaltungen im Bezug auf zukünftige Entwicklungen ;) ), dass solch scheinbar nebensächlichen Fragen besser frühzeitig gestellt und im ‘Nebenbei’ behandelt werden sollten, statt kurz vor knapp.

Dies bringt uns zur Suche nach einer geeigneten Software. Folgende Liste gibt eine (für Listen typisch: offene) Zusammenschau der notwendigen Kriterien wieder:

  • Offline Speichern von Websites, inkl. eingebundener Dateien, durchsuchbar für den Finder (Texterkennung)
  • Möglichst kostenlos oder günstig – nur die perfekte Software rechtfertigt größere Ausgaben
  • Stabilität: das app muss auch in Zukunft weiterentwickelt werden, und für leichte Exporte in andere Programme offen sein
  • Automatisches Abholen von Veränderungen der abonnierten Websites – inkl. der Erzeugung von Versionen zur Nachverfolgung einer Versionsgeschichte der Website

Selbstverständlich ist eine solche Liste an Kriterien – obgleich denkbar kurz – kaum in der gewünscht vollständigen Umsetzung erfüllbar. Dennoch ein paar Empfehlungen:

  • WebCite® – wäre vermutlich die optimale Lösung, bietet online wie offline Möglichkeit Seiten zu abonieren und ihre Erreichbarkeit zu garantieren; allerdings ist auf der Website von WebCite® zu lesen, dass, sollte der Crowdfundingaufruf unbeantwortet bleiben (und so sieht es momentan aus), der Dienst über 2013 hinaus nicht weiter angeboten werden wird. Stabilität der Software ist jedoch ein entscheidendes Kriterium für längerfristige Forschungsprojekte…

  • Pinboard – mit 10 Euro sicher eine vollkommen akzeptable Möglichkeit, wenngleich ich mich noch nicht über die Möglichkeiten schlau machen konnte; empfohlen wurde mir der Service von Adrian Herrmann, ebenso wie WebCite®
  • Evernote – Evernote ist ein kleines app, dass jüngst immer stärkeren Zuspruch findet. Dass man es zur Dokumentation verwenden könnte wurde von einer Zusammenstellung von Zettelkastenapps nahegelegt, aber praktisch erprobt ist das noch nicht.
    Die Vorteile von Evernote:
    +Plattformübergreifend und sogar für mobile Endgeräte wie Smartphones oder Tabletts geeignet!
    + kostenlos
    + so groß, dass es vermutlich noch länger unterstützt wird – lediglich die Frage, ob der Service unverändert bleibt, kann jetzt natürlich nicht beantwortet werden
    + es gibt eine nette Browsererweiterung, genannt Evernote Clipper, die ein Hinzufügen von Websites extrem einfach gestaltet.
    + Evernote arbeitet hervorragend mit dem RSSfeedReader Reeder zusammen, den ich für meine RSSfeeds verwende. Über einen solchen Reader wäre auch ein Abholen neuer posts auf Weblogs automatisch möglich – ein Export zu Evernote dann nur noch ein Klick…
    + Es gibt eine online-offline-sync Funktion, so dass man auch wenn der Computer verschwindet die Daten noch (online) verfügbar wären.
    Es gibt jedoch auch Nachteile:
    – Datenschutzrechtlich scheinen so große Online-Services immer etwas dubios – auch wenn ich in diesem Fall keine überzeugenden Argumente für meinen Verdacht bringen kann, außer: kommerziell…
    – Online-Sync-Funktionen sind zwar praktisch, aber auch sdtöranfälliger
    – Der Export ist nicht 100% einfach, auch muss zusätzlich die gespeicherte Seite im Literaturverwaltungsprogramm gespeichert werden, was wiederum sehr umständlich ist.
  • Zotero – immer mehr und mehr wird klar, wie genial, flexibel, anpassbar, stabil, kostenlos, und praktisch das Literaturverwaltungsprogramm Zotero ist! Wobei Literaturverwaltungsprogramm wäre vermutlich stark untertrieben: PDF Datenbank Verwaltung, Literaturverwaltung, Offlinearchivierung, die Verwendungsmöglichkeiten scheinen endlos… Für den hier beschriebenen Fall bietet das Programm auf jeden Fall die Möglichkeit (über den Zotero-Picker oder im Firefox als Plugin) Snypshots von Websiten zu erstellen, die Zotero offline als nahezu voll funktionsfähige .html Datei speichert und so nicht nur durchsuchbar hält, sondern auch als Website unverändert (nur die Linkstrukturen bleiben beim Snapshot unbeachtet). Für die Untersuchung von Weblogs und die auf Posts oft folgenden Kommentare ist dies ein nicht zu unterschätzendes Hilfsmittel. Auch nicht zu vergessen ist der Umstand, dass als Literaturverwaltungsprogramm Zotero schon die für wissenschaftliches Arbeiten notwendige Genauigkeit der Angaben (Quelle, Autor, Zeitstempel, etc.) ermöglicht und ein doppeltes Verweisen (Literaturverwaltung und Archivierung) unnötig macht.
    Einzige Nachteile: Zotero holt keine Updates der einmal zitierten Websites ab (zumindest ist mir das nicht bekannt) und kann somit auch keine Versionsgeschichte automatisch (=praktisch) speichern. Ebenso bleiben die Links in der Tiefe unberücksichtigt (die verlinkte Seite wird nicht mitgespeichert) auch wenn der Link selbst (vorausgesetzt die Seite existiert noch unter der ursprünglichen Adresse) funktionsfähig bleibt. (Dank an @smithersdeluxe für die Empfehlung von Zotero für diesen Verwendungskontext!)

 

Die Liste an Kriterien als auch die einzelnen vorgeschlagenen apps zeigen nur eine begrenzte Auswahl; vielleicht kommen noch neue Bedürfnisse oder auch neue Entdeckungen hinzu. Zum momentanen Zeitpunkt scheint Evernote praktisch ob der Kompatibilität mit anderen Programmen – Zotero dafür besser an Literaturverwaltung und wissenschaftliches Arbeiten angepasst. Hier kann vermutlich nur ein praktischer Versuch klären. Oder leser- / ? Kommentare erbeten…
Auf jeden Fall: Zotero zur Literaturverwaltung, Archivierungsprogramme wie oben, und der Zettelkasten von Daniel Lüdecke (siehe auch #zettelkasten in form von , oder ? auf der suche nach der form der verlinkung” href=”https://www.sinnsysteme.de/zettelkasten-in-form-von-blogs-zkn3-oder-wiki-auf-der-suche-nach-der-form-der-verlinkung/” target=”_blank”>den post zu Zettelkästen) ergeben eine leistungsstarke Kombination von Werkzeugen für die wissenschaftliche Arbeit. Ergänzungen? Rückmeldungen? Anregungen?

 

Leave a Reply