6 marca 2025

Wskazówki dotyczące archiwizacji stron internetowych oraz zawartości profili w mediach społecznościowych

Do archiwizacji witryn WWW najkorzystniejsze będzie wykorzystanie oprogramowania, które umożliwia zapisanie ich kopii w formacie WARC, który jest powszechnie wykorzystywany w tym celu. Pozwoli to w przyszłości łatwo włączyć te materiały do ewentualnego polskiego archiwum WWW. Jako przykłady można wskazać oprogramowanie przygotowane przez grupę WebRecorder, tj. ArchiveWeb.page, służący do archiwizacji stron internetowych, oraz ReplayWeb.page, do ich późniejszego odtwarzania, lub bliźniaczy serwis Conifer, który łączy obie te funkcje. Są to otwarte i łatwe w obsłudze narzędzia, które pozwalają archiwizować zasoby WWW i zapisywać je we wskazanym formacie WARC. Poniżej instrukcje do oprogramowania ArchiveWeb.page i ReplayWeb.page, w których znajdują się także odnośniki do stron, z których można je pobrać. Możliwe jest także zastosowanie innych narzędzi, które pozwalają zapisać archiwizowane zasoby w postaci pliku WARC. Lista takiego oprogramowania jest dostępna na stronie International Internet Preservation Consortium. Interwały, w których będzie odbywać się archiwizacja witryn WWW, powinny być ustalane indywidualnie w oparciu o uzyskane informacje dotyczące częstotliwości zmian lub przeprowadzanych aktualizacji treści publikowanych na danej stronie internetowej.

Do archiwizacji zawartości fanpage’ów na Facebooku jedynym rozwiązaniem jest pobranie danych z nim związanych z poziomu administratora danej strony. Funkcja ta jest dostępna w ustawieniach strony w zakładce „Ogólne” i opisana jest jako „Pobierz stronę”. Dane z fanpage’a można pobrać w formacie HTML oraz JSON, które najkorzystniej byłoby wykorzystać jednocześnie. Funkcja „Pobierz stronę” pozwala na wskazanie jaki zakres zawartości ma zostać pobrany, przede wszystkim powinny być to posty, wydarzenia oraz relacje. Należy wskazać także zakres chronologiczny, natomiast jakość multimediów pozostawić ustawioną jako wysoką. Po przygotowaniu paczki przez Facebooka będzie możliwe jej pobranie. Podobne rozwiązania są dostępne także w innych portalach społecznościowych, m.in. na Twitterze.

Archiwalne kopie zasobów WWW powinny trafić do archiwum zakładowego po ich wykonaniu i być przekazane w systemie teleinformatycznym lub na elektronicznym nośniku danych na podstawie spisu zdawczo-odbiorczego. Po upływie okresu przechowywania w jednostce, Archiwum Państwowe ustali sposób przekazania tych materiałów, które może odbyć się za pomocą Archiwum Dokumentów Elektronicznych (ADE) lub poza nim na elektronicznym nośniku danych.

 

Załączniki

Instrukcja archiwizacji witryn WWW
Data: 2025-03-06, rozmiar: 1 MB