sibek.cz

vizitka a blog

sibek.czSouběžníkinternetArchivace webu pro každého

Archivace webu pro každého

HTTrack Website Copier – Offline Browser
HTTrack je volně dostůpný software (vydaný pod General public license), který je určen k snadnému ukládání sbírek souborů a složek webových stránek na lokální disk. Veškeré odkazy v kódu jsou programem upravovány do relativní podoby, takže je posléze možné procházet stažený web v prohlížeči off-line. Výsledkem práce HTTracku je tedy zrcadlo webu uložené na Vašem počítači.

WebCite
WebCite je webový nástroj pro tvorbu „bibliografických“ citací internetových stránek. Společně s citací vzniká i archivní kopie citovaného zdroje. URL adresa takto vytvořené kopie je nedílnou součástí vygenerované citace. Jedná se tedy o archivaci webu na vyžádání. Archiv, který se tímto způsobem dál rozrůstá, je veřejně přístupný. Navíc zřizovatel služby WebCite Consortium spolupracuje s celou řadou vědeckých online časopisů, jejichž obsah je archivován přímo na základě smlouvy. Díky kooperaci s dalšími institucemi (včetně Internet Archive) vznikají i pravidelné zálohy celého archivu.

Internet Archive: Wayback Machine
Zřejmě nejznámější službou webových archivů je Wayback Machine americké organizace Internet Archive. Když byl v roce 2001 archiv zpřístupněn prostřednictvím Wayback Machine rozhraní, jednalo se o revoluční přínos do světa internetu. Na základě URL adresy můžete vyhledat seznam archivovaných verzí, které zastupují jednotlivé sklizně dané lokace. Během několika sekund je online volně k dispozici historický obraz vybrané webové stránky. Sbírka Internet Archive sahá až do roku 1996 a má univerzální celosvětový záběr. Její velikost představovala v době zpřístupnění 100 TB, o pět let později (v roce 2006) se již jednalo o 1500 TB (1,5 PB). Otevřený přístup k archivu Internet Archive přináší uživatelům nedocenitelný komfort. Jeho aplikace vychází z předpokladu, že většina autorů volně přístupných stránek nevnímá jejich zařazení do archivu jako útok na svá práva. Proto Internet Archive zpřístupňuje online veškeré sklizené webové stránky a případné stížnosti a námitky autorů řeší individuálně. Pokud si to autoři vyžádají, jsou jejich stránky ze sbírek vyřazeny. Tento specifický přístup je ovšem částečně dán americkou legislativou a také postavením Internet Archive jako neziskové organizace.


Volně čerpáno z publikace: Archivace webu. Praha : Národní knihovna ČR, 2008. ISBN 978-80-7050-562-5.