Vo vnútri internetového archívu

Domov internetového archívu, neziskového, ktorý už 22 rokov zachováva našu online históriu: Milióny webových stránok, tweety, novinové články, videá a memes.
Nie je to jednoduché. Internet je obrovské, éterické miesto v neustálom stave rozkladu. Obsahuje 1.8B webových stránok (z ktorých iba 644 m je aktívnych) a zdvojnásobuje svoju veľkosť každých 2 až 5 rokov – avšak priemerná webová stránka ostane na internete len 100 dní. Bez zálohovania sa tieto položky časom stratia. Ale archivovanie všetkého so sebou prináša veľkú zodpovednosť: Čo si zvolíte ponechať? Ako to ponecháte? A prečo na tom všetkom záleží?

archiv
 
V polovici deväťdesiatych rokov sa Brewster Kahle stal úspešným podnikateľom. Po štúdiu spustil superpočítačovú firmu, založil prvú online platformu pre publikovanie, a spustila Alexa Internet, spoločnosť, ktorá „prehľadala“ web.
Zakladateľ internetového archívu, s niekoľkými servermi, v roku 1996 začal používať softvér na „zálohovanie“ internetu v jeho podkroví. Tento projekt, nazvaný internetový archív, sa snažil poskytnúť verejnosti „univerzálny prístup ku všetkým vedomostiam“ a „znovuzrodiť“ Alexandrijskú knižnicu-

Viac ako 6 rokov súkromne archivoval viac ako 10B webových stránok. Potom v roku 2001 debutoval s Wayback Machine. V súčasnosti má stroj Wayback 388B webových stránok a internetový archív, je najväčšou knižnicou na svete.
Koľko toho vlastne je? Predstavte si 80 miliónov 4-zásuvkových kartoték plných papiera. Alebo len o niečo menej ako všetky napísané diela ľudstva (vo všetkých jazykoch) od začiatku zaznamenanej histórie až po súčasnosť. Na porovnanie, Kongresová knižnica USA obsahuje približne 28 terabajtov textu – čo je menej ako 0,1% ukladacieho priestoru internetového archívu.
Tento internetový archív sa môže pochváliť pôsobivou zbierkou médií všetkého druhu.

Každý týždeň internetový archív používa 7 000 botov, ktorí prechádzajú internetom a vytvárajú kópie miliónov webových stránok. Tieto kópie, nazývané „snímky“, sa ukladajú na rôznych frekvenciách (niekedy viackrát za deň, inokedy raz za pár mesiacov) a uchovávajú webové stránky v určitom okamihu.
Fungovanie týchto operácií vyžaduje obrovské množstvo technických zdrojov, vývoj softvéru, stroje, pevné disky, operačnú infraštruktúru – a peniaze (ktoré spolu vyčleňujú z grantov a darov, ako aj archívna služba Archív).
 
Politika zachovania
 Jednou z najväčších otázok pri archivovaní akéhokoľvek média je to, čo sa kurátor rozhodne zahrnúť.
Zálohuje sa množstvo webových stránok, ale nie všetko, vyberanie stránok , ktoré sa oplatí uchovať stojí neskutočné množstvo úsilia. Internet je jednoducho príliš rozsiahly na zachovanie všetkého v plnom rozsahu. Je to formát, ktorý sa neustále mení.

technologie

Avšak nemôžme dovoliť cenzúre alebo niekomu, aby odstraňoval stránky, ktoré sa mu nepáčia, preto uchová tieto materiály v bezpečí, a aj napriek tomu, že sú súkromné sú neustále dostupné.
Ak chceme vedieť, čo sa stalo pred 10 rokmi, pred dvadsiatimi rokmi je internet často jediným záznamom.