Internet Archive: Wayback Machine a salvat pagina cu numărul un trilion și păstrează în continuare istoria web

Am aflat zilele trecute despre o realizare neașteptată a Internet Archive: Wayback Machine a arhivat pagina cu numărul un trilion, iar povestea pornește din San Francisco, cartierul Richmond, într-o fostă biserică transformată într-un sanctuar de servere. De la începuturile webului până la clipuri vechi de televiziune și jocuri retro, proiectul amintește de marile biblioteci care au adunat cunoașterea umanității; aici însă e vorba despre pagini web, capturate în timp ce lumea online se rescrie neîncetat.

CNN, preluat de PC Gamer, relatează că Wayback primește aproape 150 TB de pagini noi zilnic, ceea ce înseamnă zeci de mii de gigabyți care intră în colecție în fiecare zi. Clădirea din Richmond, fostă Fourth Church of Christ, Scientist, păstrează vitraliile și fațada originală cu opt coloane impunătoare, dar în interior sunt acum rafturi cu servere. În fostul sanctuar se găsesc câteva servere simbolice, însă majoritatea datelor sunt stocate într-un depozit mare din afara orașului. Nu există, desigur, un trilion de pagini îngrămădite între coloane, însă imaginea e frumoasă: un loc sacru care conservă istoria internetului.

Importanța păstrării instantaneelor de pagini web este clară: de la site-urile oficiale ale guvernelor, unde modificările pot fi relevante pentru jurnaliști, până la blogurile personale care altfel s-ar pierde din memoria colectivă. Istoricul modificărilor unei pagini poate oferi context despre motive și decizii, iar accesul la versiunile anterioare devine un instrument pentru transparență. Internet Archive nu se limitează doar la pagini: proiectul include digitalizări de cărți, înregistrări audio pe vinil care datează din anii 1920, CD-uri, casete, VHS, emisiuni TV și jocuri video. Diversitatea colecției arată că arhivarea online nu înseamnă doar texte, ci și sunete și imagini care marchează epocile.

Fondatorul organizației, Brewster Kahle, a creat Wayback Machine în 2001, după ce fusese implicat în WAIS, un sistem timpuriu de căutare distribuită și recuperare de documente care a pregătit terenul pentru webul modern. Ideea de a conserva fragmente digitale provine dintr-un angajament mai vechi pentru accesul la informație, iar modul în care arhiva se extinde astăzi reflectă atât progresele tehnologice, cât și provocările legate de scalare, costuri și reguli de acces. CNN și PC Gamer au subliniat aceste aspecte pentru a arăta cât de amplă este operațiunea.

Wayback Machine a ajuns la pagina cu numărul un trilion. Ritmul de aproximativ 150 TB pe zi și prezența fizică în clădirea din Richmond ridică întrebări despre responsabilitate, acces și reglementare, pe măsură ce conținutul istoric devine atât de voluminos. Cum ar trebui comunitatea, jurnaliștii și legiuitorii să gestioneze și să folosească această arhivă uriașă?

Fii primul care comentează

Lasă un răspuns

Adresa ta de email nu va fi publicată.


*