Wayback Machine

Матэрыял з Вікіпедыі - вольнай энцыклапедыі
Перайсці да навігацыі Перайсці да пошуку
Wayback Machine
Wayback Machine
Выява лагатыпа
URL archive.org/web/ (англ.)
Тып сайта архіў
Мова(-ы) англійская
Мова праграмавання Java , Python
Уладальнік Архіў Інтэрнэту
Пачатак працы 24 кастрычніка 2001
Рэйтынг Alexa 205[1]

Wayback Machineангл. - «Машына часу») - бясплатны онлайн-архіў некамерцыйнай бібліятэкі « Архіў Інтэрнэту ». З дапамогай пошукавых робатаў або вэб-краулераў Wayback Machine архівуе і робіць агульнадаступнай большую частку «адкрытага» інтэрнэту[2] . Сэрвіс быў запушчаны ў 1996 годзе, аднак стаў даступны для грамадскасці толькі ў 2001 годзе. За першыя 20 гадоў існавання Wayback Machine каталагізавала і захаваў калекцыю з больш чым 286 млрд вэб-старонак. Архіўныя здымкі адлюстроўваюцца ў фармаце HTML , JavaScript і CSS[3] . Дзякуючы захаваным у Wayback Machine дакументам карыстальнікі могуць адсочваць змены, якія адбываюцца на сайтах, і параўноўваць розныя версіі правак [4] . На ліпень 2021 года Wayback Machine даваў доступ да больш чым 591 млрд захаваных вэб-старонак [5] .

Стварэнне

Сервера Архіва Інтэрнэта, 2008 год
Брустэр Кейл у 2009 годзе

У 1989 годзе англійская вучоны Цім Бернерс-Лі стварыў сусветную павуціну – сістэму, якая дазваляе перадаваць дадзеныя праз падлучаныя да інтэрнэту кампутары. Аднак з распаўсюджваннем сусветнага павуціння былі выяўлены дзве асноўныя праблемы. Першая складалася ў недахопе месцаў для захоўвання ўсіх дадзеных, з-за чаго многія дакументы і вэб-старонкі выдаляліся. Іншая праблема заключалася ў тым, што пасля рэдагавання вэб-старонкі (напрыклад, па юрыдычных прычынах), карыстачы не маглі паглядзець яе першапачатковую версію. Вырашыць гэтыя недахопы імкнулася амерыканская лічбавая бібліятэка " Архіў Інтэрнэту " - некамерцыйная арганізацыя, створаная праграмістамі Брустэрам Кейлам і Брусам Галіятам [en] у 1996 годзе. Пры супрацоўніцтве з Alexa Internet ( даччынай кампаніяй Amazon , якая займаецца вэб-індэксаваннем) Архіў ініцыяваў стварэнне і захоўванне копій існуючых сайтаў для развіцця "ўніверсальнага доступу да ведаў". Арганізацыя прадастаўляла бясплатны публічны доступ да аблічбаваных матэрыялаў, такіх як вэб-старонкі, кнігі, аўдыёзапісы, уключаючы жывыя канцэрты, відэа, выявы і праграмнае забеспячэнне. На 2021 год штаб-кватэра Архіва Інтэрнэту знаходзіцца ў Сан-Францыска , у будынку былой хрысціянскай царквы, размешчанай у раёне Рычманд . Журналіст мясцовай радыёстанцыі Kawl [en] у 2019 годзе параўноўваў офіс Архіва з рымскім храмам [6][7] [8] . Арганізацыя ставіць перад сабой мэту выратаваць інтэрнэт ад знікнення[9] .

Wayback Machine стаў самым вядомым праектам Архіва. Анлайн-сэрвіс быў названы ў гонар машыны часу з мультсерыяла 1960-х гадоў « Шоу Рокі і Булвінкля ». Ён дае доступ да лічбавай калекцыі з прыкладна 562 млрд вэб-старонак [4] [10] [11] . Праект Wayback Machine быў задуманы як рашэнне праблемы памылкі 404 , якая азначае, што сервер не можа знайсці дадзеныя па запытаным адрасе. Гэта звязана з так званым выміраннем спасылак - нарастальнай недаступнасцю некалі апублікаваных дадзеных. Так, у 1997 годзе сярэдняя працягласць жыцця вэб-старонкі складала 44 дні. У 2003 годзе гэты паказчык склаў 100 дзён. Праведзены ў 2008 годзе аналіз спасылак на 2700 лічбавых рэсурсаў, большасць з якіх не маюць друкаваных аналагаў, паказаў, што каля 8 працэнтаў спасылак пераставалі працаваць праз год. Да 2011 года, праз тры гады, 30 працэнтаў спасылак у калекцыі былі мёртвыя [12] . Дзякуючы інтэграцыі з Alexa, які сутыкнуўся з паведамленнем пра памылку карыстач мог атрымаць доступ да заархіваванай версіі старонкі праз укаранёную ў браўзэр панэль прылад. Калі копія недаступнай старонкі прысутнічала ў базе даных Wayback Machine, то загаралася спецыяльная кнопка. Пры гэтым карыстальнікі маглі даць браўзэру дазвол на прагляд і рэгістрацыю актыўнасці - у такім выпадку ўсе наведвальныя сайты архіваваліся на партале [13] .

Wayback Machine быў запушчаны ў маі 1996 года, аднак стаў даступным для грамадскасці толькі ў 2001-м — да гэтага ўся запісаная на лічбавых магнітных стужках інфармацыя была адкрыта толькі для абмежаванай колькасці вучоных і даследчыкаў [14] . Да моманту «адкрыцця» архіў утрымліваў больш за 10 млрд заархіваваных старонак [4] . Да снежня 2014 года кіраўніцтва Wayback Machine паведаміла, што захавала 435 млрд вэб-старонак па ўсім свеце[2] . З тэхнічнага пункта гледжання праграмнае забеспячэнне Wayback Machine не з'яўляецца архівам, а хутчэй агульнадаступным інтэрфейсам да абмежаванага падмноства ўсіх сховішчаў [15] . Так, Wayback Machine нельга лічыць пошукавай сістэмай калекцыі арганізацыі, бо яна не ажыццяўляе пошук па базе даных іншай буйной віртуальнай бібліятэкі — Open Library , якая дазваляе карыстальнікам бясплатна атрымліваць доступ да лічбавых копій кніг, якія загружаюцца і архівуюцца ў рамках праекта [16] [17 ] .

Характарыстыка

З запускам Wayback Machine «Архіў Інтэрнэту» стаў адным з самых папулярных і вядомых анлайн-парталаў і галоўным сэрвісам вэб-архівавання [4][9] . У 1999 годзе Архіў пачаў пашыраць калекцыю за межы архіўнага вэб-кантэнту, каб забяспечыць статус як да алічбаваных так і першапачаткова лічбавых рэсурсаў, у тым ліку кніг, аўдыё, фільмаў, малюнкаў, дакументаў, праграмнага забеспячэння і відэагульняў[7] . Некаторыя сканавання выконваюцца пошукавымі робатамі самога архіва, а іншыя - партнёрскімі арганізацыямі. Асобныя базы даных могуць набывацца за кошт ахвяраванняў карыстальнікаў і мэтавых набыццяў [17] . Самі стваральнікі арганізацыі параўноўвалі сваю калекцыю з Александрыйскай бібліятэкай[7] . На 2021 год Wayback Machine утрымліваў больш за 424 млрд вэб-старонак [15] — больш, чым дакументаў у Бібліятэцы Кангрэса [18][7] [17] .

Прынцып працы

Платформа Wayback Machine функцыянуе за кошт двух асноўных элементаў – пошукавых робатаў (або вэб-краулераў ) і інтэрфейсу. Вэб-краўлеры займаюцца наведваннем, атрыманнем, загрузкай і архіваваннем вэб-старонак. У сваю чаргу, праз інтэрфейс карыстачы атрымліваюць доступ да анлайн-калекцый[3] .

Пошукавыя робаты

Рост калекцыі Wayback Machine [19]
Калекцыя Wayback Machine па гадах Архіваваныя старонкі (у мільярдах)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452
2020
514
2021
581

Першапачаткова калекцыя архіва папаўнялася за кошт браузернага плагіна ад Alexa Internet, які аўтаматычна фіксаваў і захоўваў кожную вэб-старонку па меры яе наведвання, затым перадаючы ўсю сабраную інфармацыю ў "Архіў Інтэрнэту". Карыстальнікі таксама маглі ўсталяваць бясплатную панэль інструментаў, якая дазваляла правяраць статус архівавання абранага вэб-сайта [17] .

У 2002 годзе Архіў запусціў уласны пошукавы робатHeritrix [en] з адкрытым зыходным кодам. Коды краўлераў запісаныя з дапамогай камбінацыі праграмных моў Cі і Perl . Акрамя гэтага, "Архіў Інтэрнэту" таксама прымае дадзеныя сканавання ад іншых донараў[7] . Адсканаваныя копіі вэб-сайтаў аўтаматычна канвертуецца ў файлы памерам каля 100 МБ, якія затым захоўваюцца на серверах. Агульная хуткасць папаўнення архіва складае каля 10 тэрабайт у месяц [20] .

Вэб-краўлеры адлюстроўваюць версію сайта такой, якой яна была захавана на момант доступу да яе праз URL. Робаты рэгулярна скануюць вялікую колькасць вэб-старонак, рэкурсіўна загружаючы, аналізуючы і адлюстроўваючы HTML , JavaScript і CSS старонкі[3] . Механізм працы краулераў падобны на працу пошукавых сістэм – робаты самастойна шукаюць парталы для архівавання праз сістэму пошуку шляхоў, скануючы старонкі і звязаныя з імі сайты, такім чынам фармуючы сетку парталаў. На момант стварэння Архіва, сусветная сетка была настолькі маленькай, што вэб-краўлеры маглі здзейсніць абыход усіх сайтаў за адзін сеанс. Аднак з часам пастаянны рост анлайн-парталаў і іх зменлівасць зрабілі поўны абыход усёй сеткі практычна немагчымым. Такім чынам, не ўсе змены на сайтах зафіксаваны ў Wayback Machine[9] . Кіраўніцтва Архіва не ўдакладняе тое, як робаты знаходзяць і выбіраюць старонкі для сканавання, аднак заяўляе, што часцей за ўсё краўлеры накіроўваюцца на тыя сайты, якія маюць крыжаваныя спасылкі з іншых парталаў і знаходзяцца ў адкрытым доступе. Сканар пачынае з вэб-старонкі, а затым ідзе па кожнай гіперспасылцы на гэтай вэб-старонцы, каб перайсці на новыя сайты. На кожнай з новых вэб-старонак пошукавы робат паўтарае працэс [15] . Ён будзе працягвацца да таго моманту, пакуль архівацыя не будзе спынена ці не дасягне ўсталяванага скрыптам ліміту [21] . Акрамя гэтага, кожны карыстач можа выкарыстоўваць адмысловую форму на партале і выклікаць краулер, які захавае старонку ў бягучым стане[3] . Wayback Machine скануе толькі агульнадаступныя вэб-старонкі і не можа атрымаць доступ да кантэнту, абароненага паролем або размешчанага на прыватным серверы [11] [15] [4] .

Інтэрфейс

Інтэрфейс Wayback Machine дазваляе карыстальнікам ажыццявіць два асноўныя дзеянні - атрымаць доступ да гісторыі змяненняў сайта і прагледзець усе зробленыя на парталах праўкі. Таксама даступная функцыя параўнання розных версій сайтаў [13] [22] [18] [23] . Для гэтага ў спецыяльнае акно пошуку ўводзіцца URL цікавага партала, пасля чаго Wayback Machine выдае спіс дат архівацыі. Зорачка пасля некаторых дат выкарыстоўваецца для абазначэння выяўленых на старонцы змен. URL-адрас заархіваванай старонкі пачынаецца з web.archive.org [24] [15] .

Любы карыстальнік можа захаваць URL-адрасы для архівавання, а з бясплатным уліковым запісам у архіве можна стварыць і заархіваваць любыя выходныя або знешнія спасылкі на зыходнай старонцы і атрымаць аглядную справаздачу [25] [25] .

Захоўванне

На 2018 год калекцыя Архіва Інтэрнэту складала больш за 40 петабайт або 40 млн гігабайт даных, Wayback Machine даваў доступ да прыкладна 63 % усіх наяўных матэрыялаў [26] . На люты 2020 года ў архіве Wayback Machine лічылася больш за 900 млрд URL-адрасоў і больш за 400 млрд вэб-старонак [27] . На чэрвень 2021 года Wayback Machine падаваў доступ да больш за 581 млрд захаваных вэб-старонак [5] .

Выкарыстанне

Партал Wayback Machine часта ўжываюць у прававой сферы - юрысты выкарыстоўваюць сэрвіс для пошуку інфармацыі па грамадзянскіх пазовах, крымінальных справах, адміністрацыйным справаводстве і патэнтных працэсах. Атрыманыя праз Wayback Machine архіўныя версіі сайтаў могуць выкарыстоўвацца для вырашэння пытанняў аб патэнтным праве або ўстанаўленні пакарання за публікацыю матэрыялаў, якія пасля былі выдалены з сеткі[3] [13] . Нягледзячы на ​​шырокае выкарыстанне калекцыі Архіва Інтэрнэту для давання доказаў, некаторыя суды ЗША адмаўляліся прымаць скрыншоты вэб-старонак, спасылаючыся на юрыдычную складанасць атаясамлення арыгінала дакумента і яго заархіваванай версіі [28] . У 2018 годзе апеляцыйны суд ЗША пастанавіў, што скрыны з архіва вэб-старонак Wayback Machine адносяцца да законных доказаў, якія могуць быць выкарыстаны ў судовых разборах [29] [30] .

Дзякуючы архіваваным у Wayback Machine артыкулам аўтары могуць усталёўваць права на адкрыццё або на публікацыю [31] . Для сацыёлагаў і гісторыкаў Wayback Machine прапануе каштоўную буйнамаштабную крыніцу дадзеных для аналізу паводзінаў кампаній, стратэгій продажаў, сацыяльных практык[2] [32] . Таксама Wayback Machine дазваляе атрымліваць доступ да часопісаў адкрытага доступу . Так, з пачатку 2000-х гадоў з інтэрнэту зніклі 84 часопісы АД па прыродазнаўчых навуках і яшчэ каля 100 — па сацыяльных і гуманітарных [33] [34] [35] .

Актывісты і даследчыкі выкарыстоўваюць партал для барацьбы з дэзінфармацыяй , якая асабліва ўзмацнілася пасля абрання прэзідэнта Дональда Трампа ў ЗША . У адказ на якія пачасціліся супярэчлівыя заявы з боку адміністрацыі прэзідэнта , Архіў стварыў асобную калекцыю пад назовам «Архіў Трампа», утрымоўвальную выступы прэзідэнта на тэлебачанні і твіты . Архіў спадзяецца, што яго сховішча дапаможа іншым выяўляць ілжывую інфармацыю і правяраць падазроны кантэнт [36] [37] . Аднак у некаторых выпадках асобныя актывісты сцвярджалі, што заархіваваныя Wayback Machine рэсурсы наадварот садзейнічалі распаўсюджванню дэзінфармацыі. Так, з пачаткам пандэміі каранавіруса , прыхільнікі канспіратыўных тэорый выкарыстоўвалі захаваныя парталам скрыншоты для распаўсюджвання ілжывай інфармацыі аб каранавірусе [38] . У якасці контрмер у лістападзе 2020 года Архіў укараніў у Wayback Machine інструменты праверкі інфармацыі на дакладнасць. Для гэтага некамерцыйная арганізацыя пачала супрацоўнічаць з рознымі кампаніямі, якія займаюцца праверкай фактаў, каб даваць карыстальнікам прычыны выдалення той ці іншай старонкі з калекцыі. Пры адкрыцці заархіваванай версіі сайта Wayback Machine падае карыстальнікам звесткі аб прычыне яе выдалення ў выглядзе жоўтага банэра уверсе экрана. Пры падазрэнні на дачыненне вэб-старонкі да кампаніі па дэзінфармацыі Wayback Machine падае дадзеныя аб арганізацыі, якая праводзіла праверку на дакладнасць, і спасылку на яе справаздачу [39] .

У асобных выпадках атрыманая праз Wayback Machine інфармацыя фігуравала ў буйных скандалах. Так, з дапамогай партала было высветлена, што афіцыйны прадстаўнік Міністэрства аховы здароўя і сацыяльных службаў ЗША Майкл Капуто [en] у серыі ўжо выдаленых твітаў публікаваў расісцкія і прыніжальныя каментарыі аб кітайскім народзе [40] . Акрамя гэтага, Wayback Machine захоўвае копію пазней аддаленага паведамлення аб тым, што лідэр украінскіх сепаратыстаў Ігар Стралкоў узяў адказнасць за катастрофу Boeing 777 у Данецкай вобласці [41] [42] . У траўні 2021 года выданне Bellingcat высветліла, што змешчаныя ў Еўропе амерыканскія вайскоўцы выкарыстоўвалі для захоўвання засакрэчаных дадзеных дзіцячыя мабільныя прыкладанні для запамінання інфармацыі. З-за няправільна ўсталяваных налад прыватнасці іншыя карыстачы атрымалі доступ да сакрэтнай інфармацыі. Пасля выяўлення ўцечкі інфармацыі вайскоўцы выдалілі ўсе карткі, але яны засталіся ў сэрвісе Wayback Machine [43] .

Прававы статус

"Архіў Інтэрнэту" не запытвае дазволу на капіраванне вэб-сайтаў перад выдаленым зборам дадзеных, аднак выдаляе або абмяжоўвае доступ да архіўных матэрыялаў па запыце. Напрыклад, уладальнікам вэб-сайтаў даецца магчымасць "адмовіцца" ад архівавання праз стандартны файл robots.txt , які выключае вэб-сайты са спісу парталаў для вэб-краулераў[9] [44] . Аднак з-за захавання іншых дадзеных "Архіў Інтэрнэту" знаходзіцца ва ўразлівым юрыдычным становішчы [45] . Так, у 2005 годзе Wayback Machine аказаўся ўцягнутым у спрэчку аб таварных знаках паміж кампаніямі Healthcare Advocates і Health Advocate. Апошняя выкарыстоўвала Wayback Machine для доступу да вэб-старонак Healthcare Advocates, датаваным 1999 годам, у спробе знайсці інфармацыю, якая падтрымала б справу. У адказ Healthcare Advocates падала ў суд як на Health Advocatt, так і на Архіў, сцвярджаючы што архіў парушыў Закон аб аўтарскім праве ў лічбавую эпоху . Пасля справа была ўрэгулявана ў дасудовым парадку [46] .

У 2002 годзе Архіў выдаліў са сваёй сістэмы спасылкі на архіўныя копіі партала Xenu.net, які належыць крытыку царквы Андрэасу Хельдал-Лунду. Выдаленне адбылося па патрабаванні юрыстаў Царквы Саенталогіі , якія заявілі, што валодаюць правам уласнасці на вытрымкі з дакументаў Царквы, апублікаваныя на сайце [47] [48] .

Абмежаванні

Даследнікі і актывісты крытыкуюць Wayback Machine і дзейнасць Архіва Інтэрнэту за спробу захаваць усе анлайн-матэрыялы, многія з якіх не ўяўляюць належнай каштоўнасці. На думку асобных даследчыкаў, гэта звязана са састарэлай палітыкай Архіва Інтэрнэту, які быў заснаваны ў канцы 1990-х гадоў - тады, на світанку стварэння інтэрнэт-архіваў, лічылася, што дадзеныя інтэрнэту павінны захоўвацца ў поўным аб'ёме. Аднак са стварэннем мноства аднадзённых сайтаў многія даследчыкі і актывісты памянялі сваё меркаванне [49] . Іншыя крытычныя заўвагі адносяцца да тэхнічных абмежаванняў сэрвісу — Wayback Machine не дазваляе захоўваць і апрацоўваць пэўныя элементы JavaScript, а таксама можа ствараць заархіваваныя старонкі, якія змяшчаюць непрацуючыя спасылкі, адсутную графіку або якія з'яўляюцца няпоўнымі па іншых прычынах [50] . Сканары захопліваюць толькі статыстычны здымак сайта - функцыі парталаў на аснове Java або Flash працаваць не будуць. Гэта азначае, што большая частка функцыянальных магчымасцяў зыходнай вэб-старонкі губляецца[9] .

Блакіроўкі

У 2015 годзе Раскамнагляд прыняў рашэнне заблакаваць Wayback Machine за копію старонкі тэксту «Адзінкавы джыхад у Расіі», які змяшчае інфармацыю аб «тэорыі і практыцы партызанскага супраціву». Адпаведная старонка ў Архіве Інтэрнету была дададзена ў афіцыйны рэестр забароненых вэб-сайтаў у Расіі 23 чэрвеня 2015 года, з-за чаго некаторыя расійскія інтэрнет-правайдэры былі вымушаны поўнасцю заблакіраваць сайт Архіва Інтэрнета [51] [52] [53] . У 2019 годзе прадстаўнікі Асацыяцыі па абароне аўтарскіх правоў у інтэрнэце (АЗАПІ) падалі серыю іскаў супраць сэрвісу Wayback Machine за парушэнне аўтарскіх правоў. Представители АЗАПИ запросили Мосгорсуд вынести решение о вечной блокировке портала на территории России, однако на август 2020 года Архив Интернета по-прежнему продолжал свою работу [54] [55] [56] [57] .

В 2017 году портал был заблокирован в Индии и Киргизии за содержание «экстремистских материалов» [58] [59] [60] . По данным на 2021 год сайт заблокирован в Китае [61] .

Нататкі

  1. https://www.alexa.com/siteinfo/archive.org
  2. 1 2 3 Arora, 2015 .
  3. 1 2 3 4 5 Lerner, 2017 , с. 1741—1755.
  4. 1 2 3 4 5 Michael Bryant. What is the Wayback Machine and Why is it Useful? . Groovy Post (22 апреля 2021). Дата абарачэння: 29 мая 2021.
  5. 1 2 Wayback Machine Wayback Machine. Дата абарачэння: 7 чэрвеня 2021.
  6. Dominic Cummings: how the internet knows when you've updated your blog . The Conversation (28 мая 2020). Дата абарачэння: 3 чэрвеня 2021.
  7. 1 2 3 4 5 Odgen, 2017 .
  8. In An Old Church, The Internet Archive Stores Our Digital History . Kalw. San Francisco local public radio (11 сентября 2019). Дата абарачэння: 3 чэрвеня 2021.
  9. 1 2 3 4 5 Price, 2011 .
  10. Jack Schofield. The Time Machine . The Guardian (19 ноября 2007). Дата абарачэння: 1 чэрвеня 2021.
  11. 1 2 Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress . WPMudev (25 мая 2017). Дата абарачэння: 29 мая 2021.
  12. Adrienne LaFrance. Raiders of the Lost Web . The Atlantic (14 октября 2015). Дата абарачэння: 7 чэрвеня 2021.
  13. 1 2 3 Rogers, 2017 , с. 160—172.
  14. Hartelius, 2020 , с. 378.
  15. 1 2 3 4 5 Bowyer, 2021 , с. 43—57.
  16. Aja Romano. A lawsuit is threatening the Internet Archive — but it's not as dire as you may have heard . Vox (23 января 2020). Дата абарачэння: 29 мая 2021.
  17. 1 2 3 4 Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web . Forbes (18 января 2016). Дата обращения: 5 июня 2021.
  18. 1 2 O'Connor, 2008 , с. 64.
  19. michelle. Wayback Machine Hits 400,000,000,000! . Internet Archive (May 9, 2014). Дата обращения: 25 марта 2015. Архивировано 26 августа 2014 года.
  20. Richard Koman. How the Wayback Machine Works . Xml.com (21 января 2002). Дата обращения: 5 июня 2021.
  21. A. Rossi. Worldwide Web Crawls . Internet Archive (5 октября 2010). Дата обращения: 5 июня 2021.
  22. Laura Bohannon. Wayback Machine archives websites for over 20 years . Spartan News Room (7 декабря 2017). Дата обращения: 5 июня 2021.
  23. Maemura, 2018 .
  24. Notess, 2002 .
  25. 1 2 Mark Graham. Tips for Using the Internet Archive's Wayback Machine in Your Next Investigation . Global Investigative Journalism Network (5 мая 2021). Дата абарачэння: 29 мая 2021.
  26. Zachary Crockett. Inside Wayback Machine, the internet's time capsule . The Hustle (28 сентября 2018). Дата абарачэння: 29 мая 2021.
  27. Евгений Делюкин. Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц . VcRu (26 февраля 2020). Дата абарачэння: 1 чэрвеня 2021.
  28. Eltgroth, 2009 .
  29. Kieren McCarthy. Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule . The Register (4 сентября 2018). Дата абарачэння: 4 чэрвеня 2021.
  30. Маргарита Сазонова. Электронные доказательства в спорах в сфере интеллектуальной собственности . Гарант (26 октября 2020). Дата обращения: 5 июня 2021.
  31. Pearce, 2009 , с. 875.
  32. Milligan, 2016 .
  33. Jeffrey Brainard. Dozens of scientific journals have vanished from the internet, and no one preserved them . Science (8 сентября 2020). Дата абарачэння: 1 чэрвеня 2021.
  34. Diana Kwon. More than 100 scientific journals have disappeared from the Internet . Nature (10 сентября 2020). Дата абарачэння: 1 чэрвеня 2021.
  35. avouner. Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил . Хабр (10 сентября 2020). Дата обращения: 5 июня 2021.
  36. Camilla Hodgson. How the Internet Archive is waging war on misinformation . Financial Times (17 сентября 2019). Дата абарачэння: 3 чэрвеня 2021.
  37. Mary Kay Magistad. Where to find what's disappeared online, and a whole lot more: the Internet Archive . The World (23 февраля 2017). Дата абарачэння: 7 чэрвеня 2021.
  38. Acker, 2020 .
  39. Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц . Trash Box (2 ноября 2020). Дата обращения: 5 июня 2021.
  40. Журналисты припомнили расистские высказывания пресс-секретаря Минздрава США . Красная весна (24 апреля 2020). Дата обращения: 5 июня 2021.
  41. Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17? . Open Culture (19 июля 2014). Дата абарачэння: 3 чэрвеня 2021.
  42. Jil Lepore. The Cobweb . New Yorker (19 января 2015). Дата абарачэння: 7 чэрвеня 2021.
  43. Дамир Камалетдинов. В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях . T Journal (30 мая 2021). Дата обращения: 5 июня 2021.
  44. Carolyn Wimbly Martin. Internet Archive's Open Library and Copyright Law . Lutzker (15 мая 2020). Дата абарачэння: 4 чэрвеня 2021.
  45. Nate Anderson. Copy some webpages, owe more than the national debt . Ars Technica (1 мая 2011). Дата обращения: 5 июня 2021.
  46. Eric Bangeman. Internet Archive settles suit over Wayback Machine . Ars Technica (31 августа 2006). Дата абарачэння: 7 чэрвеня 2021.
  47. Lisa M. Bowman. Net archive silences Scientology critic . C Net (24 сентября 2002). Дата абарачэння: 10 чэрвеня 2021.
  48. Ernest Miller. Features: Sherman, Set the Wayback Machine for Scientology . LawMeme (24 сентября 2002). Дата абарачэння: 10 чэрвеня 2021.
  49. Nora Caplan-Bricker. Preservation Acts . Harper's Magazine (декабрь 2018). Дата абарачэння: 2 чэрвеня 2021.
  50. Crudo, 2014 .
  51. Mike Masnick. Russia Blocks The Internet Archive's Wayback Machine Over A Single Page . Tech dirt (26 июня 2015). Дата абарачэння: 3 чэрвеня 2021.
  52. Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада" . Московский комсомолец (25 июня 2015). Дата обращения: 5 июня 2021.
  53. Роскомнадзор заблокировал страницу «архива интернета» за экстремизм . Lenta (25 июня 2015). Дата обращения: 5 июня 2021.
  54. АЗАПИ хочет навечно заблокировать «Архив интернета» . Роскомсвобода (22 августа 2019). Дата обращения: 5 июня 2021.
  55. «Архив интернета» могут навечно заблокировать в России . C News (23 августа 2019). Дата абарачэння: 7 чэрвеня 2021.
  56. Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru . C News (19 августа 2020). Дата абарачэння: 7 чэрвеня 2021.
  57. Американские издатели книг подали в суд на Internet Archive . Ведомости (2 июня 2020). Дата обращения: 5 июня 2021.
  58. Access to Internet Archive's Wayback Machine Blocked in India . The Wire (8 августа 2017). Дата абарачэння: 3 чэрвеня 2021.
  59. Wayback Machine has been blocked in India . The Verge (9 августа 2017). Дата обращения: 5 июня 2021.
  60. Kyrgyzstan Blocks Archive.org on 'Extremism' Grounds . Global Voices. Дата обращения: 5 июня 2021.
  61. Anna Kramer. The internet is splitting apart. The Internet Archive wants to save it all forever . Protocol (10 марта 2021). Дата абарачэння: 9 чэрвеня 2021.

Літаратура

  • Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics. // Harvard Kennedy School (HKS) Misinformation Review. — 2020. — doi : 10.37016/mr-2020-41 .
  • Anat Ben-David, Adam Amram. The Internet Archive and the socio-technical construction of historical facts // Internet Histories. — 2018. — doi : 10.1080/24701475.2018.1455412 .
  • Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource. — 2015. — Т. 67 , вып. 8 . — С. 1904—1915 . — doi : 10.1002/asi.23503 .
  • Bowyer S. The Wayback Machine: notes on a re‑enchantment // Archival Science. — 2021. — Т. 21 . — С. 43—57 .
  • Deborah R. Eltgroth. Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence // Fordham L. Rev.. — 2009. — Т. 78 , вып. 181 .
  • Greg R. Notess. The Wayback Machine: The Web's Archive // Online. — 2002. — Т. 26 , вып. 2 .
  • Hartelius J. The anxious flâneur: Digital archiving and the Wayback Machine // Quarterly Journal of Speech. — 2020. — Т. 106 , вып. 4 . — С. 377—398 .
  • James L. Quarles III and Richard A. Crudo. [Way]Back to the Future: Using the Wayback Machine in Patent Litigation // Landslide. — 2014. — Т. 6 , вып. 3 .
  • Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present // Association for Computing Machinery. — 2017. — doi : 10.1145/3133956.3134042 .
  • Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance // Journal of the association for information science and technology. — 2018. — Т. 69 , вып. 10 . — С. 1223—1233 .
  • Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives // International Journal of Humanities and Arts Computing. - 2016.
  • Murphy J., Hashim N., O'Connor P. Take Me Back: Validating the Wayback Machine // Journal of Computer-Mediated Communication. - 2008. - Вып. 13 . — С. 60—75 .
  • Odgen J., Halford S., Carr L. Observing Web Archives // WebSci. — 2017. — С. 299—308 .
  • Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org) // Medical Hypothesis. — 2009. — С. 875 .
  • Price. Internet Archiving – The Wayback machine // MLA Commons. - 2011.
  • Phyllis Holman Weisbard. Oldies but Goodies: Archiving WebBased Information // Feminist Collections. — 2011. — Т. 32 , вып. 2 .
  • Rogers R. Doing Web history with the Internet Archive: screencast documentaries // Internet Histories. — 2017. — Т. 1 , вып. 1-2 . — С. 160—172 . — doi : 10.1080/24701475.2017.1307542 .