Как быстро восстановить сайты, если нет бэкапов

Сайты перестали работать: серверы, на которых всё лежало, разом пропали из сети — без предупреждений и без шанса скачать бэкапы. А самих бэкапов у меня к тому моменту не осталось ни одного — по иронии судьбы я потерял их все буквально за пару недель до аварии. Пришлось в авральном режиме поднимать хотя бы HTML-версию. Рассказываю, как вытащить сайт из веб-архивов, когда копий нет нигде, — и за несколько часов вернуть его в строй.

https://habr.com/ru/companies/first/articles/1050832/

#хостинг #бэкап #восстановление_данных #Wayback_Machine #common_crawl #warc #резервное_копирование #парсинг #CDX_API

Как быстро восстановить сайты, если нет бэкапов

Сайты перестали работать: серверы, на которых всё лежало, разом пропали из сети — без предупреждений и без шанса скачать бэкапы. А самих бэкапов у меня к тому моменту не осталось ни одного — по иронии...

Хабр

The #Library #Innovation Lab #Harvard has just launched #WARCbench, which they describe as a "Swiss Army Knife for #WARC Processing". This is a high benchmark because I frickin' love Swiss Army knives! 😀But, on a serious note, this WARCbench looks seriously useful. As someone who has recently been working with colleagues in this space, I have been shocked at the lack of decent tooling. WARCbench is therefore a brilliant #opensource contribution for us all!

https://lil.law.harvard.edu/blog/2026/06/09/warcbench-a-swiss-army-knife-for-warc-processing/ #archiving

WARCbench: A Swiss Army Knife for WARC Processing | Library Innovation Lab

The Library Innovation Lab is growing knowledge and community by bringing library principles to technological frontiers.

The Library Innovation Lab at Harvard University
New blog via SAA from my colleague and me about our process for archiving #warc files from Archive-It #digipres #webarchives https://saaers.wordpress.com/2026/04/22/an-approach-to-backing-up-internet-archive-web-crawls/
​​An Approach to Backing up Internet Archive Web Crawls

By Susan Borda and Scott Witmer  Adapted from the DPC Digital Preservation Workflow Webinar series, March 2026 The University of Michigan Library web archiving initiative began as a pilot prog…

bloggERS!

Готовимся к отключению. Эффективные форматы для упаковки и раздачи HTML-страниц

В 2026 году растёт риск перебоев и ограничений в работе интернета в РФ. В таких условиях имеет смысл заранее продумать, как сохранить привычное окружение при нестабильном доступе к сети. Помимо личных файлов, кино и музыки, хочется сохранить архив сайтов и веб-страниц для чтения в будущем — на месяцы или даже годы вперёд. Но в каком формате это лучше делать?

https://habr.com/ru/companies/ruvds/articles/1020916/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1020916

#Gwtar #долговременное_хранение #ПК_для_апокалипсиса #архивирование #сжатие_вебстраниц #WARC #MHTML #MAFF #SingleFile #ruvds_статьи

Готовимся к отключению. Эффективные форматы для упаковки и раздачи HTML-страниц

В 2026 году растёт риск перебоев и ограничений в работе интернета в РФ. В таких условиях имеет смысл заранее продумать, как сохранить привычное окружение при нестабильном доступе к сети. Помимо личных...

Хабр

Готовимся к отключению. Эффективные форматы для упаковки и раздачи HTML-страниц

В 2026 году растёт риск перебоев и ограничений в работе интернета в РФ. В таких условиях имеет смысл заранее продумать, как сохранить привычное окружение при нестабильном доступе к сети. Помимо личных файлов, кино и музыки, хочется сохранить архив сайтов и веб-страниц для чтения в будущем — на месяцы или даже годы вперёд. Но в каком формате это лучше делать?

https://habr.com/ru/companies/ruvds/articles/1020916/

#Gwtar #долговременное_хранение #ПК_для_апокалипсиса #архивирование #сжатие_вебстраниц #WARC #MHTML #MAFF #SingleFile #ruvds_статьи

Готовимся к отключению. Эффективные форматы для упаковки и раздачи HTML-страниц

В 2026 году растёт риск перебоев и ограничений в работе интернета в РФ. В таких условиях имеет смысл заранее продумать, как сохранить привычное окружение при нестабильном доступе к сети. Помимо личных...

Хабр
I just added my Archive-it #warc to Michigan DPN process to GitHub for easier access and whatnot. I’ll be talking about this on Monday for the @dpc_chat workflows webinar series! #webarchiving #digipres #digitalpreservation https://github.com/mlibrary/digiPres/blob/main/webarchiving/warcs2mdpn/readme.md
Hi I’ll be covering this #workflow for backing up WARCs from Archive-it to a state run LOCKSS program at the upcoming @dpc_chat workflows webinar. I also have info about running these websites offline. https://docs.google.com/document/d/14FZzbfICaddW1wJP8N1CQE6YZOHXjtT_ouAy1-YvsM0/edit?usp=sharing #digipres #webarchiving #warc #digitalpreservation Have a look!
Process for backing up WARCs from Archive-it to MDPN

Process for backing up WARCs from Archive-it to MiDPN Backup from Archive-It, partially based on this article: How to find and download your WARC files with WASAPI – Archive-It Help Center Basic Process: Get crawl ID(s) for particular seed Get WARC.gz file and page count Use "curl" to get list...

Google Docs
Ham radio operator faces child sex abuse charges

Former President of the Western Amateur Radio Club (WARC), Michael Simon Wilson, VK3FAAO, has been charged with possessing child abuse material and sex offences, including bestiality, according to the Melbourne Magistrates' Court.

VicNews
#libarchive 3.7.9 has been released (#MultiFormatArchive / #CompressionLibrary / #FileArchiver / #DataCompression / #7Zip / #7z / #RAR / #ZIP / #GZip / #TAR / #XAR / #WARC / #BZIP2 / #XZ) https://www.libarchive.org/
libarchive - C library and command-line tools for reading and writing tar, cpio, zip, ISO, and other archive formats @ GitHub