Приветствую всех читателей моего блога!
Сегодня я расскажу про один замечательный интернет ресурс, который работает в режиме онлайн библиотеки, если его так можно назвать, который сохраняет архивы сайтов.
Для чего нужен web.archive.org? Всё просто. В нём можно проверить историю любого домена, начиная с 1997 года. В котором хранится 85 000 000 страниц веб сайтов и их количество постоянно растёт.
Для чего нужен веб архив сайтов
Другими словами этот веб архив сайтов, сохраняет в своём хранилище не только исправно функционирующие сайты, но и те, которые, когда то, по разным причинам, прекратили своё существование в интернет пространстве.
Этот мега монстр web.archive.org, выполняет очень полезную работу, благодаря которой, многие веб мастера, могут восстановить свой веб сайт, в случае если, по каким то причинам, забыли сделать БЭКАП сайта.
- Этот веб архив, используют и для заработка, получая контент с закрытых сайтов, который со временем, пропал из индекса поисковых систем, стал уникальным и отличным товаром для продажи на биржах купли продажи статей.
- Весь контент сохраняется в текстовом формате, со всеми ссылками, картинками и оформлением css.
- Этот веб архив сайтов, сохраняет копии интернет ресурсов не один раз, а на разных этапах, поэтому, можно проследить развитие сайта, как он выглядел и проверить историю домена перед регистрацией (ну вдруг он торговал ссылками и попал под АГС фильтр).
Перейдя на Главную страницу web.archive.org, перед Вами будут строка поиска, в которую нужно ввести название домена и нажать на кнопку BROWSE HISTORY.
И через несколько секунд, получите отчёт в виде календаря по месяцам Цифры в кружочке означают, что этим числом датирована дата создания копии сайта. Нажмите на цифру в кружочке и увидите как выглядел сайт в ту дату.
А чтобы скачать архив сайта, я рассказывал в статье как восстановить сайт, в которой в Способе № 3, рассказал об этом со скриншотами. А в видео уроке, (в конце статьи), Вы можете узнать, как найти и скачать архив с сайтом на свой компьютер.
Если Вы хотите, чтобы контент Вашего сайта, не попадал в веб архив, то в файле robots.txt, Вы можете закрыть доступ к для робота с web.archive, Вашего сайта.
Для этого, нужно добавить в данный файл строчки:
User-agent: ia_archiver
Disallow: /
Отличная статья. Особенно понравилась строчка про запрет в robots.txt для запрета создания архива.