Веб архив сайтов webarchive

Приветствую всех читателей моего блога!

Сегодня я расскажу про один замечательный интернет ресурс, который работает в режиме онлайн библиотеки, если его так можно назвать, который сохраняет архивы сайтов.

Для чего нужен web.archive.org? Всё просто. В нём можно проверить историю любого домена, начиная с 1997 года. В котором хранится 85 000 000 страниц веб сайтов и их количество постоянно растёт.

Для чего нужен веб архив сайтов

Другими словами этот веб архив сайтов, сохраняет в своём хранилище не только исправно функционирующие сайты, но и те, которые, когда то, по разным причинам, прекратили своё существование в интернет пространстве.

Этот мега монстр web.archive.org, выполняет очень полезную работу, благодаря которой, многие веб мастера, могут восстановить свой веб сайт, в случае если, по каким то причинам, забыли сделать БЭКАП сайта.

  • Этот веб архив, используют и для заработка, получая контент с закрытых сайтов, который со временем, пропал из индекса поисковых систем, стал уникальным и отличным товаром для продажи на биржах купли продажи статей.
  • Весь контент сохраняется в текстовом формате, со всеми ссылками, картинками и оформлением css.
  • Этот веб архив сайтов, сохраняет копии интернет ресурсов не один раз, а на разных этапах, поэтому, можно проследить развитие сайта, как он выглядел и проверить историю домена перед регистрацией (ну вдруг он торговал ссылками и попал под АГС фильтр).

Перейдя на Главную страницу web.archive.org, перед Вами будут строка поиска, в которую нужно ввести название домена и нажать на кнопку BROWSE HISTORY.

И через несколько секунд, получите отчёт в виде календаря по месяцам Цифры в кружочке означают, что этим числом датирована дата создания копии сайта. Нажмите на цифру в кружочке и увидите как выглядел сайт в ту дату.

А чтобы скачать архив сайта, я рассказывал в статье как восстановить сайт, в которой в Способе № 3, рассказал об этом со скриншотами. А в видео уроке, (в конце статьи), Вы можете узнать, как найти и скачать архив с сайтом на свой компьютер.

Если Вы хотите, чтобы контент Вашего сайта, не попадал в веб архив, то в файле robots.txt, Вы можете закрыть доступ к для робота с web.archive, Вашего сайта.

Для этого, нужно добавить в данный файл строчки:

User-agent: ia_archiver
 Disallow: /
Но лучше конечно этого не делать. Мало ли, что? Вдруг забудете сделать БЭКАП или ещё, что то может произойти.
Оцените статью
Как заработать в интернете
Добавить комментарий

  1. Валерия

    Отличная статья. Особенно понравилась строчка про запрет в robots.txt для запрета создания архива.