Запретить копирование сайта в Internet Archive.
Для этого достаточно запретить доступ к сайту для сервиса INTERNET-ARCHIVE. Его бот ходит из сети AS7941 и имеет user-agent:
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/cfa2980 warc/v0.8.47
Заблокировать можно как через правила в файле htaccess, так и через Cloudflare.
Блокировка Internet Archive в HTACCESS
Актуальные правила для последних версий Apache, начиная с 2.4 и выше.
<RequireAll> Require all granted Require not ip 207.241.224.0/20 Require not ip 207.241.238.0/24 Require not ip 208.70.24.0/21 Require not ip 2620:0:9c0::/48 </RequireAll>
Блокировка Internet Archive через Cloudflare
При использовании Cloudflare, вариантов блокировки Wayback Machine у вас больше.
- блокировка по ASN (AS7941)
- блокировка по диапазону IP адресов
- блокировка Internet Archive по User-Agent (archive.org, archive.org_bot)
Список IP адресов Internet Archive
207.241.224.0/20 207.241.238.0/24 208.70.24.0/21 2620:0:9c0::/48
Если у вас возникли проблемы с блокировкой с Internet Archive ( wayback machine) вы можете обратиться ко мне через форму обратной связи.