Хрен вы скачаете современные сайты генерируемые Javascript с помощью httrack/wget.
Сам же сохраняю отдельные страницы в формате MHT с помощью браузеров на движке Chrome. Но перед сохранением нужно проверять всю страницу что все картинки, комментарии подгрузились, проскролить страницу. Каждую страницу отдельно в формате MHT.
не все сайты законно скачивать для хранения у себя
А-а-а, ну если незаконно, то конечно, не надо скачивать.
Я вот только законно скачиваю, чего и вам, с вашими законами, придуманными боксёрами и прочими спортсменами, советую.
есть: плуг для лисы singlefile, выкачивает странцу, даже если там лишь строчка кода и сохраняет в виде 1 html файла. Чем и пользуюсь. Альтернатива save page we. А для сайта со всеми потрохами - offlineexplorer. В доисторические времена, когда на динозаврах ездили, был еще такой програм teleport.
С чего ты взял, что какие-то сайты незаконно скачивать для хранения у себя? Включая ютуб. youtube-dl вполне официально хостится на гитхабе и плюёт с высокой вышки на поползновения копирастов. Гугл вообще не возражает. В той же России имеется особо оговоренное законное право на создание бэкапов, за которое, между прочим, собирается налог.
Зависит от правил сайта и страны скачивающего, это всё таки не просмотр информации на сайте, а ее копирование, сайты которые это разрешают явно, сами выкладывают свои копии для загрузки, как стаковерфлоу например или википедия.
Гугл вообще не возражает
Поэтому банит расширения, скачивающие с ютуба, в магазине хрома, при этом оставляя расширения для скачки с vimeo и пр.
Проверил я этот аддон ‘single-file’. Он не сохраняет все комментарии под статьёй, которые подгрузились динамически. А в формате Mht страница сохранилась полностью, со всеми комментариями.