История изменений
Исправление MirandaUser2, (текущая версия) :
Картинки сохраняются, но ссылки под этими картинками ведут не на локальные сохраненные полноразмерные картинки а на удаленный адрес первоисточника.
Логично - сохраняются только уже загруженные картинки. И SingleFile как и аналогичные инструменты работает также.
во вторых он имеет непонятный формат,
не то что бы непонятный. Есть RFC
MIME Encapsulation of Aggregate Documents, such as HTML (MHTML)
https://datatracker.ietf.org/doc/html/rfc2557
хочу чтобы текст сохраненной страницы был в виде plain текста,
В случае MHTML: если там только ASCII, то это в принципе возможно. Иначе - требуется кодирование того или иного рода.
Any documents including HTML documents that contain octet values
outside the 7-bit range need a content-transfer-encoding applied
before transmission over certain transport protocols
чтобы после сохранения был исключительно один html файл, и папочка с медиаресурсами, но без скриптов, css и прочего.
строго говоря встроенный в веб-браузер «Save as Web-page complete» ближе к этому требованию, чем SingleFile, т.к. последний встраивает картинки непосредственно в документ (также как MHTML)
Исходная версия MirandaUser2, :
Картинки сохраняются, но ссылки под этими картинками ведут не на локальные сохраненные полноразмерные картинки а на удаленный адрес первоисточника.
Логично - сохраняются только уже загруженные картинки. И SingleFile как и аналогичные инструменты работает также.
во вторых он имеет непонятный формат,
не то что бы непонятный. Есть RFC
MIME Encapsulation of Aggregate Documents, such as HTML (MHTML)
https://datatracker.ietf.org/doc/html/rfc2557
(AFAIK формат epub основан на нем)
хочу чтобы текст сохраненной страницы был в виде plain текста,
В случае MHTML: если там только ASCII, то это в принципе возможно. Иначе - требуется кодирование того или иного рода.
Any documents including HTML documents that contain octet values
outside the 7-bit range need a content-transfer-encoding applied
before transmission over certain transport protocols
чтобы после сохранения был исключительно один html файл, и папочка с медиаресурсами, но без скриптов, css и прочего.
строго говоря встроенный в веб-браузер «Save as Web-page complete» ближе к этому требованию, чем SingleFile, т.к. последний встраивает картинки непосредственно в документ (также как MHTML)