LINUX.ORG.RU

История изменений

Исправление MirandaUser2, (текущая версия) :

Картинки сохраняются, но ссылки под этими картинками ведут не на локальные сохраненные полноразмерные картинки а на удаленный адрес первоисточника.

Логично - сохраняются только уже загруженные картинки. И SingleFile как и аналогичные инструменты работает также.

во вторых он имеет непонятный формат,

не то что бы непонятный. Есть RFC
MIME Encapsulation of Aggregate Documents, such as HTML (MHTML)
https://datatracker.ietf.org/doc/html/rfc2557

хочу чтобы текст сохраненной страницы был в виде plain текста,

В случае MHTML: если там только ASCII, то это в принципе возможно. Иначе - требуется кодирование того или иного рода.

Any documents including HTML documents that contain octet values
      outside the 7-bit range need a content-transfer-encoding applied
      before transmission over certain transport protocols

чтобы после сохранения был исключительно один html файл, и папочка с медиаресурсами, но без скриптов, css и прочего.

строго говоря встроенный в веб-браузер «Save as Web-page complete» ближе к этому требованию, чем SingleFile, т.к. последний встраивает картинки непосредственно в документ (также как MHTML)

Исходная версия MirandaUser2, :

Картинки сохраняются, но ссылки под этими картинками ведут не на локальные сохраненные полноразмерные картинки а на удаленный адрес первоисточника.

Логично - сохраняются только уже загруженные картинки. И SingleFile как и аналогичные инструменты работает также.

во вторых он имеет непонятный формат,

не то что бы непонятный. Есть RFC
MIME Encapsulation of Aggregate Documents, such as HTML (MHTML)
https://datatracker.ietf.org/doc/html/rfc2557
(AFAIK формат epub основан на нем)

хочу чтобы текст сохраненной страницы был в виде plain текста,

В случае MHTML: если там только ASCII, то это в принципе возможно. Иначе - требуется кодирование того или иного рода.

Any documents including HTML documents that contain octet values
      outside the 7-bit range need a content-transfer-encoding applied
      before transmission over certain transport protocols

чтобы после сохранения был исключительно один html файл, и папочка с медиаресурсами, но без скриптов, css и прочего.

строго говоря встроенный в веб-браузер «Save as Web-page complete» ближе к этому требованию, чем SingleFile, т.к. последний встраивает картинки непосредственно в документ (также как MHTML)