LINUX.ORG.RU

libzim 9.4.0

 , , , ,

libzim 9.4.0

2

4

26 октября, после более полугода разработки, состоялся выпуск 9.4.0 библиотеки libzim, предназначенной для работы с файлами в формате ZIM. Разработка библиотеки ведётся и спонсируется проектом Kiwix.

ZIM – формат, предназначенный для офлайн-хранения информации, полученной из Web, в виде одного файла. В ZIM-файле в сжатом виде находятся логически связанные между собой HTML-страницы (а иногда и образы сайтов целиком) с работающими гиперссылками, изображениями, звуком и видео.

Проектом Kiwix разрабатывается набор консольных утилит zim-tools, десктопный и мобильные клиенты, и скрипты для создания файлов ZIM из дампов проектов Wikimedia или из HTML.

Также libzim используется в форке словаря GoldenDict – GoldenDict-NG.

Краткий список возможностей библиотеки:

  • создание файлов ZIM cо сжатием данных в формате Zstandard (ранее поддерживались форматы ZIP, LZMA и Bzip2);
  • поиск по названиям статей;
  • опциональная поддержка Xapian для полнотекстового поиска. Множество файлов ZIM можно скачать здесь.

Библиотека написана на языке C++ и распространяется по лицензии GNU GPL 2.0.

Список изменений:

  • В API добавлена поддержка масштаба иллюстраций (dpr), высоты и ширины.
  • Добавлена возможность предварительной загрузки индексов Xapian.
  • Добавлена возможность изменения размеров кешей и централизация использования памяти для кешей.
  • Улучшены примитивы логирования.
  • Исправлена ошибка сборки с библиотекой ICU версии 76 и выше.
  • Прекращён выпуск PPA для Ubuntu Focal 20.04.

>>> Подробности на GitHub

★★★★★

Проверено: shell-script ()
Последнее исправление: shell-script (всего исправлений: 2)

Это для написания ИИ-веб-скрейперов?

А стандарта по отдаче снимка сайта в ZIM формате через torrent ещё не придумали?

AlexVR ★★★★★
()

Несколько непродуманно делать логотип с прозрачным фоном.

unC0Rr ★★★★★
()

Тихо и не заметно после 10 веков разработки состоялась альфа версия ненужной либы для ненужного формата, который тоже веками в бета тестировании и последний раз вышел век назад и тоже тихо и незаметно

hibou ★★★★★
()

на языке C++

Опасный софт. Не rust, не java…

Saakx
()
Ответ на: комментарий от hibou

Тихо и не заметно после 10 веков разработки состоялась альфа версия ненужной либы для ненужного формата, который тоже веками в бета тестировании и последний раз вышел век назад и тоже тихо и незаметно

Я, конечно, не монтажник, но даже беглый взгляд на таблицу релизов говорит, что проект выходит пару раз в год, последний релиз был в апреле, а релиз до этого в апреле 2024 года. А про ненужность сейчас послушаем специалистов по всему.

VIT
()
Ответ на: комментарий от hibou

Я тоже так могу:

Мне не нужно, значит никому не нужно! И я обязан об этом заявить ГРОМКО и заметно! Чтоб все другие ненужнисты знали, что они не одни во всей Вселенной!

dataman ★★★★★
() автор топика
Последнее исправление: dataman (всего исправлений: 1)
Ответ на: комментарий от u-235

Между тем есть полностью открытый MHT. Почему его нет в каждом браузере и каждой читалке документов – загадка.

hobbit ★★★★★
()

Kiwix это вещь. Локальная википедия оказалась очень кстати в нынешнее время. Теперь можно зависать там вообще без интернета. Сейчас качаю потихоньку stackoverflow, посмотрим как там поиск будет работать.

bread
()
Ответ на: комментарий от hobbit

mht одностраничный насколько я знаю, тут же можно сотни тысяч страниц эффективно упаковать.

ptah_alexs ★★★★★
()
Ответ на: комментарий от hobbit

есть полностью открытый MHT

Не жмёт, не обеспечивает поиск в пожатом виде

Saakx
()
Ответ на: комментарий от zanac1

И даже полнотекстовый поиск есть, но это неточно

Написано же, поиск только по заголовкам. Где вы „полнотекстовый” увидели?

Saakx
()
Ответ на: комментарий от Saakx

The CHM file format is owned by Microsoft Corporation…

Это заявление никаким образом не делает упаковщик закрытым:

The htmlhelp compiler chmcmd is a GPL licensed htmlhelp1 (CHM) helpfile compiler.

cdslow ★★
()
Ответ на: комментарий от cdslow

Это не сильно поможет, если Microsoft засудит за использование формата, а вас при выезде в условный египет на отдых арестуют

Saakx
()
Ответ на: комментарий от bread

Там не только википедия или stackoverflow, можно самому скачивать нужные сайты (любым удобным способом) и запаковывать их в zim. У меня около 30 сайтов сейчас так скачано для просмотра в Kiwix.

Mapper720
()
Ответ на: комментарий от Saakx

Это не сильно поможет, если Microsoft засудит за использование формата

Сколько лет отсидел Matthew T. Russotto за реверс CHM?

u-235
()
Ответ на: комментарий от u-235

Он просто не достиг популярности Павла Дурова.

Saakx
()

скрипты для создания файлов ZIM из дампов проектов Wikimedia или из HTML.

А где-то можно скачать бесплатно без смс без регистрации какие-то базы в этом формате, чтобы самому не скоблить википедию или ещё чего?

Bfgeshka ★★★★★
()
Ответ на: комментарий от Bfgeshka

Википедию можно просто скачать с офсайта, zim-файл уже подготовлен. Русская занимает гигабайт 40, английская – примерно 100-120 (если без картинок – 40-45).

https://library.kiwix.org/#lang=eng

Mapper720
()
Последнее исправление: Mapper720 (всего исправлений: 1)
Ответ на: комментарий от Saakx

Где вы „полнотекстовый” увидели?

Да вот прямо в новости написано:

опциональная поддержка Xapian для полнотекстового поиска.

u-235
()
Ответ на: комментарий от dataman

Лично я отношусь скептически к идее впихивания википедии для офлайнового просмотра ибо никакого места не хватит, если начать поддерживать локализацию (особенно распухнет установщик).

Но если кто-то из сообщества озадачится таким вопросом и предусмотрит возможность скачивания «базы знаний» - почему нет.

alex-w ★★★★★
()

Для Chrome, Edge, Firefox, and Safari есть расширение SingleFile, позволяющее сохранять страницу сайта в один файл.

Пользуюсь в Firefox, давно, нравится.

Надеюсь, Zim «породит» более универсальный софт...

Somebody ★★★
()
Последнее исправление: Somebody (всего исправлений: 1)
Ответ на: комментарий от zanac1

Просмотрщиков CHM много, и на Qt и на GTK, xCHM на wxWidget недавно релизнулся. А вот упаковщик вспомнили только на дельфях.

u-235
()

В ZIM-файле в сжатом виде находятся логически связанные между собой HTML-страницы (а иногда и образы сайтов целиком) с работающими гиперссылками, изображениями, звуком и видео.

Звучит, как CHM.

Radjah ★★★★★
()
Ответ на: комментарий от Radjah

Нет. Зачем вообще цепляться за сплошь «огороженный» формат от Microsoft??..

Somebody ★★★
()
Ответ на: комментарий от alex-w

Лично я отношусь скептически к идее впихивания википедии для офлайнового просмотра ибо никакого места не хватит

Так вся и не нужна:

wikipedia_en_astronomy_maxi_2025-09.zim   2025-09-12 15:11  1.4G
wikipedia_en_astronomy_nopic_2025-10.zim  2025-10-15 09:45  329M

Это намного меньше, чем все каталоги звёзд Stellarium v3.0.
Хотя они пока не делают астрономические .zim для других языков, но я попрошу добавить их в конвейер.

Но если кто-то из сообщества озадачится таким вопросом

Так как предложил я, то озадачусь. :) Но я не пользуюсь QtCreator’ом, сначала попробую без него.
Это должен быть новый плагин (типа ZimQueries) или можно добавить поддержку zim в OnlineQueries и переименовать его в просто Queries?

предусмотрит возможность скачивания «базы знаний»

А эта возможность должна быть в Stellarium? У пользователей Kiwix или GoldenDict эти zim уже могут находиться в другом каталоге.
Может быть, просто сделать возможность задавать этот каталог?

dataman ★★★★★
() автор топика
Ответ на: комментарий от dataman

Так вся и не нужна

Так все дело в том, что самые объемные части каталога не поставляются с установщиком - они скачиваются либо внутри программы, либо чем-нибудь сторонним - к примеру во FreeBSD при установке порта можно пометить для установки дополнительные каталоги.

Это должен быть новый плагин (типа ZimQueries) или можно добавить поддержку zim в OnlineQueries и переименовать его в просто Queries?

Не знаю - есть свои плюсы как в расширении существующего плагина, так и в создании нового.

А эта возможность должна быть в Stellarium?

По идее с плагином должна идти какая-то минимальная база знаний - к примеру только на английском языке и только основные темы. Но ведь пользователи могут захотеть другой язык или более полные сведения, поэтому должна быть возможность расширять эти самые данные.

У пользователей Kiwix или GoldenDict эти zim уже могут находиться в другом каталоге. Может быть, просто сделать возможность задавать этот каталог?

Как вариант. Тут нужно думать о некоторых стандартных местах для таких данных и кроссплатформенности.

alex-w ★★★★★
()
Ответ на: комментарий от alex-w

Ещё проблема – libzim использует Meson.
В Debian она традиционно устаревшая:

libzim-dev/unstable 9.2.3

Попрошу их добавить поддержку CMake. Посмотрим, что ответят.

dataman ★★★★★
() автор топика
Ответ на: комментарий от dataman

В смысле libzimConfig.cmake? Может проще написать Findlibzim.cmake и держать его в своём проекте?

u-235
()
Последнее исправление: u-235 (всего исправлений: 1)

Надо бы взять на вооружение

liilliil
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.