LINUX.ORG.RU

MClient 8.0

 , , , ,


2

1

Состоялся выпуск MClient 8.0 — оболочки для онлайн- и офлайн-словарей. Уже существует большое количество программ, работающих с электронными словарями, но как правило, своей функциональностью они напоминают браузеры и не обрабатывают отдельные элементы словарной статьи.

Что позволяет делать MClient и чем он отличается от большинства других просмотрщиков:

  • просматривать статьи в виде таблицы;
  • выделять элементы статьи автоматически, чтобы быстро скопировать их в буфер — идеально при переводе;
  • упорядочивать отдельные теги (например, по тематикам, словоформам, частям речи и т. п.) и сортировать термины и фразы по алфавиту;
  • приоритизировать или блокировать источники и тематики;
  • быстро посмотреть перевод из других программ, нажав Ctrl+C+C или Ctrl+Ins+Ins на выделенном тексте;
  • быстро переключиться на окно просмотрщика, нажав Alt+~;
  • переводить с помощью Мультитрана — одного из самых больших онлайн-словарей в мире.

Программа ориентирована на профессиональных переводчиков и лингвистов, но может быть полезна и студентам, изучающим язык.

В новой версии:

  • значительно улучшена поддержка локальных словарей (DSL и StarDict);
  • добавлена поддержка Fora;
  • добавлена возможность конвертировать словари DSL, StarDict и Fora во внутренний формат MDic, что позволяет значительно ускорить поиск (запускайте программу с ключом --convert);
  • поиск теперь производится глобально — как по multitran.com, так и в локальных словарях;
  • добавлен новый режим — «Полный»;
  • добавлено 2 новых столбца — «Источники» и «Словари». Источники можно приоритизировать и блокировать;
  • поиск с помощью multitran.com стал опционален — заблокируйте его в ~/.config/mclient/mclient.json, если он вам не нужен.

Поместите локальные словари (если имеются) в каталог ~/.config/mclient/dics для Linux или C:\Users\<user>\Application Data\mclient\dics для Windows.

>>> Исходный код и релизы



Проверено: CrX ()
Последнее исправление: CrX (всего исправлений: 2)

Исходный код

Добавил тег python.

dataman ★★★★★
()
Ответ на: комментарий от wandrien

Там просто очень много вариантов переводов. Я мультитран пользуюсь, правда, через curl + самописный скрипт. Действительно, классный словарь, когда нужен перевод для узкого технического термина.

arrecck ★★★
()

Хм. Интересно, но непонятно. Можно комментарий от мимокрокодила?

Он мультитрановские варианты сохраняет у себя? в личном словарике или базы данных? Было бы хорошо, чтобы сохранял. И вообще, впитывал всё в себя. Это позволило бы пользоваться офлайн (что сейчас важно) и иметь в конце концов всю базу в одном файле. Например в sql базе данных. Хранить слово и источник откуда взял. Не знаю как это с точки зрения лицензий, но мне это было бы очень полезно.

Место хранения словарей - установленные в Линукс словари Goldendict ставятся в /usr/кудато/ другие скачаные тоже в папочке лежат своей и удобнее было бы не складывать их в скрыту папку конфигов твоей проги, а указать папки (не одну) в которых у тебя уже есть словари.

Панель инструментов снизу. Мы все уже давно привыкли, что всё сверху. У меня бы и рука вверх тянулась. У тебя и панель десктопа даже сверху. А инструменты программы сниху. Не логично. Ну и сходу непонятно что эти все значки делают и набуханы они как попало, как кажется, отпугивает.

PcheloBiaka
()

Там есть фича «вытащить с мультитрана текущий словарь и сохранить локально в формате StarDict»?

Stanson ★★★★★
()
Ответ на: комментарий от sklprogs

Поскольку в новых версиях и форках GoldenDict добавились новые форматы, уточню, какие источники поддерживает MClient:

  • multitran.com
  • StarDict
  • Lingvo (DSL)
  • Fora (dsl, stardict-x)
  • Мультитран (демо на 1 млн. слов, скачиваемое с сайта multitran.com)
  • MDic
sklprogs
() автор топика
Ответ на: комментарий от PcheloBiaka

Он мультитрановские варианты сохраняет у себя?

Все, что сохраняется - расшифровка тематик (например, общ. -> Общая лексика). Но можно отдельно статьи сохранять. Могу в дальнейшем добавить автосохранение просмотренных статей, если есть в этом смысл (контент онлайн обновляется постоянно, а слов в английском столько, что я, бывший переводчик, каждый день узнаю что-то новое).

Было бы хорошо, чтобы сохранял. И вообще, впитывал всё в себя.

Где-то полгода назад мультитрановский сервер просто был периодически недоступен, что и побудило меня улучшить поддержку локальных словарей. Неплохо было бы сделать зеркало сайта (я бы адаптировал под него парсер), но там реально десятки миллионов статей, а сервер не очень хорошо держит нагрузку. Как вариант - есть платный Мультитран (офлайн). По структуре похож на демо, я его более-менее научился парсить, но основной файл зашифрован. В принципе, можно попробовать воссоздать словарь по другим частям, которые не зашифрованы, и там будет вроде бы все, кроме комментариев.

удобнее было бы не складывать их в скрыту папку конфигов твоей проги, а указать папки (не одну) в которых у тебя уже есть словари

Попробуй внутри dics симлинк сделать на каталог. С Lingvo и Fora такое прокатывает, со StarDict, к сожалению, пока нет.

Панель инструментов снизу

Ну, могу ключ сделать для ее позиции :-) Как мне кажется, 2 панели вместе перегружают вид (тем более, я чаще клавиатурой пользуюсь).

Ну и сходу непонятно что эти все значки делают и набуханы они как попало, как кажется, отпугивает.

На GitHub есть дока, правда, для старой версии.

sklprogs
() автор топика
Ответ на: комментарий от Stanson

Там есть фича «вытащить с мультитрана текущий словарь и сохранить локально в формате StarDict»?

multitran.com онлайновый, программа на сервере берет термины из баз, которые не вытащить. Парсер поддерживает демо-версию, но конвертация реализована пока только из DSL, Fora и StarDict. Базы из полной офлайн-версии Мультитрана пока не поддерживаются. Конвертация идет во внутренний формат MDic. StarDict для этой цели не стал брать, потому что теги там весьма скудные и заточены под показ как в браузере, без дополнительной сортировки.

sklprogs
() автор топика
Ответ на: комментарий от Stanson

Более интересный вариант - ODict, там действительно есть поддержка частей речи и других тегов, но для моих целей формат не подошел, пришлось изобретать свой. Кроме того, не настолько он и быстрый оказался, как рекламировалось (или я неправильно его тестировал). В релиз парсер ODict XML встраивать не встал, но можно взять из исходников.

sklprogs
() автор топика
Ответ на: комментарий от sklprogs

Ну и сходу непонятно что эти все значки делают и набуханы они как попало, как кажется, отпугивает.

На GitHub есть дока, правда, для старой версии.

Ну и подсказка появляется при наведении на кнопку :-)

sklprogs
() автор топика
Ответ на: комментарий от sklprogs

С Lingvo и Fora такое прокатывает, со StarDict, к сожалению, пока нет.

Попробовал еще раз, для DSL симлинк работает только на файл. В общем, пока лучше отдельно копировать. В любом случае, если коллекция большая, есть смысл переконвертировать ее в MDic, чтобы поиск быстрее работал.

sklprogs
() автор топика
Ответ на: комментарий от sklprogs

форках GoldenDict добавились новые форматы, уточню, какие источники поддерживает MClient

А ZIM, AARD и SLOB (== AARD 2)?

dataman ★★★★★
()
Ответ на: комментарий от yvv1

Это медленнее, чем нажать Ctrl+C+C. Да и затратнее по ресурсам. С помощью ИИ имеет смысл тексты целиком переводить.

sklprogs
() автор топика
Ответ на: комментарий от dataman

Ну, с ZIM я вообще не знаком, но спасибо за наводку. Я имел в виду большие профессиональные коллекции словарей, и знаю я таких только две - Мультитран и Lingvo. Тут скорее коллекция определяет формат. Можно, конечно, перегнать один формат в другой, но сделать это не так уж просто, тем более без потери той смысловой нагрузки, которую несут теги.

sklprogs
() автор топика
Ответ на: комментарий от sklprogs

спасибо за наводку

Тогда дам ещё одну. :)

https://tatoeba.org/ru:

Проект Tatoeba — это коллекция предложений и переводов.
Это совместный, открытый, свободный и даже вызывающий привыкание проект.

На https://tatoeba.org/ru/downloads есть все их данные в CSV.

dataman ★★★★★
()
Ответ на: комментарий от dataman

спасибо за наводку

Тогда дам ещё одну. :)

Сначала они дают тебе на водку, потом - на пиво, а потом ты и сам втягиваешься... мда....

Somebody ★★★★
()
Ответ на: комментарий от sklprogs

multitran.com онлайновый, программа на сервере берет термины из баз, которые не вытащить.

Ну можно же потихоньку перебором. :)

Мультитран вообще странный, оффлайн версию ( https://multitran.sourceforge.net/ ) они давно забросили, сейчас только поддерживаемый сообществом в смысле наполнения контентом multitran.com остался, насколько я понимаю, сами базы словарей вообще никак не распространяются.

Есть старая база под GPLv2. Есть опенсорсные либы и утилиты чтобы её читать. Есть онлайн multitran.com свежий.

Перелить старую базу в формат StarDict (ну или более удобный, главное чтобы поддерживался словариками), добить её с онлайн мультитрана. Хотя бы аглицкий будет.

Stanson ★★★★★
()
Последнее исправление: Stanson (всего исправлений: 1)
Ответ на: комментарий от Stanson

Перелить старую базу в формат StarDict (ну или более удобный, главное чтобы поддерживался словариками), добить её с онлайн мультитрана

Нет смысла «добивать», лучше тогда сразу пользоваться онлайн или зеркало выкачивать. Онлайн неограничен, кроме того, в старой версии могут быть ошибки.

главное чтобы поддерживался словариками

С форматами словарей вышло как в комиксе про протоколы — каждый хотел еще один. А в итоге получилось так, что есть 2-3 серьезных базы в проприетарных форматах, а все остальное - шелуха, хоть их и много. Перегонять проприетарные базы незаконно, поэтому все, кому надо, либо покупают в закрытом формате и используют ту виндовую оболочку, которую дали, либо ищут незаконно перелитое в StarDict на торрентах (я такое не поддерживаю и все такое :-).

sklprogs
() автор топика
Ответ на: комментарий от Stanson

Сам Мультитран при этом в серой зоне. Никаких ссылок на авторов словарей, никакой лицензии ни онлайн, ни офлайн (по крайней мере, в старой офлайн-сборке ее не было). Соглашение по использованию касается только форума, и намекает оно на проприетарность:

Мультитран – частный ресурс

Кроме того, сам автор Мультитрана, Андрей Поминов, требовал удалить Android-приложение (тоже проприетарное, насколько знаю) стороннего разработчика, даже петиция была на change.org.

Стало быть, зеркало от Мультитрана, если такое появится, тоже будет в серой зоне.

Таким образом, сообщество оказалось в патовой ситуации относительно больших словарей под свободными лицензиями:

  1. Есть закрытые словари, которые нельзя декомпилировать. К ним поставляется виндовая оболочка, и выбора тут нет.
  2. Есть открытые словари, но они небольшие и для профессионалов не предназначены.
  3. Есть большие дампы закрытых словарей, но они нарушают закон.
  4. Вряд ли получится сделать свой Мультитран под GPL — это колоссальная работа, да и не найдется столько профессионалов, готовых этим заниматься.
sklprogs
() автор топика
Ответ на: комментарий от sklprogs

Никаких ссылок на авторов словарей, никакой лицензии ни онлайн, ни офлайн (по крайней мере, в старой офлайн-сборке ее не было)

Оффлайн мультитран под GPL/LGPLv2 - см. https://multitran.sourceforge.net База тоже GPLv2

Никаких сведений о смене лицензии или о какой-то другой лицензии я не нашёл вообще.

Андрей Поминов, требовал удалить Android-приложение (тоже проприетарное, насколько знаю) стороннего разработчика, даже петиция была на change.org.

Я бы тоже требовал удалить, если бы моё GPL поделие какой-то проприераст опроприерастил бы.

Поминов при этом не требовал и не требует удалить multitran.sourceforge.net, так что есть все основания считать именно GPL лицензию актуальной.

Можно как разработчик - разработчика спросить, в libmtquery, например, помимо Поминова в авторах ещё Stanislav Ievlev inger@altlinux.org

Так что «Мультитран под GPL» вообще, похоже, единственный существующий Мультитран. :)

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

Я имел в виду актуальный офлайн под винду. Если Поминова устраивает GPL, то, во-первых, где исходники под винду, а во-вторых, почему словари зашифрованы?

ещё Stanislav Ievlev inger@altlinux.org OK, напишу ему.

sklprogs
() автор топика
Ответ на: комментарий от Stanson

Сообщение не доставлено, так как адрес inger@altlinux.org не найден или не принимает входящие письма.

https://multitran.sourceforge.net Мне кажется, проект заброшен. Выглядит так же, когда я перед началом разработки зашел на эту страницу 11 лет назад.

sklprogs
() автор топика
Ответ на: комментарий от sklprogs

Я имел в виду актуальный офлайн под винду.

А я вообще его не нашёл в живом виде где-либо кроме торрентов.

0.0.1alpha1 2005-01-28

И это единственное место где есть лицензия на Мультитран.

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

А я вообще его не нашёл в живом виде

На официальном сайте здесь. Если заходить на сайт через телефон, такой ссылки нет.

sklprogs
() автор топика
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.