LINUX.ORG.RU

Китайский GoldenDict

 , , ,


2

2

GoldenDict - замечательный мультиформатный электронный словарь, которым я пользуюсь много лет.

Но у оригинального GoldenDict есть несколько проблем:

  • использует Qt 5 и Qt WebKit;
  • медленное и прожорливое полнотекстовое индексирование словарей.

В попытках исправить положение, китайский программист xiaoyifang развивает свой форк со следующими изменениями:

  • использование Qt WebEngine;
  • возможность использования Qt 6;
  • возможность использования Xapian для полнотекстового поиска.

Полный список изменений.

>>> Просмотр (1920x1050, 276 Kb)

★★★★

Проверено: hobbit ()
Последнее исправление: hobbit (всего исправлений: 3)

Ответ на: комментарий от thesis

Пользуюсь, конечно.

А вот наступит всеобщий звездец, буду вам голубями кондорами статьи рассылать, на глиняных табличках. За небольшой гешефт.

dataman ★★★★
() автор топика
Ответ на: комментарий от dataman

Пользуюсь, конечно.

Тогда ты наверняка сможешь прочесть в ней, в чём же состоит разница между словарём, толковым словарём, энциклопедией и энциклопедическим словарём.

thesis ★★★★★
()
Ответ на: комментарий от thesis

Зато Wiktionary, всё-таки - лучший переводной словарь нашего времени и лучший толковый словарь редких языков (если повезёт).

token_polyak ★★★★
()
Ответ на: комментарий от thesis

Для GD между ними нет разницы - все эти источники информации просто key-value DB, с хранением индекса в B-tree.

dataman ★★★★
() автор топика
Ответ на: комментарий от token_polyak

лучший переводной словарь

Да ладно?

thesis ★★★★★
()
Ответ на: комментарий от dataman

Основание микроскопа это просто массивный кусок железа, евпочя.

Я же говорю не о способностях софта, а о разумном, с моей точки зрения, подходе к организации информации юзером.

thesis ★★★★★
()
Ответ на: комментарий от thesis

Мне не особо было что ответить, вот и ограничился автографом.

token_polyak ★★★★
()
Ответ на: комментарий от emorozov

для испанского - уже мрак

$ sudo apt install dict-freedict-spa-eng?

dataman ★★★★
() автор топика
Ответ на: комментарий от no-such-file

Может быть проблема в том, что слова в какой-то не словарной форме? Это же не переводчик.

Нет, я способен всё-таки привести слово к инфинитиву, перед тем как искать.

В нём именно нет каких-то слов, а для многих слов, которые встречаю в современной литературе, перевод какой-то неправильный, некорректный.

Понятно, что языки меняются очень быстро, а вот испанско-русским словарям, видимо, уже более полувека.

Или вот из английского пример чуть менее яркий, но всё же: trestle переводится Lingvo как эстакада, хотя, гуглинг показывает, что это скорее вид треугольных козел, на которых может стоять мост или стол, или скамья. Но не сам мост, или стол или скамья. Разница невелика, но она всё же может ввести в заблуждение, когда читаешь книгу. Не говоря уж о каких-нибудь инженерных трактатах.

В испанском такого намного больше, и есть переводы, которые даже рядом не стояли с настоящим значением слова. К сожалению, я специально их не выписываю и прямо сейчас показать не смогу, но их много.

emorozov
()
Ответ на: комментарий от emorozov

trestle переводится Lingvo как эстакада

Возможно это проблема именно онлайн версии. У меня есть словари от десктопной и там это «кОзлы» в первом значении.

no-such-file ★★★★★
()
Ответ на: комментарий от no-such-file

Я пользуюсь попеременно онлайн версией и версией на смартфоне. Для смартфона когда-то купил почти все русско-испанские словари, которые были доступны.

Проблемы есть и там и там. М.б. вообще все словари несовершенны, конечно.

Но это подстёгивает искать какие-то альтернативы. Чаще проще бывает загуглить слово, особенно, если находишь его в контексте.

emorozov
()
Ответ на: комментарий от thesis

Во-первых, я не наезжал на энциклопедии. Во-вторых, википедия - это универсальная энциклопедия, а не энциклопедический словарь.

Исторически энциклопедическими словарями называли именно что универсальные энциклопедии. Отраслевые и тематические энциклопедии вместе с энциклопедическими словарями появились уже потом. Большой ошибки в том, чтобы употреблять слова в значениях столетней давности, нет.

Я к тому, что разница между словарем, энциклопедическим словарем и энциклопедией, построенной вокруг слов, количественная, а не качественная. В словаре человек много ищет и мало читает. В энциклопедии человек мало ищет и много читает. Энциклопедический словарь в современном значении этого термина находится где-то между словарями и энциклопедиями.

Так или иначе, пользователю нужны инструменты и для поиска, и для чтения, что ведет к очень похожим, а то и одинаковым решениям. Ты с этим не согласен? Или с тем, что человек хранит Википедию локально?

Ну, допустим. Пока DNS вернет IP для en.wikipedia.org., у него уже всё откроется и отрисуется. Когда Википедию снова закроют на сутки в знак протеста против какого-то дурного закона, у него ничего не изменится. Локальная версия открывается в самолете или в поезде. Локальная версия не боится попыток разбомбить энергосистему твоей страны и доступна ровно столько, сколько у тебя заряда в батареях и пауэрбанках, солнца на фотопанелях и бензина в генераторе.

Vidrele ★★
()
Ответ на: комментарий от Vidrele

Я не против хранения локально. Но я считаю неудобным упихивать всё локальное в одно окно. Словарь - это то, где я ищу краткое значение, происхождение и переводы какого-то слова или выражения. Энциклопедия - это куда я лезу покурить, например, историю появления бегемотов в Колумбии. Это разные хранилища и по-моему разумно иметь к ним разные интерфейсы. Пусть даже сабж, но разные инстансы.

Википедия - не словарь, короче говоря.

thesis ★★★★★
()
Ответ на: комментарий от thesis

Я правильно понимаю, что тебя вполне устраивают одинаковые интерфейсы у разных сущностей? Допустим, Википедия и Викисловарь крутятся на одном движке, но разделены: крутятся на разных доменах, имеют непересекающиеся индексы, друг на друга ссылаются при помощи шаблонов в тексте статьи.

В GoldenDict можно перейти к конкретному словарю или энциклопедии при помощи фрейма в верхнем правом углу и, допустим, сразу читать Википедию. Еще словари можно группировать, добавляя или удаляя энциклопедии в зависимости от задач. То есть, отделить энциклопедии от словарей таки можно, если возникнет такая потребность.

К сожалению, словари несовершенны. Словарная статья может быть актуальна для XX века, но устареть в XXI веке. Словарных определений или переводов может не хватить, чтобы понять, о чем речь. Или бывает, что сообразил, но контекстуального перевода в голове все равно нет. В GoldenDict я держу Википедию где-то в конце списка, чтобы разобраться в теме, когда словари не помогли. В таком случае я читаю ее очень выборочно: первое предложение, остаток первого абзаца, интервики (очень ценный источник переводов), отдельные места статьи. То есть, использую ее как справочник обо всем на свете. Эдакий толковый и переводной словарь последней надежды. Ладно, предпоследней перед Гуглом. Если я получил нужную информацию из словарей-словарей, до Википедии я просто не дохожу.

Но я переводчик. Мне – норм в одну кучу свалить толковые словари, переводные словари, энциклопедии, потому что я примерно в таком порядке буду производить поиск и остановлюсь, когда мне нужно. Когда я читатель, меня вполне устраивает разделение сущностей в Kindle: отдельно словари, отдельно начало статьи в Википедии, полную версию которой можно открыть в браузере, отдельно X-Ray, отдельно Bing. Но похожий опыт можно организовать себе в GoldenDict, если захотеть.

Vidrele ★★
()
Ответ на: комментарий от EXL

«использует» и «может использовать» это разные вещи. Так-то там всё завязано на dev-qt/qtsql, который может использовать как mysql, так и postgresql

>=dev-qt/qtsql-${QTMIN}:5[mysql?,postgres?]

У меня собрано с поддержкой postgresql, так что никакого mysql у меня в системе нет.

WatchCat ★★★★★
()
Последнее исправление: WatchCat (всего исправлений: 2)
Ответ на: комментарий от Vidrele

Я правильно понимаю, что тебя вполне устраивают одинаковые интерфейсы у разных сущностей?

Пока не мешают понимать, в каком контексте я в данный момент нахожусь - устраивают.

В GoldenDict можно перейти к конкретному словарю или энциклопедии

Имхо неудобно. И там еще был разговор о жоре памяти, т.е. даже ради экономии ресурса жирнопедию я бы предпочел запускать по требованию, а вот словарик у меня, именно как у читателя, висит на хоткее и запущен постоянно.

thesis ★★★★★
()
Ответ на: комментарий от Mobutu_Sese_Seko

Deepl лучше.

Для моих задач не подходит, да и значительной разницы в лучшую сторону даже в переводе предложений я не заметил (хотя обещано) — сложные места такие же косячные как и везде. А вот разбирать тексты, чтобы увеличивать словарный запас, яндекс-транслейт в сочетании с reverso-context пока лучшее сочетание для меня.

papin-aziat ★★★★★
()
Ответ на: комментарий от thesis

Дык, можешь отдельно сгруппировать энциклопедии, отдельно - словари. В контексте не запутаешься. Тем более что есть такие книги, из которых надо бегать в энциклопедии, а не словари. Правда, я не знаю, как именно GoldenDict управляет памятью. Не исключено, что загружает все индексы целиком, а потом фильтрует.

Vidrele ★★
()
Последнее исправление: Vidrele (всего исправлений: 1)
Ответ на: комментарий от emorozov

искать какие-то альтернативы

Мультитран? Для английского он вроде норм. Французский на первый взгляд тоже годный. Но вообще я чаще использую толковые словари на целевом языке.

no-such-file ★★★★★
()

Отпишитесь, кто тоже установил. Интересно сравнить впечатления!

dataman ★★★★
() автор топика
Ответ на: комментарий от papin-aziat

По мне, так именно сложные места в художественных текстах он переводит лучше всего, перевод получается вполне «живым» и, что самое забавное, более качественным, чем у некоторых живых переводчиков. Иногда теряет контекст, это да, но так у всех электронных перводчиков.

Mobutu_Sese_Seko
()
Ответ на: комментарий от Vidrele

Если понадобится - попробую, ага. Пока нет такой нужды.

thesis ★★★★★
()
Ответ на: комментарий от Mobutu_Sese_Seko

Ну вот я в Анки наталкиваю слова (в выражениях) и выражения из книги, так вот для этой работы в центре событий лучше всего себя проявил яндекс, так как там скорее всего я докапываюсь до нужных мне смыслов — там много всяких фишек прямо в нём.

Кстати, в окне яндкса есть маленькая ссылка, которая тебя ознакомит и с «мнением» Гугла по данному вопросу.

Если машины не справляются, то использую реверсо, впрочем у них тоже есть приличный робот.

Ну и если хочется узнать мнение человека о слове (обычно корневом), то голдендикт с Апресяном (так вроде фамилия).

А DeepL совсем не впечатлил, это скорее для тех, кто не знает языка и хочет получить представление, уловить хоть как-то смысл. Я же язык знаю (учу), мне нужны помощники для сложных случаев (лексика и идомы, грамматику я знаю), а не переводчики.

papin-aziat ★★★★★
()
Ответ на: комментарий от WatchCat

У меня собрано с поддержкой postgresql, так что никакого mysql у меня в системе нет.

Я правильно понимаю, что ситуация когда MP3-плеер зависит от MySQL, MariaDB или PostgreSQL и других тяжёловесных баз данных, вместо SQLite который используют примерно все, тебя полностью устраивает?

EXL ★★★★★
()
Ответ на: комментарий от EXL

Я использую deadbeef или strawberry. А Амарок отсутствует даже в портажах:

$ eix amarok
Совпадений не найдено.

Он вообще живой?

А akonadi может в sqlite:

        sqlite? (
                dev-db/sqlite:3
                >=dev-qt/qtsql-${QTMIN}:5=[sqlite]
        )

Просто у меня он собран с поддержкой postgres.

Кстати не вижу в этом ничего плохого.

WatchCat ★★★★★
()
Последнее исправление: WatchCat (всего исправлений: 2)
Ответ на: комментарий от token_polyak

Эм, а почему 4.2? Ну точнее не сам KDE, а его компонент - Akonadi. И мускуль можно на постгре поменять.

hatred ★★★
()
Ответ на: комментарий от WatchCat
~ $ eix amarok
* media-sound/amarok [1]
     Available versions:  (5) **9999*l
       {debug +handbook ipod lastfm mariadb mtp ofa podcast wikipedia}
     Homepage:            https://amarok.kde.org/
     Description:         Advanced audio player based on KDE frameworks

[1] "kde" /var/db/repos/kde
Ololo_Trololo
()

Qt WebKit

Чем плох?

Qt WebEngine

Чем лучше вышеупомянутого?

С виду изменения ни о чём, но я и оболочкой не так уж и часто пользуюсь чтоб сравнить скорость работы индексирования и поиска.

Xant1k ★★
()
Ответ на: комментарий от Xant1k

Ну вебкит типа устарел и не развивается, поэтому правильные пацаны топят за вебенжин. Но на самом деле, словарю и litehtml за глаза хватит. Кстати, в Qt Creator для показа документации с недавних пор litehtml и используют.

DrBrown
()

Автор созрел для переименования форка.

Список кандидатов:

  • goldendict-ng (GoldenDict-ng)
  • XGoldenDict
  • GoldenDictX
  • PlatinumDict

Голосование: https://github.com/xiaoyifang/goldendict/discussions/500

Но это не самая большая проблема.

dataman ★★★★
() автор топика
Последнее исправление: dataman (всего исправлений: 1)
Ответ на: комментарий от dataman

Голосование завершено, теперь это goldendict-ng.

Всем спасибо! :-D

dataman ★★★★
() автор топика
Ответ на: комментарий от Aprel

На зачем, если есть multitran.ru

Давай разберемся, из чего состоит Мультитран. Итак:

  1. Советские общие словари. Во-первых, они частично устарели (awesome – ужасный?). Во-вторых, они внаглую спирачены (о том, как основатель проекта героически стоял за сканером, можно прочитать на сайте проекта).
  2. Такие же спираченные советские отраслевые словари. Эти до сих пор актуальны.
  3. Авторские переводы разной степени качества. Кто-то предлагает очень удачные общие или контекстуальные переводы. Кто-то переводит с китайского английского, а потом эти переводы в силу логики работы Мультитрана попадают в Ru-En. Помета, что это китайский английский, или что это перевод только для Ru-En, присутствует не всегда. Кто-то переводит из головы названия организаций или термины, для которых уже есть официальный или устоявшийся эквивалент.

Всё это сгруппировано в отдельные словари, но внутри словарей свалено в одну кучу, обычно без стилистических помет и без примеров. Чтобы выбрать нужный перевод, надо много думать и проделывать дополнительные поиски.

Выбрать отдельные словари, чтобы искать только по ним? Допустим, для перевода патента нужен общий словарь, патентный, технический и юридический. Можно в Lingvo, можно в GoldenDict, но нельзя в Мультитран.

И таки да, мне приходилось переводить, когда свет давали 4 часа через 5. Мобильный интернет держится от ИБП только первые два часа. Купить Мультитран для десктопа? Ну да, это будет набор из убогого локального клиента, запускающегося (запускающегосяся ли?) через Wine, спираченных словарей и юзерских переводов, которые офлайн не особо проверишь. Либо же придется скачать заброшенную альфу 2005 года под Linux и пытаться скормить ей базу от купленного Мультитрана под винду.

Vidrele ★★
()
30 мая 2023 г.
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.