LINUX.ORG.RU

Словари? Словари!


0

0

Для тех, кто, как и я, использует в работе словари, возможно, будет интересна моя страничка, посвященная методу работы с ними:

http://selnix.narod.ru/dics.html

Я работаю со словарями профессионально и считаю описанный метод наилучшим. Постоянно продумываю детали и буду признателен за любые идеи по совершенствованию методики. Thanks & welcome! (Признаюсь, что программы-словари, использующие ту или иную оболочку считаю по определению ограниченными и неэффективными, поэтому не хотел бы их обсуждать, sorry).


Ты troll что-ли? Помню эта тема как-то здесь была. Зачем продолжать навязывать свою точку зрения? dict делает все намного быстрее благодаря индексам и качественнее, благодаря разным стратегиям поиска.
$ dict -S
Strategies available:
exact Match headwords exactly
prefix Match prefixes
substring Match substring occurring anywhere in a headword
suffix Match suffixes
re POSIX 1003.2 (modern) regular expressions
regexp Old (basic) regular expressions
soundex Match using SOUNDEX algorithm
lev Match headwords within Levenshtein distance one
word Match separate words within headwords
$ dict -D
Databases available:
mueller24 Mueller English-Russian Dictionary
beslov Большой Энциклопедический Словарь
ushakov Толковый словарь Ушакова
dalf Толковый словарь живого великорусского языка Даля
gcide The Collaborative International Dictionary of English v.0.48
jargon Jargon File (4.4.4, 14 Aug 2003)
$

Кстати, unix toolchain используется неоптимально. Можно было бы абстрагировать каталоги словарей от юзеров, чтобы не делать cd ~/dic/kjv. И тогда бы после кучи других изменений в лучшем случае появился бы аналог dict, только в десятки раз более медленный.

rihad
()
Ответ на: комментарий от Selnix

> А кто индексы проставляет?
# apt-get install dictfmt
К тому же, dictd создает дополнительный индекс в памяти, чтобы еще более убыстрить доступ.

rihad
()
Ответ на: комментарий от Selnix

> А как в этот dict словари добавлять?

Легко. Я пользуюсь готовыми - в сети навалом. А авторы используют dictfmt и прочие тулзы для конвертации готовых баз данных в dictd формат. Есть кстати и гуевый клиент, Gnome dictionary.

rihad
()
Ответ на: комментарий от rihad

>> используют dictfmt и прочие тулзы для конвертации

Вот это, месье, меня как раз и не устраивает. Мне нужен чистый поиск, без всякой индексации (которая что-то упускает), причем по файлам, которые не являются обработанными вообще никак.

Впрочем, Вы правы, это, скорее, не собственно словарный алгоритм, а лингвистический инструмент. Прошу прощения, если проявил навязчивость, совсем того не желал. Sorry.

Selnix
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.