LINUX.ORG.RU

Почему hunspell обрезает последний символ в вариантах ответа?

 


0

2

Словарь не может найти правильный вариант для «ошипки» выдаёт результат: «ошибк, ощипк, Шипк»

echo "ошипки" | hunspell -a -d ru_RU
@(#) International Ispell Version 3.2.06 (but really Hunspell 1.6.2)
& ошипки 3 0: ошибк, ощипк, Шипк

aspell в тоже время показывает 14 вариантов в том числе и правильный «ошибки»

echo "ошипки" | aspell -a -d ru
@(#) International Ispell Version 3.1.20 (but really Aspell 0.60.7-20110707)
& ошипки 14 0: Шипки, ошибки, ощипки, шпики, шапки, Шипка, Шипке, Шипку, охапки, окопки, ощипка, ощипке, ощипку, ушивки

Можно как-то исправить/улучшить результат для hunspell?



UPD. Обновил заголовок так как предыдущий не соответствовал реальной проблеме. Почему у hunspell такая слабая поддержка русского языка?

При пристальном взгляде оказалось что проблема не в слабом словаре, а в том что hunspell обрезает последний символ.
Это хорошо видно в сравнении с enchant.

echo "ошипки" | enchant -a -d ru_RU
@(#) International Ispell Version 3.1.20 (but really Enchant 1.6.0)
& ошипки 3 0: ошибки, ощипки, Шипки

Как убедить hunspell не обрезать слова?

$ echo «ошипки» | hunspell -a -d ru_RU
@(#) International Ispell Version 3.2.06 (but really Hunspell 1.7.0)
& ошипки 2 0: ощипки, ошибки

imul ★★★★★ ()

почему ты не хочешь улучшить aspell ? половина слов не пойми на каком языке, другая половина не имеет никакого отношения к написанному. мне, кстати, мой божественный маузер предлагает только Шипки (деревня такая что ли?), а ведь даже ёжиков понимает. навек но это такое слащаво пипочки в консументов доплатить невозможно.

anonymous ()

Можно как-то исправить/улучшить результат для hunspell?

Наверно да, дополнив словарь hunspell-ru.

aureliano15 ★★ ()

Что-то у тебя не то:

echo "ошипки" | hunspell -a -d ru_RU
@(#) International Ispell Version 3.2.06 (but really Hunspell 1.6.2)
& ошипки 2 0: ощипки, ошибки

echo "ошипки" | aspell -a -d ru
@(#) International Ispell Version 3.1.20 (but really Aspell 0.60.7-rc1)
& ошипки 3 0: Шипки, ошибки, ощипки

anonymous ()
Ответ на: комментарий от anonymous

Про ежиков:

echo "ежик" | aspell -a -d ru
@(#) International Ispell Version 3.1.20 (but really Aspell 0.60.7-rc1)
*

echo "ежик" | hunspell -a -d ru_RU
@(#) International Ispell Version 3.2.06 (but really Hunspell 1.6.2)
& ежик 5 0: ёжик, ежи, ежин, ерик, ежих
хунспел не дал правильного варианта. Так что, лучше пользоваться аспелом.

anonymous ()
Ответ на: комментарий от anonymous

У меня стоит hunspell-ru версии 1:6.0.3-3. Возможно в нём затыка, так как версии hunspell совпадают

KlausFisher ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.