LINUX.ORG.RU

LanguageTool 3.6

 , , ,


1

3

28 декабря состоялся релиз LanguageTool 3.6 — свободной (GNU LGPL v2.1 или новее) системы проверки грамматики, стиля, пунктуации и орфографии, позволяющей анализировать тексты на 30 различных языках. LanguageTool может использоваться как независимое приложение или как расширение для LibreOffice/OpenOffice. На сайте http://www.languagetool.org/ru доступна online-форма, с помощью которой можно проверять тексты самой свежей версией системы.

В этом выпуске:

  • Обновлены модули для проверки текстов на русском, английском, каталанском, французском, немецком, польском, португальском, испанском и украинском языках.
  • Обновлены встроенные библиотеки.

Для русского языка:

  • Создано около 80 правил (xml, Java и гибридных xml/Java).
  • Исправлена работа имеющихся грамматических правил.
  • Улучшен механизм сегментации текста на предложения.
  • Обновлён и перестроен встроенный словарь частей речи.
  • Изменена логика работы правил грамматического контекстного анализатора.

>>> Подробности



Проверено: maxcom ()
Ответ на: комментарий от Kompilainenn

Online-версия ограничивает вывод пятью вариантами замены. Независимая версия предлагает 29 вариантов замены, среди которых есть правильный.

Yakov ()
Ответ на: комментарий от Yakov

Для данного примера можно настроить предпочтительный вариант

Yakov ()
Ответ на: комментарий от Yakov

Зачем что-то настраивать, когда эту же фразу можно вставить в гуглопоиск и он догадается с первого раза?

shikata_ga_nai ()
Ответ на: комментарий от shikata_ga_nai

свободной (GNU LGPL v2.1 или новее) системы проверки грамматики

А где код гугло-сервисов можно взять?

mandala ★★ ()

Спасибо, что продолжаете пилить :) На странице по ссылке есть упоминание о плагине для OmegaT. Плагин устарел, сейчас OmegaT статически собирается с LanguageTool, но при этом умеет работать с ним и по HTTP через обновлённый API. Может стоит поправить информацию?

simburde ()
Ответ на: комментарий от shikata_ga_nai

Он не уважает твои свободы и твоё право на приватность.

Chaser_Andrey ★★★★★ ()

на счет пунктуации: не понял как заставить его подсказывать? Запятые убирал и ставил где не поподя...

anonymous ()
Ответ на: комментарий от anonymous

на счет пунктуации: не понял как заставить его подсказывать? Запятые убирал и ставил где не поподя...

запятую перед «а» требует, например

Причастные и деепричастные обороты проглотило без запятой. Моя учительница по русскому вызвала бы всех разрабов к себе и отчитала за такое

anonymous ()
Ответ на: комментарий от anonymous

Обработка причастных и деепричастных оборотов пока не реализована.

Yakov ()
Ответ на: комментарий от Kompilainenn

это обыкновенный hunspell, просто словарик, без контекста и разбора на части речи.

Rastafarra ★★★ ()

CompoundRule у вас там есть, а «Вста вьте» заменить на «Вставьте» не предлагает :(

Rastafarra ★★★ ()

К сожалению, единственная нормальная прога для проверки пунктуации - MS Office.

anonymous ()
Ответ на: комментарий от anonymous

Насколько я помню, офис пользовался разработкой от Орфо, которая доступна в том числе и для OpenOffice.

Legioner ★★★★★ ()
Ответ на: комментарий от anonymous

К сожалению, единственная нормальная прога для проверки пунктуации - MS Office.

единственная прога для грамотного написания текстов - это прилежное обучение в школе. МСО такое иногда предлагает, что лучше бы он молчал в тряпочку с ацетоном

Kompilainenn ★★★★★ ()
Последнее исправление: Kompilainenn (всего исправлений: 1)

Все бы ничего, но джава...

AVL2 ★★★★★ ()
Ответ на: комментарий от AVL2

Джава не так страшна, а вот DotNet - набор тормозов.

anonymous ()
Ответ на: комментарий от Legioner

Начиная с MS Office 2013 используется собственный MS движок, который на порядок хуже и Орфо и LanguageTool.

anonymous ()

Спасибо за новость. Нужная штука.

Odalist ★★★★★ ()
Ответ на: комментарий от Rastafarra

CompoundRule у вас там есть, а «Вста вьте» заменить на «Вставьте» не предлагает :(

CompoundRule расставляет дефисы, то есть обнаруживает ошибки, когда вместо пробела должен быть дефис, или слово написано слитно, а должно быть через дефис.

Yakov ()
Ответ на: комментарий от Rastafarra

это обыкновенный hunspell, просто словарик, без контекста и разбора на части речи.

Hunspell используется для проверки орфографии только для некоторых языков. Для русского языка в LT используется morfologik-speller, но не все возможности Hunspell в нём реализованы. Я попробую улучшить алгоритм поиска вариантов подстановок.

Yakov ()
Ответ на: комментарий от Yakov

При чём тут гугл? Я апеллировал мнению, что есть гугл и сабж не нужен.

mandala ★★ ()
Последнее исправление: mandala (всего исправлений: 2)

Ну, раз оно на джаве, можно прикрутить к этому сайту.

abraziv_whiskey ★★★★★ ()

По сабжу — классическое ненужно в кубе.

Верия перевалила за 3.0, а до сих пор ничего не умеет. Но не это самое страшное. Самое страшное что ОНО на JAVA. Спеллчекер на жирножабе, вы серьезно вообще?! Мне надо dedicated сервер с теребайтом RAM покупать чтобы им пользоваться? Выучите уже нормальный язык¹ и перепишите.

_____________________

1. Нормальный язык — C++.

anonymous ()
Ответ на: комментарий от Yakov

я посмотрел сырцы и словарь, спасибо :)

просто оно никак не вяжется на спелчекер, я об этом. и это печально :(

Rastafarra ★★★ ()
Ответ на: комментарий от Yakov

Я попробую улучшить алгоритм поиска вариантов подстановок.

как мысль.

я бы прям щас форкнул hunspell и передавал бы ему не только слово для исправления, а слово и предложение, чтобы он смог понять часть речи и предложить только связанные.

из примера выше: «шол» ---> не «мол» (из вики сущ. масса, насыпь), а «идти», глагол.

я бы прям наверно поучаствовал.

и тут же вопрос, как вяжутся стенфорские или какие нравятся nlp с русским корпусом? в ваших сырцах никак, а вроде хочется?

я вдруг подумал что не пробовал в opennlp скормить куздру ))

Rastafarra ★★★ ()
Последнее исправление: Rastafarra (всего исправлений: 3)
Ответ на: комментарий от anonymous

Тормоза не так страшны, как страшен джава-ад.

AVL2 ★★★★★ ()
Ответ на: комментарий от anonymous

А не кажется ли уважаемому дону, что в такого рода продуктах важен не язык реализации, а алгоритмы? Если оно умеет хорошие алгоритмы, пусть хоть на брейнфаке пишут.

И да, хороший язык реализации это не про «терабайты рам на сервере», а коммьюнити предметных специалистов, умеющих еще и писать на этом языке. Это не формочки писать и тетрисы кодить — тут серьезный интеллектуальный вклад нужен. По аналогии с различными системами моделирования: язык вторичен, алгоритмы — первичны.

unanimous ★★★★ ()
Ответ на: комментарий от anonymous

Не, именно так. Может там всё под открытой лицензией, вот я и спросил. Если бы «оппонировал», то я бы утверждал. Хотя грамотностью я не отличаюсь, и вполне возможно, что моя фраза не грамотна.

mandala ★★ ()
Ответ на: комментарий от shikata_ga_nai

А как гуглосервис к тому же эмаксу прикрутить, не подскажешь?

raven_cler ()
Ответ на: комментарий от anonymous

Учитывая специфику и возможную сложность алгоритмов для чего-то связанного с языками пусть пишется хоть на perl.

raven_cler ()
Ответ на: комментарий от raven_cler

А как гуглосервис к не нужно прикрутить, не подскажешь?

ну и прикручивайте свое не нужно к не нужно

shikata_ga_nai ()
Ответ на: комментарий от shikata_ga_nai

Ммм, подскажешь какой-нибудь удобный редактор с синонимайзером, поиском тавтологий, генератором случайных сочетаний, средней статистикой по всему тексту или выделенному участку, дополнением по словарю, навигацией по предложениям-абзацам-частям-главам, возможностью фолдить эти самые абзацы-части-главы, возможностью вставлять «комментарии» в обычный текст, интегрируемый с полями ввода браузеров, к тому же умеющий в древовидные заметки и экспорт в fb2 или даже готовый для печати нормально выглядящий на бумаге pdf?

При этом чтобы не было всяких ненужных отвлекающих мышкотыкательных элементов интерфейса. Ну, и конечно же, чтобы оно интегрировалось с гуглосервисами.

raven_cler ()
Ответ на: комментарий от Rastafarra

просто оно никак не вяжется на спелчекер

Спеллчекер и проверка грамматики реализованы в программе независимо. Объясняется это тем, что LT разрабатывался как система проверки грамматики для OpenOffice.org/LibreOffice/Apache OpenOffice, в котором уже есть своя система проверки орфографии. Поэтому для использования в составе офиса проверка орфографии не нужна. Но для независимого приложения – необходима. Поэтому и была добавлена позже.

Yakov ()
Ответ на: комментарий от Rastafarra

Re: лор, ты ли это?

Ответ на сообщение:

а жести и оттоптанных самолюбий мало

Это всё теперь сконцентроировано здесь.

#t13150277

anonymous ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.