LINUX.ORG.RU

LanguageTool 3.6

 , , ,


1

3

28 декабря состоялся релиз LanguageTool 3.6 — свободной (GNU LGPL v2.1 или новее) системы проверки грамматики, стиля, пунктуации и орфографии, позволяющей анализировать тексты на 30 различных языках. LanguageTool может использоваться как независимое приложение или как расширение для LibreOffice/OpenOffice. На сайте http://www.languagetool.org/ru доступна online-форма, с помощью которой можно проверять тексты самой свежей версией системы.

В этом выпуске:

  • Обновлены модули для проверки текстов на русском, английском, каталанском, французском, немецком, польском, португальском, испанском и украинском языках.
  • Обновлены встроенные библиотеки.

Для русского языка:

  • Создано около 80 правил (xml, Java и гибридных xml/Java).
  • Исправлена работа имеющихся грамматических правил.
  • Улучшен механизм сегментации текста на предложения.
  • Обновлён и перестроен встроенный словарь частей речи.
  • Изменена логика работы правил грамматического контекстного анализатора.

>>> Подробности



Проверено: maxcom ()
Последнее исправление: maxcom (всего исправлений: 3)

Ответ на: комментарий от Kompilainenn

Online-версия ограничивает вывод пятью вариантами замены. Независимая версия предлагает 29 вариантов замены, среди которых есть правильный.

Yakov
() автор топика
Ответ на: комментарий от shikata_ga_nai

свободной (GNU LGPL v2.1 или новее) системы проверки грамматики

А где код гугло-сервисов можно взять?

mandala ★★★★★
()

Спасибо, что продолжаете пилить :) На странице по ссылке есть упоминание о плагине для OmegaT. Плагин устарел, сейчас OmegaT статически собирается с LanguageTool, но при этом умеет работать с ним и по HTTP через обновлённый API. Может стоит поправить информацию?

simburde
()
Ответ на: комментарий от shikata_ga_nai

Он не уважает твои свободы и твоё право на приватность.

Chaser_Andrey ★★★★★
()

на счет пунктуации: не понял как заставить его подсказывать? Запятые убирал и ставил где не поподя...

anonymous
()
Ответ на: комментарий от anonymous

на счет пунктуации: не понял как заставить его подсказывать? Запятые убирал и ставил где не поподя...

запятую перед «а» требует, например

Причастные и деепричастные обороты проглотило без запятой. Моя учительница по русскому вызвала бы всех разрабов к себе и отчитала за такое

anonymous
()
Ответ на: комментарий от anonymous

Обработка причастных и деепричастных оборотов пока не реализована.

Yakov
() автор топика

К сожалению, единственная нормальная прога для проверки пунктуации - MS Office.

anonymous
()
Ответ на: комментарий от anonymous

К сожалению, единственная нормальная прога для проверки пунктуации - MS Office.

единственная прога для грамотного написания текстов - это прилежное обучение в школе. МСО такое иногда предлагает, что лучше бы он молчал в тряпочку с ацетоном

Kompilainenn ★★★★★
()
Последнее исправление: Kompilainenn (всего исправлений: 1)
Ответ на: комментарий от Legioner

Начиная с MS Office 2013 используется собственный MS движок, который на порядок хуже и Орфо и LanguageTool.

anonymous
()

Спасибо за новость. Нужная штука.

Odalist ★★★★★
()
Ответ на: комментарий от Rastafarra

CompoundRule у вас там есть, а «Вста вьте» заменить на «Вставьте» не предлагает :(

CompoundRule расставляет дефисы, то есть обнаруживает ошибки, когда вместо пробела должен быть дефис, или слово написано слитно, а должно быть через дефис.

Yakov
() автор топика
Ответ на: комментарий от Rastafarra

это обыкновенный hunspell, просто словарик, без контекста и разбора на части речи.

Hunspell используется для проверки орфографии только для некоторых языков. Для русского языка в LT используется morfologik-speller, но не все возможности Hunspell в нём реализованы. Я попробую улучшить алгоритм поиска вариантов подстановок.

Yakov
() автор топика

Ну, раз оно на джаве, можно прикрутить к этому сайту.

abraziv_whiskey ★★★★★
()

По сабжу — классическое ненужно в кубе.

Верия перевалила за 3.0, а до сих пор ничего не умеет. Но не это самое страшное. Самое страшное что ОНО на JAVA. Спеллчекер на жирножабе, вы серьезно вообще?! Мне надо dedicated сервер с теребайтом RAM покупать чтобы им пользоваться? Выучите уже нормальный язык¹ и перепишите.

_____________________

1. Нормальный язык — C++.

anonymous
()
Ответ на: комментарий от Yakov

Я попробую улучшить алгоритм поиска вариантов подстановок.

как мысль.

я бы прям щас форкнул hunspell и передавал бы ему не только слово для исправления, а слово и предложение, чтобы он смог понять часть речи и предложить только связанные.

из примера выше: «шол» ---> не «мол» (из вики сущ. масса, насыпь), а «идти», глагол.

я бы прям наверно поучаствовал.

и тут же вопрос, как вяжутся стенфорские или какие нравятся nlp с русским корпусом? в ваших сырцах никак, а вроде хочется?

я вдруг подумал что не пробовал в opennlp скормить куздру ))

Rastafarra ★★★★
()
Последнее исправление: Rastafarra (всего исправлений: 3)
Ответ на: комментарий от anonymous

Тормоза не так страшны, как страшен джава-ад.

AVL2 ★★★★★
()
Ответ на: комментарий от anonymous

А не кажется ли уважаемому дону, что в такого рода продуктах важен не язык реализации, а алгоритмы? Если оно умеет хорошие алгоритмы, пусть хоть на брейнфаке пишут.

И да, хороший язык реализации это не про «терабайты рам на сервере», а коммьюнити предметных специалистов, умеющих еще и писать на этом языке. Это не формочки писать и тетрисы кодить — тут серьезный интеллектуальный вклад нужен. По аналогии с различными системами моделирования: язык вторичен, алгоритмы — первичны.

unanimous ★★★★★
()
Ответ на: комментарий от anonymous

Не, именно так. Может там всё под открытой лицензией, вот я и спросил. Если бы «оппонировал», то я бы утверждал. Хотя грамотностью я не отличаюсь, и вполне возможно, что моя фраза не грамотна.

mandala ★★★★★
()
Ответ на: комментарий от anonymous

Учитывая специфику и возможную сложность алгоритмов для чего-то связанного с языками пусть пишется хоть на perl.

raven_cler ★★
()
Ответ на: комментарий от shikata_ga_nai

Ммм, подскажешь какой-нибудь удобный редактор с синонимайзером, поиском тавтологий, генератором случайных сочетаний, средней статистикой по всему тексту или выделенному участку, дополнением по словарю, навигацией по предложениям-абзацам-частям-главам, возможностью фолдить эти самые абзацы-части-главы, возможностью вставлять «комментарии» в обычный текст, интегрируемый с полями ввода браузеров, к тому же умеющий в древовидные заметки и экспорт в fb2 или даже готовый для печати нормально выглядящий на бумаге pdf?

При этом чтобы не было всяких ненужных отвлекающих мышкотыкательных элементов интерфейса. Ну, и конечно же, чтобы оно интегрировалось с гуглосервисами.

raven_cler ★★
()
Ответ на: комментарий от Rastafarra

просто оно никак не вяжется на спелчекер

Спеллчекер и проверка грамматики реализованы в программе независимо. Объясняется это тем, что LT разрабатывался как система проверки грамматики для OpenOffice.org/LibreOffice/Apache OpenOffice, в котором уже есть своя система проверки орфографии. Поэтому для использования в составе офиса проверка орфографии не нужна. Но для независимого приложения – необходима. Поэтому и была добавлена позже.

Yakov
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.