LINUX.ORG.RU

Вышла новая версия ABBYY FineReader Engine для Linux

 ,


0

0

Компания ABBYY объявляет о выходе ABBYY FineReader Engine 9.0 for Linux, новой версии инструментария разработчика (SDK), предназначенного для встраивания функций оптического распознавания в приложения независимых производителей. Инструментарий сопровождается подробной документацией, имеет квалифицированную техническую поддержку (в том числе на русском языке), постоянно обновляется.

Среди ключевых возможностей ABBYY FineReader Engine 9.0 for Linux:

  • Поддержка множества языков
  • Технология адаптивного распознавания документов (ADRT)
  • Точное распознавание штрихкодов
  • Возможность конвертации файлов формата PDF или PDF/A с MRC-сжатием
  • Поддержка множества форматов (PDF, BMP, PCX, DCX, JPEG, GIF, TIFF и PNG. Сохранение можно производить в RTF, PDF, PDF/A, DOC, XLS, PPT, XML, DOCX, XLSX, PPTX, TXT, CSV, HTML и DBF).

Сайт ABBYY

>>> Подробности

★★★★★

Проверено: Aceler ()

Ответ на: комментарий от question4

> Goldendict приятнее, имхо. Если нет желания смотреть на танцующие деревья :)

Какие ещё танцующие деревья в стардикте? :)

AP ★★★★★
()
Ответ на: комментарий от Skull

>$ apt-cache search multitran

Гм. Торможу. ОК, тогда просто «лучше», без «но».

duott ★★★★★
()

Есть такой забавный аспект, который многие не замечают:

чем дальше, тем менее нужны OCR технологии. Просто потому, что распознавать нужно лишь старые документы. Чем дальше тем их меньше. Весь современный документооборот предусматривает обмен файлами. И чем дальше - тем больше...

В результате фирмы разработчики OCR практически не имеют будущего - объём установленного софта растёт, а объём бумажных архивов уменьшается.

ignik
()
Ответ на: комментарий от tempuser002

> Вика, чем же он перспективный? Было ли улучшено распознавание хоть на йоту после того, как его сделали Open Source? Что нет?

И не улучшат. Я щас заглянул мельком в сырцы. Там неподдерживаемое месиво.

Штоб у куннилингуса появились опенсорсные перспективы - нужно вдумчиво посидеть и переписать пять метров исходников. Алё, мы ищем таланты.

yk4ever
()
Ответ на: комментарий от ignik

> В результате фирмы разработчики OCR практически не имеют будущего - объём установленного софта растёт, а объём бумажных архивов уменьшается.

Будущего не имеют, примерно как загнивающий капитализм. Зато настоящее охрененное.

yk4ever
()
Ответ на: комментарий от question4

отрыл гуглём новость о 6естой версии сабжа http://old.slackware.ru/news.ghtml?ID=1082

учитывая инфляцию и время, можно смело множить на пи в квадрате...

И это только двиг, чтобы сделать распознавалку нужно нанимать прогеров итп, дешевле допилить тесеракт.

anonymous
()
Ответ на: комментарий от anonymous

> И это только двиг, чтобы сделать распознавалку нужно нанимать прогеров итп, дешевле допилить тесеракт.

«Допиливание» - это 90% работы.

Короче, мне кажется, что с нынешними скоростями инета, наиболее адекватная схема - онлайн-распознавание как сервис.

yk4ever
()
Ответ на: комментарий от yk4ever

>наиболее адекватная схема - онлайн-распознавание как сервис.
Невсегда, а вдруг надо что-нибудь конфиденциальное/секретное распознать?

amorpher ★★★★★
() автор топика
Ответ на: комментарий от Deleted

Потому я и говорю, что он никому не нужен :)

AP ★★★★★
()
Ответ на: комментарий от Quasar

>CuneiForm есть как в виде движка, так и в виде распознавалки с GUI. FineReader есть только в виде платного дорогущего движка.

И чо? От этого cf стал работать лучше fr?

petrosyan ★★★★★
()
Ответ на: комментарий от namezys

>Темпы развития?

вы называете развитием добавлени шрифтов и подчистку кода? Тогда я спокоен за fine reader. Уровень cf у него достигнут более 10 лет назад, а сообщество не преподнесет ничего принципиально нового


Так а я про что.

petrosyan ★★★★★
()
Ответ на: комментарий от ignik

Вы забываете, что объем быдло-документов, которые созданы в электронном виде намного меньше объема документов, написанных до компьютерной эры. Для былдо-корпораций это может и не актуально, но для остальных людей ocr нужен.

petrosyan ★★★★★
()
Ответ на: комментарий от Quasar

> Нынешняя маркетинговая политика ABBYY протухла и загоняет эту конторку в могилу.

то, что они срут на линуксоидов, никак не загонит их в могилу

overmind88 ★★★★★
()
Ответ на: комментарий от ignik

> В результате фирмы разработчики OCR практически не имеют будущего - объём установленного софта растёт, а объём бумажных архивов уменьшается.

Ключевое слово: data capture

Еще долго будет нужно

namezys ★★★★
()
Ответ на: комментарий от namezys

> СтарФорс фаин ридер не использует

Какую технологию используют версии 9 и 10, чтобы предотвратить патчение файлов exe и dll? Насколько я знаю, это связано со StarForce Crypto: http://www.star-force.ru/solutions/products/sf_crypto/ Обеспечить его поддержку в вайне можно, но пока он не работает.

Заодно: по какой причине FR9 заполняет реестр мусором, вызывая замедление работы WINE и всей системы?

question4 ★★★★★
()
Ответ на: комментарий от AP

> Какие ещё танцующие деревья в стардикте? :)

StarDict при открытии словарной статьи может выводить сложные анимированные древовидные структуры, показывающие связь данного слова с другими. Фича у моих знакомых, не умеющих её отключить, вызывала сильное раздражение :)

С «танцующими деревьями» из Reiser4 ничего общего :)

question4 ★★★★★
()
Ответ на: комментарий от ignik

> Весь современный документооборот предусматривает обмен файлами.

Но по непонятным причинам пока привёл к увеличению объёма бумаги :) Согласен, это — временное явление. Но надолго.

В результате фирмы разработчики OCR практически не имеют будущего - объём установленного софта растёт, а объём бумажных архивов уменьшается.

Есть распознание рукописного ввода, где работы — непочатый край. Есть близкая тема векторизации изображений. Да и архивов больше, чем кажется.

question4 ★★★★★
()
Ответ на: комментарий от dotbg

> но помочь может )) только вот, пока что, с конкурентами напряг

во во. являюсь чуть ли не монополистом технологическим - их не задавишь

namezys ★★★★
()
Ответ на: комментарий от question4

> Какую технологию используют версии 9 и 10, чтобы предотвратить патчение файлов exe и dll?

Вроде ABBYY сами защиту пишут.

А вот про заполнение мусором - ХЗ. Хотя могу предположить, что и как, но не уверен, что могу об этом говорить. Но если это так - то это значит WINE сильно отличается от винды

namezys ★★★★
()
Ответ на: комментарий от question4

Нет. Распозновалка ввода текста и векторизация - вещь очень далекая. Но смежная.

С другой стороны современые распозновалки - это не просто найти похожий символ. Вот это можно и объединиться

namezys ★★★★
()
Ответ на: комментарий от namezys

> Вроде ABBYY сами защиту пишут.

Информация — из багзиллы WINE. Не знаю, как проверить. В списке клиентов на star-force.ru ABBYY не нашёл.

про заполнение мусором ... WINE сильно отличается от винды

Не то, чтобы это был мусор. Просто очень много ключей непонятного назначения похожих на какие-то хеши. Windows с ними справляется почти не замедляясь, но WINE после попытки установить FR9 работает очень медленно. С 10-й версией такой проблемы нет.

question4 ★★★★★
()
Ответ на: комментарий от anonymous

> учитывая инфляцию и время, можно смело множить на пи в квадрате...

90000 долларов за SDK? Многовато. Позже на их сайте появлялась цена в несколько раз ниже 9000. Потом они вообще убрали ценник. Имхо, хотят иметь возможность драть по максимуму с корпораций, но сделать цену доступной для мелких независимых разработчиков. Спольски утверждал, что сокрытие ценника плохо работает :)

question4 ★★★★★
()
Ответ на: комментарий от Deleted

halturin, вы такой проницательный человек.., на цену то смотрели? Не знаю как там для бизнеса, а вот дома за такие деньги пойдет и cuneiform или fn8+wine...

bohm ★★★★★
()
Ответ на: комментарий от Skull

>Все знают про CuneiForm, а Вы — нет?

Оно ещё не готово к использованию. Вряд ли серьезные потребители
согласятся выступать в качестве бета-тестеров.

ttnl ★★★★★
()

Не вижу смысла при таких ценах и отсутствии гуевины.

MuZHiK-2 ★★★★
()

троллевато, но программа кому то нужна, наверное хорошо, что релизится

mikhalich ★★
()
Ответ на: комментарий от hibou

уже не к стардикту, а голдендикту :) Но таки да, прикрутили :)

В этом контексте, кстати, позиция автора goldendict'а очень правильная. Он упирает на то, что основа этого бизнеса - это бизнес словарей, а не бизнес оболочек.

AlexM ★★★★★
()
Ответ на: комментарий от AlexM

> Ну, пример Ларри какбэ говорит, что всё дело в правильно обученных продажниках :)

Если Oracle, то цены у них на сайте указаны: https://shop.oracle.com/pls/ostore/f?p=ostore:4:0:::CIR,RIR:PROD_HIER_ID: А обученные продажники помогают потенциальному клиенту выбрать вариант за $11000 вместо $46.

question4 ★★★★★
()
Ответ на: комментарий от ttnl

>> CuneiForm

ещё не готово к использованию.

Не знаю, как, но решения на нём уже продают :)

question4 ★★★★★
()
Ответ на: комментарий от ttnl

> Оно ещё не готово к использованию.

и не будет

namezys ★★★★
()
Ответ на: комментарий от Deleted

> Перечитал каменты... диву даюсь... всем бы только халяву.

Читать надо внимательнее.

Нет, чтобы взять и написать хороший визуальный инструмент на базе их разработок

Цена на их Engine в два раза завышена по сравнению с версией для Windows. Напишу я гуй - и с ним надо будет продавать движок, который никто не будет покупать.

hobbit ★★★★★
()
Ответ на: комментарий от question4

> Какую технологию используют версии 9 и 10, чтобы предотвратить патчение файлов exe и dll? Насколько я знаю, это связано со StarForce Crypto: http://www.star-force.ru/solutions/products/sf_crypto/ Обеспечить его поддержку в вайне можно, но пока он не работает.

Заодно: по какой причине FR9 заполняет реестр мусором, вызывая замедление работы WINE и всей системы?

В виртмашину его, засранца.

yk4ever
()
Ответ на: Распознавание от romeg

> Abbyy пришла в линукс с продуктом,

Да не пришла она. SDK - это ещё не продукт. Хотя, на самом деле, про продукт слух был тоже вроде. Правда консольный, но гуй - это проще уже. Наверное, можно те же адаптировать, что и для Cuneiform есть.

AS ★★★★★
()
Ответ на: комментарий от petrosyan

> CLI версия от 149 €

О,вот он, слух. А вот на сайте у них я сходу не нашёл что-то... На SDK только попадаются ссылки.

AS ★★★★★
()
Ответ на: комментарий от AS

149 €/12.000 pages = 0,0124 €/page = 1,2 cent/page и т.д.

FR -> Cuneiform!

bohm ★★★★★
()
Ответ на: комментарий от anonymous

> в ALT Linux 5 видел точно то же что и под виндой.

Версии фронтэндов под Linux разрабатываются независимыми разработчиками, а версию для Windows пилят сами когнитивцы.

Skull ★★★★★
()
Ответ на: комментарий от Binary

> А где он там? Прошёл по «сайт ABBYY», ничего не нашёл.

«Цена лицензии на комплект разработчика фиксированная — 4900 USD»

http://www.abbyy.ru/Default.aspx?DN=5314ff20-d83f-44be-b4b7-242dd6cb0cf7

Вряд ли что-то поменялось с версии 7.1.

Skull ★★★★★
()
Ответ на: комментарий от ignik

> Весь современный документооборот предусматривает обмен файлами. И чем дальше - тем больше...

В эпоху облаков файлы не нужны. Уже давно. Рулят XML-потоки.

Skull ★★★★★
()
Ответ на: комментарий от amorpher

> Невсегда, а вдруг надо что-нибудь конфиденциальное/секретное распознать?

Платный сервис в ближайшем датацентре.

Skull ★★★★★
()
Ответ на: комментарий от petrosyan

> И чо? От этого cf стал работать лучше fr?

Да. Он, как минимум, работает. В отличие от тилкита fr под Linux, который почти никто не видел.

Skull ★★★★★
()
Ответ на: комментарий от ttnl

> Оно ещё не готово к использованию.

Люди используют и без Ваших пророчеств.

Вряд ли серьезные потребители согласятся выступать в качестве бета-тестеров.

Во-первых, это уже не бета. Во-вторых, рынок не состоит из одних «серьёзных потребителей».

Skull ★★★★★
()
Ответ на: комментарий от Skull

>Цена лицензии на комплект разработчика фиксированная — 4900 USD

ну если на основе это слепить, скажем, SaaS, то ведь не так и дорого

Binary ★★★★★
()
Ответ на: комментарий от Skull

> Во-первых, это уже не бета.

Ну да, уже лет как 15. и именно эта версия

В отличие от тилкита fr под Linux, который почти никто не видел.

Зато результаты видите постоянно

Вряд ли что-то поменялось с версии 7.1.

Там достаточно гибкая политика ценообразования. Это не для домашнего пользователя, поэтому есть разные типы лицензий: временые, постраничные, постраничные возобновляемые, неограниченные и тд

namezys ★★★★
()
Ответ на: комментарий от Skull

> Все знают про CuneiForm, а Вы — нет?

А оно разве живое? Ибо на их сайте - Текущая версия: 0.1.0 Дата выпуска: 14.02.2009, последняя новость - 29.12.09

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.