LINUX.ORG.RU

Вышла новая версия ABBYY FineReader Engine для Linux

 ,


0

0

Компания ABBYY объявляет о выходе ABBYY FineReader Engine 9.0 for Linux, новой версии инструментария разработчика (SDK), предназначенного для встраивания функций оптического распознавания в приложения независимых производителей. Инструментарий сопровождается подробной документацией, имеет квалифицированную техническую поддержку (в том числе на русском языке), постоянно обновляется.

Среди ключевых возможностей ABBYY FineReader Engine 9.0 for Linux:

  • Поддержка множества языков
  • Технология адаптивного распознавания документов (ADRT)
  • Точное распознавание штрихкодов
  • Возможность конвертации файлов формата PDF или PDF/A с MRC-сжатием
  • Поддержка множества форматов (PDF, BMP, PCX, DCX, JPEG, GIF, TIFF и PNG. Сохранение можно производить в RTF, PDF, PDF/A, DOC, XLS, PPT, XML, DOCX, XLSX, PPTX, TXT, CSV, HTML и DBF).

Сайт ABBYY

>>> Подробности

★★★★★

Проверено: Aceler ()

Ответ на: комментарий от yk4ever

Спасибо, я и Cuneiform+XSane обхожусь (с таблицами только возни немного бывает).

amorpher ★★★★★
() автор топика
Ответ на: комментарий от anonymous

> А оно разве живое? Ибо на их сайте - Текущая версия: 0.1.0 Дата выпуска: 14.02.2009, последняя новость - 29.12.09

Где вы такие сайты находите? Ссылку можно?

А потом глянь сюда: https://launchpad.net/cuneiform-linux

Последняя версия 0.9. Вышла 2010-02-01.

question4 ★★★★★
()
Ответ на: комментарий от Skull

> http://www.abbyy.ru/Default.aspx?DN=5314ff20-d83f-44be-b4b7-242dd6cb0cf7

Вряд ли что-то поменялось с версии 7.1.

$4900 за базовый комплект + $2200 за иероглифические языки + непонятно сколько за FlexiCapture.

Текст, явно, относится к SDK под Windows. Насколько я знаю, не существует того же FormDesigner под юниксы. Судя по более старому http://old.slackware.ru/news.ghtml?ID=1082 , версия под Windows может оказаться чуть ли не вдвое дешевле.

question4 ★★★★★
()
Ответ на: комментарий от question4

> FlexiCapture

Господа, не путайте OCR и Data Capture. Это абсолютно разные продукты, даже распозновалки разные (хотя это близкие задачи). Так что для покупки FC не надо пакупать FR

FlexuCapture стоит куда дороже FR, и куда сложнее и навороченнее. При этом это не самый мощный из Data Capture продуктов, который есть а ABBYY, и имеет очень гибкую политику лицензирования. И я даже не знаю, портирована ли хотя бы распозновалка под linux. Тем более при data capture большая часть времени - это верификация.

namezys ★★★★
()
Ответ на: комментарий от Skull

>Люди используют и без Ваших пророчеств.

Отлично. Да, некоторым она может быть полезной. Но не надо обобщать.
Те, кому достаточно Cuneiform, будут пользоваться ей. Остальные
выберут FR. Это ведь лучше, когда человек пользуется одной несвободной
программой под Линукс, чем когда он вынужден переходить на венду из-за
её отсутствия. Или Вы с этим не согласны?

Во-первых, это уже не бета.


Неправда.

Во-вторых, рынок не состоит из одних «серьёзных потребителей».


Правильно. Именно поэтому у Cuneiform своя ниша, а у FR - своя.
До поры до времени.

ttnl ★★★★★
()
Ответ на: комментарий от Binary

> ну если на основе это слепить, скажем, SaaS, то ведь не так и дорого

Это на персональное место. Для SaaS можно увеличить на порядок-два.

Skull ★★★★★
()
Ответ на: комментарий от ttnl

> Но не надо обобщать.

И в мыслях этого не имел.

Остальные выберут FR. Это ведь лучше, когда человек пользуется одной несвободной программой под Линукс, чем когда он вынужден переходить на венду из-за её отсутствия. Или Вы с этим не согласны?

Во-первых, не обобщайте. Во-вторых, ГДЕ эта нативная (пусть даже несвободная) программа для конечного пользователя под Linux? Nero можно пощупать, а FR? В-третьих, хотелось бы услышать количество тех, кто перешёл на Windows из-за того, что обнаружил отсутствие FR под Linux? В-четвёртых, ответ на Ваш вопрос нужно спрашивать у представителей ABBYY, а не у сообщества.

Неправда.

Пруфлинк на доказательство?

Правильно. Именно поэтому у Cuneiform своя ниша, а у FR - своя. До поры до времени.

Ещё бОльшая доля тех, кто вообще не занимается распознаванием.

Skull ★★★★★
()
Ответ на: комментарий от Skull

>Это на персональное место.

нифига себе ж. оно хоть каптчи умеет резолвить? :)))

Binary ★★★★★
()
Ответ на: комментарий от namezys

> В смысле с движком?

Можно купить движок OCR, можно купить движок OCR и FlexiCapture.

question4 ★★★★★
()
Ответ на: комментарий от vspider

> ну если на основе это слепить, скажем, SaaS, то ведь не так и дорого

Так а почему никто не берёт? Может, всем лором скинуться и прикупить?


У них же уже есть SAAS-сервис по распознаванию.

Ttt ☆☆☆☆☆
()
Ответ на: комментарий от petrosyan

>В виндовой версии ограничений нет и цена вполне вменяемая (девятка стоит около 1400 деревянных)

Подозреваю, что в ГовнОС-версии гуй и является ограничением. Ведь её можно по-нормальному использовать только на одном компьютере, на котором она установлена. А консольную можно использовать удалённо с неограниченного числа рабочих мест. Поэтому, скорее всего, и ввели дополнительный зонд.

Ttt ☆☆☆☆☆
()
Ответ на: комментарий от Ttt

> Подозреваю, что в ГовнОС-версии гуй и является ограничением. Ведь её можно по-нормальному использовать только на одном компьютере, на котором она установлена.

man RDP, lamo...

anonymous
()
Ответ на: комментарий от anonymous

>man RDP

С каких это пор в ГовнОС есть man?

А RDP разве позволяет одновременно нескольким клиентам одновременно работать с этой программой? Я всё время думал, что к одному серверу позволяет коннектиться только одному клиенту. Ну извините, в сортах г... не разбираюсь, вендой давно почти не пользуюсь.

Ttt ☆☆☆☆☆
()
Ответ на: комментарий от Ttt

> А RDP разве позволяет одновременно нескольким клиентам одновременно работать с этой программой? Я всё время думал, что к одному серверу позволяет коннектиться только одному клиенту.

LOL! В одной из клиентских контор у меня стоит небольшой кластер, на котором работают около полутора тысяч клиентов одновременно. Это из крупного. Из мелочи - обычный комп на квадрике и два десятка пользователей.

anonymous
()
Ответ на: комментарий от Ttt

> С каких это пор в ГовнОС есть man?

PS C:\Users\root> man
РАЗДЕЛ
Get-Help

КРАТКОЕ ОПИСАНИЕ
Отображает справочные сведения о командлетах и концепциях Windows
PowerShell.

ПОЛНОЕ ОПИСАНИЕ

СИНТАКСИС
get-helphelp {<имя_командлета> | <название_раздела>}
help {<имя_командлета> | <название_раздела>}
<имя_командлета> -?

Команды «Get-help» and "-?" отображают справку на одной странице.
Команда «Help» - на нескольких.

Примеры
get-help get-process :отображает справку о командлете
Get-Process.
get-help about_signing :отображает справку о
подписании скриптов.
help where-object :отображает справку о командлете
Where-Object.
help about_foreach :отображает справку о циклах foreach
в PowerShell.
set-service -? :отображает справку о командлете
Set-Service.

В командах справки можно использовать подстановочные знаки
(исключая команду "-?"). Если поисковому запросу соответствует
несколько разделов справки, оболочка PowerShell отображает список
этих разделов. Если запросу соответствует только один раздел,
оболочка PowerShell отобразит его сразу.

Примеры
get-help * :отображает все разделы справки.
get-help get-* :отображает разделы, начинающиеся с get-.
help *object* :отображает разделы, имя которых содержит слово
«object».
get-help about* :отображает все концептуальные разделы.

Чтобы получить сведения о подстановочных знаках, введите:
get-help about_wildcard

ПРИМЕЧАНИЕ
Дополнительные сведения о Windows PowerShell см. в следующих
разделах справки:
get-command :получает сведения о командлетах из
кода командлета.
get-member :получает свойства и методы объекта.
where-object :фильтрует свойства объекта.
about_object :возвращает сведения об использовании объектов в
Windows PowerShell.
about_remote :возвращает сведения о выполнении команд на
удаленных компьютерах.

Концептуальные разделы справки (с именем «about_<раздел>»),
например:
about_regular_expression.

Названия файлов концептуальных разделов нужно вводить на
английском языке, даже если используется локализованная версия
Windows PowerShell.

С помощью команд справки можно также узнать псевдонимы
командлетов. Это альтернативные имена, которые обычно проще
вводить. Например, командлет Invoke-Command имеет
псевдоним remote.

Чтобы узнать псевдонимы, введите команду:

get-alias



PS C:\Users\root>

Ты вообще что-нибуть знаешь или только трындеть способен, красноглазик? :-)

anonymous
()
Ответ на: комментарий от Ttt

> Лично я внутренности ГовнОС даже знать не хочу.

Угу, не знай. Незнание - сила тролля, да? :-)

anonymous
()
Ответ на: комментарий от anonymous

Я не тролль. Я просто высказал предположение, почему в консольном FineReader для Linux есть такое банальное ограничение, а в гуёвом для Windows — нет.

Ttt ☆☆☆☆☆
()

Как понимаю Cuneiform-Qt не подойдет, как GUI для движка в теме, так?
И какой тогда возможно прикрутить из уже написанных, есть ли такой?

NK ★★★★★
()
Ответ на: комментарий от NK

> Как понимаю Cuneiform-Qt не подойдет, как GUI для движка в теме, так?

Да.

И какой тогда возможно прикрутить из уже написанных, есть ли такой?

Не правя исходников — никакой. Есть несколько программ, которые можно под него переделать. Тот же YAGF просто запускает консольную программу и читает stdout и stderr. Исходники Cuneiform-Qt не смотрел, но думаю, что он работает так же. Было несколько программ, позволявших выбирать из нескольких консольных движков (помню только заброшенную Kooka) — туда точно можно добавить.

question4 ★★★★★
()
Ответ на: комментарий от anonymous

> http://www.openocer.org/

Такого не существует :)

Сссылка на их форум ведет с www.cuneiform.ru

Нашёл. На http://www.cuneiform.ru/forum/ стоит редирект на http://openocr.org/forum/ Печально известный большим количеством спама, официально поддерживаемый Cognitive, но к линуксовой версии отношения не имеющий. Хотя на форуме на вопросы по линуксовой версии отвечают.

Почему-то openocr.org притягивает недоумков и неадекватов, любящих кричать, как в линуксе всё плохо. Ты случайно не GotDotNetMono?

Не знал, что у них был релиз OpenOCR в прошлом феврале. Но согласно http://openocr.org/downloads/license.txt этот релиз — несвободный. И только под Windows. По-видимому, отличия от CuneiForm 12 чисто косметические.

question4 ★★★★★
()
Ответ на: комментарий от awesome

>мультитран -сайт тормозит как на модеме

это да :( но лингва для проф.перевода не годится

duott ★★★★★
()
Ответ на: комментарий от awesome

Вообще, чтобы полностью решить проблему со словарём, надо над викисловарём работать. Википедия же уделывает по объёму и актуальности содержимого все проприетарные энциклопедии, почему со словарём нельзя сделать то же самое?

Ttt ☆☆☆☆☆
()
Ответ на: комментарий от Skull

>ГДЕ эта нативная (пусть даже несвободная) программа для конечного пользователя под Linux?

Для самых невнимательных напоминаю: речь идет об инструментарии
разработчика (SDK), а не о пользовательской программе. Это разные
продукты. Они имеют разные области применения. Конечно, если за время своей профессиональной деятельности Вы не имели дела с большими
многомодульными проектами, то понять Вам будет сложно. Но я попробую
объяснить на простом примере.

СУБД. Система управления базами данных. Хранилище, представляющее
несложные интерфейсы для манипулирования структурированными единицами
информации произвольного вида.

Пользователи с ними напрямую не работают. Они работают с программами,
GUI, написанными для взаимодействия с базой данных, и зачастую даже
не подозревают об её существовании. И если сравнивать сложность логических
компонент конечного покупаемого продукта, то в большинстве случаев
сложность пользовательской программы не составляет и 1% от сложности
СУБД. Однако никто не говорит: «Я покупаю БД Oracle» или «Я покупаю
Sybase», а говорят «Я покупаю АБС такую-то», например, Diasoft или аналогичный
отечественный ужас. Но, не смотря на это, лицензия на «GUI» стоит намного
больше, чем лицензия на оставшиеся 99%.

Вы не можете себе представить, но в мире линукса, все тоже самое!
Никто не пользуется напрямую ядром, все пользуются программами,
построенными на основе его интерфейсов. ВНЕЗАПНО, не празда ли?!

Именно поэтому Fine Reader и ядро нельзя, как Вы это говорите,
«пощупать».

Кстати, даже горячо любимый всеми Альт Линукс пользуется этим ядром.

Cuneiform - глючный, нестабильный, часто падает и не имеет нормального
фронтенда. Не будем вспоминать то, что из него выпилили кучу вендовых
библиотек, раз уж его открыли, и посчитаем это причиной первых трех
пунктов. Нормальный фронтенд - дело времени, будем считать, что он
появится в обозримом будущем. Сам я пробовал пользоваться CF, плевался
и решил ждать лучших времен.

ttnl ★★★★★
()
Ответ на: комментарий от anonymous

Для словаря дизайн то что надо. А из онлайновых словарей ИМХО лучший, поскольку поддерживается сообществом профессиональных переводчиков. Так что фактически это самый опенсорсный словарь в рунете )

djester
()
Ответ на: комментарий от Ttt

это конечно так, но для этого надо взяться за ум и посмотреть что есть уже сейчас.

например тот же мультитран отчасти наполняют его пользователи. но я не вникал, что у него за лицензия и можно ли качнуть его словари и использовать в другом переводческом проекте. + опять же куча несортированный словарей из stardict, самодельные пользовательские словари для лингвы (dsl).

проста надо разобраться во всей этой помойке и понять, что действительно свободно уже сейчас и можно ли это развивать дальше. или это так и останется на уровне очередной поделки.

awesome
()
Ответ на: комментарий от vspider

> Так а почему никто не берёт? Может, всем лором скинуться и прикупить? )

ABBYY настаивает, что за каждый распространяемый продукт на основе этого SDK нужно им отчислять. Поэтому можете покупать на свои деньги, для основной массы LOR'овцев это не окупится.

Skull ★★★★★
()
Ответ на: комментарий от NK

> Как понимаю Cuneiform-Qt не подойдет, как GUI для движка в теме, так?

Будет свободным движок, можно вполне использовать, так как Cuneiform-Qt — только фронтенд для консольных команд.

Skull ★★★★★
()
Ответ на: комментарий от question4

> Не правя исходников — никакой.

Глупости не говорите. И для YAGF и для Cuneiform-Qt достаточно сделать скрипт-враппер для унификации вызовов движка FineReader и запуска cuneiform. Дело 10 минут без правки кода программ.

Skull ★★★★★
()
Ответ на: комментарий от ttnl

> Конечно, если за время своей профессиональной деятельности Вы не имели дела с большими многомодульными проектами, то понять Вам будет сложно.

Вы пафос, пожалуйста, уменьшите. Здесь сидят вполне подкованные люди, способные разделить банальную исполняемую программу и библиотеку. :)

Именно поэтому Fine Reader и ядро нельзя, как Вы это говорите, «пощупать».

FineReader вполне можно «пощупать», так как имелась ввиду именно программа. Причём любому пользователю. Библиотеку/SDK/etc. тоже вполне можно «пощупать» на предмет API и/или инструментов, использующих API библиотки. Правда, это уже другая группа людей, более подготовленная.

Так что не нужно дешёвой демагогии, если нет от ABBYY в свободном доступе ни прикладной программы, ни библиотеки/SDK.

Cuneiform - глючный, нестабильный, часто падает и не имеет нормального фронтенда.

Тем не менее, он работает и доступен, что не может не вызывать уважения и не привлекать разработчиков. «Talk is cheap. Show me the code.» © Torvalds, Linus (2000-08-25)

Skull ★★★★★
()
Ответ на: комментарий от frost_ii

> Не рулят. man документооборот

Цивилизованный или made in Russia?

Skull ★★★★★
()
Ответ на: комментарий от frost_ii

> Зачем? man wine

Вайн со старфорсом справляется хорошо ли? У вайна много проблем до сих пор.

yk4ever
()
Ответ на: комментарий от Skull

> И для YAGF и для Cuneiform-Qt достаточно сделать скрипт-враппер для унификации вызовов движка FineReader и запуска cuneiform.

То есть сделать скрипт /usr/local/bin/cuneiform, вызывающий finereader? Да, не сообразил :)

question4 ★★★★★
()
Ответ на: комментарий от question4

> То есть сделать скрипт /usr/local/bin/cuneiform, вызывающий finereader? Да, не сообразил :)

Точнее: в любом каталоге в $PATH, стоящим до /usr/bin (например, в $HOME/bin).

Skull ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.