LINUX.ORG.RU
ФорумTalks

Google запустил «облачный FineReader» с поддержкой русского языка


0

0

Ъ

Сервис Google Docs научился распознавать текст на PDF-документах и изображениях, написанный на 34 языках, в том числе на русском. Об этом сообщается в официальном блоге Google.

Документы, которые необходимо распознать, можно загрузить в облачный сервис Google так же, как и обычные файлы. При этом пользователи должны будут пометить в специальном поле, что они хотят перевести эти документы из их нынешнего формата в формат Google Docs, а также указать, на каком языке он написан.

Кто-нибудь пробовал? Насколько юзабельно ? Таки одним шагом к НЕМУ ближе ?

Я уж подумал, что надо отсылать в гугль бумажные документы, лол.

CTAPK
()

не нравится мне все это. теперь часть сканированых документов будет проходить через гугл..

Komintern ★★★★★
()
Ответ на: комментарий от Komintern

Да, твоя «Поваренная книга анархиста» - это очень секретная вещь. А ценные документы никто в здравом уме так сканировать не станет.

CTAPK
()

Жду облачных степлеров и дыроколов.

absinthe
()
Ответ на: комментарий от Morphine

cuneiform под линупс у меня такой результат выдавал

короче, пока вперде

duott ★★★★★
()
Ответ на: комментарий от Morphine

Ах, вот оно что. Следовательно, дело даже не в языке, а в том, что с распознаванием разных форматов дела у Гугла обстоят очень по-разному, и причем с картинками намного лучше, чем с документами.

SlonoInquisitor
()

Там случайно не tesseract используется для этого?

pevzi ★★★★★
()
Ответ на: комментарий от KERNEL_PANIC

Украинский распознает?

Когда сказали что распознаёт русский, имели ввиду и его диалекты. Впрочем, как тут продемонстрировали, с русским у него очень туго.

r_asian ★☆☆
()

Признаться, из новости я сначала подумал, что гугел таки файнридер запустил в облаке, ну там с ABBY договорился... Пока finereader лучший и не имеет конкурентов :(

[вброс]Как зарабатывать деньги организации, если б она за свой счёт создала продукт подобного качества (finereader) и лицензировала бы его под GPL ?[/вброс]

temporary ★★
() автор топика
Ответ на: комментарий от temporary

> Как зарабатывать деньги организации, если б она за свой счёт создала продукт подобного качества (finereader) и лицензировала бы его под GPL ?

Предполагается, что подобные продукты должны быть побочным результатом деятельности не-IT компаний. Т.е. например газпрому захотелось оцифровать в текстовый вид бумажную библиотеку по методам разработки нефти и газа. Газпром нанимает за 100 млн уе контору, которая под GPL улучшает ему кьюнформ, и библиотеку оцифровывает. Потом Газпрому становится интересно оцифровать еще что-нибудь, он нанимает следующую контору (или ту же самую - пофиг), но уже за 10 млн уе, дает ей готовую распознавалку, и получает результат.

Суть в том, софт для газпрома - это вспомогательный инструмент, а не источник получения прибыли. Газпром заинтересован в том, чтобы этот инструмент попутно совершенствовали и другие организации (например, NASA). Заинтересован в том, чтобы не попадать в ректальное рабство Abby, когда понадобится добавить в распознавалку еще пару фич.

Manhunt ★★★★★
()
Ответ на: комментарий от Igron

>> Google запустил «облачный FineReader» с поддержкой русского языка

Это интерфейс к ВикиЛикс ))

hi_artem
()
Ответ на: комментарий от unikum

finereader online существует. Кто-нить знает обход кол-ва распознаваемых страниц? Ато 3 страницы ЗАБЕСПЛАТНО. это уж мало

nutz ★★
()
Ответ на: комментарий от r_asian

точно-точно. я ещё слышал, что иврит - это диалект арабского.

leiche ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.