LINUX.ORG.RU

OCR в браузере

 ,


0

5

В связи с распространением практики постить скриншоты текста возник вопрос. Сохранять сотни килобайт вместо десятков байт расточительно. Есть ли удобное дополнение к браузеру, которое бы распознавало текст и сохраняло текстовый файл? Или копировало текст в буфер обмена. Или, ещё лучше, сыпало весь текст в один текстовый файл с пометками дата-время-URL. Есть такое?

Желательно, чтобы оно было доступно и на десктопном Firefox (который у меня основной), и на андроидном Firefox, и на десктопном Chrome. Но можно 3 разных.

Пока перебираю, что нашёл поиском…

P.S. Важное дополнительное требование. Сохранение фоновой картинки в десктопных браузерах делается через задницу, а в мобильных ещё сложнее. Но такой способ вёрстки сайтов почему-то набирает популярность. Поэтому дополнение должно уметь распознавать текст в фоновых изображениях.

★★★★★

Последнее исправление: question4 (всего исправлений: 2)

Image Reader (OCR) от Sevina

+ Использует Tesseract, скомпилированный на js.

+ Работает без подключения к интернету.

- Требует drag-and-drop-нуть распознаваемый файл в окно/вкладку аддона, но это не работает. Загрузка файла с диска работает.

- Выделение распознаваемого участка не предусмотрено.

- Требует выбирать строго 1 язык. Пары вида eng+rus, как в консольном Tesseract недоступны.

+ Но выбор языков больше, чем в стандартном консольном — 66 штук.

- При неверном выборе языка, чтобы переключить, нужно дождаться окончания распознавания.

question4 ★★★★★
() автор топика

Korporize

+ Использует движок Tesseract.

+ Нормально распознаёт картинки внутри тегов <IMG ...> и открытые в отдельных вкладках.

- Не умеет работать с фоновыми изображениями.

+ Работает в автономном режиме.

- Автоматическое детектирование языка всегда выбирает английский.

- Чтобы сменить настройки распознавания, нужно сменить настройки по умолчанию и перезагрузить страницу.

- Не распознал серый текст на сером фоне, но это недостаток самого Tesseract-а.

question4 ★★★★★
() автор топика

Copyfish

± Использует свой собственный движок UI.Vision. Если я правильно понял их вебсайт, базовая версия открыто-свободная, но исходников модуля OCR я не нашёл.

- Для распознавания все изображения отсылаются на удалённый сервер. Или можно поставить закрытый(?) бинарник для анализа. Есть версии для Windows, MacOS и Linux.

+ Нормально распознаются изображения в <IMG ...> и в отдельных вкладках.

- Не умеет работать с фоновыми изображениями.

± Нормально распознал серый текст на сером фоне, с которым не справился Tesseract. Но тут же пропустил кусок чёрного текста на сером фоне, с которым у Tesseract-а проблем не бывало.

+ Кнопки Redo OCR и Recapture есть и работают.

+ Позволяет выбрать участок изображения. Полезно для «Страдающего Средневековья».

+ Копирует текст в буфер обмена.

- Нельзя распознавать несколько языков.

question4 ★★★★★
() автор топика
Последнее исправление: question4 (всего исправлений: 1)

一键读图(OCR) («распознание в 1 клик»)

- Выглядит как кривой порт с Хрома на Фаерфокс. Русский интерфейс переведён автоматически, как переключиться на английский — не нашёл.

+ В мануале высказывается здравая идея, что если сайт не даёт скопировать текст, можно сделать скриншот и распознать. То есть хотя бы так можно распознавать тексты из видео и фона.

- Но в силу кривизны порта, дополнение не запрашивает у браузера необходимые разрешения.

- Вместо соответствующей страницы мануала на сайте автора — ошибка 404.

- Распознание работает только со страницы настроек и только для сохранённых локально изображений.

+ Русский распознаётся нормально.

- Есть пара китайский + английский, других нет.

- Для распознавания изображения отсылаются на удалённый сервер.

- Соответственно, без интернета не работает.

Информации о движке нет.

question4 ★★★★★
() автор топика

Если всё-таки не получится найти именно разширение, то всегда можно отправить в полноценную гуевину к тесеракту. Прямо сейчас зашарил на Андроиде в Text Fairy (если что, автор скурвился, закрыл код и требует денежку, так что ищите альтернативы), распозналось.

Ещё если есть полноженный буфер обмена, то картинки просто копипастятся в программу OCR, и всё так же замечательно.

А вот интегрированное решение с сохранением текста и URL - наверное предстоит создать.

token_polyak ★★★★
()
Ответ на: комментарий от question4

Так это share, не буфер обмена (clipboard).

А по существу - могильный фаерфокс не предлагает скопировать/открыть/зашарить фоновую картинку, хотя в десктопном всё присутствует в контекстном меню.

token_polyak ★★★★
()