OCR в браузере

0

5

В связи с распространением практики постить скриншоты текста возник вопрос. Сохранять сотни килобайт вместо десятков байт расточительно. Есть ли удобное дополнение к браузеру, которое бы распознавало текст и сохраняло текстовый файл? Или копировало текст в буфер обмена. Или, ещё лучше, сыпало весь текст в один текстовый файл с пометками дата-время-URL. Есть такое?

Желательно, чтобы оно было доступно и на десктопном Firefox (который у меня основной), и на андроидном Firefox, и на десктопном Chrome. Но можно 3 разных.

Пока перебираю, что нашёл поиском…

P.S. Важное дополнительное требование. Сохранение фоновой картинки в десктопных браузерах делается через задницу, а в мобильных ещё сложнее. Но такой способ вёрстки сайтов почему-то набирает популярность. Поэтому дополнение должно уметь распознавать текст в фоновых изображениях.

←	Настройка i3status (информация о втором диске)

Double Commander не закрывается окно Свойства

→

Image Reader (OCR) от Sevina

+ Использует Tesseract, скомпилированный на js.

+ Работает без подключения к интернету.

- Требует drag-and-drop-нуть распознаваемый файл в окно/вкладку аддона, но это не работает. Загрузка файла с диска работает.

- Выделение распознаваемого участка не предусмотрено.

- Требует выбирать строго 1 язык. Пары вида eng+rus, как в консольном Tesseract недоступны.

+ Но выбор языков больше, чем в стандартном консольном — 66 штук.

- При неверном выборе языка, чтобы переключить, нужно дождаться окончания распознавания.

question4 ★★★★★
(24.07.22 23:35:20 MSK) автор топика

Korporize

+ Использует движок Tesseract.

+ Нормально распознаёт картинки внутри тегов <IMG ...> и открытые в отдельных вкладках.

- Не умеет работать с фоновыми изображениями.

+ Работает в автономном режиме.

- Автоматическое детектирование языка всегда выбирает английский.

- Чтобы сменить настройки распознавания, нужно сменить настройки по умолчанию и перезагрузить страницу.

- Не распознал серый текст на сером фоне, но это недостаток самого Tesseract-а.

question4 ★★★★★
(25.07.22 00:03:10 MSK) автор топика

Copyfish

± Использует свой собственный движок UI.Vision. Если я правильно понял их вебсайт, базовая версия открыто-свободная, но исходников модуля OCR я не нашёл.

- Для распознавания все изображения отсылаются на удалённый сервер. Или можно поставить закрытый(?) бинарник для анализа. Есть версии для Windows, MacOS и Linux.

+ Нормально распознаются изображения в <IMG ...> и в отдельных вкладках.

- Не умеет работать с фоновыми изображениями.

± Нормально распознал серый текст на сером фоне, с которым не справился Tesseract. Но тут же пропустил кусок чёрного текста на сером фоне, с которым у Tesseract-а проблем не бывало.

+ Кнопки Redo OCR и Recapture есть и работают.

+ Позволяет выбрать участок изображения. Полезно для «Страдающего Средневековья».

+ Копирует текст в буфер обмена.

- Нельзя распознавать несколько языков.

question4 ★★★★★
(25.07.22 00:30:38 MSK) автор топика
Последнее исправление: question4 25.07.22 00:35:32 MSK (всего исправлений: 1)

Ответ на: комментарий от question4 25.07.22 00:03:10 MSK

Забыл написать про Korporize:

+ Копирует в буфер обмена.

question4 ★★★★★
(25.07.22 00:36:51 MSK) автор топика

一键读图(OCR) («распознание в 1 клик»)

- Выглядит как кривой порт с Хрома на Фаерфокс. Русский интерфейс переведён автоматически, как переключиться на английский — не нашёл.

+ В мануале высказывается здравая идея, что если сайт не даёт скопировать текст, можно сделать скриншот и распознать. То есть хотя бы так можно распознавать тексты из видео и фона.

- Но в силу кривизны порта, дополнение не запрашивает у браузера необходимые разрешения.

- Вместо соответствующей страницы мануала на сайте автора — ошибка 404.

- Распознание работает только со страницы настроек и только для сохранённых локально изображений.

+ Русский распознаётся нормально.

- Есть пара китайский + английский, других нет.

- Для распознавания изображения отсылаются на удалённый сервер.

- Соответственно, без интернета не работает.

Информации о движке нет.

question4 ★★★★★
(25.07.22 00:56:21 MSK) автор топика

Selectext - Copy text from videos!

- Для статических изображений не работает. Для видео не проверял.

- Требует логиниться в Гугл.

question4 ★★★★★
(25.07.22 01:01:53 MSK) автор топика

Если всё-таки не получится найти именно разширение, то всегда можно отправить в полноценную гуевину к тесеракту. Прямо сейчас зашарил на Андроиде в Text Fairy (если что, автор скурвился, закрыл код и требует денежку, так что ищите альтернативы), распозналось.

Ещё если есть полноженный буфер обмена, то картинки просто копипастятся в программу OCR, и всё так же замечательно.

А вот интегрированное решение с сохранением текста и URL - наверное предстоит создать.

token_polyak ★★★★
(25.07.22 12:49:47 MSK)

Ответ на: комментарий от token_polyak 25.07.22 12:49:47 MSK

Ещё если есть полноженный буфер обмена

Мобильные браузеры умеют копировать туда фоновые картинки?

question4 ★★★★★
(25.07.22 16:27:42 MSK) автор топика

Ответ на: комментарий от question4 25.07.22 16:27:42 MSK

А буфер обмена на мобильных устройствах - полноценный?

token_polyak ★★★★
(25.07.22 16:29:36 MSK)

Ответ на: комментарий от token_polyak 25.07.22 16:29:36 MSK

Картинки в какое-то приложение из браузера я успешно пересылал. 1 раз. Года 4 назад, на Андроиде.

question4 ★★★★★
(25.07.22 16:32:28 MSK) автор топика

Ответ на: комментарий от question4 25.07.22 16:32:28 MSK

Так это share, не буфер обмена (clipboard).

А по существу - могильный фаерфокс не предлагает скопировать/открыть/зашарить фоновую картинку, хотя в десктопном всё присутствует в контекстном меню.

token_polyak ★★★★
(25.07.22 16:46:48 MSK)

←	Настройка i3status (информация о втором диске)

Desktop

Double Commander не закрывается окно Свойства

→

Похожие темы