LINUX.ORG.RU

Переименовать большое количество картинок в зависимости от текста на них

 , , ,


0

3

Есть большое количество небольших картинок, на каждой из них отчётливо написана одна короткая фраза. Шрифт довольно крупный, в основном Open Sans Condensed, но не всегда. Язык в основном русский, но встречается также английский, турецкий, армянский, грузинский, японский, арабский, фарси, японский, китайский, корейский, тайский (менее 1%).
Задача — распознать текст и установить фразу с каждой картинки в качестве имени файла. Реально?

★★★★★

Ответ на: комментарий от CYB3R

Ну тогда без словарика.
Тессеракт не очень хорошо распознает, даже после должного обучения, так что тут либо потом человеком всё проверять, либо забить.
Можешь попробовать поискать реализации распознавалок капч на нейросетях или напрячь обезьянок с antigate.

Deleted ()

А зачем эти картинки вообще сохранять? Раз открыл прямой эфир, посмеялся, закрыл.

А так по теме: если для английского можно найти что-то, что будет хорошо работать, для русского будет уже сложнее, а для всяких там там армянских и грузинских вряд ли можно вообще что-то найти. На счёт китайского и японского не знаю, но гуглопереводчик как-то распознаёт.

sudopacman ★★★★★ ()
Ответ на: комментарий от sudopacman

а для всяких там там армянских и грузинских вряд ли можно вообще что-то найти

А в чём проблема? Шрифт есть, глифы все можно отрендерить, осталось только свой OCR написать. Но я хочу что-то готовое.

CYB3R ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.