LINUX.ORG.RU

Какого API вам не хватает?

 , ,


0

1

Скучно на праздниках, думаю может сообразить какое-нибудь API (REST) для чьих либо нужд. Может распознавание картинок или там решение текстовых формул, перевод текстов или еще чего?. Чего вам не хватает?

★★★★★

Хранение небольших текстовых строк (<1KB) по уникальному ключу. Как у пастебина, например, но с возможностью добавлять/редактировать/удалять чаще, чем раз в полчаса.

E ★★ ()

распознавание картинок

Хочу библиотеку поиска дублей для художественных картин современных художников. Дубли могут быть разного разрешения, но оно всегда достаточно большое (от 640 точек по горизонтали и от 320 точек по вертикали). Могут быть частично обрезаны. Желательно без всяких нейросеток, чтобы прогонять огромный массив (порядка 1_000_000 изображений) не на китайских суперкластерах.

В этом плане можно начать отсюда http://stackoverflow.com/questions/843972/image-comparison-fast-algorithm/844... На русском отсюда https://habrahabr.ru/company/yandex/blog/256291/

foror ★★ ()
Последнее исправление: foror (всего исправлений: 4)

Не хватает API для представления мусорных объявлений Avito в виде нормальной структурированной таблицы. Я пробовал парсингом говносайта Авито - у него постоянно меняется монструозный по сути «код», так что привязаться к HTML не получается. Ну и номера телефонов, запиханные в картинки - как-то нужно извлекать. Думаю, для реализации нужно реверс-инжирить их платный API.

Я в своё время использовал программу парсинга Авито (грузил JSON'ом в dataTable.js) для поиска велокомпонентов подешевле - иначе там просто утонешь в море какого-то г-на. ИМХО единственный нормальный сайт объявлений - это ЦИАН, им и без API удобно пользоваться - вот из Авито хочется сделать что-то подобное.

DRVTiny ★★★★★ ()
Ответ на: комментарий от DRVTiny

номера телефонов, запиханные в картинки - как-то нужно извлекать

Под линухом это делается опенсорцной тулзой по распознаванию текста, не помню название, но она очень популярна и её можно ставить из официальных реп. Единственно нужно отмасштабировать номер телефона x2, иначе не срабатывает. Я как-то парсил телефоны авито и всё нормально работало.

foror ★★ ()
Ответ на: комментарий от static_lab

Иногда бывает нужно расшарить простые не особо важные данные между несколькими людьми/девайсами. Например, у меня есть расшаренная html-страничка со списком книг, которые можно отмечать как прочитанные и следить за прогрессом других людей. Или хотелось бы иметь возможность с работы/чужого компьютера отправить на домашнюю машину пару строк текста, а vps или белый айпи только для этого жаба давит заводить, и светить личные учётки не хочется.

E ★★ ()

Может распознавание картинок или там решение текстовых формул, перевод текстов или еще чего?

О, ну тогда написание кода по ТЗ.

Hater ★★ ()
Ответ на: комментарий от DRVTiny

Прошу прощения, забыл поле «Имя» - для имени создавшего объявление (обычно пофигу, но часто содержит название «кагбе магазина»)

Я бы ещё добавил флаг «частное»/«магазин», хотя на мой взгляд Avito очень часто по невнятным причинам считает магазинами обычных частных продавцов.

DRVTiny ★★★★★ ()

сообразить какое-нибудь API (REST)

Кстати, вопрос к знатоку. Определение REST API подразумевает, что он должен работать с авторизацией, или без неё, или это вообще ортогональные понятия?

anonymous ()