LINUX.ORG.RU

Поиск одинаковых фрагментов на изображении

 , ,


1

3

Решаем задачу, напоминающую преобразование звука в MIDI-файл. Пока sox'ом преообразовал аудиофрагмент в спектрограмму, ImageMagick'ом порезал её на фрагменты, соответствующие полосам частот и пытаюсь понять, как и чем анализировать изображения на предмет наличия одинаковых фраментов в них. Есть ли какое-то готовое или полуготовое решение (кроме man libpng), которое позволит классифицировать фрагменты и определить их координаты на изображении? Нужен выход типа «фрагмент - массив X-координат, где он встречается».

чо а анализировать спектрограммы (которые одномерный массив по сути), а не их фоточки (которые двумерный массив) не проще?

Deleted
()

Я думаю что тебе здесь нужна какаято нейронная сеть иначе утонешь. Без нейронных сетей там все не просто ...

cvv ★★★★★
()
Ответ на: комментарий от Iron_Bug

Я в курсе. Просто если человека смущает «man libpng» то скорее всего он их просто не сможет. Все они всетаки предполагают хоть какоето использование мозга ...

cvv ★★★★★
()
Ответ на: комментарий от cvv

и даже не «какое-то», а довольно активное. в таких алгоритмах много математики и даже готовыми библиотеками пользоваться - не совсем тривиальная задача.

Iron_Bug ★★★★★
()

я конечно мало понимаю в этом, но: звук же разбит на семплы, я так понимаю это и есть с «частота дискретизации». так вот если эту частоту снижать даже не до тысяч герц, а до вообще сотен или десятков кадров в секунду - может быть в таком виде их можно будет быстро сравнивать или даже индексировать?

neschastnyjj86
()
Ответ на: комментарий от neschastnyjj86

Автор скорее всего не осилит

cvv ★★★★★
()
Ответ на: комментарий от neschastnyjj86

Тут суть проблемы что один и тот же звук в разных местах тойже звукозаписи представлен сильно разными наборами сэмплов. Если развить твою идею то как минимум можно попробовать выполнить преобразование Гильберта а потом искать при помощи взаимной корреляции.

cvv ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.