Как «размазать» поиск медианы?

median filter

Нужно считать медиану на последовательности отсчетов длиной 8...128.

Т.к. за один раз считать долго, хочется апдейтить медиану после каждого нового отсчета (или можно заталкивать данные парами, чтобы четность не менялась).

Как это проделать наиболее эффективным образом (с минимумом обращений к памяти)? Можно сделать 2 массива (с нижней половиной и верхней половиной значений). Тогда добавление 2 новых элементов в худшем случае будет ~ 1/2 линейного скана (когда оба элемента попадают в одну половину).

Что-то еще можно придумать? Все для Cortex-m0/m3, где обращение к памяти - 5 тактов.

Ссылка

← Go best practices. Когда использовать встраивание структур?

Qt Designer без Creator →

← 1 2 →

Использовать heap для хранения? И хранить только половину элементов. Максимальный элемент это медиана. Добавление за логарифм обращений к памяти.

OxiD ★★★★
(22.08.18 08:17:55 MSK)

Только связные списки помогут тебе. Каждое новое значение будешь втыкать в соответствующее место уже отсортированного ряда. Но, сам понимаешь, это долго.

И еще раз повторю тебе: бросай эту кулибинщину и калокубство! Почитай книжки для начала.

anonymous
(22.08.18 08:32:08 MSK)

Ответ на: комментарий от anonymous 22.08.18 08:32:08 MSK

Почему бы тебе не перестать засирать каждую мою тему своими тупыми постами? Мне не интересны твои пионерские достижения.

Vit ★★★★★
(22.08.18 08:38:26 MSK) автор топика

Ответ на: комментарий от OxiD 22.08.18 08:17:55 MSK

А с какой длины профит начнется? Если через референсы бегать, обращений к памяти сразу вдвое больше как минимум.

Vit ★★★★★
(22.08.18 08:41:34 MSK) автор топика

Наверное что-то такое: https://rcoh.me/posts/linear-time-median-finding/

beastie ★★★★★
(22.08.18 08:56:53 MSK)

Ответ на: комментарий от beastie 22.08.18 08:56:53 MSK

Там единоразово 2n обращений к памяти для вычисления медианы.

А у меня 1/2n на каждом добавлении данных - в сумме дольше, но зато время блокировки меньше (данные добавляют по прерыванию, по мере равномерного поступления).

Vit ★★★★★
(22.08.18 09:33:10 MSK) автор топика

Ссылка

Ответ на: комментарий от Vit 22.08.18 08:41:34 MSK

Какие еще референсы? Двоичная куча это массив

OxiD ★★★★
(22.08.18 09:35:06 MSK)

Ответ на: комментарий от OxiD 22.08.18 09:35:06 MSK

Тогда я не понял, в чем суть предлагаемого улучшения. По сравнения с тем что я описал.

Vit ★★★★★
(22.08.18 09:36:33 MSK) автор топика

Ответ на: комментарий от Vit 22.08.18 08:38:26 MSK

Это кто здесь пионер?

Ты настолько офигенную пургу несешь, что просто смешно! Когда уже почитаешь спецлитературу, прежде чем лезть в программирование?

anonymous
(22.08.18 09:47:19 MSK)

Ссылка

Ответ на: комментарий от Vit 22.08.18 09:36:33 MSK

Без сортировки твой вариант будет всегда линейным и придется просматривать совершенно все элементы, прежде чем впихнуть новый.

Связный список тоже придется проходить линейно - бинарный поиск здесь не используешь.

Просто сделай несколько реализаций и сравни. Делов-то!

// но медиана для переменного количества объектов звучит странно

anonymous
(22.08.18 09:51:15 MSK)

Ссылка

Ответ на: комментарий от Vit 22.08.18 09:36:33 MSK

Насколько я понял таое решие квадратичное. Или я не понял. Если отсчеты призодят в случайном порядке то теье нпдо для каждого просканировать массив чтобы понять куда вставить. А мое nlogn в худшем случае

OxiD ★★★★
(22.08.18 09:53:50 MSK)

Ответ на: комментарий от OxiD 22.08.18 09:53:50 MSK

У меня прилетает по одному отсчету за прерывание. Смысл в том чтобы не блочиться надолго. В моем случае вставка одного отсчета => скан 1/2 от набранных элементов.

Если в максимуме 128 отсчетов, значит на последнем прерывании будет скан с 64 обращениями к памяти.

Если все просуммировать, то конечно дольше. Но вот каждое отдельное прерывание лочится существенно меньше, и мне это важнее.

Vit ★★★★★
(22.08.18 09:58:20 MSK) автор топика

Ответ на: комментарий от OxiD 22.08.18 09:53:50 MSK

И еще в моем случае нужно хранить строго половину последовательности

OxiD ★★★★
(22.08.18 09:59:51 MSK)

Ответ на: комментарий от Vit 22.08.18 09:58:20 MSK

Если предыдущие отсчёты отсортированы, то скан бинарным поиском места вставки будет в log_2 128 элементов,то есть 7 чтений.

aedeph_ ★★
(22.08.18 10:01:13 MSK)

Ответ на: комментарий от Vit 22.08.18 09:58:20 MSK

В моем решении на вставку потребуется log2(128) это кажется меньше 64

OxiD ★★★★
(22.08.18 10:01:16 MSK)

Ответ на: комментарий от OxiD 22.08.18 09:59:51 MSK

Память менее критична, там небольшой размер. Мне критична максимально возможная блокировка проца.

Vit ★★★★★
(22.08.18 10:01:48 MSK) автор топика

Ссылка

Ответ на: комментарий от OxiD 22.08.18 10:01:16 MSK

А как делается быстрая вставка с сохранением возможности доступа по индексу?

Если простой связный список, то вставка будет быстрой, а доступ по индексу - сканом, и методом половинного длеления искать не выйдет.

Vit ★★★★★
(22.08.18 10:05:25 MSK) автор топика

Ответ на: комментарий от Vit 22.08.18 10:05:25 MSK

Про это в топике не было. Зачем тебе доступ? Медиана будет всегда в одном месте в нулевом или в последнем элементе, смотря какая куча - minheap или maxheap

OxiD ★★★★
(22.08.18 10:11:03 MSK)

Ответ на: комментарий от aedeph_ 22.08.18 10:01:13 MSK

Бинарный поиск требует доступа по индексу. Как можно иметь одновременно и доступ по индексу и быструю вставку?

Если на вставке начнет копироваться кусок массива, это затрат примерно столько же сколько на скан. Оцениваю самый худший случай.

Vit ★★★★★
(22.08.18 10:12:44 MSK) автор топика

мне одному кажется, что ты хочешь странного?

Morin ★★★★★
(22.08.18 10:16:18 MSK)

Ответ на: комментарий от OxiD 22.08.18 10:11:03 MSK

Зачем тебе доступ?

Ты предлагал решение, которое подразумевает хранение отсортированных данных. То есть там нужна и быстрая вставка и бинарный поиск. Я не очень понимаю, как такое возможно одновременно.

Всякую торсионщину вроде сегментированных массивов пропустим, это не будет эффективно на столь малых размерах.

Vit ★★★★★
(22.08.18 10:18:03 MSK) автор топика

Ответ на: комментарий от Morin 22.08.18 10:16:18 MSK

Я никогда не скрывал, что хочу странного. Хобби же.

Vit ★★★★★
(22.08.18 10:18:51 MSK) автор топика

Ответ на: комментарий от Vit 22.08.18 10:18:51 MSK

Тут вопрос то такой, ты хочешь уменьшить время обработки, но при этом берешь, на мой взгляд, неоправданно большое число выборок, для поиска медианы. Как бы помягче - обоснуй нафейхоа? Может я что-то пропустил и тебе в принципе-то не медиана нужна

Morin ★★★★★
(22.08.18 10:24:19 MSK)

Ссылка

Ответ на: комментарий от Vit 22.08.18 10:05:25 MSK

Кажется мое решение тебе не подойдет. Но есть улучшенное твое.

https://stackoverflow.com/questions/15319561/how-to-implement-a-median-heap

Доступ по индексу - ну это массив. Правда это куча и тебе по индексу там так просто не поискать. Вставка- прочитай на википедии, это тривиально. По сути идея в том сто тв хранишь отсортированный список, который быстро обновлять

OxiD ★★★★
(22.08.18 10:29:40 MSK)

Binary heap и трюки для оптового обращения к памяти.

tailgunner ★★★★★
(22.08.18 10:30:11 MSK)

Ответ на: комментарий от Vit 22.08.18 10:18:03 MSK

Прочитай что такое куча...

https://ru.m.wikipedia.org/wiki/Куча_(структура_данных)

OxiD ★★★★
(22.08.18 10:35:25 MSK)

Ссылка

Ответ на: комментарий от OxiD 22.08.18 10:29:40 MSK

Мое решение будет работать после n/2 отсчетов. По ссылке начнет сразу после первого. Оно похоже на твое с лвумя массивами но не квадратичное а логарифмическое

OxiD ★★★★
(22.08.18 10:37:25 MSK)

Ссылка

считать медиану на последовательности отсчетов длиной 8...128.

вы точно хотите медиану (то есть получить вектор из типичных соседних), а не типичное значение «отсчёта» ? формулировка задачи подхрамывает на все три имеющиеся лапы :-)

медиану можно быстро считать асемблером - всё равно есть чтение исходного массива и запись результата, а сами сравнения (поиск среднего из 3-х) можно сделать на регистрах:

4 общих регистра, R0,R1,R2 - значения, R4 - результат.
2 адресных - src,dst
1.инициализация : R0=src[0], R1=src[1], R2=src[2], src+=2 
2.считаем медиану R4=median R0,R1,R2 , *dst=R4, dst++
3.R0=*src++;
4.считаем медиану (см.2)
5.R1=*src++;
6.считаем медаину
7.R2=*src++;
8.считаем медиану
9. jmp 3
контроль за границами массивов добавить по вкусу  
Код вам тут по просьбе сделают.

MKuznetsov ★★★★★
(22.08.18 11:21:36 MSK)

Ответ на: комментарий от MKuznetsov 22.08.18 11:21:36 MSK

Медиана это не вектор из типичных соседних.. Это средний элемент в отсортированном наборе значений.

OxiD ★★★★
(22.08.18 11:47:06 MSK)

Уже вторую (или третью?) тему смотрю как ты пытаешься изобразить что-то очень похожее на отрисовку звуковой волны с зумом, где, для каждого размера зума нужна своя выборка.

Сейчас искал так: https://stackoverflow.com/search?q=waveform zoom

Но не нашел тот классный ответ как это делается правильно чтобы работало быстро. Пошурши в эту сторону.

deep-purple ★★★★★
(22.08.18 11:47:37 MSK)

Ссылка

Раз уж переключились на «скользяшие методы», м.б. попробуете мой исходничек из вашей предыдущей темы ( Посоветуте оптимальный алгоритм поиска медианы (комментарий) )

А лучше - выложите сигнал со входа фильтра, сам попробую.

Ваще мало данных (что за сигнал и помеха, их параметры. Цель - по каким параметрам оптимизируется), деятельность напоминает тыканье пальцем в небо.

anonymous
(22.08.18 11:53:17 MSK)

Ответ на: комментарий от OxiD 22.08.18 11:47:06 MSK

Медиана это не вектор из типичных соседних.. Это средний элемент в отсортированном наборе значений

помниться TC в предыдущих своих темах делал медианные фильтры с разными окнами, поэтому то что он сейчас хочет читается то-ли фильтром, то ли-ли поиском средней статистики.

MKuznetsov ★★★★★
(22.08.18 12:06:24 MSK)

Ссылка

поставь какой-нибудь атом в свою сверлилку :)

Harald ★★★★★
(22.08.18 12:24:05 MSK)

Ответ на: комментарий от Vit 22.08.18 10:18:03 MSK

Я не очень понимаю, как такое возможно одновременно.

Одновременно используй и связный список, и массив: после того, как впихнешь очередное значение в связный список, копируй весь список в массив. Далее для поиска нового индекса будешь использовать бинарный поиск. Нашел в массиве индекс места, куда сделать вставку — сделал в цикле *ptr = *ptr->next нужное количество раз, сделал вставку, скопировал в массив...

А?

Еще один вариант — обычное дерево. Кстати, почему бы тебе действительно не воспользоваться деревьями для вычисления медианы?

anonymous
(22.08.18 12:24:49 MSK)

Ссылка

Ответ на: комментарий от Harald 22.08.18 12:24:05 MSK

Судя по темам ТС, он делает инструмент пыток, который будет менять скорость сверления (зубов? костей?) в зависимости от тональности и громкости воплей поцЫента.

anonymous
(22.08.18 12:26:04 MSK)

Ответ на: комментарий от anonymous 22.08.18 12:26:04 MSK

да и вообще обработку сигналов можно на десктопе делать, а управляющие сигналы по проводам слать

тогда и проблемы с быстрым подсчётом медианы не будет

Harald ★★★★★
(22.08.18 12:27:33 MSK)

Ответ на: комментарий от Harald 22.08.18 12:27:33 MSK

Ну, не всегда нужно тащить комп. Некоторые задачи вполне решаемы микроконтроллерами.

Правда, надо все же понимать некие границы: скажем, нет никакого смысла корячиться с TCP/IP на STM32F407, если за 600 рублей можно взять Orange Pi zero, где нормальный линукс, а отсутствие GPIO решается довесом дешевых МК.

anonymous
(22.08.18 12:33:21 MSK)

Ссылка

Ответ на: комментарий от Vit 22.08.18 10:12:44 MSK

Order statistic tree, например.

aedeph_ ★★
(22.08.18 12:41:51 MSK)

Ответ на: комментарий от beastie 22.08.18 08:56:53 MSK

 l = sorted(l)

- это линейно?

А ваще-то у медианного фильтра - дребезг фронтов, а у устредняющих - задержка, одинаковая по восходящему и падающему (т.е ШИМ сохранится)

anonymous
(22.08.18 13:33:30 MSK)

Ответ на: комментарий от anonymous 22.08.18 13:33:30 MSK

- это линейно?

Пардон, не дочитал до конца ссылку.

anonymous
(22.08.18 13:38:51 MSK)

Ссылка

Ответ на: комментарий от Vit 22.08.18 10:18:03 MSK

Кстати, можно твой массив отсортировать за линейное время с помощью radix-sort и взять средний элемент. Может это самое простое.

OxiD ★★★★
(22.08.18 14:27:16 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.08.18 11:53:17 MSK

https://github.com/speedcontrols/ac_sc_grinder/tree/master/doc/data

Там вычисляется скорость по каждой паре отсчетов. Но из-за помех результаты мотыляет. Зато результатов много :) . Поэтому медиана должна нормально прокатить.

Надо брать только тот кусок, где ток нарастает, и пока напряжение не упадет до нуля. Остальное - мусор.

Vit ★★★★★
(22.08.18 17:19:43 MSK) автор топика

Ответ на: комментарий от aedeph_ 22.08.18 12:41:51 MSK

Это несомненно будет хорошо работать на больших массивах. Но там есть накладные расходы, которые скушают профит при малых размерах.

Случайно не знаешь с какого момента профит начинает соответствовать логарифмическому?

Vit ★★★★★
(22.08.18 17:55:40 MSK) автор топика

Ссылка

Ответ на: комментарий от OxiD 22.08.18 10:29:40 MSK

Да, ты прав, с добавлением парами я переборщил. Это не улучшит код. Сделал как на SO описывали:

https://github.com/speedcontrols/ac_sc_grinder/blob/median/src/median.h

Vit ★★★★★
(22.08.18 18:01:07 MSK) автор топика

Ответ на: комментарий от tailgunner 22.08.18 10:30:11 MSK

У тебя нет примерной оценки, с какого размера данных binary heap станет эффективной? Явно ведь в фильтр для 8 элементов совать не стоит.

С оптовом обращением к памяти пока повременим. Там сложность возрастает не пропорционально профиту. Вроде скорости и так должно хватить на 64 элемента, а дальше результат скорее всего уже не улучшится.

Vit ★★★★★
(22.08.18 18:07:31 MSK) автор топика

Ссылка

Ответ на: комментарий от OxiD 22.08.18 11:47:06 MSK

{2, 4, 6, 8} Что тут медиана?

peregrine ★★★★★
(22.08.18 19:11:40 MSK)

Ответ на: комментарий от peregrine 22.08.18 19:11:40 MSK

Почитай на википедии?

OxiD ★★★★
(22.08.18 19:14:53 MSK)

Ссылка

Ответ на: комментарий от peregrine 22.08.18 19:11:40 MSK

{2, 4, 6, 8} Что тут медиана?

5 по определению медианы.

beastie ★★★★★
(22.08.18 20:02:34 MSK)
Последнее исправление: beastie 22.08.18 20:02:46 MSK (всего исправлений: 1)

Что-то мне подсказывает, что задача поставлена некорректно.

Если я правильно помню, то тебе нужно убрать выбросы из сигнала,
для этого необязательно вычислять именно медиану.

Если что - вот мой прошлый пост на эту тему: Посоветуте оптимальный алгоритм поиска медианы (комментарий)

только там надо поправить чутка:

int16_t tr_mean(int16_t input)
{
    int32_t delta = (int32_t)input - (mean / denom);
    int32_t nz = delta * delta; /*Оцениваем квадрат отклонения*/
    
    int32_t alpha = (nz > noise * 9)?med:fast; /*Изменения < 3s будем копить быстрее*/
    mean  += delta * alpha;

    noise += (nz - (noise / denom)) * slow; /*Оценку шума делаем медленнее всего*/
    return (int16_t)(mean / denom);
}

Там небольшое постоянное количество обращений к памяти и
постоянное небольшое время вычисления.

Как раз для быстрой нелинейной фильтрации.

И да, зачем ты создаешь новый тред, когда можно продолжить в старом?

shkolnick-kun ★★★★★
(22.08.18 20:08:35 MSK)
Последнее исправление: shkolnick-kun 22.08.18 20:12:22 MSK (всего исправлений: 2)