Алгоритм умножения на логических схемах

4

3

Каким образом в вычислительных устройствах (АЛУ процессора) аппаратно реализован алгоритм умножения? В частности судя по http://www.sm.bmstu.ru/sm5/n4/oba/proz2.html для умножения используются сумматоры и двоичный сдвиг. Я придумал другой метод. Я через дешифраторы преобразовываю двоичную систему счисления в одноединичный код, потом ищу пересечения этих единичек для двух чисел, потом преобразовываю через дешифратор это в двоичную систему счисления. И т.к. умножение это коммутативная операция, схема несколько(почти в два раза) упрощается. Вот нарисовал в logisim http://dump.bitcheese.net/files/umucuby/upd_2.circ и в виде картинки http://dump.bitcheese.net/images/aditoso/sc.png
Имеет ли смысл использовать подобное решение вместо привычного подхода с сумматорами(лучше или хуже оно)? Используется ли подобный подход в процессорах? Если у кого есть опыт с программированием FPGA через verilog/VHDL, имеет ли смысл подобное реализовывать в софт-микропроцессорах? И да, есть ли в Verilog или VHDL cредства для кодогенерации того, что я тут изобразил, для произвольной разрядности чисел? Или надо для таких случаев свой кодогенератор писать? Кастану пожалуй yax123, он вроде что-то на спартанах там делает

Ссылка

←	Какая практическая польза от Symbol?

Как замотивировать себя работать на технологии N когда видел технологию M?

→

← 1 2 →

Ответ на: комментарий от yax123 10.11.15 16:23:12 MSK

Правда дешифратор не полный (должно быть 8 выходов, а не 7, ну это не самая главная проблема).

Ну так восьмой вывод же должен под нуль выводиться. Но нули мне не нужны т.к. 0 умножить на что угодно это 0. Проблему я вижу только в том, что схема эта будет черезмерно разрастаться при увеличении разрядности. Я сначала хотел это нарисовать для перемножения 8-битных чисел, но оценив примерный объем работ, решил сократить до 4, а потом и до 3-битных

SZT ★★★★★
(10.11.15 16:34:22 MSK) автор топика
Последнее исправление: SZT 10.11.15 16:34:37 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Zubok 10.11.15 15:50:16 MSK

Я глянул исходную схему чуть-чуть повнимательнее. А ты проверил - она работает? А то я на глаз что-то не могу определить.

Да, работает. В logisim тестировал на разных числах - результат был всегда правильным.

Теперь мнение по практичности. Непрактично совершенно. Если ты будешь множить 8-битные числа, то сам прикинь, сколько у тебя ресурсов сожрет твое решение.

А и не надо. Можно использовать трехбитные умножатели для реализации 8-битных, примерно как при умножении в столбик мы умножаем отдельные цифры числа с переносом

SZT ★★★★★
(10.11.15 16:38:25 MSK) автор топика

Ответ на: комментарий от SZT 10.11.15 16:38:25 MSK

Можно использовать трехбитные умножатели для реализации 8-битных, примерно как при умножении в столбик мы умножаем отдельные цифры числа с переносом

Вот бы глянуть на такую схему.

yax123 ★★★★★
(10.11.15 16:48:40 MSK)

Ответ на: комментарий от SZT 10.11.15 16:38:25 MSK

А и не надо. Можно использовать трехбитные умножатели для реализации 8-битных, примерно как при умножении в столбик мы умножаем отдельные цифры числа с переносом

Еще глянь на LUT-based multipliers как вариант реализации. Их можно объединить по алгоритму Бута в умножители большей разрядности.

Zubok ★★★★★
(10.11.15 19:43:40 MSK)

Ссылка

Ответ на: комментарий от SZT 10.11.15 10:53:48 MSK

Тьфу ты, зашел сюда не верилог посмотреть, а тут срамота такая) Это из верилога что ли вылезло?

asaw ★★★★★
(10.11.15 20:01:15 MSK)
Последнее исправление: asaw 10.11.15 20:02:04 MSK (всего исправлений: 1)

Ответ на: комментарий от yax123 10.11.15 16:48:40 MSK

Посмотри алгоритм Карацубы. Для множителей размера n он использует 3 перемножения размера n/2. Причём перемножения размера n/2 можно вычислять дальнейшим разбиением до n/4 и так далее пока мы не дойдём до однобитного перемножения.

~~prischeyadro~~ ★★★☆☆
(10.11.15 21:03:24 MSK)

Ответ на: комментарий от asaw 10.11.15 20:01:15 MSK

Верилог тут притом, что я это хочу на верилоге переписать

SZT ★★★★★
(11.11.15 00:37:20 MSK) автор топика

Ссылка

Ответ на: комментарий от prischeyadro 10.11.15 21:03:24 MSK

Посмотри алгоритм Карацубы.

Понятно что у математиков все просто и понятно. Нарисовал пару формул и хорошо. Я про то как это будет в логических элементах выглядеть.
Изначально то я спрашивал про то как исходную модель ТС-а каскадировать.
Самая содомия именно в железе.
Из производственного. К virtex6 подключены 8 SPF+. Нужно через них осуществлять коммуникацию с внешним миром. Транссиверы подключены каждый к своему GTX. И у каждого по 32+32 линии данных (на чтение и на запись). Вот вам уже 512 линии которые должны быть строго синхронные. Попробуйте протащить их через весь кристалл.

yax123 ★★★★★
(11.11.15 12:38:52 MSK)

Ссылка

Простите за оффтоп, но даже самые младшие FPGA типа cyclone II или spartan 3 уже содержат в себе выделенные блоки умножения. А так иногда лучше несколько коротких тактов, чем один но с большой задержкой.

Rupricht ★★
(11.11.15 12:58:30 MSK)

Ответ на: комментарий от Rupricht 11.11.15 12:58:30 MSK

хе, ну может я хочу это в кристалле сделать (мечты)

SZT ★★★★★
(12.11.15 13:46:08 MSK) автор топика

Ссылка

Ответ на: комментарий от Rupricht 11.11.15 12:58:30 MSK

А самые интересные FPGA, для которых есть open source toolchain (ice40) никаких dsp slices не имеют.

anonymous
(12.11.15 21:01:56 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

←	Какая практическая польза от Symbol?

Development

Как замотивировать себя работать на технологии N когда видел технологию M?

→

Похожие темы