сдвиг влево

Любой из этих способов рабочий. Я обычно пользуюсь 3-м.

aiqu6Ait ★★★★★
(25.04.22 18:30:53 MSK)

Ссылка

Функционально разницы нет, семантически правильный последний - ты выставляешь нужные биты, и именно это написано в коде.

slovazap ★★★★★
(25.04.22 18:33:01 MSK)

Ответ на: комментарий от slovazap 25.04.22 18:33:01 MSK

Понятно что они дадут одинаковый результат.

Что там с кодом на С для MCU 8051, есть смысл морочиться с экономией тактов?

futurama ★★★★★
(25.04.22 18:36:31 MSK) автор топика

Ответ на: комментарий от futurama 25.04.22 18:36:31 MSK

Что там с кодом на С для MCU 8051, есть смысл морочиться с экономией тактов?

Разверни в ассемблер все три варианта и посмотри, если там gcc, то флажок -S.

~~EXL~~ ★★★★★
(25.04.22 18:50:57 MSK)

Ответ на: комментарий от EXL 25.04.22 18:50:57 MSK

1.

       src/main.c:97: ID = gpio_pin_val_read(P0_1) + (gpio_pin_val_read(P0_2) * 2) + (gpio_pin_val_read(P0_3) * 4);
        mov     dpl,#0x01
        lcall   _gpio_pin_val_read
        mov     r7,dpl
        mov     dpl,#0x02
        push    ar7
        lcall   _gpio_pin_val_read
        mov     r6,dpl
        pop     ar7
        mov     a,r6
        add     a,r6
        add     a,r7
        mov     r6,a
        mov     dpl,#0x03
        push    ar6
        lcall   _gpio_pin_val_read
        mov     r7,dpl
        pop     ar6
        mov     a,r7
        add     a,r7
        add     a,acc
        mov     dptr,#_ID
        add     a,r6
        movx    @dptr,a
;       src/main.c:101: } //main()
        ret

2.

;       src/main.c:98: ID = gpio_pin_val_read(P0_3);
        mov     dpl,#0x03
        lcall   _gpio_pin_val_read
        mov     r7,dpl
        mov     dptr,#_ID
        mov     a,r7
        movx    @dptr,a
;       src/main.c:99: ID = (ID<<1) | gpio_pin_val_read(P0_2);
        mov     a,r7
        add     a,r7
        mov     r7,a
        mov     dpl,#0x02
        push    ar7
        lcall   _gpio_pin_val_read
        mov     r6,dpl
        pop     ar7
        mov     a,r7
        orl     ar6,a
        mov     dptr,#_ID
        mov     a,r6
        movx    @dptr,a
;       src/main.c:100: ID = (ID<<1) | gpio_pin_val_read(P0_1);
        mov     a,r6
        add     a,r6
        mov     r6,a
        mov     dpl,#0x01
        push    ar6
        lcall   _gpio_pin_val_read
        mov     r7,dpl
        pop     ar6
        mov     dptr,#_ID
        mov     a,r7
        orl     a,r6
        movx    @dptr,a
;       src/main.c:101: } //main()

3
;       src/main.c:98: ID = gpio_pin_val_read(P0_3)<<2 | gpio_pin_val_read(P0_2)<<1 | gpio_pin_val_read(P0_1);
        mov     dpl,#0x03
        lcall   _gpio_pin_val_read
        mov     a,dpl
        add     a,dpl
        add     a,acc
        mov     r7,a
        mov     dpl,#0x02
        push    ar7
        lcall   _gpio_pin_val_read
        mov     r6,dpl
        pop     ar7
        mov     a,r6
        add     a,r6
        orl     ar7,a
        mov     dpl,#0x01
        push    ar7
        lcall   _gpio_pin_val_read
        mov     r6,dpl
        pop     ar7
        mov     dptr,#_ID
        mov     a,r6
        orl     a,r7
        movx    @dptr,a
;       src/main.c:99: } //main()

futurama ★★★★★
(25.04.22 18:52:20 MSK) автор топика

Ответ на: комментарий от futurama 25.04.22 18:52:20 MSK

код лютый какой-то. это с какими флагами оптимизации? или вообще без оных?

alysnix ★★★
(25.04.22 21:14:43 MSK)

Ответ на: комментарий от alysnix 25.04.22 21:14:43 MSK

можешь оптимизировать вручную, ну так, для осознания ущербности этого кода?

futurama ★★★★★
(25.04.22 22:10:48 MSK) автор топика

Ответ на: комментарий от futurama 25.04.22 22:10:48 MSK

я про флаги спросил. а не про разрешение оптимизировать вручную.

alysnix ★★★
(25.04.22 23:52:51 MSK)

Ответ на: комментарий от alysnix 25.04.22 23:52:51 MSK

CC  = sdcc
# Program to use for the linker
LK = sdcc

# Flags for above programs when calling them from the command line
DFLAGS = -MM $(INCDIRS) $<
CFLAGS = --model-large --std-c99 $(INCDIRS) -c $< -o "$(OBJDIR)/"
LFLAGS = --model-large --code-loc 0x0000 --code-size 0x4000 --xram-loc 0x0000 --xram-size 0x400 -o $(MAINIHX) $(LIBDIRS)/* $(OBJFILES)

futurama ★★★★★
(26.04.22 09:04:43 MSK) автор топика
Последнее исправление: futurama 26.04.22 09:04:55 MSK (всего исправлений: 1)

Ответ на: комментарий от alysnix 25.04.22 23:52:51 MSK

а не про разрешение оптимизировать вручную.

Это был вопрос. Есть ли там что оптимизировать вообще?

futurama ★★★★★
(26.04.22 09:06:26 MSK) автор топика

Ссылка

Ответ на: комментарий от futurama 25.04.22 22:10:48 MSK

Если нет SHR SHL (или они очень тяжелые по тактам алу), то 3 вариант вполне логичен

Morin ★★★★★
(26.04.22 10:14:09 MSK)

а зачем двигать?

id = (4 * h) | (2 * m) | (1*l);

id = (h ? 4:0) | (m ? 2:0) | (l ? 1:0);

vel ★★★★★
(26.04.22 10:20:43 MSK)

Ответ на: комментарий от Morin 26.04.22 10:14:09 MSK

беззнаковый сдвиг…это ж самая примитивная операция для реализации в железе. за один такт должна делаться, просто биты перегоняются в одну сторону, плюс кой чего еще.

alysnix ★★★
(26.04.22 10:37:46 MSK)

Ответ на: комментарий от alysnix 26.04.22 10:37:46 MSK

а вот это совсем не факт, смотря что за камень

Morin ★★★★★
(26.04.22 10:42:23 MSK)

Ссылка

Ответ на: комментарий от futurama 26.04.22 09:04:43 MSK

понятно. это какой-то sdcc компилятор со своими тараканами. http://sdcc.sourceforge.net/

alysnix ★★★
(26.04.22 10:45:25 MSK)
Последнее исправление: alysnix 26.04.22 10:47:37 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от vel 26.04.22 10:20:43 MSK

Ну мой первый вариант с + вместо |

Вот твой второй интересно посмотреть в ассемблере. Гляну сейчас.

futurama ★★★★★
(26.04.22 10:47:38 MSK) автор топика

Ответ на: комментарий от futurama 26.04.22 10:47:38 MSK

вообще правильно, канонично, наглядно, это как уже сказали - третий вариант. но правильный компилятор(с наворотами в оптимизации), типа gcc, должен превратить все три варианта в один и тот же асм. это если оптимизации включены, типа -02. но тут компилятор свой и потому вопросы снимаются.

alysnix ★★★
(26.04.22 10:50:43 MSK)

Ответ на: комментарий от futurama 26.04.22 10:47:38 MSK

Вот твой второй интересно посмотреть в ассемблере. Гляну сейчас.

Разлапистый код получился из-за условных переходов (тут оператор ?)

futurama ★★★★★
(26.04.22 10:53:27 MSK) автор топика

Ссылка

Ответ на: комментарий от alysnix 26.04.22 10:50:43 MSK

Как я вижу по ассемблеру I и III варианты примерно одинаковые

futurama ★★★★★
(26.04.22 10:55:17 MSK) автор топика

Ответ на: комментарий от futurama 26.04.22 10:55:17 MSK

a gcc умеет в твою архитектуру?

alysnix ★★★
(26.04.22 10:55:54 MSK)

Ответ на: комментарий от alysnix 26.04.22 10:55:54 MSK

MCU 8051? gcc не умеет

sdcc

Optimization options:
      --nooverlay           Disable overlaying leaf function auto variables
      --nogcse              Disable the GCSE optimisation
      --nolabelopt          Disable label optimisation
      --noinvariant         Disable optimisation of invariants
      --noinduction         Disable loop variable induction
      --noloopreverse       Disable the loop reverse optimisation
      --no-peep             Disable the peephole assembly file optimisation
      --no-reg-params       On some ports, disable passing some parameters in registers
      --peep-asm            Enable peephole optimization on inline assembly
      --peep-return         Enable peephole optimization for return instructions
      --no-peep-return      Disable peephole optimization for return instructions
      --peep-file           <file> use this extra peephole file
      --opt-code-speed      Optimize for code speed rather than size
      --opt-code-size       Optimize for code size rather than speed
      --max-allocs-per-node  Maximum number of register assignments considered at each node of the tree decomposition
      --nolospre            Disable lospre
      --allow-unsafe-read   Allow optimizations to read any memory location anytime
      --nostdlibcall        Disable optimization of calls to standard library

futurama ★★★★★
(26.04.22 10:59:45 MSK) автор топика
Последнее исправление: futurama 26.04.22 11:02:06 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от futurama 26.04.22 10:55:17 MSK

Как я вижу по ассемблеру I и III варианты примерно одинаковые

суммирование более дорогая операция чем OR битов, по самой теории. поскольку суммирование предполагает перенос, а OR - нет. и если любой нетупой компиллятор поймет, что беззнаковое умножение на степень двойки это сдвиг, то суммирование он на OR не заменит. самый правильный и дешевый вариант - 3. потому что он делает ровно то, что ты хочешь сделать.

alysnix ★★★
(26.04.22 11:06:05 MSK)
Последнее исправление: alysnix 26.04.22 11:06:45 MSK (всего исправлений: 1)

Ответ на: комментарий от futurama 26.04.22 09:04:43 MSK

В твоём выводе sdcc есть такая строчка

--opt-code-speed      Optimize for code speed rather than size

А в твоём Makefile такого флага я не вижу.

Попробуй добавить к CFLAGS и посмотреть изменится ли ассемблерный вывод?

fsb4000 ★★★★★
(26.04.22 11:27:01 MSK)

Ответ на: комментарий от alysnix 26.04.22 11:06:05 MSK

Всё зависит от камня. Бывают случаи когда «+» может быть быстрее. Например когда нет shl/shr на определенное количество бит, есть только на 1 (например 6502 ca65)

PPP328 ★★★★★
(26.04.22 11:55:07 MSK)

Ответ на: комментарий от PPP328 26.04.22 11:55:07 MSK

Всё зависит от камня. Бывают случаи когда «+» может быть быстрее. Например когда нет shl/shr на определенное количество бит, есть только на 1 (например 6502 ca65)

это OR можно заменить на суммирование, а не сдвиг.

сдвиг на n разрядов, это подобно беззнаковому умножению/делению на степень двойки. сомнительно что в проце есть быстрое умножение/деление, но нет сдвига на n разрядов. скорее наоборот.

сдвиг на n разрядов технически очень же простой, а вот умножение/деление - в железе сложно.

alysnix ★★★
(26.04.22 12:07:17 MSK)

Ответ на: комментарий от alysnix 26.04.22 12:07:17 MSK

Дядь, я вам только что рассказал про 6502 камень, у которого ADC (сложение регистра и памяти) - это одна железная инструкция. А Shr/Shl N банально нет. Только делать цикл и долбить ASL/LSR (сдвиг регистра на один бит) N раз.

сомнительно что в проце есть быстрое умножение/деление

Речь про умножение вообще не идет, его там нет. Зачем вам умножение для A << N | B << M ?

PPP328 ★★★★★
(26.04.22 12:32:43 MSK)

Ответ на: комментарий от fsb4000 26.04.22 11:27:01 MSK

Я их пробовал, разницы нет

futurama ★★★★★
(26.04.22 12:45:35 MSK) автор топика

Ссылка

Ответ на: комментарий от PPP328 26.04.22 12:32:43 MSK

Дядь, я вам только что рассказал про 6502 камень, у которого ADC (сложение регистра и памяти) - это одна железная инструкция. А Shr/Shl N банально нет. Только делать цикл и долбить ASL/LSR (сдвиг регистра на один бит) N раз.

какое отношение сложение имеет к сдвигу? как можно сдвиг эмулировать сложением?

эта ваша фраза о чем? каким сложением можно эмулировать сдвиг на 6 разрядов например?

Бывают случаи когда «+» может быть быстрее. Например когда нет shl/shr на определенное количество бит, есть только на 1 (например 6502 ca65)

alysnix ★★★
(26.04.22 13:05:51 MSK)

Ответ на: комментарий от alysnix 26.04.22 13:05:51 MSK

начнем с патерна сдвига))))

и ты точно хорошо понял 3ий вариант, а ведь там двигают на 2 разряда)))

Morin ★★★★★
(26.04.22 13:08:09 MSK)

Ответ на: комментарий от Morin 26.04.22 13:08:09 MSK

и ты точно хорошо понял 3ий вариант, а ведь там двигают на 2 разряда)))

датышо!

ps. если в конкретном камне нет сдвига на более чем разряд, то второй способ может быть быстрей, поскольку в нем только два сдвига, а в третьем - три. но такой конкретный камень не обсуждался.

alysnix ★★★
(26.04.22 13:11:42 MSK)
Последнее исправление: alysnix 26.04.22 13:16:06 MSK (всего исправлений: 1)

Ответ на: комментарий от alysnix 26.04.22 13:11:42 MSK

мда, спеси поубавим ;)

что такое сдвиг влево и вправо на бит? подсказка, можно выразить как деление или умножение на 2, как выглядит умножение на сумматоре, сюрприз - это сложение

про паттерн я не просто так тоже задал вопрос, простейший это тоже 1 бит, и сюрприз, сдвигать можно 0ом или 1ей

Morin ★★★★★
(26.04.22 13:21:01 MSK)
Последнее исправление: Morin 26.04.22 13:22:55 MSK (всего исправлений: 1)

Ответ на: комментарий от alysnix 26.04.22 13:05:51 MSK

какое отношение сложение имеет к сдвигу? как можно сдвиг эмулировать сложением?

эта ваша фраза о чем? каким сложением можно эмулировать сдвиг на 6 разрядов например?

О божечки-кошечки, да прочтите вы наконец моё сообщение.

Ваше утверждение

суммирование более дорогая операция чем OR битов, по самой теории

ложно, потому что я уже назвал вам платформу, где суммирование имеет такую же сложность, что и OR.

PPP328 ★★★★★
(26.04.22 13:24:26 MSK)

Ответ на: комментарий от Morin 26.04.22 13:21:01 MSK

что такое сдвиг влево и вправо на бит? подсказка, можно выразить как деление или умножение на 2, как выглядит умножение на сумматоре, сюрприз - это сложение

ты как бы намекаешь, что чтобы умножить миллион на миллион… надо миллион раз прибавить миллион к нулю??? спасибо. но так не умножают. гы

alysnix ★★★
(26.04.22 13:33:03 MSK)

Ответ на: комментарий от alysnix 26.04.22 13:33:03 MSK

я как бы намекаю, что тебе надо почитать основы цифровой логики, первые алу кроме сумматора не имели нихрена, от слова совсем

Morin ★★★★★
(26.04.22 13:36:30 MSK)

Ответ на: комментарий от PPP328 26.04.22 13:24:26 MSK

ложно, потому что я уже назвал вам платформу, где суммирование имеет такую же сложность, что и OR.

и что за платформа? вы вроде ничто не назвали.

вы не поняли моей фразы. я просто сказал, что OR не требует переноса, и потому, даже теории проще. вне зависимости от платформ. то есть устройство, осуществляющее операцию OR схемотехнически проще, чем осуществляющее полновесное сложение битов с переносом. вы с этим спорите?

alysnix ★★★
(26.04.22 13:38:25 MSK)

Ответ на: комментарий от alysnix 26.04.22 13:38:25 MSK

и что за платформа? вы вроде ничто не назвали.

ДВА раза назвал. Прочитайте чертовы сообщения

PPP328 ★★★★★
(26.04.22 13:40:51 MSK)

Ссылка

Ответ на: комментарий от Morin 26.04.22 13:36:30 MSK

я как бы намекаю, что тебе надо почитать основы цифровой логики, первые алу кроме сумматора не имели нихрена, от слова совсем

а я как бы намекаю, что умножения на таких алу делались алгоритмически с вычислением поразрядных произведений и их суммированием. а не просто «суммированием».

alysnix ★★★
(26.04.22 13:41:09 MSK)

Ответ на: комментарий от alysnix 26.04.22 13:41:09 MSK

нахрена :)

это такты девать лишние некуда? ряд 2 4 8 … ничего не говорит?

ладно, походу надо завязывать, а то мы тут каким-то археологически битодрочем занимаемся

Morin ★★★★★
(26.04.22 13:44:15 MSK)

Ответ на: комментарий от Morin 26.04.22 13:44:15 MSK

http://kspt.icc.spbstu.ru/media/files/2020/course/comp_eng/5.pdf

alysnix ★★★
(26.04.22 13:49:13 MSK)

Ответ на: комментарий от alysnix 26.04.22 13:49:13 MSK

Ну молодец, вот только твоя математическая модель всосала на реальной платформе.

lda $00
clc
adc $01
clc
adc $01
clc
adc $01

Будет быстрее, чем всё твоё бито*бство из статьи.

PPP328 ★★★★★
(26.04.22 13:51:39 MSK)

Царь: вызывает антирес ваш питательный процесс: как у вас там пють какаву - с сахарином, али без?
Посол: йес
Царь: вызывает антирес ваш технический прогресс: как у вас там сеють брюкву - с кожурою, али без?
Посол: йес
Царь: вызывает антирес вот ещё какой разрез: как у вас там ходють бабы - в панталонах, али без?
Посол: йес

и оный топик в аналогичном духе.. 🤦‍♂️

aol ★★★★★
(26.04.22 13:56:54 MSK)
Последнее исправление: aol 26.04.22 13:57:14 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от PPP328 26.04.22 13:51:39 MSK

Ну молодец, вот только твоя математическая модель всосала на реальной платформе.

что за модель? вернитесь в топик. вопрос был такой -

Вопрос банальный, но спрошу. ID микроконтроллера задается тремя ногами от 000 до 111 как правильно вдвинуть эти биты в инт?

причем тут асм какого-то конкретного проца с помойки, вопрос ж был про си, и не пойми какого проца.

alysnix ★★★
(26.04.22 14:15:02 MSK)

Ответ на: комментарий от alysnix 26.04.22 14:15:02 MSK

что за модель?

То есть вы даже собственные сообщения не читаете? Класс. Какой смысл тогда иметь с вами дискуссию.

конкретного проца с помойки

Охлол

PPP328 ★★★★★
(26.04.22 14:22:00 MSK)
Последнее исправление: PPP328 26.04.22 14:22:51 MSK (всего исправлений: 1)

Ответ на: комментарий от PPP328 26.04.22 14:22:00 MSK

Охлол

судя по lda… это какая-то аккумуляторная хрень с парой еще регистров, архитектуре которой лет стописят с хвостиком. это даже не помойка, а окаменелости. спасибо за ценный код на асме.

alysnix ★★★
(26.04.22 14:29:10 MSK)

Ссылка

Ответ на: комментарий от futurama 25.04.22 18:52:20 MSK

По-моему, разница между тремя вариантами съедается на фоне использования lcall для доступа к биту GPIO и обрамляющего сохранения и восстановления контекста.

p.s. 3 вариант более читабельный в общем случае, если захардкоженные величины сдвигов будут заменены на макроопределения

qbe ★
(26.04.22 14:51:05 MSK)

Ссылка

Ответ на: комментарий от futurama 25.04.22 18:52:20 MSK

ID = gpio_pin_val_read(P0_1) + (gpio_pin_val_read(P0_2) * 2) + (gpio_pin_val_read(P0_3) * 4);

и наоборот, если не предполагается менять местами пины, а религия позволяет обращаться к портам в обход NRF SDK, то можно считывание ID сократить так:

ID = (P0 >> 1) & 0x07;

qbe ★
(26.04.22 15:22:48 MSK)

Ответ на: комментарий от qbe 26.04.22 15:22:48 MSK

Так и сделаю, спасибо

_P0 =   0x0080

    mov a,_P0
    clr c
    rrc a
    mov r7,a
    mov dptr,#_ID
    mov a,#0x07
    anl a,r7
    movx    @dptr,a

futurama ★★★★★
(26.04.22 18:37:38 MSK) автор топика
Последнее исправление: futurama 26.04.22 18:38:53 MSK (всего исправлений: 2)

Ссылка

Похожие темы