Так ли нужна оптимизация хвостовых вызовов?

0

4

Вон в rust считают, что не нужна:

- Tail calls «play badly» with deterministic destruction. Including deterministic drop of ~ boxes. Not to say that they're not composable, but the options for composing them are UI-awkward, performance-penalizing, semantics-complicating or all of the above.
- Tail calls also «play badly» with assumptions in C tools, including platform ABIs and dynamic linking.
- Tail calls require a calling convention that is a performance hit relative to the C convention.
- We find most cases of tail _recursion_ convert reasonably well to loops, and most cases of non-recursive tail calls encode state machines that convert reasonably well to loops wrapped around enums. Neither of these are _quite_ as pretty as the tail-call-using variants, but they do work and are «as fast»*, as well as idiomatic for C and C++ programmers (who are our primary audience).

https://mail.mozilla.org/pipermail/rust-dev/2013-April/003557.html

Ссылка

←	Rust, tail call optimization

Библиотека облегченной работы с tk из ruby

→

← 1 2 3 →

Ответ на: комментарий от anonymous 12.04.13 15:58:38 MSK

Зачем? Прошлый правый уже полностью обработан, в прошлом правом только ret остался, который можно спокойно убрать с ТСО и вернуться сразу «домой».

нет. У прошлого правого(*) просмотрен только левый, в котором ничего нет. И вернуться надо опять на правый(*), и посмотреть его правый.

Такого быть не может. Нарисуй и разбери на бумажке, если так не получается.

что я должен рисовать-то? Где код с jmp? Сам пиши код и рисуй, что у тебя не получится. Я и так знаю, в чём тут дело.

~~drBatty~~ ★★
(12.04.13 16:25:27 MSK)

Ответ на: комментарий от anonymous 12.04.13 16:21:22 MSK

тогда почему там нет TCO, если в конце стоит вызов другой функции?

yyk ★★★★★
(12.04.13 16:26:43 MSK)

Ответ на: комментарий от qulinxao 12.04.13 16:00:46 MSK

речь про случай «линейного» последнесторонего дерева

слушай, я про _любое_ дерево, в котором может быть что угодно, и как угодно. Алгоритм с рекурсией на нём работает. А после ТСО ломается. И я не знаю, как это чинить. предлагаешь чинить дерево, а не алгоритм?

короче концевой вызов допускает реализацию с замедлением(в идеале нулевой рост) роста стэка вот и всё.

да, только это надо дерево как-то лечить.

~~drBatty~~ ★★
(12.04.13 16:28:16 MSK)

Ответ на: комментарий от qulinxao 12.04.13 16:03:20 MSK

именно с этой точки зрения оказывается понятной почему имена аргументов в первой версии С были в заголовке - а их типы в секции между заголовком функции и её телом.

ну это ещё в K&R написано.

~~drBatty~~ ★★
(12.04.13 16:29:56 MSK)

Ссылка

Ответ на: комментарий от drBatty 12.04.13 16:25:27 MSK

нет. У прошлого правого(*) просмотрен только левый, в котором ничего нет.

Такого быть не может. Если у прошлого правого просмотрен левый, значит мы _уже_ находимся в правом прошлого правого. И если мы дошли до рет'а, значит его просмотрели. Вообще непонятно о чем спор, я тебе привел пример твоего кода с деревом, в котором стек не растет.

что я должен рисовать-то? Где код с jmp?

При чем тут код с джампами? Для тебя это слишком сложно, нарисуй пока сам ход алгоритма - какие элементы дерева вслед за какими рассматриваются, по шагам. Составь блоксхему, на худой конец. А то ты не понимаешь вообще что происходит в приведенном тобой куске кода с обходом дерева.

Сам пиши код и рисуй, что у тебя не получится.

:cry:

Уже получилось. Код я предоставил.

Я и так знаю, в чём тут дело.

Неправильно знаешь, выходит, раз твои знания противоречат экспериментальным фактам.

anonymous
(12.04.13 16:34:17 MSK)

Ответ на: комментарий от anonymous 12.04.13 16:11:11 MSK

Ты читать не умеешь? Написано же - расти не будет в том случае, если длина левых поддеревьев ограничена. Вот пример:

блжад. Оно всегда ограничено. Высотой дерева. Это у тебя какие-то особые деревья, там да, стек растёт пропорционально левой высоте.

В принципе, да, запоминать это всё нужно только для входа в левое дерево, только мне что-то не сообразить, как это в коде x86 будет выглядеть?

~~drBatty~~ ★★
(12.04.13 16:34:52 MSK)

Ответ на: комментарий от yyk 12.04.13 16:26:43 MSK

тогда почему там нет TCO, если в конце стоит вызов другой функции?

ТСО формально везде есть. Имеется ввиду, что вызов p не ТСО. А взыов print - ТСО, понятное дело.

anonymous
(12.04.13 16:35:39 MSK)

Ответ на: комментарий от drBatty 12.04.13 16:28:16 MSK

А после ТСО ломается.

Почему у меня ничего не ломается?

anonymous
(12.04.13 16:37:53 MSK)

Ссылка

Ответ на: комментарий от yyk 12.04.13 16:11:30 MSK

Важно. Ибо если она что-то делает там, где у тебя // (***2), то это не ТСО. А если ничего не делает, то после отработки правого обхода x тебе уже нафиг не нужен, ибо тебе осталось только что вернуться на пред. уровень. А если и там это правый обход, то тебе тоже ничего не надо, кроме как вернуться на пред. уровень и т.д.

в принципе - да. Не нужно ничего, кроме как вернуться. Ладно, x->right это перейти, а возвращаться как? Повесить ещё по указателю на каждый узел? Не жирно-ли будет?

~~drBatty~~ ★★
(12.04.13 16:38:44 MSK)

Ответ на: комментарий от drBatty 12.04.13 16:34:52 MSK

Это у тебя какие-то особые деревья, там да, стек растёт пропорционально левой высоте.

Да нет, это вполне обычное дерево. Просто из-за ТСО правые вызовы оптимизируются. В результате с правой высотой стек не растет, а с левой - растет. Если я сделаю, чтобы хвостовой вызов обходил левое поддерево, а не правое, то будет стек расти с правой высотой, а с левой не будет. Хотя дерево останется тем же самым.

anonymous
(12.04.13 16:39:47 MSK)

Ответ на: комментарий от dave 12.04.13 16:14:48 MSK

Можно не мучаться, да и просто взять F# async - там уже все придумано за нас. Будет тебе обход дерева без съедания стека просто за красивые глаза, если я правильно уловил суть вашей беседы - особо не вчитывался.

ЕМНИП там кучу будет есть, а не стек. Так я и в C++ могу.

~~drBatty~~ ★★
(12.04.13 16:39:55 MSK)

Ответ на: комментарий от anonymous 12.04.13 16:35:39 MSK

ТСО формально везде есть. Имеется ввиду, что вызов p не ТСО. А взыов print - ТСО, понятное дело.

не везде, ибо не везде перед ret есть только call. Вызов p из p - тот самый tail recursion. Любой другой вызов - TCO. В том коде - putchar. Почему там нет ТСО?

yyk ★★★★★
(12.04.13 16:40:11 MSK)

Ответ на: комментарий от drBatty 12.04.13 16:38:44 MSK

Ладно, x->right это перейти, а возвращаться как?

А никак. Зачем? В этой ветке исполнения уже все сделали, не надо к ней возвращаться. В этом смысл ТСО - не возвращаться туда, куда возвращаться не нужно.

anonymous
(12.04.13 16:41:18 MSK)

Ссылка

Ответ на: комментарий от yyk 12.04.13 16:40:11 MSK

не везде, ибо не везде перед ret есть только call.

Я не рассматриваю операторы, так что - везде.

Почему там нет ТСО?

Так как оно есть везде вообще, то вопрос о его наличии смысла не несет.

anonymous
(12.04.13 16:42:28 MSK)

Ответ на: комментарий от drBatty 12.04.13 16:34:52 MSK

как это в коде x86 будет выглядеть?

это for(ptr = ..., ptr != null, ptr = ptr->next_ptr);

anonymous
(12.04.13 16:44:22 MSK)

Ссылка

Ответ на: комментарий от anonymous 12.04.13 16:42:28 MSK

ТСО формально везде есть. Имеется ввиду, что вызов p не ТСО. А взыов print - ТСО, понятное дело.

Тогда почему ты утверждал, что там ТСО нет? :)

yyk ★★★★★
(12.04.13 16:46:10 MSK)

Ссылка

Ответ на: комментарий от anonymous 12.04.13 16:16:27 MSK

При входе в p надо сохранить старое значение s и адрес возврата, чтобы потом выполнить putchar('Z');

зачем это всё надо для putchar('Z')?

Другое дело, что компилятор может быть умный и переставит вызовы:

зачем переставлять то, что ни на что не влияет? К тому-же это плохая перестановка, ибо если печатать static int, то до перестановки будет 3 2 1, а после 1 2 3. Меняется относительный порядок функции.

~~drBatty~~ ★★
(12.04.13 16:46:35 MSK)

Ответ на: комментарий от drBatty 12.04.13 16:46:35 MSK

зачем это всё надо для putchar('Z')?

А это уже к ТСО не относится.

зачем переставлять то, что ни на что не влияет?

Переставить затем, чтобы вызов р стал хвостовым и стек не отвалился. А _можно_ переставить именно потому, что оно ни на что не влияет.

anonymous
(12.04.13 16:50:32 MSK)

Ссылка

Ответ на: комментарий от yyk 12.04.13 16:17:37 MSK

ТСО тут практическая, ибо по выходу из putchar совершенно всё равно, портил он там что или нет. И куда возвращаться из putchar - в p, чтобы сразу вернуться в место её вызова, или сразу в это место - безразлично.

вот только после функции порядок вызовов будет противоположный порядку вызовов до функции. Если просто печатать Z, да, без разницы. Впрочем, порядок будет противоположен функции p, а раз функции независимы, то и не важно, в каком порядке они выполняются (или не?).

Но если печатать *s, то TCO ломается - строка печатается наоборот. Символы загоняются в стек, а печатаются перед возвратом, начиная с последнего.
Код давай

дык поменяй 'Z' на *s.

~~drBatty~~ ★★
(12.04.13 16:50:39 MSK)

Ответ на: комментарий от anonymous 12.04.13 16:19:07 MSK

Толку мне от умножения TCO, если это тривиальная функция?
Нету толку. Но это хвостовой вызов, в языках с proper TCO он будет оптимизирован.

там нечего оптимизировать.

~~drBatty~~ ★★
(12.04.13 16:52:00 MSK)

Ответ на: комментарий от drBatty 12.04.13 16:46:35 MSK

К тому-же это плохая перестановка, ибо если печатать static int, то до перестановки будет 3 2 1, а после 1 2 3.

Ну тогда переставлять нельзя, а если переставлять нельзя - то p хвостовым никогда не будет и стек будет съеден без вариантов.

anonymous
(12.04.13 16:52:04 MSK)

Ссылка

Ответ на: комментарий от anonymous 12.04.13 16:34:17 MSK

Уже получилось. Код я предоставил.

там непонятно что происходит, и есть-ли TCO. Давай C код.

~~drBatty~~ ★★
(12.04.13 16:54:00 MSK)

Ответ на: комментарий от drBatty 12.04.13 16:52:00 MSK

там нечего оптимизировать.

Почему же, есть (один фрейм вызова и замена call+ret на джамп), и, как я уже сказал, языки с ТСО соптимизируют.

anonymous
(12.04.13 16:54:46 MSK)

Ссылка

Ответ на: комментарий от drBatty 12.04.13 16:50:39 MSK

дык поменяй 'Z' на *s.

Соптимизирован будет _хвостовой_ вызов, а это вызов print, а не вызов p.

anonymous
(12.04.13 16:56:35 MSK)

Ссылка

Ответ на: комментарий от anonymous 12.04.13 16:39:47 MSK

Да нет, это вполне обычное дерево. Просто из-за ТСО правые вызовы оптимизируются. В результате с правой высотой стек не растет, а с левой - растет.

у меня обычно более-менее сбалансированные деревья, и высота правого/левого не сильно разная. В моём коде стек растёт как большая из левого/правого(т.е. разница небольшая).

~~drBatty~~ ★★
(12.04.13 16:57:52 MSK)

Ответ на: комментарий от drBatty 12.04.13 16:54:00 MSK

там непонятно что происходит

Ну так учи стандарт схемы, станет понятно.

и есть-ли TCO.

ТСО там есть по 2 причинам:

1. стандарт схемы требует, чтобы оно было

2. потребление памяти не растет.

Давай C код.

с код ничего не даст, т.к. в сишке нету proper TCO. Можешь предложить другой вариант кроме схемы? Я просто что-то не могу вспомнить альтернатив.

anonymous
(12.04.13 16:59:22 MSK)

Ссылка

Ответ на: комментарий от drBatty 12.04.13 16:57:52 MSK

у меня обычно более-менее сбалансированные деревья

Ну так а ты проверь на несбалансированном.

anonymous
(12.04.13 17:00:09 MSK)

Ответ на: комментарий от drBatty 12.04.13 16:39:55 MSK

ЕМНИП там кучу будет есть, а не стек. Так я и в C++ могу.

А больше двоичное дерево ты никак и не обойдешь. Вариантов нет. Либо кушаешь стек по рабоче-крестьянски через прямую рекурсию, либо кушаешь кучу, но хитровывернуто как истый антилигент через TCO и продолжения.

~~dave~~ ★★★★★
(12.04.13 17:06:58 MSK)

Ответ на: комментарий от drBatty 12.04.13 16:38:44 MSK

Ладно, x->right это перейти, а возвращаться как? Повесить ещё по указателю на каждый узел? Не жирно-ли будет?

Ничего вывешивать не надо. call и ret - это те-же goto (jmp) c сохранением/извлечением адреса возврата из стека - не? Мне влом писать ассемблерный код, ибо сначала придётся вспоминать внутренности этой кухни.

yyk ★★★★★
(12.04.13 17:08:51 MSK)

Ссылка

Ответ на: комментарий от drBatty 12.04.13 16:22:17 MSK

если нацелен на непонимание то только самостоятельное написание ТСО поможет.

со стека снимают/(не кладут на ) перед выполнением концевого ну и стек(верх так реконфигурируют что бы уже находясь в вызваной концевой стек неотличается от прямого вызова этой функции из деда ) - да и так как с-call вызывающий чистит есть гемморой .

~~qulinxao~~ ★★☆
(12.04.13 19:15:21 MSK)

Ссылка

Ответ на: комментарий от drBatty 12.04.13 13:41:07 MSK

Нет уж, ты за базар отвечай - когда конкретно call быстрее jmp при прочих равных условиях? Код с TCO не будет «заметно больше», там будет максимум код для сдвига аргументов вызова в начало фрейма.

anonymous
(12.04.13 21:34:02 MSK)

Ссылка

Ответ на: комментарий от anonymous 12.04.13 17:00:09 MSK

Ну так а ты проверь на несбалансированном.

смысл? ладно, убедили, правый узел рекурсивно обходить не нужно. Что это даёт? Да ничего, только экономию стека в случае, если дерево кренит ВСЕГДА вправо (а где IRL такое бывает?). Причём очевидно, что хоть размер стека и определяется левой высотой, но вот время всё равно будет определяться максимальной. Т.е. профита от такого дерева тоже не будет. Не нужно.

~~drBatty~~ ★★
(13.04.13 08:37:27 MSK)

Ответ на: комментарий от dave 12.04.13 17:06:58 MSK

А больше двоичное дерево ты никак и не обойдешь. Вариантов нет. Либо кушаешь стек по рабоче-крестьянски через прямую рекурсию, либо кушаешь кучу, но хитровывернуто как истый антилигент через TCO и продолжения.

нет. сбалансированное дерево обойду. Например стека на 64 эл-та мне хватит для обхода красночёрного дерева с 4294967296 узлами, а если дерево сбалансировано получше, то и с 9223372036854775808 узлами. Что мешает мне сделать стек скажем на 256 эл-тов, и обойти ВСЕ АТОМЫ этой вселенной?

~~drBatty~~ ★★
(13.04.13 08:40:57 MSK)

Ответ на: комментарий от drBatty 13.04.13 08:40:57 MSK

Про вселенную ты загнул, а вот остальное не противоречит тому, что я написал. Мой посыл был о другом.

~~dave~~ ★★★★★
(13.04.13 08:55:31 MSK)

Ответ на: комментарий от dave 13.04.13 08:55:31 MSK

Про вселенную ты загнул

хорошо, пусть будет «видимая вселенная». Размер стека растёт как log₂ от числа узлов, и это можно строго доказать. Потому стек на 256 эл-тов хватит для ЛЮБОГО числа узлов, если они хранятся в памяти (в любой памяти, если конечно там не плотнее 1 бит/атом, и если атомов не более, чем в видимой вселенной).

А вот если дерево несбалансировано, то стек может и линейно расти. Тут да, проблема.

Мой посыл был о другом.

о чём же?

~~drBatty~~ ★★
(13.04.13 09:23:47 MSK)

Ответ на: комментарий от drBatty 13.04.13 09:23:47 MSK

Извини, не хочу я сейчас балаболить :)

~~dave~~ ★★★★★
(13.04.13 10:23:48 MSK)

Ссылка

Ответ на: комментарий от drBatty 13.04.13 09:23:47 MSK

о чём же?

О том, что математике до лампочки, сколько там в какой-то вселенной атомов.

ilammy ★★★
(13.04.13 15:01:10 MSK)

Ответ на: комментарий от drBatty 13.04.13 08:37:27 MSK

Что это даёт?

А почему это должно что-то давать?

anonymous
(14.04.13 02:52:28 MSK)

Ссылка

Ответ на: комментарий от ilammy 13.04.13 15:01:10 MSK

О том, что математике до лампочки, сколько там в какой-то вселенной атомов.

а мне до лампочки, что там с твоей математикой. Я просто доказал, что при _любом_ числе узлов стек не переполнится. Этого достаточно.

~~drBatty~~ ★★
(14.04.13 10:20:27 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 →

←	Rust, tail call optimization

Development

Библиотека облегченной работы с tk из ruby

→

Похожие темы