c: скорость компиляции

А спец. математические пакеты для сего извращения не годятся?

anonymous
(11.02.08 17:57:12 MSK)

Ответ на: комментарий от anonymous 11.02.08 17:57:12 MSK

Все на них и делается. Но численное интегрирование Вегасом проводится, он достаточно шустрый и по памяти оптимален. Проблема в том, что компиляторы на промежуточных выражениях загибаются...

Die-Hard ★★★★★
(11.02.08 18:10:42 MSK) автор топика

Ответ на: комментарий от Die-Hard 11.02.08 18:10:42 MSK

По теме ничего полезного не скажу, но что это за такое хитрое выражение, что его иначе как многомегабайтной строкой и не выразить?

anonymous
(11.02.08 18:14:36 MSK)

Исползуй D! Скорость компиляции примерно в 20 раз быстрее, чем gcc.

Все известные мне компиляторы C либо медленные (gcc), либо windows-only (DMC)...

naryl ★★★★★
(11.02.08 18:17:49 MSK)

Если есть время на реализацию, я бы сразу в машинный код это выражение транслировал. Алгоритм будет не намного сложнее трансляции в С (т.к. выражение простое). Есть такая библиотека, называется lightning, с её помощью машинный код генерировать очень просто. Или можно gasm использовать.

anonymous
(11.02.08 18:18:23 MSK)

Ответ на: комментарий от anonymous 11.02.08 18:14:36 MSK

> ...что это за такое хитрое выражение, что его иначе как многомегабайтной строкой и не выразить?

Я ж писАл:

>...По строчкам бить на суммы -- вроде, жрет, но ОЧЕНЬ долго (часы). Считает потом пару минут...

Имелось в виду нечто типа:

tmp=0.0;

tmp+=x[2]+(pow(x[2],1.22)-x[7])/x[2]+log(x[2])-10.0;

tmp+=....;

....

return tmp;

Die-Hard ★★★★★
(11.02.08 18:23:15 MSK) автор топика

Ответ на: комментарий от anonymous 11.02.08 18:18:23 MSK

> Алгоритм будет не намного сложнее трансляции в С

Ну, я ж не сам его в Си транслирую!

В принчипе, тоже выход, но меня интересует кроссплатформенность хотя бы по АМД и Интелу (включая Итаник).

Die-Hard ★★★★★
(11.02.08 18:26:44 MSK) автор топика

Ссылка

distcc ?

marsijanin ★★
(11.02.08 18:31:03 MSK)

Ответ на: комментарий от Die-Hard 11.02.08 18:23:15 MSK

>Имелось в виду нечто типа: >tmp=0.0; >tmp+=x[2]+(pow(x[2],1.22)-x[7])/x[2]+log(x[2])-10.0; >tmp+=....; Я имел в виду возможно ли завернуть эту бяку в цикл? Да, а что если попробовать fortran?

anonymous
(11.02.08 18:33:38 MSK)

Ответ на: комментарий от anonymous 11.02.08 18:33:38 MSK

>Имелось в виду нечто типа:
 >tmp=0.0; 
>tmp+=x[2]+(pow(x[2],1.22)-x[7])/x[2]+log(x[2])-10.0; 
>tmp+=....; 
Я имел в виду возможно ли завернуть эту бяку в цикл? 

Да, а что если попробовать fortran?

anonymous
(11.02.08 18:34:20 MSK)

Ответ на: комментарий от naryl 11.02.08 18:17:49 MSK

> Исползуй D!

В принципе, вроде, то, что надо...

А можно его в СИ подлинковать? То есть, чтобы main() был СИшным?

Die-Hard ★★★★★
(11.02.08 18:44:42 MSK) автор топика

Ответ на: комментарий от anonymous 11.02.08 18:34:20 MSK

> Я имел в виду возможно ли завернуть эту бяку в цикл?

Гы! Если б можно было, то и проблема не стояла бы.

> ...если попробовать fortran?

С него и начинали: Вегас-то на Фортране!. Все фортрановские компиляторы тормозят сильнее СИшных.

Die-Hard ★★★★★
(11.02.08 18:48:55 MSK) автор топика

Ссылка

Ответ на: комментарий от marsijanin 11.02.08 18:31:03 MSK

> distcc ?

Не тот случай. distcc просто разбрасывает препроцесснутые файлы по разным компам и там звет тот же gcc.

Die-Hard ★★★★★
(11.02.08 19:36:36 MSK) автор топика

Ссылка

Ответ на: комментарий от Die-Hard 11.02.08 18:44:42 MSK

>А можно его в СИ подлинковать? То есть, чтобы main() был СИшным?

Насколько я знаю, Ди линкуется с Си нативно. Но в деталях не разбирался.

~~KRoN73~~ ★★★★★
(11.02.08 19:38:47 MSK)

Ссылка

Выражение то простое -- напиши простенький парсер который сгенерирует ast в бинарном виде -- и маленький сишный код пусть это дерево вычислит в data-driven fashion. Конечно результирующий код будет в 2-3 раза медленнее, чем прямо скомпилированное выражение.

dilmah ★★★★★
(11.02.08 19:45:19 MSK)

Ответ на: комментарий от Die-Hard 11.02.08 18:23:15 MSK

> tmp+=x[2]+(pow(x[2],1.22)-x[7])/x[2]+log(x[2])-10.0;

Почему не скормить это калькулятору а-ля bc или dc ?

~~sdio~~ ★★★★★
(11.02.08 20:04:38 MSK)

Ответ на: комментарий от dilmah 11.02.08 19:45:19 MSK

> результирующий код будет в 2-3 раза медленнее...

Боюсь, больше чем в 2-3 раза медленнее...

Хотя, тоже выход. Надо подумать.

Дело в том, это не совсем мой проект, я просто коллегу консультирую, а он вообще не особо в программировании силен. Если я все же плотно подключусь, тогда буду плотнее думать. Наверное, действительно, самое эффективное будет в Гнутый ассемблер выражение гнать. Я сейчас прикинул -- gcc ассемблер с приемлемой скоростью жует.

Die-Hard ★★★★★
(11.02.08 20:05:29 MSK) автор топика

Ссылка

Ответ на: комментарий от sdio 11.02.08 20:04:38 MSK

> Почему не скормить это калькулятору а-ля bc или dc ?

Пару миллиардов раз? :-)

Это интегранд от 8-мерного интеграла.

Die-Hard ★★★★★
(11.02.08 20:08:51 MSK) автор топика

Ответ на: комментарий от Die-Hard 11.02.08 20:08:51 MSK

И что? bc вызвать один раз и лить ему по трубе команды

~~sdio~~ ★★★★★
(11.02.08 20:10:20 MSK)

Ответ на: комментарий от sdio 11.02.08 20:10:20 MSK

Поддерживаю sdio

cvv ★★★★★
(11.02.08 20:40:49 MSK)

TCC(Tiny C Compiler)? http://fabrice.bellard.free.fr/tcc/

anonymous
(11.02.08 20:51:01 MSK)

А почему бы интерполяцию не сделать, просчитать в нескольких точках и аппроксимировать каким-нибудь методом? Я так понял, что в принципе расчёт по этому выражению провести можно.

anonymous_incognito ★★★★★
(11.02.08 20:57:31 MSK)

Ответ на: комментарий от anonymous_incognito 11.02.08 20:57:31 MSK

> А почему бы интерполяцию не сделать, просчитать в нескольких точках и аппроксимировать каким-нибудь методом? Я так понял, что в принципе расчёт по этому выражению провести можно.

Оно все равно интегрируется -- т.е. то что ты предлагаешь -- это фактически угрубить сетку + использовать методы высокой степени -- видимо это и так делается по максимуму.

dilmah ★★★★★
(11.02.08 21:23:41 MSK)

Ответ на: комментарий от cvv 11.02.08 20:40:49 MSK

> Поддерживаю sdio

Боги, дайте мне йаду! :-)

Это текстовое выражение генерится Математикой -- она побыстрее bc считать умеет.

К сожалению, недостаточно быстро :(

Die-Hard ★★★★★
(11.02.08 21:56:07 MSK) автор топика

Ссылка

Ответ на: комментарий от dilmah 11.02.08 21:23:41 MSK

> ...то что ты предлагаешь -- это фактически угрубить сетку + использовать методы высокой степени -- видимо это и так делается по максимуму.

Разумеется!

Вообще, так скажу: речь идет о рекордных вычислениях на дорогом железе с использованием продвинутых математических методов.

Die-Hard ★★★★★
(11.02.08 22:00:12 MSK) автор топика

Ссылка

Ответ на: комментарий от anonymous 11.02.08 20:51:01 MSK

> Tiny C Compiler

Да, спасибо. Я про него знаю -- он немного быстрее gcc, но мне нужны порядки...

Die-Hard ★★★★★
(11.02.08 22:03:30 MSK) автор топика

Ссылка

Ответ на: комментарий от dilmah 11.02.08 19:45:19 MSK

> ...и маленький сишный код пусть это дерево вычислит в data-driven fashion.

Да, так и поступим.

Выше я чушь написАл -- в магазин торопился, не подумал... :-) Конечно, в этом направлении и надо было думать с самомго начала.

Die-Hard ★★★★★
(11.02.08 22:07:43 MSK) автор топика

Ссылка

Я в аналогичной ситуации свой кодогенератор писал. Тупой такой, без оптимизации, поверх промежуточной стековой машины (а не трёхадрессной, как все Си на x86). Сотни мегабайт кода за секунды молотило, а по скорости работы результата от Си раза в 3 всего отставало в самом худшем случае на double-ах.

anonymous
(11.02.08 22:14:05 MSK)

Ссылка

Может быть, какой-нибудь диалект C--?

Davidov ★★★★
(11.02.08 22:32:31 MSK)

Ответ на: комментарий от Davidov 11.02.08 22:32:31 MSK

Ещё тут недавно pcc откопали.

Davidov ★★★★
(11.02.08 22:35:56 MSK)

Ссылка

>> Есть эта самая функция в виде сишного выражения, дробно-рациональное выражение над double, pow() и log().

Я так понимаю что тут от возможностей языка C используется где-то 0.1%... дак почему бы не взять уже упомянутый tcc и по максимуму из него всё выкинуть? Или вообще написать свой собственный простой компилятор. Или написать транслятор этого выражения в ассемблер и скармливать nasm'у, fasm'у или ещё чему-нибудь быстрому?

Deleted
(11.02.08 22:51:13 MSK)

Ссылка

Там же наверно есть общие подвыражения?

Видимо и компилятор Си много тратит на их поиск.

dilmah ★★★★★
(11.02.08 23:04:20 MSK)

Ссылка

Ответ на: комментарий от Die-Hard 11.02.08 18:44:42 MSK

> А можно его в СИ подлинковать? То есть, чтобы main() был СИшным?

У твоей программки на D будет сишная main сгенерированная компилятором, которая вызывает твою main на D. D имеет все сишные типы и линкуется с C с помощью extern(C).

http://www.digitalmars.com/d/1.0/interfaceToC.html

Через GDC, который примерно в 2 раза медленнее, чем DMD получишь реализацию для всех процессоров, на которых есть gcc. Но стандартная библиотека доступна только на Win32/Linux/MacOS. AFAIK DMD есть только для x86.

mailto: cy (at) ngs (dot) ru

naryl ★★★★★
(11.02.08 23:45:53 MSK)

интересно, а любимая всеми jvm осилит? ;)

anonymous
(12.02.08 00:05:17 MSK)

Ссылка

Ответ на: комментарий от naryl 11.02.08 23:45:53 MSK

> mailto: cy (at) ngs (dot) ru

Thanks,

Я пока проникся идеей dilmah. Попробую просто исходное выражение в Польскую строку скомпилить и на поддающихся примерах сравнить скорость ее интерпретации с вычислением C-компилированного выражения. Если будет сопоставимо, можно будет чего поумнее придумать с триадами или ast. Если нет -- посмотрю на D.

Die-Hard ★★★★★
(12.02.08 00:17:44 MSK) автор топика

Ссылка

А как это выражение получается, если не секрет?

Просто поиграться хочется :)

alexru ★★★★
(12.02.08 00:19:41 MSK)

Ответ на: комментарий от alexru 12.02.08 00:19:41 MSK

> А как это выражение получается, если не секрет?

> Просто поиграться хочется :)

+1 Хотелось бы посмотреть поближе.

naryl ★★★★★
(12.02.08 00:39:10 MSK)

Ссылка

Ответ на: комментарий от alexru 12.02.08 00:19:41 MSK

> А как это выражение получается, если не секрет?

Хирый фейнмановский интеграл в альфа-представлении, sector decomposition. Коллега придумал стратегию, когда разбиение (вроде) всегда сходится. Код написан на Математике. В принципе, она это дело интегрирует, но долго, и потом надо будет на пару порядков сложность повысить. Возникла идея сектора считать Вегасом. Уперлось в то, что фортранные выражения, которые Математика генерит, компилятся (если по памяти не вылетают) часами.

Die-Hard ★★★★★
(12.02.08 00:55:02 MSK) автор топика

Ответ на: комментарий от Die-Hard 12.02.08 00:55:02 MSK

я думаю тебе нужно оттраслировать программу в какой нить язык типа forth для компилятора которого длина исходного кода не имеет значения.

bc/dc хоть и не компилер к примеру но ему наплевать на длину исходного кода. тоже касается postscript которому главное стек не переполнить.

cvv ★★★★★
(12.02.08 12:26:51 MSK)

Ответ на: комментарий от cvv 12.02.08 12:26:51 MSK

>я думаю тебе нужно оттраслировать программу в какой нить язык типа forth для компилятора которого длина исходного кода не имеет значения.

Если он выражение оттранслирует в Форт, то он точно также его оттраслирует и в машкоды сопроцессора ;) А это будет уже намного быстрее.

...

Вообще, я бы именно так делал. Вариант с tmp += ... - очень хорошо ложится на сопроцессор.

~~KRoN73~~ ★★★★★
(12.02.08 13:16:02 MSK)

Ответ на: комментарий от KRoN73 12.02.08 13:16:02 MSK

я о том что транслятор в другой язык может требовать заметно меньше памяти чем прямая компиляция...

cvv ★★★★★
(12.02.08 13:29:38 MSK)

Ответ на: комментарий от cvv 12.02.08 13:29:38 MSK

>я о том что транслятор в другой язык может требовать заметно меньше памяти чем прямая компиляция...

Нет. Трансляция в машкод FPU потребует столько же памяти, сколько в Форт, зато результат можно будет исполнить сразу. А в Форте придётся ту же трансляцию, из Форта в машкод (в лучшем случае, в худшем - в шитый код) потом проводить.

...

Зато, кстати, можно объединить. Сам транслятор сделать на Форте. Т.е. входной поток парсить Фортом, но не в Форт, а сразу через форт-ассемблер в машкод. Другое дело, что я не знаю, есть ли под Линуксом популярные Форты с форт-ассемблером, поддерживающим инструкции FPU. SP-Forth под Linux в каком-то подвешенном состоянии и я не помню, что у него с плавучкой.

~~KRoN73~~ ★★★★★
(12.02.08 13:41:21 MSK)

Ответ на: комментарий от KRoN73 12.02.08 13:41:21 MSK

Я думаю что если Die-Hard поделится примером реального кода мы че нить изобретем

cvv ★★★★★
(12.02.08 14:31:44 MSK)

Ссылка

Ответ на: комментарий от KRoN73 12.02.08 13:16:02 MSK

> Если он выражение оттранслирует в Форт, то он точно также его оттраслирует и в машкоды сопроцессора ;) А это будет уже намного быстрее.

Что-то мне имхается что посчитать это выражение интерпретатором будет эффективнее по времени чем оттранслировать и посчитать потом нативным кодом.

Полезный выхлоп от процесса с трансляцией будет только если посчитать одно и то же надо минимум два раза.

anonymous
(12.02.08 15:27:53 MSK)

Ответ на: комментарий от anonymous 12.02.08 15:27:53 MSK

> Полезный выхлоп от процесса с трансляцией будет только если посчитать одно и то же надо минимум два раза.

Если кто не заметил -- его надо будет считать _миллиарды_ раз.

Еще раз про проблему, максимально подробно и медленно :). Есть сложная функция f(x), где x -- многомерный вектор . Ее нужно проинтегрировать по единичному (супер)кубику решеткой. То есть, надо вычислить значение этой функции во всех узлах решетки. Интеграл для начала 8-мерный, надо хотя бы пару знаков. Для наивного суммирования шаг решетки нужно делать 100, следовательно, число узлов равно (10^2)^8=10^16. Разумеется, в реальности мы используем продвинутую интерполяцию, поэтому число узлов меньше, но все равно исчисляется миллиардами.

Die-Hard ★★★★★
(12.02.08 16:55:09 MSK) автор топика

А gcc используется с оптимизатором или без? Имхо всякую оптимизацию надо отключать. Она может подвесить компиляцию.

~~dave~~ ★★★★★
(12.02.08 17:09:14 MSK)

Ответ на: комментарий от anonymous 12.02.08 15:27:53 MSK

>Что-то мне имхается что посчитать это выражение интерпретатором будет эффективнее по времени чем оттранслировать и посчитать потом нативным кодом.

В случае нецикличности и одноразовости вычисления - да, однозначно.

~~KRoN73~~ ★★★★★
(12.02.08 17:54:12 MSK)

Ссылка

Ответ на: комментарий от Die-Hard 12.02.08 16:55:09 MSK

>Если кто не заметил -- его надо будет считать _миллиарды_ раз.

Да, тогда - только компиляция в натив :)

~~KRoN73~~ ★★★★★
(12.02.08 17:54:51 MSK)

Ссылка

По поводу скорости компиляции - с помощью этого: http://fabrice.bellard.free.fr/tcc/ умудрялись компилировать linux kernel при загрузке.

capricorn20 ★
(12.02.08 18:04:15 MSK)

Ответ на: комментарий от dave 12.02.08 17:09:14 MSK

> А gcc используется с оптимизатором или без?

Все оптимизации отключаются.

Похоже, с компиляцией кранты. Даже два порядка не помогут. Вчера запустил на большой машине более-менее "боевое" выражение (67 мег). Компилирует уже сутки, память потихонечку отжирается, уже 6 гиг скушано...

Die-Hard ★★★★★
(12.02.08 18:31:15 MSK) автор топика

Похожие темы