Компиляция

0

0

В заметке "Как происходит компиляция" (автор Mike Diehl, перевод А.Тарасова) подробно объясняется ход процесса компиляции исходного текста в исполняемую программу. В первой части рассмотрены этапы компиляции, выполняемые компилятором GCC - обработка препроцессором, трансляция, ассемблирование и линковка. Во второй части процесс линковки рассмотрен более подробно. Также описаны системные вызовы Linux и то, как компилятор GCC проводит оптимизации.

>>> Подробности

Ссылка

←	Неукротимая поступь Open Source....

Вышел NetBeans 6.5

→

← 1 2 →

Хотелось бы подробностей, как внутри устроен GCC. И как прикрутить свой фронтенд к кодогенератору GCC, вроде такого:http://languagemachine.sourceforge.net/gcc_interface.htm, + сравнение кодогенераторов GCC/LLVM/whatever

anonymous
(20.11.08 14:36:14 MSK)

Ссылка

А как собрать программку с другим libc? "заменить C runtime library" по умолчанию. Почему при сборке хелловорда линкуется с /lib/libc.so.6, как собрать с http://www.fefe.de/dietlibc/, например, и т.п.

anonymous
(20.11.08 14:50:03 MSK)

Ссылка

Ответ на: комментарий от question4 20.11.08 01:44:39 MSK

> 1. Зачем компилятор разворачивает цикл в 5 команд печати?

man unroll loops. jmp -- неудобная для кеша команда, "размотанные циклы" без jmp'ов работают быстрее.

> 2. В последней программе подряд идут pushl %ecx и popl %ecx. Зачем они нужны?

man stack frame, frame pointer.

хотя тема кодогенерации gcc не раскрыта, похоже на лишние инструкции. Многие пишут, что кодогенератор у gcc 2.93/gcc 3 получше, чем у gcc 4 -- "лишних инструкций" меньше.

anonymous
(20.11.08 15:05:16 MSK)

Ответ на: комментарий от Crew 20.11.08 01:54:43 MSK

> Последовательные команда быстрее цикла, т.к. не нужно помнить адрес возвращения в начало цикла и переходить туда.

потому что переход может сбросить кеш (или не сбросить, если сработает branch prediction). В целом, jmp и шитый код не удобны для кеша.

anonymous
(20.11.08 15:07:12 MSK)

Ссылка

Ответ на: комментарий от anonymous 20.11.08 10:12:13 MSK

> Классику надо читать. http://lib.mexmat.ru/books/2444

1986 год, при всём уважении к классикам. Сейчас можно посоветовать "Modern Compiler Implementation"
http://www.devincook.com/goldparser/articles/other-parsers.htm
, почитать в википедии про Packrat , PEG http://en.wikipedia.org/wiki/Parsing_expression_grammar , монадические парсеры,Tom, GLR парсеры и т.п
http://en.wikipedia.org/wiki/Comparison_of_parser_generators .

anonymous
(20.11.08 15:14:53 MSK)

Ответ на: комментарий от Orlusha 20.11.08 14:12:23 MSK

> в сановском пакете компиляторов специальный промежуточный язык, а не ассемблер. В этом вопросе возможны разные подходы

в православном GCC тоже есть промежуточный язык, из которого потом генерируется ассемблер конкретной целевой платформы. Это всё равно компиляция, хоть на входе будут и жаба с валой -- всё равно генерится сразу или трансляцией через си промежуточное представление, потом уже на выходе конкретный ассемблер. В итоге, чтобы перенацелить на новый процессор, не надо переписывать кодогенератор -- достаточно задать описание команд этого нового процессора на своём языке. Сравните, например, кодогенераторы OpenWatcom и GCC.

anonymous
(20.11.08 15:20:39 MSK)

Ссылка

Ответ на: комментарий от anonymous 20.11.08 15:14:53 MSK

> почитать в википедии про Packrat , PEG... [много умных слов skipped]

А нельзя ли более сжато тыкнуть на современные методы компилляции? Все эти восходящие грамматики, парсеры-распарсеры конечно интересно, но только в узких кругах широкой академической среды. Нам бы что-то, что уже доказанно превосходит другие техники и является перспективным подходом. Пожалуйста. :)

matumba ★★★★★
(20.11.08 17:28:48 MSK)

Сцуки! Я даже по сцылке кликнул. Довели.

anonymous
(20.11.08 18:06:34 MSK)

Ссылка

Ответ на: комментарий от anonymous 20.11.08 00:52:29 MSK

> как минимум три (mov+dec+jz/jnz)

одна: loop

dk2
(20.11.08 18:26:11 MSK)

Ответ на: комментарий от dk2 20.11.08 18:26:11 MSK

>одна: loop

а как же присвоение счетчика ecx? так что как минимум две

anonymous
(20.11.08 19:35:09 MSK)

Ссылка

Ответ на: комментарий от anonymous 20.11.08 15:05:16 MSK

>> подряд идут pushl %ecx и popl %ecx

> хотя тема кодогенерации gcc не раскрыта, похоже на лишние инструкции. Многие пишут, что кодогенератор у gcc 2.93/gcc 3 получше, чем у gcc 4 -- "лишних инструкций" меньше.

То самое, что Торвальдс назвал "вставляет мусор"?

question4 ★★★★★
(20.11.08 20:07:31 MSK)

Ответ на: комментарий от question4 20.11.08 20:07:31 MSK

>одна: loop

хм..
когда я на асме проги писал loop была медленней чем:

@@1:
...
dec ax
jnz @@1

сейчас что, уже нет?

anonymous
(20.11.08 22:54:34 MSK)

Ответ на: комментарий от matumba 20.11.08 17:28:48 MSK

>Нам бы что-то, что уже доказанно превосходит другие техники и является перспективным подходом. Пожалуйста. :)

голова и руки. не за что.

anonymous
(21.11.08 00:15:42 MSK)

Ответ на: комментарий от matumba 20.11.08 10:53:19 MSK

>"компилляция"

лолщито?

anonymous
(21.11.08 00:18:18 MSK)

Ссылка

Ответ на: комментарий от anonymous 20.11.08 00:52:29 MSK

>Если if (i<=5) это две команды, а если цикл, то при оптимизации по >скорости как минимум три (mov+dec+jz/jnz) как минимум две. mov мог сделаться задолго до начала цикла и его можно не считать (действительно - зачем его считать, если он исполняется 1 раз а dec + jnz 20 миллионов раз?)

anonymous
(21.11.08 00:27:05 MSK)

Ссылка

Ответ на: комментарий от anonymous 20.11.08 22:54:34 MSK

> когда я на асме проги писал loop была медленней чем:

>@@1:
>...
>dec ax
>jnz @@1

> сейчас что, уже нет?

Неоднокрано слышал сетования ассемблерщиков, что зависит от процессора. Вплоть до того, что на 3-м пентиуме выгодно одно, на 4-м — другое. Не проверял.

question4 ★★★★★
(21.11.08 03:43:36 MSK)

Ответ на: комментарий от anonymous 21.11.08 00:15:42 MSK

>>Нам бы что-то, что уже доказанно превосходит другие техники и является перспективным подходом. Пожалуйста. :)

> голова и руки. не за что.

Да пытался уже! Лучше обычного конечного автомата пока не нашёл.
Хотя может это и есть идеал. :)

matumba ★★★★★
(21.11.08 11:50:55 MSK)

Ссылка

Ответ на: комментарий от question4 21.11.08 03:43:36 MSK

просто dec/jnz распараллеливаются по UV-пайпам и выполняются одновременно, за 1 такт. А loop чуть медленнее и требует ecx

anonymous
(21.11.08 15:43:05 MSK)

Ответ на: комментарий от anonymous 21.11.08 15:43:05 MSK

киньте ссылку на какую-нить книгу по асму на русском. желательно чтоб и о pm там было, а лучше чтоб вообще только о pm. то есть книгу не для начинающих... спсб.

anonymous
(21.11.08 18:10:57 MSK)