Компиляция для самых маленьких

0

2

Всем привет и с наступающим Новым Годом :)

Объясните «популярно», пожалуйста, какая разница между python -m py_compile «%f» и gcc source.c, и что такое вообще «машинный код», а что «байт-код»? И почему source.pyc это исполняемый python байт-код, а а.out — исполняемый, кроме того, что к a.out дописан этот байт.

Ссылка

←

дедовщина

закрой, быстро закрой!!!

→

байт код не зависит от архитектуры процессора, а в исполняемом уже конкретные машинные команды

anonymous_sapiens ★★★★★
(29.12.13 00:27:33 MSK)

Чем не объяснение http://en.wikipedia.org/wiki/Bytecode ?

UVV ★★★★★
(29.12.13 00:27:37 MSK)

Ссылка

man архитектура_процессора
Машинный код выполняет твой процессор, а байт-код транслируется виртуальной машиной в команды твоего процессора.

CYB3R ★★★★★
(29.12.13 00:43:00 MSK)

Ссылка

Собственно, всё уже сказали. Чуть более точно:

исходный код - человекочитаемый (plain text), прямому исполнению не подлежит (надо скомпилировать)
байт-код - машиночитаемый (бинарный), прямому исполнению не подлежит (надо запускать в интерпретаторе)
машинный код - машиночитаемый (бинарый), подлежит исполнению на процессоре

Иногда исходный код интерпретируется напрямую (python source.py), но внутри всё равно происходит трансляция в почти_байт-код.

intelfx ★★★★★
(29.12.13 01:56:09 MSK)

Ответ на: комментарий от intelfx 29.12.13 01:56:09 MSK

Спасибо за пояснения. А как насчет PyPy? Что такое Jit-компиляция?

Pa
(29.12.13 01:59:31 MSK) автор топика

Ответ на: комментарий от anonymous_sapiens 29.12.13 00:27:33 MSK

байт код не зависит от архитектуры процессора

это _нормальный_ байткод не зависит.....

~~stevejobs~~ ★★★★☆
(29.12.13 02:02:55 MSK)

Ответ на: комментарий от Pa 29.12.13 01:59:31 MSK

пробовал погуглить?

~~stevejobs~~ ★★★★☆
(29.12.13 02:03:53 MSK)

Ответ на: комментарий от Pa 29.12.13 01:59:31 MSK

JIT - это особый вид интерпретации, когда байт-код непосредственно перед исполнением компилируется в машинный код, и исполняется уже машинный. Причём компилируется по кускам: грубо говоря, при первом вызове функции foo() она компилируется, результат кладётся в кэш и сразу же выполняется.

Другими словами, это компиляция, но без сохранения результата на диск. Делают так, чтобы совместить преимущества компиляции (высокая скорость) и интерпретации (универсальность - не нужно делать 9000 бинарников под все архитектуры процессоров).

intelfx ★★★★★
(29.12.13 02:08:10 MSK)

Ответ на: комментарий от stevejobs 29.12.13 02:02:55 MSK

Если байт-код зависит от CPU, то толку от такого байт-кода ноль. :)

intelfx ★★★★★
(29.12.13 02:09:30 MSK)
Последнее исправление: intelfx 29.12.13 02:10:14 MSK (всего исправлений: 1)

Ответ на: комментарий от intelfx 29.12.13 02:09:30 MSK

расскажи это питонщикам, ллвмщикам, и другим)

~~stevejobs~~ ★★★★☆
(29.12.13 02:15:58 MSK)

Ответ на: комментарий от stevejobs 29.12.13 02:15:58 MSK

Реквестирую пруфлинки что у питона и llvm байт-код машино-зависим. По-моему, ты не прав.

true_admin ★★★★★
(29.12.13 02:25:58 MSK)

Ответ на: комментарий от stevejobs 29.12.13 02:03:53 MSK

Пробовал, потому и прошу «популярно» объяснить что к чему.

Pa
(29.12.13 02:37:43 MSK) автор топика

Ответ на: комментарий от true_admin 29.12.13 02:25:58 MSK

Ну давай включим логику. Что произойдет с ллвм если на целевой платформе поменяется размер указателей? ABI для внешних вызовов стопудово надо соблюдать. С floating point надо что-то делать. В цепочке lang->HIR->LIR->ASM, LIR вообще непортабелен. Любые сайзофы непортабельны. Даже при переходе в HIR делаются оптимизации, которые могут не заработать на другой платформе (заработать как-то не так), и технически нельзя будет отреверсить назад в изначальный lang так чтобы восстановить изначальный смысл и пересобрать.

Компромат на питонщиков надо спросить у питонщиков)

~~stevejobs~~ ★★★★☆
(29.12.13 02:37:55 MSK)

Ссылка

Ответ на: комментарий от true_admin 29.12.13 02:25:58 MSK

г-ди б-же, погуглил, об этом даже в факе есть: http://llvm.org/docs/FAQ.html#can-i-compile-c-or-c-code-to-platform-independe...

~~stevejobs~~ ★★★★☆
(29.12.13 02:39:22 MSK)

Ответ на: комментарий от stevejobs 29.12.13 02:39:22 MSK

У питона подобных проблем нет, если он в нативщину не лезет.

PolarFox ★★★★★
(29.12.13 02:40:43 MSK)

Ссылка

Ответ на: комментарий от intelfx 29.12.13 02:08:10 MSK

Jit — компилируется в машинный код, сохраняется в кэше (процессора?) чтобы потом повторно выполнится или при повторном запросе к foo() оно снова скомпилируется?

Pa
(29.12.13 02:42:01 MSK) автор топика

Ответ на: комментарий от Pa 29.12.13 02:37:43 MSK

Когда запускаешь прогу, «виртуальный процессор» (н-р JavaVM) выполняет твой байткод. При этом он может тормозить. Одновременно измеряется, какие куски программы выполняются чаще всего. Эти куски компилируются в код уже «реального» процессора, (н-р Intel Pentium). Реальный процессор может работать быстрее. Скорость проги повышается. Так понятно?

~~stevejobs~~ ★★★★☆
(29.12.13 02:46:13 MSK)

Ответ на: комментарий от stevejobs 29.12.13 02:46:13 MSK

Так понятно?

Нет.

Байткод ведь выглядит как единицы и нули, машинный код выглядит так же? Ладно, я понял что бесперспективен. :(

Pa
(29.12.13 02:56:23 MSK) автор топика

Ответ на: комментарий от Pa 29.12.13 02:56:23 MSK

выражаясь гсм-но, единицы и нули, образующие узоры. Узоры разные. Каждый для своего дела. Какие конкретно дела - надо разбираться отдельно для каждого кода.

~~stevejobs~~ ★★★★☆
(29.12.13 03:03:37 MSK)

Ссылка

Ответ на: комментарий от Pa 29.12.13 02:42:01 MSK

Не, кэш процессора - это сильно ниже. У интерпретатора есть свой «кэш» - т. е. место, куда кладутся скомпилированные куски, чтобы при повторном обращении к foo() не компилить заново, а исполнить сразу.

В этом и весь профит компиляции как таковой (что JIT, что обычной) - компилировать долго, зато полученный машинный код исполняется сверхбыстро, потому что сразу на процессоре.

intelfx ★★★★★
(29.12.13 03:50:23 MSK)

Ссылка

Ответ на: комментарий от Pa 29.12.13 02:56:23 MSK

Только машинный код может прочитать и выполнить непосредственно процессор. То есть если пренебречь некоторыми нюансами можно указать процессору на начала кода и сказать выполняй - и он выполнит. А с байткодом такая вещь не пройдет. Его сможет прочитать и исполнить только виртуальная машина.

aiive ★
(29.12.13 04:55:54 MSK)

В общем, ТС, суть в том, что байткод исполняет его интерпретатор (и только потом всё это исполняет процессор), а машинный код процессор выполняет напрямую.

Поэтому в спорах скриптобогов против компиляльщиков побеждают всегда компиляльщики.

(за исключением редких случаев, например, когда интерпретатор может разбить switch на +1 параметр к функциям и +n функций для каждого из кейсов - тем самым уменьшая время вызова конкретного метода. Компиляторы так пока не умеют - им недоступен статистический анализ самых выполняемых кусков программы в рантайме).

Adonai ★★★
(29.12.13 09:29:49 MSK)
Последнее исправление: Adonai 29.12.13 09:30:28 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от aiive 29.12.13 04:55:54 MSK

Ну вот ты все понял. Только для случая x86, то что называют машинным кодом, также является байт-кодом только его интерпретатор реализован уже в самом процессоре.

naszar ★
(29.12.13 10:01:19 MSK)

Ссылка

Ответ на: комментарий от stevejobs 29.12.13 02:39:22 MSK

об этом даже в факе есть

Там про C и C++. Никто не мешает тебе использовать фиксированные типы.

true_admin ★★★★★
(29.12.13 14:23:28 MSK)

Ссылка

Ответ на: комментарий от stevejobs 29.12.13 02:39:22 MSK

Короче, проблема не в том что llvm генерит непортабельный биткод. Как раз он-то портабелен потому что пишется под сферический процессор в вакууме.

true_admin ★★★★★
(29.12.13 14:26:54 MSK)

Ответ на: комментарий от true_admin 29.12.13 14:26:54 MSK

~~Есть два стула - на одном карандаши точёные~~ Есть две платформы - на одной есть аппаратный floating point, на другой нету. Должен ли быть байткод одинаковым?

~~stevejobs~~ ★★★★☆
(29.12.13 17:10:58 MSK)

Ответ на: комментарий от stevejobs 29.12.13 17:10:58 MSK

Должен ли быть байткод одинаковым?

У LLVM байткод пишется не для платформы, а для некого виртуального процессора. Там есть, например, поддержка 128-битных целых, причём, вне зависимости от того поддерживает ли это хост. Если что — будет сэмулировано.

В этом-то вся и фишка — байткод это всего лишь скомпилированный код на «языке llvm». Ты всегда можешь декомпилировать его через llvm-dis и получить ровно то же самое что и было. Или выполнить через lli (оно даже jit поддерживает).

true_admin ★★★★★
(29.12.13 18:52:13 MSK)