LLVM 3.0

1

3

30.11.2011 в свет вышла очередная версия фреймворка для построения компиляторов и виртуальных машин.

Википедия
Low Level Virtual Machine (LLVM) — универсальная система анализа, трансформации и оптимизации программ, реализующая виртуальную машину с RISC-подобными инструкциями. Может использоваться как оптимизирующий компилятор этого байткода в машинный код для различных архитектур либо для его интерпретации и JIT-компиляции (для некоторых платформ).

Проект LLVM официально включает в себя следующие основные проекты:

LLVMCore - библиотеки для обеспечения платформонезависимой оптимизации и кодогенерации под различные виды процессоров и платформ;
CLang - компилятор языков C/C++/Objective-C для LLVM;
dragonegg - объединяет в себе парсер GCC-4.5 и оптимизацию и кодогенерацию на основе библиотек LLVM;
LLDB - дебаггер, использует Clang и LLVM;
libc++ - реализация стандартной библиотеки C++ (включает неполную поддержку стандарта C++11);
vmkit - реализация языков Java и .Net для LLVM;
SAFECode - память-безопасный компилятор С/С++.

Помимо упомянутых официальных проектов существует большое количество проектов, которые используют LLVM для компиляции программ для таких языков как Ruby, Python, Haskell, Java, D, PHP, Lua и т.д.

Основные изменения:

llvm-gcc больше не поддерживается, рекомендуется использовать clang или dragonegg;
LLVM IR (intermediate representation - платформонезависимый ассемблер для LLVM) включает в себя полную поддержку атомарных операций с памятью (load, store, compare, exchange, read/modify/write, etc.);
полностью переделан механизм обработки исключений в LLVM IR;
полностью переделана система типов LLVM IR;
MIPS backend доведён до production quality;
...

Полный и подробный перечень изменений можно посмотреть в подробностях.

В настоящее время для скачивания доступен только исходный код (через svn). В ближайшее время на сайте в списке закачек ожидается появление бинарных сборок и тарболла.

>>> Подробности (англ.)

Ссылка

← GNUnet 0.9.0

Реализован порт LinuxTV под Windows →

← 1 2 3 4 5 6 7 →

Ура ура ура. Кстати, libcxx прекрасно на линуксе работает, хотя и написано, что она только на макоси поддерживается. Но блин, хочу лямбды!

Gorthauer ★★★★★
(01.12.11 01:15:54 MSK)

На общем «кислом» фоне, наконец-то, действительно положительная новость.

И главное - как вовремя новая версия вышла // это уже с личной, «потребительской» точки зрения ;)

~~OldFatMan~~ ☆
(01.12.11 01:25:16 MSK)

Ссылка

C++0x

C++11 оно теперь называется

unfo ★★★★★
(01.12.11 01:52:00 MSK)

Ссылка

С++11, кстати, не полностью поддерживается.

http://clang.llvm.org/cxx_status.html

encyrtid ★★★★★
(01.12.11 08:04:55 MSK)

Ссылка

НУЖНО!

Dark_SavanT ★★★★★
(01.12.11 11:40:13 MSK)

Ссылка

Классная новость! Теперь D можно пересобрать с третьей версией и забыть про Си как страшный сон страуса.

matumba ★★★★★
(01.12.11 11:44:16 MSK)

память-безопасный

Классное словосочетание)

~~CKPbIT_HUK~~
(01.12.11 11:45:58 MSK)

Ссылка

Объясните смысл этой системы? Если интерпретировать llvm-байткод, то производительность хромает.

Если же компилировать его на лету под заданную архитектуру, то опять производительность будет хромать, т.к. когда исходники компилировались в байт-код, делались предположения об архитектуре реального процессора, такие как число команд за такт и возможности распараллеливания. И по-видимому, если взять один и тот же байткод, и запускать его на VLIW процессорах и обычных, то как минимум в одном из этих двух случаев будут тормоза

cvs-255 ★★★★★
(01.12.11 12:15:36 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:15:36 MSK

Объясните смысл этой системы?

Готовый бэкенд для компиляторов. Достаточно написать компилятор в llvm — можно будет компилировать под любую платформу, поддерживаемую llvm

~~stack_protector~~
(01.12.11 12:18:17 MSK)

Ответ на: комментарий от Gorthauer 01.12.11 01:15:54 MSK

Но блин, хочу лямбды!

во во, без лямбд оно пока что не очень годно

dt1 ★★
(01.12.11 12:19:33 MSK)

Ссылка

Ответ на: комментарий от stack_protector 01.12.11 12:18:17 MSK

Достаточно написать компилятор в llvm — можно будет компилировать под любую платформу, поддерживаемую llvm

Я выразил сомнения по поводу производительности, как мне кажется, обоснованные.

cvs-255 ★★★★★
(01.12.11 12:20:08 MSK)

для таких языков как Ruby, Python, Haskell, Java, D, PHP, Lua

да... LLVM - супер технология! базовая, очень важная, прогресс => светлое линукс-будущее

если не секрет, подскажите самый основной проект LLVM+Python? мне любопытно насколько он быстр и совместим ли с PyQt/PySide и т.п.

I-Love-Microsoft ★★★★★
(01.12.11 12:35:13 MSK)

Ответ на: комментарий от I-Love-Microsoft 01.12.11 12:35:13 MSK

они же пилят пипи

namezys ★★★★
(01.12.11 12:37:15 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:20:08 MSK

Так в отличие от жавы, результатом компиляции является не байт-код. а native, под конкретную архитектуру. Или я неправ?

Dark_SavanT ★★★★★
(01.12.11 12:37:16 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:15:36 MSK

С чего это при выдаче llvm-ассемблера должно быть предположение о конечной архитектуре?

namezys ★★★★
(01.12.11 12:38:19 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:15:36 MSK

Так оно на той же самой машине и компилится в байткод и байткод транслирует в машинный код. Байткод нужен в качестве кроссплатформенного ассемблера, чтобы разработчики фронтендов не беспокоились о поддержке кучи архитектур.

buddhist ★★★★★
(01.12.11 12:38:28 MSK)

Ответ на: комментарий от Dark_SavanT 01.12.11 12:37:16 MSK

можно рассмотреть систему как классический многостадийный компилятор

namezys ★★★★
(01.12.11 12:38:49 MSK)

Ссылка

Ответ на: комментарий от Gorthauer 01.12.11 01:15:54 MSK

Когда я пытался разбираться в коде коллеги, который ни с того ни с сего стал писать на C++11 и активно использовал лямбды я не мог не желать ему смерти.

buddhist ★★★★★
(01.12.11 12:39:48 MSK)

Ответ на: комментарий от namezys 01.12.11 12:38:19 MSK

С чего это при выдаче llvm-ассемблера должно быть предположение о конечной архитектуре?

должны быть предположения об возможности распараллеливания

cvs-255 ★★★★★
(01.12.11 12:40:12 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:15:36 MSK

когда исходники компилировались в байт-код, делались предположения об архитектуре реального процессора, такие как число команд за такт и возможности распараллеливания

Эмм... ты точно понимаешь, что такое байт-код?

pitekantrop ★★★
(01.12.11 12:40:19 MSK)

Ответ на: комментарий от buddhist 01.12.11 12:39:48 MSK

Когда я пытался разбираться в коде коллеги, который ни с того ни с сего стал писать на С вместо asm, я не мог не желать ему смерти.

FIX

namezys ★★★★
(01.12.11 12:41:08 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:40:12 MSK

должны быть предположения об возможности распараллеливания

Распараллеливания чего?

namezys ★★★★
(01.12.11 12:41:48 MSK)

Ссылка

Ответ на: комментарий от matumba 01.12.11 11:44:16 MSK

Все попытки забыть Си утыкаются в громадное количество сишных программ и библиотек, как утыкались в свое время попытки забыть Фортран. Однако, если для Фортрана еще можно было сделать f2c, то сделать какой-нибудь «c2d» не так уж просто, поскольку немалая часть кода на си — низкоуровневая.

buddhist ★★★★★
(01.12.11 12:42:09 MSK)

Ответ на: комментарий от pitekantrop 01.12.11 12:40:19 MSK

Тонкости неизвестны, но принцип знаю. И получается, что байт-код, оптимизированный для x86, с его 1-2 команды за такт, будет тормозить на итаниумах.

cvs-255 ★★★★★
(01.12.11 12:43:43 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:43:43 MSK

И получается, что байт-код, оптимизированный для x86, с его 1-2 команды за такт, будет тормозить на итаниумах.

С какого перепугу синтаксический транслятор занимается микрооптимизацией?

namezys ★★★★
(01.12.11 12:44:34 MSK)

Ответ на: комментарий от namezys 01.12.11 12:41:08 MSK

Имхо, не совсем справедливая ирония, поскольку С++ уже давно по нечитабельности обогнал хаскель.

Да, а в аду С++ программисты будут разбирать ошибки STL и Boost :)

buddhist ★★★★★
(01.12.11 12:44:43 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:43:43 MSK

Байткод не оптимизируется под архитектуру. Оптимизация производится при трансляции байткода в машинный код.

buddhist ★★★★★
(01.12.11 12:45:35 MSK)

Ответ на: комментарий от buddhist 01.12.11 12:45:35 MSK

вообще байткод не используется без необходимости

namezys ★★★★
(01.12.11 12:47:24 MSK)

Годно, нужно, одобряю!

m0rph ★★★★★
(01.12.11 12:48:17 MSK)

Ссылка

Ответ на: комментарий от cvs-255 01.12.11 12:43:43 MSK

Тонкости неизвестны, но принцип знаю.

Судя по тому, что ты пишешь — не очень.

pitekantrop ★★★
(01.12.11 12:48:44 MSK)

Ссылка

Ответ на: комментарий от namezys 01.12.11 12:44:34 MSK

LLVM реализует виртуальную RISC-машину (так говорит википедия). Если мы будем потом это исполнять на существенно отличающейся архитектуре, то тормоза неизбежны.

cvs-255 ★★★★★
(01.12.11 12:51:29 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:51:29 MSK

Ну укроти для начала дракона, что ли....

Компиляция всегда состоит из нескольких стадий:
* препроцессинг
* синтаксический анализ
* семантический анализ
* генерация кода

После семантического анализа промежуточное представление фактически уже не содержит не каких знаний о языке. Что gcc, что llvm генерит используют какое-то промежуточное представление в виде как-то абстрактной простой машине. Далее работает кодогенератор, переводя с промежуточного представления в машинный код.

Конечно, возможно, инфорацию о платформе можно использовать и на стадии семантического анализа, но в данный момент я не представляю, какую помощь при этом могут оказать эти данные

namezys ★★★★
(01.12.11 12:55:24 MSK)

Ответ на: комментарий от buddhist 01.12.11 12:44:43 MSK

в аду С++ программисты будут разбирать ошибки STL и Boost

А особо злостные грешники ещё и ace с loki? =)

GAMer ★★★★★
(01.12.11 12:57:27 MSK)

Ссылка

Ответ на: комментарий от cvs-255 01.12.11 12:51:29 MSK

Если мы будем потом это исполнять на существенно отличающейся архитектуре

А вот не надо это исполнять. Надо оттранслировать в нативный машинный код, попутно оптимизнув под целевую систему.

const86 ★★★★★
(01.12.11 12:57:39 MSK)

Ссылка

Ответ на: комментарий от namezys 01.12.11 12:37:15 MSK

да, в общем там костыльная реализация поддержки того же PyQt и тому подобного, питон странная платформа, куча реализаций, несовместимых...

I-Love-Microsoft ★★★★★
(01.12.11 12:58:59 MSK)

Ответ на: комментарий от namezys 01.12.11 12:55:24 MSK

и на стадии семантического анализа, но в данный момент я не представляю, какую помощь при этом могут оказать эти данные

В Z80 например со сложением работать в некоторых случаях удобнее, чем с вычитанием, так что заменить одно на другое с изменением знака вычитаемого может быть выгодно. В сильно ортогональных архитектурах конечно попроще.

GAMer ★★★★★
(01.12.11 13:00:23 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:51:29 MSK

Если мы будем потом это исполнять

Иди курить матчасть, в обычных условиях оно не исполняется, а компилируется в машинные коды. Виртуальная машина там -лишь прослойка между фронт- и бэкендом.

anonymous
(01.12.11 13:00:42 MSK)

Ссылка

Ответ на: комментарий от I-Love-Microsoft 01.12.11 12:58:59 MSK

на С++ тоже не совсем соестимы

namezys ★★★★
(01.12.11 13:01:21 MSK)

Ссылка

Ответ на: комментарий от namezys 01.12.11 12:37:15 MSK

да, и вообще, самая нормальная интеграция с нативщиной - у Mono(.net), это обычные дэлэлэ/сошки, вот так наверное и стоило делать Си-шные расширения для питона, а то странная ситуаций все равно получается - куча расширений совместимы с одной реализацией и не совместимы с другой

кажется я заблуждаюсь, поясните пожалуйста в чем :)

I-Love-Microsoft ★★★★★
(01.12.11 13:01:43 MSK)

Ответ на: комментарий от GAMer 01.12.11 13:00:23 MSK

В Z80 например со сложением работать в некоторых случаях удобнее, чем с вычитанием, так что заменить одно на другое с изменением знака вычитаемого может быть выгодно.

А компиляция в нативный код у нас тупая? Хотя тут конечно сложно проследить, что вычисления вычитаемого надо производить с учетом разного знака. Я думаю и семантический анализатор это не сделает

namezys ★★★★
(01.12.11 13:04:29 MSK)

Ссылка

Ответ на: комментарий от I-Love-Microsoft 01.12.11 13:01:43 MSK

проблема питона в том, что библиотеки написаны на С с учетом на некоторый API, который предоставляет язык для С либ

namezys ★★★★
(01.12.11 13:05:31 MSK)

Ответ на: комментарий от namezys 01.12.11 13:05:31 MSK

а, ясно, но питон же может простые dll/so подтягивать? ведь там можно как-то это приукрасить и упростить этот механизм со стороны языка? не? вот как в Mono сделано...

I-Love-Microsoft ★★★★★
(01.12.11 13:08:10 MSK)

Ответ на: комментарий от I-Love-Microsoft 01.12.11 13:08:10 MSK

Надо стнадартизовать, какминиум

namezys ★★★★
(01.12.11 13:08:55 MSK)

Ссылка

Ответ на: комментарий от namezys 01.12.11 13:05:31 MSK

и еще, например если расширение ориентировано на API Python 3.2 (просто от балды версия), но и в CPython и в PyPy и еще в другой реализации они будут гарантированно работать? они - расширения, модули (dll/so)... или какой там формат у расширений

I-Love-Microsoft ★★★★★
(01.12.11 13:11:09 MSK)

Ответ на: комментарий от namezys 01.12.11 12:55:24 MSK

Ну вот мы получили некоторое промежуточное представление. А затем мы его переводим не в машинные коды, а в байт-код. А лишь затем байт-код будет переводиться в машинный код. Если бы все процессоры были бы строго фон-Неймановскими машинами, то разницы бы не было. Но это не так. И если в коде есть участки, которые могут выполняться параллельно, то надо по-возможности их распараллелить. Но на архитектурах, выполняющих 2 и 22 команды за раз, это происходит несколько по-разному. А потому, если мы хотим оптимизации на разных архитектурах, то интерпретатор байт-кода должен быть «умным», т.е. динамически раскидывать байт-код на параллельные куски. Но при этом существенно теряется скорость => быстрый интерпретатор должен быть простым. А тогда он не сможет оптимизировать байт-код для разных архитектур

cvs-255 ★★★★★
(01.12.11 13:12:56 MSK)

Ответ на: комментарий от namezys 01.12.11 12:38:19 MSK

С чего это при выдаче llvm-ассемблера должно быть предположение о конечной архитектуре?

А ты его пробовал выдавать? IIRC, там как минимум зависимость от endianness.

tailgunner ★★★★★
(01.12.11 13:17:50 MSK)

Ответ на: комментарий от I-Love-Microsoft 01.12.11 13:11:09 MSK

Ну если была бы договоренность. Но пока достигнуть ее не получается, ибо CPythone сдена по принципу максимальной защищенности, а пипи скорости

namezys ★★★★
(01.12.11 13:17:50 MSK)

Ссылка

Ответ на: комментарий от cvs-255 01.12.11 13:12:56 MSK

А затем мы его переводим не в машинные коды, а в байт-код. А лишь затем байт-код будет переводиться в машинный код.

Какая разница? Не кто не обязывает компилятор инструкцию a+b неоптимизировать.

И если в коде есть участки, которые могут выполняться параллельно, то надо по-возможности их распараллелить.

Это называется микрооптимизация, им занимается кодогенератор, но не как не семантический транслятор. А кодогенератор не тупой. Если есть: a+b, c+d, он вполне догадается их раскидать на разные регистры. Кроме того, он даже может переставлять их местами.

Насчет затрат на трансляцию байт-кода в машинный, если уж интересно, рекомендую посмотреть, что такое JIT и HotSpot в жабе. Но к этой теме это отношение не имеет: llvm может выдовать код в нативном виде. Кроме того, результат работы кодогенератора можно кэшировать.

namezys ★★★★
(01.12.11 13:21:45 MSK)

Ответ на: комментарий от cvs-255 01.12.11 13:12:56 MSK

А тогда он не сможет оптимизировать байт-код для разных архитектур

Поэтому там не один оптимизатор. Один - во время препроцессинга, второй - во время преобразования байткода в машинный.

anonymous
(01.12.11 13:21:50 MSK)

Ссылка

Ответ на: комментарий от tailgunner 01.12.11 13:17:50 MSK

IIRC, там как минимум зависимость от endianness.

А при чем тут это?

namezys ★★★★
(01.12.11 13:22:39 MSK)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 4 5 6 7 →

← GNUnet 0.9.0

Open Source

Реализован порт LinuxTV под Windows →

Похожие темы