Вышел LLVM 3.1

llvm

После 6 месяцев, прошедших с выпуска LLVM 3.0, представлен очередной релиз проекта LLVM 3.1. LLVM (Low Level Virtual Machine) — универсальная система анализа, трансформации и оптимизации программ, реализующая виртуальную машину с RISC-подобными инструкциями. Может использоваться как оптимизирующий компилятор этого байткода в машинный код для различных архитектур либо для его интерпретации и JIT-компиляции (для некоторых платформ).

Некоторые изменения:

значительно расширена поддержка C++'11 в компиляторе Clang;
AddressSanitizer — инструмент для поиска ошибок работы с памятью, позволяющий обнаруживать типичные ошибки при программировании на Си и Си++, такие как выход за границы буфера и т.п.;
в генератор кода добавлена поддержка так называемых «связок инструкций», позволяющих значительно повысить качество генерируемого кода для архитектур процессоров VLIW;
улучшена работа MIPS и ARM бэкенда;
помимо основных функций, этот релиз включает в себя улучшение производительности, исправление ошибок и другие усовершенствования.

Напоминаю, что LLVM позволяет компилировать программы написанные на языках С, C++, Objective-C, Fortran, Ada, Haskell, Java, Python, Ruby, JavaScript, GLSL или любом другом, для которого реализован front-end. В рамках проекта разработан фронтенд Clang для языков C и C++ и версия GCC, использующие llvm в качестве бэкенда. В Glasgow Haskell Compiler также реализована компиляция посредством llvm, существует ещё множество программ, использующих данную инфраструктуру.

>>> Подробности

Ссылка

← Конкурент Raspberry Pi — мини-компьютер на базе Android от VIA за 49$

DevConf 2012 (Москва) — сформирована предварительная версия программы конференции →

← 1 2 3 4 →

Ответ на: комментарий от theos 23.05.12 18:58:53 MSK

Кому очевидно? Откуда вообще вы это взяли

ну чего вы такой непонятливый. читайте полностью:

llvm - байткод который выполняется эффективнее чем распространяемые бинарники собранные один раз и для всех => очевидно что llvm-байткодный дистрибутив ожидает нас

punya ★★
(23.05.12 19:09:11 MSK)

Ответ на: комментарий от punya 23.05.12 19:06:58 MSK

взял gcc/clang - собрал бинарник для своей расширенной архитектуры. проблем 0.

только долго, и исходники качать муторно. а тут скачал байткод и сделал то же самое, только быстрее. В этом, видимо, идея.

RedPossum ★★★★★
(23.05.12 19:12:50 MSK)

Ответ на: комментарий от punya 23.05.12 19:06:58 MSK

Уже говорили, но повторюсь: ты упорот.

encyrtid ★★★★★
(23.05.12 19:13:47 MSK)

Ссылка

Ответ на: комментарий от theos 23.05.12 19:01:29 MSK

И вообще, какая разница?

У стековых машин [потенциально] выше плотность кода. Регистровые потенциально кое-где побыстрее. В случае с LLVM, где байткод используется, как compiler IR, а не для дистрибуции, трейд-оффы отличаются от традиционных для виртуальных машин.

triampurum
(23.05.12 19:16:45 MSK)

в генератор кода добавлена поддержка так называемых «связок инструкций», позволяющих значительно повысить качество генерируемого кода для архитектур процессоров VLIW

МЦСТ смотрит с одобрением!

Xintrea ★★★★★
(23.05.12 19:27:37 MSK)

Ссылка

Ответ на: комментарий от punya 23.05.12 19:09:11 MSK

llvm - байткод который выполняется эффективнее чем распространяемые бинарники

Вы лично меряли?

очевидно что llvm-байткодный дистрибутив ожидает нас

Если бы пара процентов производительности была бы для всех на первом месте, все бы пользовались source-based дистрибутивами, что как мы замечаем, не так.

theos ★★★
(23.05.12 19:28:12 MSK)

Ответ на: комментарий от triampurum 23.05.12 19:16:45 MSK

У стековых машин [потенциально] выше плотность кода

Какая разница для реализации динамический языков.

Регистровые потенциально кое-где побыстрее.

При условии компиляции в native - нет (а именно так делает LLVM)

theos ★★★
(23.05.12 19:29:49 MSK)

Ссылка

Наконец-то он стал поддерживать ламбды, списки инициализации и прочие фичи 0x, которые до этого были только в GCC.

Deleted
(23.05.12 19:44:52 MSK)

Ссылка

Ответ на: комментарий от theos 23.05.12 19:28:12 MSK

libvpx которые кодирует и декодирует vp8 с включенными sse3 и sse4 будет иметь значительный прирост производительности т.к. сам алгоритм учитывает их

punya ★★
(23.05.12 19:46:19 MSK)

Ответ на: комментарий от tensai_cirno 23.05.12 17:10:28 MSK

Как это ничего? Все необходимые инструменты для JIT.

Deleted
(23.05.12 19:49:52 MSK)

Ответ на: комментарий от RedPossum 23.05.12 19:12:50 MSK

маловата мотивация для создания дополнитеьного уровня абстракции. я могу быть неправ но мне кажется что финансируют этот проект для возможности анального огораживания исходника: выложен только llvm байткод и он автоматически оптимизируется под каждую платфому

punya ★★
(23.05.12 19:56:32 MSK)

Ответ на: комментарий от pevzi 23.05.12 17:37:24 MSK

C, C++, Objective-C - clang. Fortran, Ada - DragonEgg (последний является плагином GCC), Java - в составе IcedTea и Vmkit, Python - Unladen Swallow и бэкенд для Pypy, Ruby - Rubinius, JavaScript - хз, GLSL - в составе знаешь-чего.

Deleted
(23.05.12 19:59:26 MSK)

Ответ на: комментарий от Anonymous 23.05.12 18:52:42 MSK

Думаю, что FreeBSD :-)

BeerSeller ★★★★
(23.05.12 20:13:57 MSK)

Ссылка

Ответ на: комментарий от Deleted 23.05.12 19:49:52 MSK

Как это ничего? Все необходимые инструменты для JIT.

Yes, but
«Similarly, it makes really-fast JITing hard. LLVM is fast compared to some other static C compilers, but it's not fast compared to real JIT compilers. Compiling one LLVM IR level instruction at a time can be relatively simple, ignoring the weird stuff, but this approach generates comically bad code.» http://lists.cs.uiuc.edu/pipermail/llvmdev/2011-October/043719.html
Рассказывает девелопер LLVM из Apple.

«First of all, we explored a lot of pros and cons of using LLVM for the JIT code generator. The initial choice to use LLVM was made because at the time none of us had significant experience with x86 assmebly, and we really wanted to support x86 and x86_64 and potentially ARM down the road. There were also some investigations of beefing up psyco, which I beleive were frusturated by the need for a good understanding of x86. Unfortunately, LLVM in its current state is really designed as a static compiler optimizer and back end. LLVM code generation and optimization is good but expensive. The optimizations are all designed to work on IR generated by static C-like languages. Most of the important optimizations for optimizing Python require high-level knowledge of how the program executed on previous iterations, and LLVM didn't help us do that.».
http://qinsb.blogspot.com/2011/03/unladen-swallow-retrospective.html
разработчики из Unladen Swallow.

triampurum
(23.05.12 20:17:26 MSK)

Ответ на: комментарий от triampurum 23.05.12 20:17:26 MSK

В LLVM для JIT нет PGO. Вот почему он уступает таким JIT, как HotSpot. Разработчики psyco столкнулись с необходимостью писать эту часть самостоятельно, словили острый когнитивный диссонанс и решили забить на всё. Но в основном по причине того, что Гугль оказался не заинтересован в быстром Питоне.

aist1 ★★★
(23.05.12 20:25:03 MSK)

Ответ на: комментарий от aist1 23.05.12 20:25:03 MSK

И еще. Перед глазами как-то пробегал кандидат на GSoC 2011, бравшийся впилить PGO в LLVM JIT, но что-то я об этом больше не слышал. Возможно, задача оказалась неподъемной.

aist1 ★★★
(23.05.12 20:29:25 MSK)

Ссылка

Ответ на: комментарий от aist1 23.05.12 20:25:03 MSK

В LLVM для JIT нет PGO. Вот почему он уступает таким JIT, как HotSpot. Разработчики psyco столкнулись с необходимостью писать эту часть самостоятельно

Ты хотел сказать «Unladen Swallow»?

tailgunner ★★★★★
(23.05.12 20:32:26 MSK)

Ответ на: комментарий от Deleted 23.05.12 19:59:26 MSK

Python - Unladen Swallow и бэкенд для Pypy

Оба проекта мертвы. Не знаю ни об одном живом Python-to-LLVM компиляторе - думаю, Python можно уверенно вычеркуть из списка поддерживаемых языков.

tailgunner ★★★★★
(23.05.12 20:34:54 MSK)

Ответ на: комментарий от tailgunner 23.05.12 20:34:54 MSK

Python-to-LLVM

*-to-LLVM

этот LLVM байт-код он кроссплатформенный?

RedPossum ★★★★★
(23.05.12 20:39:23 MSK)

Ответ на: комментарий от tailgunner 23.05.12 20:32:26 MSK

Да про него, могу путаться. Каюсь, конец рабочего дня. Начало рабой ночи :)

aist1 ★★★
(23.05.12 20:39:50 MSK)

Ссылка

Эти люди не уважают GCC

~~Sholy~~
(23.05.12 20:44:02 MSK)

Ссылка

Ответ на: комментарий от RedPossum 23.05.12 19:12:50 MSK

в общем случае llvm-байткод _платформозависим_.

yyk ★★★★★
(23.05.12 20:46:39 MSK)

Ссылка

Ответ на: комментарий от punya 23.05.12 19:46:19 MSK

с включенными sse3 и sse4

Использовать опционально использовать SSE3, SSE4 ему ничто не мешает и сейчас. Это уж не говоря о том, что для декодирования видео есть видеокарточка.

theos ★★★
(23.05.12 20:59:03 MSK)

Ссылка

Ответ на: комментарий от punya 23.05.12 18:29:23 MSK

Феерическая чушь. Ты не имеешь никакого понятия, что такое llvm, и как его применяют - изучи, пожалуйста. Подсказки: статический анализ, jit итп

Divius ★★
(23.05.12 21:04:59 MSK)

Ответ на: комментарий от RedPossum 23.05.12 20:39:23 MSK

этот LLVM байт-код он кроссплатформенный?

Конечно. Ты можешь смело копировать эти байты с одной платформы на другую - ничего с ними не сделается.

LamerOk ★★★★★
(23.05.12 21:07:34 MSK)

Ссылка

Ответ на: комментарий от RedPossum 23.05.12 20:39:23 MSK

Кроссплатформенно очень большое подмножество байт-кода, но не весь, т.к. он поддерживает inline assembler и платформозависимые инструкции.

И кроссплатформенность байткода != кроссплатформенность программ.

Deleted
(23.05.12 21:11:36 MSK)

Ссылка

Ответ на: комментарий от punya 23.05.12 19:06:58 MSK

вот то что вы сказали я ниразу не спорю. я указывал на понятное слово «native» которое указывает на применение всех фич моего процессора.

а какой у вас процессор?

~~AVL2~~ ★★★★★
(23.05.12 21:15:55 MSK)

Ссылка

Ответ на: комментарий от AVL2 23.05.12 17:30:06 MSK

Однопроходной компилятор-оптимизатор

зачем?

Допустим есть у тебя воспроизводимая логическая ошибка, тут ты на слабом железе за несколько секунд всё собираешь, запускаешь и смотришь, раз 10, и находишь нужную бяку. А если сборка занимает дофига в квадрате времени, то нужно изобретать что-то другое, велосипедное.

~~Napilnik~~ ★★★★★
(23.05.12 21:21:58 MSK)

Ответ на: Ага... от anonymous 23.05.12 18:56:17 MSK

А вот сейчас они (типы данных) так и скачут... Так и скачут... То int'ом, то float'ом прикидываются...

А int это сколько байт;)

~~Napilnik~~ ★★★★★
(23.05.12 21:23:51 MSK)

Ответ на: комментарий от Napilnik 23.05.12 21:23:51 MSK

Кстати да, раз уж начинается веселье. FAQ говорит, что «int X() { int i; return i; }» скомпилируется в «ret i32 undef». Значит ли это, что для x86 и x86_64 будет разное представление long long (и как следствие проблемы с переносимостью даже без ассемблерных вставок)?

u42
(23.05.12 21:38:40 MSK)

Ответ на: комментарий от Atlant 23.05.12 17:45:47 MSK

Atlant
пилится также фронтенд для FreePascal

пруф? у них глухо вроде как на этом фронте

unC0Rr ★★★★★
(23.05.12 22:02:56 MSK)

Ответ на: комментарий от Napilnik 23.05.12 21:23:51 MSK

Дык!

А int это сколько байт;)

Linux IA-32 4, Linux Intel 64 8, Linux IA-64 8, но мне это не мешает как-то. :)

anonymous
(23.05.12 22:05:19 MSK)

Ответ на: комментарий от Divius 23.05.12 21:04:59 MSK

у меня нет претензии к llvm как средствам анализа, реализации opencl (как было замечено кем-то вверху) и тд. внесу чоткости что меня бесит:

source-based дистрибутивы и так прекрасно работают. внутреннее представление данных в gcc используется только в gcc и не развивается в другую сторону => надежно. а из llvm делают монстра. любой его чих скажется на clang => ненадежно

punya ★★
(23.05.12 22:14:29 MSK)

Ответ на: комментарий от u42 23.05.12 21:38:40 MSK

Хммм...

Значит ли это, что для x86 и x86_64 будет разное представление long long (и как следствие проблемы с переносимостью даже без ассемблерных вставок)?

Странно, но всё же — http://software.intel.com/en-us/articles/size-of-long-integer-type-on-differe...

Если повар нам не врёт, ой, простите, Intel, то:

If it is important to you for integer types to have the same size on all Intel platforms, then consider replacing «long» by either «int» or «long long». The size of the «int» integer type is 4 bytes and the size of the «long long» integer type is 8 bytes for all the above combinations of operating system and architecture.

Цитата из ссылки выше.

anonymous
(23.05.12 22:17:11 MSK)

Ответ на: Дык! от anonymous 23.05.12 22:05:19 MSK

Linux Intel 64 8, Linux IA-64 8

man *LP64

~~wota~~ ★★
(23.05.12 22:24:19 MSK)

Ответ на: комментарий от punya 23.05.12 19:09:11 MSK

ох тепло!

Thero ★★★★★
(23.05.12 22:24:46 MSK)

Ссылка

Ответ на: комментарий от punya 23.05.12 19:06:58 MSK

тебе аватара мозг съела, добро пожаловать!

Thero ★★★★★
(23.05.12 22:26:59 MSK)

Ссылка

Ответ на: комментарий от wota 23.05.12 22:24:19 MSK

man *LP64

http://software.intel.com/en-us/articles/size-of-long-integer-type-on-differe...

А про 32 в курсе. ;)

anonymous
(23.05.12 22:30:13 MSK)

Ответ на: комментарий от punya 23.05.12 14:09:39 MSK

Мсье идиот? В детстве головой об пол роняли?

На уровне машинного кода можно делать только очень немногие, крайне примитивные оптимизации. Бегом курить хотя бы dragon book, лошара!

Кстати, для разминки, ознакомься с тем, на каком уровне промежуточного кода и какие оптимизации делает gcc. Очень удивишься.

anonymous
(23.05.12 22:32:01 MSK)

Ссылка

Ответ на: комментарий от iZEN 23.05.12 16:46:23 MSK

Однопроходной компилятор-оптимизатор доступен только для паскалеподобных языков со строгой статической системой типов.

Еще один идиот. Паскаль компилируется в один проход благодаря особенностям синтаксиса. Оптимизировать же в один проход его невозможно. Ознакомься, лошара, с темой. Даже банальный liveness analysis, без которого эффективно переменные по регистрам не раскидаешь, требует более одного прохода по CFG. Я уж не говорю про что-то более серьезное, типа SSA-преобразования, constant propagation и агрессивного DCE.

anonymous
(23.05.12 22:34:17 MSK)

Ссылка

Ответ на: комментарий от punya 23.05.12 18:17:54 MSK

Батенька, вы дебил. Клинический.

anonymous
(23.05.12 22:36:40 MSK)

Ссылка

Ответ на: комментарий от punya 23.05.12 18:29:23 MSK

с точки зрения пользователя что llvm есть его нет - глазу не заметно

Недоумок.

Пользователь llvm и clang - это программист. А ему очень даже заметно: более качественные сообщения об ошибках, возможности кросс-модульной оптимизации (включая глобальный DCE, это даже в последних gcc с его недоделанным LTO глючит адски), множество полезных пассов для анализа кода, унифицированное представление промежуточного кода, модульная архитектура, тупой как пробка plain C API и все такое прочее, чего в gcc никогда уже не будет.

anonymous
(23.05.12 22:39:03 MSK)

Ссылка

Ответ на: комментарий от anonymous 23.05.12 22:30:13 MSK

http://software.intel.com/en-us/articles/size-of-long-integer-type-on-differe...

«size of long integer»

~~wota~~ ★★
(23.05.12 22:39:14 MSK)

Ответ на: Дык! от anonymous 23.05.12 22:05:19 MSK

Linux IA-32 4, Linux Intel 64 8, Linux IA-64 8, но мне это не мешает как-то. :)

А если тебе надо класть в int числа возможно занимающие больше 4 байт и ты не хочешь устраивать глюки пользователям 32 битных платформ, тогда тоже не мешает?

~~Napilnik~~ ★★★★★
(23.05.12 22:40:15 MSK)

Ответ на: комментарий от punya 23.05.12 18:48:08 MSK

Недоумок. Ты не понял, что такое llvm. Он от gcc отличается ровно по одному пункту : там, где у GCC множество разных промежуточных представлений, у llvm оно всего лишь одно. Все остальные различия на фоне этого несущественны. И, кстати, gcc тоже умеет сериализовать в биткод свое промежуточное представление (см. LTO). Только у него это херово получается.

anonymous
(23.05.12 22:40:57 MSK)

Ссылка

Ответ на: комментарий от punya 23.05.12 19:09:11 MSK

llvm - байткод который выполняется эффективнее чем распространяемые бинарники собранные один раз и для всех => очевидно что llvm-байткодный дистрибутив ожидает нас

IMXO пока никто не переводит критичные к скорости участки сишных проектов на байткод виртуальной машины,
даже наоборот - критичные к скорости участки проектов под Java или Андроид(dalvik) переписывают на С и компилируют - почему?

Anonymous ★★★★★
(23.05.12 22:42:04 MSK)

Ссылка

Ответ на: комментарий от punya 23.05.12 19:06:58 MSK

Гражданин недоумок, для вашего сведения: промежуточный код LLVM машиннозависимый, и всегда имеет смысл только ровно на одной платформе, только для одного конкретного процессора (например, те же Neon интринсики будут использоваться на ARM, от которых ноль толку на x86).

anonymous
(23.05.12 22:43:21 MSK)

Ответ на: комментарий от Napilnik 23.05.12 22:40:15 MSK

А если тебе надо класть в int числа возможно занимающие больше 4 байт

int64_t либо gmp

~~wota~~ ★★
(23.05.12 22:43:36 MSK)

Ответ на: комментарий от punya 23.05.12 19:56:32 MSK

выложен только llvm байткод и он автоматически оптимизируется под каждую платфому

Это невозможно. Биткод платформозависимый.

anonymous
(23.05.12 22:44:58 MSK)

Ссылка

Ответ на: комментарий от u42 23.05.12 21:38:40 MSK

Кстати да, раз уж начинается веселье. FAQ говорит, что «int X() { int i; return i; }» скомпилируется в «ret i32 undef». Значит ли это, что для x86 и x86_64 будет разное представление long long (и как следствие проблемы с переносимостью даже без ассемблерных вставок)?

Вот тебе статья http://habrahabr.ru/post/81222/ Как-то велосипедят, используют не все байты переменной. Ты думаешь отчего пишут «игра X требует под хренью N Гб оперативы, под вистой - N+1».

~~Napilnik~~ ★★★★★
(23.05.12 22:48:34 MSK)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 4 →

← Конкурент Raspberry Pi — мини-компьютер на базе Android от VIA за 49$

Open Source

DevConf 2012 (Москва) — сформирована предварительная версия программы конференции →

Дык!

Хммм...

Похожие темы