LLVM 3.0

1

3

30.11.2011 в свет вышла очередная версия фреймворка для построения компиляторов и виртуальных машин.

Википедия
Low Level Virtual Machine (LLVM) — универсальная система анализа, трансформации и оптимизации программ, реализующая виртуальную машину с RISC-подобными инструкциями. Может использоваться как оптимизирующий компилятор этого байткода в машинный код для различных архитектур либо для его интерпретации и JIT-компиляции (для некоторых платформ).

Проект LLVM официально включает в себя следующие основные проекты:

LLVMCore - библиотеки для обеспечения платформонезависимой оптимизации и кодогенерации под различные виды процессоров и платформ;
CLang - компилятор языков C/C++/Objective-C для LLVM;
dragonegg - объединяет в себе парсер GCC-4.5 и оптимизацию и кодогенерацию на основе библиотек LLVM;
LLDB - дебаггер, использует Clang и LLVM;
libc++ - реализация стандартной библиотеки C++ (включает неполную поддержку стандарта C++11);
vmkit - реализация языков Java и .Net для LLVM;
SAFECode - память-безопасный компилятор С/С++.

Помимо упомянутых официальных проектов существует большое количество проектов, которые используют LLVM для компиляции программ для таких языков как Ruby, Python, Haskell, Java, D, PHP, Lua и т.д.

Основные изменения:

llvm-gcc больше не поддерживается, рекомендуется использовать clang или dragonegg;
LLVM IR (intermediate representation - платформонезависимый ассемблер для LLVM) включает в себя полную поддержку атомарных операций с памятью (load, store, compare, exchange, read/modify/write, etc.);
полностью переделан механизм обработки исключений в LLVM IR;
полностью переделана система типов LLVM IR;
MIPS backend доведён до production quality;
...

Полный и подробный перечень изменений можно посмотреть в подробностях.

В настоящее время для скачивания доступен только исходный код (через svn). В ближайшее время на сайте в списке закачек ожидается появление бинарных сборок и тарболла.

>>> Подробности (англ.)

Ссылка

← GNUnet 0.9.0

Реализован порт LinuxTV под Windows →

← 1 2 3 4 5 6 7 →

Ответ на: комментарий от shty 01.12.11 18:18:35 MSK

насолько я помню разговор был именной такой, что дескать тяжело возиться с llvm

PyPy в принципе другая вещь, чем LLVM. И да, LLVM если и подходит для динамических языков, то только с недавних пор.

tailgunner ★★★★★
(01.12.11 18:33:12 MSK)

Ответ на: комментарий от shty 01.12.11 18:24:20 MSK

Ну понятно, если пытаться реализовывать то, что не понимаешь вляпаешься со 100% вероятностью. :)

anonymous
(01.12.11 18:39:14 MSK)

Ссылка

Ответ на: комментарий от shty 01.12.11 18:18:35 MSK

ну да. Имхо, просто не осилили. Зато много фана

namezys ★★★★
(01.12.11 18:49:00 MSK)

Ссылка

Ответ на: комментарий от tailgunner 01.12.11 18:33:12 MSK

Ну кто им мешал генерить не x86 асм, а для llvm

namezys ★★★★
(01.12.11 18:50:40 MSK)

Ответ на: комментарий от namezys 01.12.11 18:50:40 MSK

Ну кто им мешал генерить не x86 асм, а для llvm

То, что они генерят и перегенерируют асм постоянно. Насчет пригодности LLVM для Python хорошо было написано в посмертной записке Unladen.

tailgunner ★★★★★
(01.12.11 18:57:46 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:40:12 MSK

Это же LLVM, он низкоуровневый, т.е., распараллеливанием он не занимается.

Deleted
(01.12.11 19:10:33 MSK)

Ссылка

Ответ на: комментарий от buddhist 01.12.11 12:42:09 MSK

А кто запрещает FFI?

Deleted
(01.12.11 19:11:30 MSK)

Ответ на: комментарий от Deleted 01.12.11 19:11:30 MSK

Да нет, никто не запрещает, но фанатики языка (стремящиеся заменить X на Y) не считают это Ъ :)

buddhist ★★★★★
(01.12.11 19:12:32 MSK)

Ответ на: комментарий от cvs-255 01.12.11 12:43:43 MSK

Байт-код НЕ оптимизируется под архитектуру. Оптимизация под конкретную архитектуру делается при компиляции байт-кода в нативный код под эту самую архитектуру.

Deleted
(01.12.11 19:13:25 MSK)

Ссылка

Ответ на: комментарий от buddhist 01.12.11 19:12:32 MSK

А зачем изобретать велосипед, когда нужные библиотеки есть, и все языки имеют FFI, умеющий их вызывать? Не проще ли обернуть эту самую библиотеку в удобную и более родную для данного языка обертку вместо изобретения такой же, но нативной для данного языка, библиотеки?

Deleted
(01.12.11 19:15:33 MSK)

Ответ на: комментарий от buddhist 01.12.11 12:44:43 MSK

Имхо, не совсем справедливая ирония, поскольку С++, написанный моими кривыми руками, уже давно по нечитабельности обогнал хаскель.

Очевидный фикс. Не надо наезжать на язык только потому, что он дает тебе слишком много свободы.

Да, а в аду С++ программисты будут разбирать ошибки STL и Boost :)

Сколько пользуюсь STL, на ошибки в нем вроде не наталкивался. Хотя, конечно, некоторые моменты сделаны не лучшим образом.

Deleted
(01.12.11 19:19:03 MSK)

Ответ на: комментарий от namezys 01.12.11 12:47:24 MSK

Он используется как промежуточное представление: LLVM API дает возможность генерировать только байт-код, который только потом можно скомпилить (не сохраняя байт-код на диск).

Deleted
(01.12.11 19:21:04 MSK)

Ссылка

Ответ на: комментарий от Deleted 01.12.11 19:19:03 MSK

Сколько пользуюсь STL, на ошибки в нем вроде не наталкивался.

Вот, кстати, да. Правда я не так уж интенсивно пользую C++/STL, но из личного опыта - STL вполне надёжен.

Вот про Boost не скажу ни за, ни против - на практике не использовал, только немножко поковырялся по собственной инициативе.

~~OldFatMan~~ ☆
(01.12.11 19:25:45 MSK)

Ссылка

Ответ на: комментарий от cvs-255 01.12.11 12:51:29 MSK

Ошибаешься. Компиляция (любая современная) состоит из таких этапов:

1. Препроцессинг, синтаксический анализ и прочие (здесь LLVM не при чем).

2. Генерация промежуточного кода (этот и последующие пункты входят в компетенцию LLVM)

3. Оптимизация промежуточного кода.

4. (и только здесь производится оптимизация кода под архитектуру) Генерация нативного кода (она еще делится на кучу этапов, но не суть).

Такая схема не только у LLVM, а почти у всех.

Deleted
(01.12.11 19:27:50 MSK)

Ссылка

Ответ на: комментарий от Deleted 01.12.11 19:15:33 MSK

А зачем изобретать велосипед

Спросите у фанатиков :)

С++, написанный моими кривыми руками

Я вообще никогда не писал на С++, но периодически приходится разбираться в чужом коде.

buddhist ★★★★★
(01.12.11 19:37:56 MSK)

Ссылка

Ответ на: комментарий от cvs-255 01.12.11 13:12:56 MSK

Вот в случае надобности такое распараллеливание должно делаться LLVM-ом при компиляции байткода в нативный код.

Deleted
(01.12.11 19:39:54 MSK)

Ответ на: комментарий от tailgunner 01.12.11 13:17:50 MSK

LLVM-код сам по себе никак не прибит к endianess.

Deleted
(01.12.11 19:43:43 MSK)

Ссылка

Ответ на: комментарий от shty 01.12.11 18:25:31 MSK

Втянули меня в этот спор :) Вообще автоматическое запаралелливание в том виде о котором мы сейчас говорим не синоним оптимизации, оно редко кому нужно в компиляторе. Оно только увеличивает суммарное количество операций которые нужно выполнить программе. А выполнение нескольких инструкций за такт это уже стадия компиляции в native код.

anonymous
(01.12.11 19:44:08 MSK)

Ссылка

Ответ на: комментарий от Rzhepish 01.12.11 14:11:41 MSK

Этот самый адрес сгенерирует LLVM при компиляции байт-кода в нативный код. Зачем он до этого?

Deleted
(01.12.11 19:53:48 MSK)

Ссылка

Ответ на: комментарий от Rzhepish 01.12.11 14:14:11 MSK

С размерами и смещениями работает LLVM, а не фронтенд.

Deleted
(01.12.11 19:59:18 MSK)

Ссылка

Ответ на: комментарий от Deleted 01.12.11 19:39:54 MSK

Не обязательно. Распараллеливание теоретически может происходить и на этапе оптимизации, только, дейтсвительно, поближе к трансляции в нативный код. Правда зачем оно нужно не знаю =).

Sparn
(01.12.11 20:16:43 MSK)

Ответ на: комментарий от Sparn 01.12.11 20:16:43 MSK

Если нужно - никто не запрещает написать свой проход (LLVM Pass), только хз в каких ситуациях подобное распараллеливание даст заметный профит.

Deleted
(01.12.11 20:21:08 MSK)

Ответ на: комментарий от Deleted 01.12.11 20:21:08 MSK

ну я о том же писал ) смысла от автоматического распараллеливания нет ) только геморрой можно нажить )

Sparn
(01.12.11 20:22:19 MSK)

Ссылка

Ответ на: комментарий от buddhist 01.12.11 12:44:43 MSK

в аду С++ программисты будут разбирать ошибки STL и Boost

Ну ты и хам, так мою работу обзывать!!!

one_more_hokum ★★★
(01.12.11 20:22:41 MSK)

Ссылка

Ответ на: комментарий от namezys 01.12.11 14:29:35 MSK

Порядок бит??? Что это???

Deleted
(01.12.11 20:26:59 MSK)

Ответ на: комментарий от pitekantrop 01.12.11 12:40:19 MSK

Байт-код LLVM, к сожалению, не является платформено-независимым. Некоторые вещи LLVM определяет при формировании кода, так-то разрядность, размер int,word и т.п. Ну и Big/Litle Endian. Это вам не Java, и не C#. Кстати, информацию о том, что LLVM-байткод не может служить кросс-платформенным представлением программы для различных аппаратных платформ был в официальных доках на сабж. Байт-код сабжа собранный в Linux под x86_64 отлично компилируется/интерпретируется в Winodws под ту же аппаратную платформу, но заглохнет на ARM. Всё из-за того, что желая по максимуму использовать все особенности поддерживаемых архитектур, компилятор сабжа в баткод засовывает и дополнительную информацию. Ну а определять размер int и прочих примитивных типов данных равными стандартным для данной аппаратной архитектуры - это преступление. В Java и .NET типы данных одного размера для любой архитектуры. Поэтому у них нормальная виртуальная машина, истинно кросс-платформенная, а разрабы LLVM испортили такую идею.

lucentcode ★★★★★
(01.12.11 20:29:13 MSK)

Ответ на: комментарий от buddhist 01.12.11 12:45:35 MSK

Нормальный байт-код, или нечто странное от LLVM?

lucentcode ★★★★★
(01.12.11 20:31:21 MSK)

Ссылка

Ответ на: комментарий от Deleted 01.12.11 20:26:59 MSK

ну это такая штука... просто в байте биты «номеруются» с 1 до 8. А вот в слове хер знает как

namezys ★★★★
(01.12.11 20:36:46 MSK)

Ответ на: комментарий от lucentcode 01.12.11 20:29:13 MSK

В Java и .NET типы данных одного размера для любой архитектуры. Поэтому у них нормальная виртуальная машина, истинно кросс-платформенная, а разрабы LLVM испортили такую идею.

То есть размер указателя там всегда 32 бита?

Gorthauer ★★★★★
(01.12.11 20:37:21 MSK)

Ответ на: комментарий от namezys 01.12.11 20:36:46 MSK

Точно так же. И порядок байт в слове ничего тебе не поломает.

Deleted
(01.12.11 20:37:52 MSK)

Ответ на: комментарий от lucentcode 01.12.11 20:29:13 MSK

да кто мешает комилятору генерировать код с учетом этого? тогда будет кроссплатформенно. Это не задача llvm

namezys ★★★★
(01.12.11 20:40:09 MSK)

Ссылка

Ответ на: комментарий от Deleted 01.12.11 20:37:52 MSK

как? младший арифметичски байт может как быть младшим, так и старшим по адрессу. А значит выбирать не так рпосто

namezys ★★★★
(01.12.11 20:40:53 MSK)

[trollmode]Круто, теперь можно взять исходники любой открытой или не очень виндодиректной игры и компильнуть под линукс! Да хоть фотожоп с сонивегасом, если кто сырцы сольёт. LLVM преобразует WinApi в LinApi и дело в шляпе.[/trollmode]

~~Napilnik~~ ★★★★★
(01.12.11 20:42:08 MSK)

Ссылка

Ответ на: комментарий от namezys 01.12.11 20:40:53 MSK

Я обычно извлекаю биты так: (unsigned_number >> bit_num) & 1

Т.к. оно работает с числами, то пофиг, как эти самые байты размещены физически.

Deleted
(01.12.11 20:54:34 MSK)

Ответ на: комментарий от Deleted 01.12.11 20:54:34 MSK

А в LLVM еще проще, т.к. там есть целые числа любой длины.

Deleted
(01.12.11 20:56:20 MSK)

Ссылка

Ответ на: комментарий от Gorthauer 01.12.11 20:37:21 MSK

нет, там для этого тип «указатель» и методы работы с ним не зависят от его разрядности.

Sparn
(01.12.11 20:57:58 MSK)

Ссылка

Ответ на: комментарий от Deleted 01.12.11 20:54:34 MSK

Т.к. оно работает с числами, то пофиг, как эти самые байты размещены физически.

ну я об это и говорил. а вот если через массив чаров тянуть

namezys ★★★★
(01.12.11 21:00:08 MSK)

Ответ на: комментарий от namezys 01.12.11 21:00:08 MSK

А если завести для этих целей массив чаров - тоже пофиг :) А извлекать байты из беззнакового целого (единственное, что могу вспомнить, где порядок байт все ломает) - ССЗБ.

Deleted
(01.12.11 21:11:25 MSK)

Ответ на: комментарий от namezys 01.12.11 14:18:25 MSK

Конечно. Сюрприз?

vasily_pupkin ★★★★★
(01.12.11 21:27:40 MSK)

Ответ на: комментарий от anonymous 01.12.11 18:31:26 MSK

И да, вы не поверите, но «passing bу name» абсолютно ничего не меняет.

конечно не поверю, ибо только что с гемором на эту тему разбирался

читали эту статью, думаете она ни с того ни с сего появилась?

shty ★★★★★
(01.12.11 21:35:55 MSK) автор топика

Ответ на: комментарий от tailgunner 01.12.11 18:33:12 MSK

насолько я помню разговор был именной такой, что дескать тяжело возиться с llvm
PyPy в принципе другая вещь, чем LLVM.

конечно другая, PyPy - реализация ЯП, LLVM - backend

И да, LLVM если и подходит для динамических языков, то только с недавних пор.

это почему? и с недавних пор - это года с 2000?

shty ★★★★★
(01.12.11 21:39:21 MSK) автор топика

Ответ на: комментарий от tailgunner 01.12.11 18:57:46 MSK

Насчет пригодности LLVM для Python хорошо было написано в посмертной записке Unladen.

не было там ничего такого, чувак вещал, что он не врубается как это сделать по-человечески

shty ★★★★★
(01.12.11 21:40:54 MSK) автор топика

Ссылка

Ответ на: комментарий от shty 01.12.11 21:39:21 MSK

PyPy - реализация ЯП

PyPy - это нечто большее.

И да, LLVM если и подходит для динамических языков, то только с недавних пор.
это почему?

Я уже сказал, где это разъясняется.

tailgunner ★★★★★
(01.12.11 21:48:36 MSK)

Ответ на: комментарий от tailgunner 01.12.11 21:48:36 MSK

PyPy - реализация ЯП
PyPy - это нечто большее.

???? пруф или не было

shty ★★★★★
(01.12.11 21:51:19 MSK) автор топика

Ссылка

Ответ на: комментарий от tailgunner 01.12.11 21:48:36 MSK

И да, LLVM если и подходит для динамических языков, то только с недавних пор.
это почему?
Я уже сказал, где это разъясняется.

ссылочку не подкинешь?

shty ★★★★★
(01.12.11 21:52:08 MSK) автор топика

Ответ на: комментарий от shty 01.12.11 21:52:08 MSK

http://qinsb.blogspot.com/2011/03/unladen-swallow-retrospective.html

tailgunner ★★★★★
(01.12.11 21:55:41 MSK)

Ответ на: комментарий от namezys 01.12.11 20:40:53 MSK

просто в байте биты «номеруются» с 1 до 8. А вот в слове хер знает как

младший арифметичски байт может как быть младшим, так и старшим по адрессу. А значит выбирать не так рпосто

Ну а младший бит как был a & 1, так им и останется. Девятый бит тоже остаётся (a & 0x100) >> 8 — порядок слов на порядковых номерах битов не сказывается.

sjinks ★★★
(01.12.11 21:56:19 MSK)

Ответ на: комментарий от tailgunner 01.12.11 21:55:41 MSK

благодарствую, сейчас перечитаю

shty ★★★★★
(01.12.11 21:57:06 MSK) автор топика

Ссылка

Чорт, реализации Pascal для LLVM протухшие :(

Andru ★★★★
(01.12.11 21:59:31 MSK)

Ответ на: комментарий от tailgunner 01.12.11 21:55:41 MSK

Так, значит я всё же правильно помнил основные тезисы.

Первый тезис, и самый главный: The primary reason is that we weren't able to generate enough internal customers at Google. То есть если бы не это любые вопросы можно было бы порешать.

Едем дальше, читаем про llvm.

1) «Unfortunately, LLVM in its current state is really designed as a static compiler optimizer and back end.» - не нашёл кнопку «сделать хорошо».

1) «LLVM code generation and optimization is good but expensive.» - WTF??? и что?

2) «The optimizations are all designed to work on IR generated by static C-like languages. Most of the important optimizations for optimizing Python require high-level knowledge of how the program executed on previous iterations, and LLVM didn't help us do that.» - снова не нашёл кнопку «сделать хорошо», отличная тема, чо.

3) «LLVM will not fold loads from the Python stack across calls to external functions (ie the CPython runtime, so all the time). We eventually wrote an alias analysis to solve this problem, but it's an example of what you have to do if you don't roll your own code generator.» - плачется и говорит что порулили, чего тогда плакался, снова не нашёл кнопку?

4) «For example, LLVM doesn't really support back-patching, which PyPy uses for fixing up their guard side exits. It's a fairly large dependency with high memory usage, but I would argue that based on the work Steven Noonan did for his GSOC that it could be reduced, especially considering that PyPy's memory usage had been higher.» - верните кнопку, скоты!

5) .... всё, это все претензии к LLVM?

Мой вердикт таков - чувак думал что LLVM - это страшное колдунство и если его запустить то оно автоматом все проблемы ему порешает. Ну чо, наивный малтшик, не в курсе что означают две первых L в слове LLVM.

Только я не пойму как это доказывает тезис «LLVM если и подходит для динамических языков, то только с недавних пор»? И ещё больше я не пойму, Unladden Swallow - это что, единственный динамический язык на свете, других не бывает?

shty ★★★★★
(01.12.11 22:29:26 MSK) автор топика

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 4 5 6 7 →

← GNUnet 0.9.0

Open Source

Реализован порт LinuxTV под Windows →

Похожие темы