Открыт код компилятора EKOPath 4

ekopath, opensource, компиляторы

Компания PathScale открыла исходный код собственного компилятора EKOPath 4. До этого компилятор выпускался под проприетарной лицензией, стоимость одной лицензии составляла порядка $2000.

Основные возможности EKOPath 4

Генерирует значительно более быстрый код, чем GCC
Оптимизации под x86_64 (Intel® 64/AMD64, поддержка Intel® MMX™, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, AMD SSE4A и AVX)
Поддержка ISO C99/C++ 2003 и расширений GNU
Поддержка Fortran 90/95 и 2003
Поддержка DWARF4 и совместимость с GDB

В сравнении, произведенном Phoronix, преимущество EKOPath 4 перед GCC 4.5.2 составляет от 8% до 270%.

Исходный код доступен под лицензией GPLv3, поддержка коммерческих версий будет продолжена.

Также компания в скором времени планирует выпустить под свободной лицензией «убийцу CUDA», собственную реализацию GPGPU. Stay tuned.

Тесты от Phoronix: 1 2 3

>>> Подробности

Ссылка

← Apache Traffic Server 3.0

OpenSUSE Medical 11.4 →

← 1 2 3 4 5 →

Ответ на: комментарий от AVL2 16.06.11 00:06:12 MSK

> фиерия глупости.

Да, именно «фИерия».

tailgunner ★★★★★
(16.06.11 00:15:28 MSK)

Ссылка

Ответ на: комментарий от AVL2 16.06.11 00:06:12 MSK

> фиерия глупости.

О да, наполненный глубоким смыслом комментарий. И главное, своевременный. Если ты не заметил, мне уже всё объяснили.

i-rinat ★★★★★
(16.06.11 00:20:17 MSK)

Ссылка

Кажется я таки собрал эту вундервафлю!

# pathcc -version
Path64 Community Compiler: Version 4.0.10
Built on: 
Thread model: posix
GNU gcc version  (PathScale 4.0.10 driver)

Copyright PathScale Inc.  All Rights Reserved.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law.

# cat test.cpp 
#include <iostream>

int main()
{
        std::cout << "Hello!!!" << std::endl;
        return 0;
}

# pathcc -lstdc++ test.cpp 

# ./a.out 
Hello!!!

Теперь надо придумать что с ней делать...

Deleted
(16.06.11 00:22:02 MSK)

Ответ на: комментарий от Deleted 16.06.11 00:22:02 MSK

> Теперь надо придумать что с ней делать...

Сравнить скорость генерируемого кода с GCC? :)

anonymous
(16.06.11 00:28:26 MSK)

Ссылка

Ответ на: комментарий от Deleted 16.06.11 00:22:02 MSK

> Теперь надо придумать что с ней делать...

Начинай пересобирать Федору.

tailgunner ★★★★★
(16.06.11 00:30:32 MSK)

Ссылка

Ответ на: Очень ждем ебилдов! от staseg 15.06.11 11:52:56 MSK

> Компания PathScale...

А я даже не слышал о такой компании... а она:

от 8% до 270%

Два сакраментальных вопроса: Ядро собирает? Кеды собирает?

Кому что, а соурсникам кеды. А гном?

Очень ждем ебилдов!

А почему сам не соберёшь ебилд?

Ждём deb'ов.

Ждем патчей в GCC.

давай ключики

А вообще народ, вы только на лоре новости читаете, или я просто придираюсь и здесь могло быть over 9000 народу? Не лором единым.

anonymous
(16.06.11 01:14:59 MSK)

Ссылка

Ответ на: комментарий от Deleted 16.06.11 00:22:02 MSK

>Теперь надо придумать что с ней делать...

собери чонить из реп простенькое, что на крестах :) до жути интересно

tazhate ★★★★★
(16.06.11 01:28:39 MSK)

Ссылка

Ответ на: комментарий от Deleted 16.06.11 00:22:02 MSK

> Теперь надо придумать что с ней делать...

Для начала собрать его же им самим, а затем, например, собрать им gzip, bzip2 и xz и сравнить скорость сжатия и распаковки одних и тех же файлов (например, исходников ядра в tmpfs) архиваторами, скомпиленными gcc и этой «вундервафлей».

anonymous
(16.06.11 01:29:24 MSK)

Ссылка

Ответ на: комментарий от anonymous 15.06.11 15:09:40 MSK

плевать - пробовал забанить и матлибы и фортран и ещё что-то
насрать!
не собираецо

megabaks ★★★★
(16.06.11 01:30:03 MSK)

Ссылка

Ответ на: комментарий от Deleted 15.06.11 11:51:51 MSK

ща попробую дуру эту тоже собрать. у тебя с какими флагами в итоге собралось?

tazhate ★★★★★
(16.06.11 01:34:06 MSK)

Ссылка

Ответ на: комментарий от devl547 15.06.11 13:07:19 MSK

а головой подумать!?

megabaks ★★★★
(16.06.11 01:36:35 MSK)

Ссылка

Пока обычные люди смотрят затмение - гентушники компилируют компиляторы.

anonymous
(16.06.11 01:37:15 MSK)

Ответ на: комментарий от anonymous 16.06.11 01:37:15 MSK

завидуй молча...

megabaks ★★★★
(16.06.11 01:37:40 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.06.11 01:37:15 MSK

ыгы, сумерки скажи еще.

tazhate ★★★★★
(16.06.11 01:42:11 MSK)

Ответ на: комментарий от tazhate 16.06.11 01:42:11 MSK

Уже почти все закончилось. Онлайн-трансляция была тут: http://www.youtube.com/google

anonymous
(16.06.11 01:44:54 MSK)

Ответ на: комментарий от anonymous 16.06.11 01:37:15 MSK

> Пока обычные люди смотрят затмение

не у всех есть возможность. У нас облачно, ничего не видно.

i-rinat ★★★★★
(16.06.11 01:45:18 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.06.11 01:37:15 MSK

>Пока обычные люди смотрят затмение - гентушники компилируют компиляторы.

...а тролли спешат оббежать все сайты, чтобы побольше затроллить

goingUp ★★★★★
(16.06.11 02:02:17 MSK)

Ответ на: комментарий от anonymous 16.06.11 01:44:54 MSK

да уж, просто потрясно.
на что там смотреть? на комментарии?

tazhate ★★★★★
(16.06.11 02:06:41 MSK)

Ссылка

Ответ на: комментарий от goingUp 16.06.11 02:02:17 MSK

>...а тролли спешат оббежать все сайты, чтобы побольше затроллить

а люди людят.

tazhate ★★★★★
(16.06.11 02:07:27 MSK)

Ссылка

Ответ на: комментарий от Deleted 16.06.11 00:22:02 MSK

> Теперь надо придумать что с ней делать...

собрать что-то вроде ffmpeg или bzip, и собсно пустить на одной и той же машине gcc-шное и вундервафлевое.

time конечно выложить сюда.

Rastafarra ★★★★
(16.06.11 07:35:28 MSK)

в генту уже прибыл бинарный пакет

[ebuild  N     ] dev-lang/ekopath-bin-4.0.10_pre20110612  34,373 kB

fads ★★
(16.06.11 07:39:02 MSK)

Ответ на: комментарий от fads 16.06.11 07:39:02 MSK

ну так собери им че-нить да покажи как работает, будь уже мужиком.

Rastafarra ★★★★
(16.06.11 10:30:21 MSK)

Ссылка

для того чтоб получить максимальную отдачу нужно перекомпилить все, ядро, все библиотеки... а так впринципе не очень то и нужно

sendel
(16.06.11 11:14:20 MSK)

Ссылка

Ответ на: комментарий от Rastafarra 16.06.11 07:35:28 MSK

Исходники еще не доступны. Тот код в github это совсем другое и сто лет как было доступно. Подождите официального заявления про исходники.

anonymous
(16.06.11 13:31:37 MSK)

Ответ на: комментарий от anonymous 16.06.11 13:31:37 MSK

>Тот код в github это совсем другое
Там то что надо это.

Подождите официального заявления про исходники

вот оно - https://twitter.com/ctopathscale: «github.com/path64 has enough open to build base compiler»

anonymous
(16.06.11 14:27:51 MSK)

Ссылка

Ссылки

Deleted
(16.06.11 15:52:40 MSK)

Ссылка

gcc vs pathcc vs icc

Погонял немного появившийся сегодня в генте бинарный EKOPath 4.0.10_pre20110612 в сравнении с GCC 4.5.2 и ICC 12.0.4 (из Intel Composer XE 2011.4.191)
Сравнивал на архиваторах gzip v.1.4 и bzip2 v.1.0.6
Процессор AMD Athlon(tm) II X3 445 с частотой 3 GHz
Команды тестов:

time nice -n -20 /path_to_gzip/gzip < linux-2.6.39.tar | pipebench > /dev/null

time nice -n -20 /path_to_bzip2/bzip2 < linux-2.6.39.tar | pipebench > /dev/null

linux-2.6.39.tar на tmpfs
Каждый тест прогонялся 3 раза
Везде линковалось так: LDFLAGS=-Wl,-O1,--as-needed
Результаты gzip:

gcc Gentoo 4.5.2 p1.1
CFLAGS="-O2 -march=amdfam10 -mtune=amdfam10 -mmmx -msse -msse2 -msse3 -msse4a -ftree-vectorize -fomit-frame-pointer -pipe -s"

Summary:
Piped   92.33 MB in 00h00m15.77s:    5.85 MB/second
real    0m15.776s
user    0m15.703s
sys     0m0.169s

pathcc Version 4.0.10 :
CFLAGS=-O2 -fomit-frame-pointer -pipe -s

Summary:
Piped   92.33 MB in 00h00m14.61s:    6.31 MB/second
real    0m14.618s
user    0m14.562s
sys     0m0.153s

icc Version 12.0.4
Фейл. gzip не собрался
Результаты bzip2
CFLAGS="-O2 -march=amdfam10 -mtune=amdfam10 -mmmx -msse -msse2 -msse3 -msse4a -ftree-vectorize -fomit-frame-pointer -pipe -s"

Summary:
Piped   72.57 MB in 00h01m13.11s: 1016.32 kB/second
real    1m13.121s
user    1m12.994s
sys     0m0.165s

pathcc Version 4.0.10 :
CFLAGS=-O2 -fomit-frame-pointer -pipe -s

Summary:
Piped   72.57 MB in 00h01m10.82s:    1.02 MB/second

real    1m10.824s
user    1m10.718s
sys     0m0.146s

icc Version 12.0.4
CFLAGS=-O2 -axSSE3 -msse3 -fomit-frame-pointer -ip -gcc -pipe -s

Summary:
Piped   72.57 MB in 00h01m05.26s:    1.11 MB/second

real    1m5.264s
user    1m5.144s
sys     0m0.162s

Выводы ЛОР делай сам, но вроде неплохой компилятор. И кстати по ощущениям pathcc более совместим с gcc чем тот же icc. Меньше варнингов выдавал при сборке и тд.

sqee
(16.06.11 18:07:40 MSK)

вот убийцу CUDA с радостью потыкаем - посмотрим!

g-apps
(16.06.11 18:37:29 MSK)

Ссылка

Ответ на: gcc vs pathcc vs icc от sqee 16.06.11 18:07:40 MSK

Интересные результаты.

-O2

А почему О2, а не O3?

vovic ★
(16.06.11 18:45:06 MSK)

Ответ на: комментарий от vovic 16.06.11 18:45:06 MSK

А почему О2, а не O3?

-O3 параметр не однозначный, часто дает даже замедление. К тому же у всех этих компиляторов -O2 идет как нормальный уровень куда включены все стабильные оптимизации.

Кстати для pathcc надо бы поиграться с параметрами оптимизации, там их много, как и в gcc.

sqee
(16.06.11 18:54:21 MSK)

Ответ на: gcc vs pathcc vs icc от sqee 16.06.11 18:07:40 MSK

> И кстати по ощущениям pathcc более совместим с gcc чем тот же icc

Но он, вроде, и помедленнее icc получается. А на интеловском проце, поди, ещё больше разница была бы.

alt-x ★★★★★
(16.06.11 19:37:02 MSK)

Ответ на: комментарий от alt-x 16.06.11 19:37:02 MSK

Но он, вроде, и помедленнее icc получается. А на интеловском проце, поди, ещё больше разница была бы.

Угу, но icc даже gzip собрать не смог, что странно весьма.

Если будет время потом прогоню ещё dcraw и xz. Да и с дополнительными параметрами оптимизации у pathcc надо бы разобраться, а то может оно собрало код вообще без mmx/sse/etc

sqee
(16.06.11 20:17:22 MSK)

Ссылка

Ебилды для Gentoo:
http://git.overlays.gentoo.org/gitweb/?p=dev/xarthisius.git;a=commit;h=690207d2

http://gentoo-overlays.zugaina.org/xarthisius/dev-lang.html.en

dev-lang/ekopath-bin, =dev-lang/ekopath-9999, =dev-lang/path64-9999

anonymous
(17.06.11 17:00:22 MSK)

Ответ на: комментарий от Deleted 16.06.11 00:22:02 MSK

как собирал?
код кстати меняется на гитхабе...
бинарник поставить не вариант - ибо 64-онли

megabaks ★★★★
(17.06.11 17:30:47 MSK)

Ссылка

Ответ на: комментарий от anonymous 17.06.11 17:00:22 MSK

>* [[ $(gcc-version) != 4.2 ]] && die «To bootstrap Path64 you'll need to use gcc:4.2[vanilla]»;
ппц...

megabaks ★★★★
(17.06.11 17:36:41 MSK)

Ответ на: комментарий от megabaks 17.06.11 17:36:41 MSK

Да, он собирается только GCC 4.2 и только в Debug-билд (не Release).

Deleted
(17.06.11 17:43:06 MSK)

Ответ на: комментарий от Deleted 17.06.11 17:43:06 MSK

лол )

megabaks ★★★★
(17.06.11 17:49:43 MSK)

Ссылка

Ответ на: комментарий от Deleted 17.06.11 17:43:06 MSK

да счаз )

[ root@desktop ] driver # ../../bin/table < /var/tmp/portage/dev-lang/path64-9999/work/path64-9999_build/src/driver/OPTIONS.P
Ошибка сегментирования
[ root@desktop ] driver #

megabaks ★★★★
(17.06.11 18:20:19 MSK)

Ссылка

Ответ на: комментарий от sqee 16.06.11 18:54:21 MSK

> -O3 параметр не однозначный, часто дает даже замедление.

Увеличение по размеру/памяти - возможно. Но замедление? В любом случае стоит дополнительно проверить O3. А еще неплохо бы делать несколько замеров и показывать минимальное, максимальное и среднее значение, чтобы можно было оценить погрешность измерений. А то если разница между gcc и pathcc - в десятых долях секунды а погрешность - в секундах... Например, у меня разброс между соседними запусками bzip2 около 4%.

PS: очень важно перед тестом не забыть ВЫКЛЮЧИТЬ cpufreq/cpuspeed - это даст прирост по скорости еще на 20% :)

anonymous
(17.06.11 18:25:11 MSK)

Ответ на: комментарий от anonymous 17.06.11 18:25:11 MSK

на некотором софте даёт таки замдление

megabaks ★★★★
(17.06.11 18:31:05 MSK)

Ссылка

Ответ на: комментарий от anonymous 17.06.11 18:25:11 MSK

>Но замедление?
Прямое следствие

Увеличение по размеру/памяти

Кэш не резиновый.
Бенчмарки в гугле. Числодробилкам от -O3 хорошо, остальному обычно не очень.

x3al ★★★★★
(17.06.11 18:56:08 MSK)

Ответ на: комментарий от x3al 17.06.11 18:56:08 MSK

> Прямое следствие

Нет тут следствия. Код большего размера может выполняться быстрее кода меньшего размера. Вместо цикла, выполняющегося 5 раз, можно написать все тело цикла 5 раз подряд, в результате кода станет больше, а работать он будет быстрее, потому что не будет лишних проверок на окончание цикла и инкрементов счетчика, плюс освободится несколько регистров процессора, которые тоже можно использовать для чего-то полезного.

Больше кода - не значит медленнее.

> Бенчмарки в гугле.

Бенчмарки в гугле кривые. Те, кто их делает, часто понятия не имеет о работе компилятора. Они почему-то думают, что если они напишут какой-нибудь цикл, который повторяет сложное вычисление стопиццот раз, то на этом можно тестить компилятор. А это - бред.

Cколько, например, будет выполняться вот такой кусок кода:

int main()
{
  int i, j = 0;
  for (i = 0; i < 1000000000; i++)
    if (i+1 > 0)
      j++;
  return j%2;
}

Миллиард итераций, в каждой итерации - несколько операций...

Правильный ответ - он будет выполняться ноль миллисекунд, потому что компилятор развернет и посчитает цикл. После компиляции там останется:

main:
        xorl    %eax, %eax
        ret

Так что не надо про бенчмарки в гугле. Или ссылку на конкретный бенчмарк, который можно повторить, или ссылку на официальное заявление разработчиков gcc, в котором они утверждают, что O3 может привести к замедлению. Мои тесты показывают, что -O3 по сравнению с -O2 дает либо такую же, либо большую производительность.

> Числодробилкам от -O3 хорошо, остальному обычно не очень.

Все наоборот. Числодробилки обычно изначально оптимизированы хорошо, и O3 дает там такую же производительность, как O2. А в остальных программах, где девелоперы специально не оптимизировали вызовы, O3 дает выигрыш.

anonymous
(17.06.11 21:02:11 MSK)

Ответ на: комментарий от anonymous 17.06.11 21:02:11 MSK

>Код большего размера может выполняться быстрее кода меньшего размера
А может и медленнее. В реальном мире часто встречается второе.
Меньше кода — не значит медленнее.

Бенчмарки в гугле кривые.

http://www.global.phoronix-test-suite.com/index.php?k=profile&u=staalmannen-6...
http://www.global.phoronix-test-suite.com/index.php?k=profile&u=staalmannen-2...
Достаточно прямые? Там видно, что с GCC -O2 бывает заметно быстрее, чем -O3. А бывает и медленнее.
С GCC из результатов с заметной разницей 5 против 3 в пользу -O2.
Повторяемо, не слишком фороникс (но их test-suite).

x3al ★★★★★
(17.06.11 21:28:25 MSK)

Ссылка

Ответ на: комментарий от anonymous 17.06.11 21:02:11 MSK

>Cколько, например, будет выполняться вот такой кусок кода:
И да, мерять скорость в циклах — идиотизм из прошлого века.

x3al ★★★★★
(17.06.11 21:31:55 MSK)

Ссылка

Ответ на: комментарий от anonymous 17.06.11 18:25:11 MSK

Тест запускался по 3 раза каждый, сюда я постил лучший результат. Разброс результатов между запусками не превышал 0.250 секунды так что можете считать результаты вполне достоверными. Естественно в scaling_governor было выставлено performance.
Почему у вас разброс по запускам 4% не понятно, может сдимаемый файл не на tmpfs? И попробуйте выставлять sticky bit на бинарники.

PS Единственно что. Я перепроверил позже параметры оптимизации pathcc, в том числе с помощью утилиты analyze-x86 проскакивавшей тут когда то. Опции -mmmx -msse -msse2 msse3 вообще не изменили код. А вот опция -ipa аналог -ip у icc дала на bzip2 прирост примерно в 5% а gzip с ней не собрался.

PSS Насчет -O3. Вот вы пособирайте разные архиваторы dcraw-ы c -O2 и -03 и проверте сами раз не верите. Еще на acovea погоняйте. В 60% случаев производительность падает, и только в остальный 40% растет но совсем не много, и при этом размер бинарника сильно увеличивается, то есть памяти система собранная с -O3 будет жрать значительно больше.

sqee
(17.06.11 21:38:02 MSK)