LINUX.ORG.RU
ФорумTalks

Проект по задействованию LTO-оптимизации при сборке ядра Linux

 , ,


0

2

Копипаста с Опеннета:

Разработчики из компании Intel представили набор патчей с результатами работы по адаптации ядра Linux для сборки с использованием режима оптимизации во время динамического связывания (LTO - Link Time Optimization). LTO-оптимизации отличаются учётом состояния всех файлов, участвующих в процессе сборки, в то время, как традиционные режимы оптимизации оптимизируют каждый файл по отдельности и не учитывают условия вызова функций, определённых в других файлах. Например, при LTO для функций из других файлов возможно inlinе-развёртывание, в исполняемый файл не включается неиспользуемый код, осуществляется проверка типов для всей программы, производится общая оптимизация на уровне проекта в целом.

Подготовленные патчи включают в себя устранения проблем, всплывших в результате более агрессивной оптимизации, а также содержат ряд обходных путей для исключения влияния известных проблем в GCC 4.7. В результате использования патчей при сборке ядра 3.6 при помощи GCC 4.7 удалось добиться заметного повышения производительности результирующей сборки. Ускорение наблюдается практически во всех тестах, за исключением нескольких незначительных регрессий, которые планируется устранить в ближайшее время.

Ценой использования LTO является замедление процесса сборки в 2-4 раза и необходимость наличия в системе от 4 до 9 Гб ОЗУ в зависимости от собираемой конфигурации ядра. Ожидается, что в будущих версиях GCC проблемы с производительностью будут решены и скорость сборки в режиме LTO будет существенно увеличена.

Ответ на: комментарий от justAmoment

Т.е. уходит на анализ кода больше времени, но в результате машинный код более оптимизированы, так?

deterok ★★★★★
()

Кто, кстати, пробовал задействовать флаг -flto при сборке системы? Профит заметен?

Kindly_Cat
() автор топика

Ценой использования LTO является замедление процесса сборки в 2-4 раза и необходимость наличия в системе от 4 до 9 Гб ОЗУ

Я прям боюсь представить, что нужно для LO. Пойду, куплю 20 кг DDR3 для компиляции мира :)

MahMahoritos ★★★
()
Последнее исправление: MahMahoritos (всего исправлений: 1)

По поводу улучшения производительности:

Performance:

Hackbench goes about 5% faster, so the scheduler benefits. Kbuild
is not changing much. Various network benchmarks over loopback
go faster too (best case seen 18%+), so the network stack seems to
benefit. A lot of micro benchmarks go faster, sometimes larger numbers.
There are some minor regressions.

A lot of benchmarking on larger workloads is still outstanding.
But the existing numbers are promising I believe. Things will still
change, it's still early.

I would welcome any benchmarking from other people.

rival ★★
()

Как обычно, за очевидные, но трудоёмкие проекты берутся лишь корпорации.

quiet_readonly ★★★★
()

Годно, пришло время закупиться оперативкой.

encyrtid ★★★★★
()
Ответ на: комментарий от xsektorx

почему много? для чего используется?

Цитата:

With LTO gcc will do whole program optimizations for
the whole kernel and each module. This increases compile time,
but can generate faster code.

LTO allows gcc to inline functions between different files and
do various other optimization across the whole binary.

justAmoment ★★★★★
()
Ответ на: комментарий от havelite

все равно в нынешних железках меньше 4гб найти сложно

Да вы зажрались. Я только в сентябре, наверное, до магазина дойду, памяти прикупить до 8 гиг, а пока и дома и на работе на 2х живу, и относительно неплохо.

redgremlin ★★★★★
()
Ответ на: комментарий от havelite

А я живу на восьми и мне это нравится больше.

Kindly_Cat
() автор топика
Ответ на: комментарий от havelite

На рабочем компе - 2 Гб, на домашнем первом - 1 Гб, на домашнем втором - 512 Мб. И у кучи знакомых редко более 3 Гб стоит.

Chaser_Andrey ★★★★★
()

Хорошо, будет еще одно применение моим 24ГБ.

pekmop1024 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.