LINUX.ORG.RU
ФорумTalks

всё-таки адовый мультипоток.

 , ,


1

2

Платформа под названием 2S1451A4VIHE4_29/14_N обладает двумя сокетами, в которые можно установить два процессора AMD Naples. У каждого из процессоров есть 32 ядра и 64 потока. Это значит, что в 2017 году мы увидим 128-поточные системы от AMD, которые будут работать при базовой частоте 1.44 ГГц и 2.9 ГГц в режиме boost.

http://www.nix.ru/computer_hardware_news/hardware_news_viewer.html?id=193327

похоже амд таки сдались и мы увидим их только в многопотоке на серверах. в однопотоке будет рулить штеуд. ибо программасты ААА йоба-игр только-только осилили 2 ядра. лишь некоторые 4.

вообще, этот подход правильный. просто потому что технологии «уперлись», и точка упора уже не транзисторы а индуктивность, емкость и сопротивление проводов.

а сдастся таки интел в итоге. он просто не туда пошел.

i36_zubov
()
Ответ на: комментарий от i36_zubov

Intel рульнул

Я большой фоннад AMD, но таки Intel пошёл туда куда нужно, и уже давно. Далеко не все задачи хорошо распараллеливаются, поэтому производительность процессоров в однопоточном режиме очень важна. Intel опережает, AMD отстаёт.

Camel ★★★★★
()

похоже амд таки сдались и мы увидим их только в многопотоке на серверах

Напомню тебе про Xeon с 24 ядрами, 48 потоками и 4 сокетах на материнку. 192 потока. Intel уже всё?

devl547 ★★★★★
()

Жаль конечно что ценник будет сугубо серверный. На десктоп такое не припердолишь.

Promusik ★★★★★
()
Ответ на: Intel рульнул от Camel

Intel опережает, AMD отстаёт.

Таки да, в десктопном использовании старый б/у вестмер 6-головый уделывает топовые FX.

devl547 ★★★★★
()
Ответ на: Intel рульнул от Camel

Будущее за многопотоком и не известно как штеуд перестроит свою архитектуру для этого мультипотока.

YLoS ★★★
()

Каждый элемент процессора Naples состоит из 4 ядер и 8 Мб кэша L3. Версия процессора с 32 ядрами будет располагать 64 Мб кэша L3. Если эта информация подтвердится, то у Intel могут появиться серьезные проблемы в следующем году.

В материнскую плату, которая была использована при тестировании, установили 128 Гб оперативной памяти DDR4. Данный объем памяти позволил полностью раскрыть возможности процессоров. В программе Geekbench система показала результат в 1141 балл при выполнении операций в один поток и 15620 баллов в мультипоточном тесте.

Протестировал свой 5-летний Core i7 2600 + 8 Gb DDR3. Дааа, у Интела будут прям огромные проблемы в будущем году))

Deleted
()

Десктопный софт активно допиливается до нормальной многопоточности, АМД просто поспешило, зато теперь могут быть профиты.

Valeg ★★★
()

АМД должна победить, я в них верю...

Venediktov
()

ибо программасты ААА йоба-игр только-только осилили 2 ядра. лишь некоторые 4.

а что там можно на 128 потоков распараллеливать

Harald ★★★★★
()

Грусть-печаль-тоска.

Жалко, что AMD отстали настолько. Не видать мне макбука с amd+amd, видимо.

Ну и пофиг, дома по-прежнему работает FX-8350, мне вполне хватает.

ekzotech ★★★★
()
Ответ на: комментарий от Valeg

АМД просто поспешило, зато теперь могут быть профиты.

В чём? В софте, который не использует FPU?
Сейчас выкатят Zen и во всей линейке модульников резко найдутся тонны фатальных недостатков, которые сама AMD и озвучит.

devl547 ★★★★★
()
Ответ на: Intel рульнул от Camel

Куда ушел интел я знаю. В domino logic и лютые усложнения. Но это танцы на граблях ибо растёт длина конвейера, и прочие наказания.

Кроме того, domino logic можно и на более простых процессах и меньших частотах применять, и там оно даёт больший эффект в плане быстродействия/площадь.

i36_zubov
()
Ответ на: комментарий от Harald

ну вообще там такая проблема: есть «сцена», её «обновляют», потом рисуют, потом читают состояния клавиш и мышек...

в общем-то поэтому квейк-1 был так чувствителен к FPS: каждый FPS это одно чтение состояние клавиш и мыши. конечно, новые игры не настолько пальцем деланы(хотя и не всегда) но всё таки есил рендерить в отдельном потоке, то надо состояние сцены копировать. а это надо думать кококо. и да, если уж мы его копируем, один хрен opengl и directx11 однопоточные. в одном потоке живет сцена, во втором gl/dx11. больше «жрать» нечего.

i36_zubov
()
Ответ на: комментарий от Rost

рендерит видеокарта по большей части, логику и ИИ конечно можно усложнить, чтоб она целое ядро отжирала, ну звук ещё, но дальше всё

Harald ★★★★★
()
Ответ на: комментарий от ekzotech

на самом деле не всё так плохо.

ибо вот я сам делаю свой проц и у мну по плану еще более свирепая жесткая схема: 800мгц * {50-200 ядер} * 8оп/цикл

так вот. можно однопоточные приложухи тащить в N потоков.

другое дело, что сделать реально N-ггцовый проц очень сложно изза патентов. дело не в «отставании» в плане техники. Просто ты не можешь сделать АЛУ на нужную частоту потому что все возможные подходы заминированы патентами. Я об эту же проблему споткнулся. Еще когда patentstorm был жив, нашел 8 патентов, блокирующих создание «быстрого» FPU

i36_zubov
()
Ответ на: комментарий от Harald

вы не поняли сарказма :)

а так, да, обычно досточно:

1) рендеринг 2) вся игра

Rost ★★★★★
()

Ученый изнасиловал жунралиста.жпг

Как было - юзеры браузили дазу банных гикбенча и набраузили на сомнительной достоверности тест инжиниринг семпла не очень понятно чего, не очень понятно каким образом протестированного. У юзеров более технически подкованных и внимательных вылезли вопросы по поводу результатов, в частности memory bandwidth и невидимого L3 кеша. У юзеров более параноидальных вылезли вопросы по поводу достоверности бенчмарка, и гикбенчу припомнили фейки в прошлом. Юзеры с недевичьей памятью припомнили так же утекшие бенчмарки вродебыкак десктопной (но тоже ES) версии с гораздо более няшными результатами.

infine
()
Ответ на: комментарий от Rost

работа с вводом-выводом на практике не паралелится.

ии тоже не паралелится, т.к. ему надо лазать в «сцену» где происходит игра.

вообще, если ты придумаешь именно игровой движок, а не рендеровый, который может во много-поточность, то ты считай что выиграл. именно он гробит FPS. но такого пока никто не придумал.

i36_zubov
()
Ответ на: комментарий от darkenshvein

начав с серверных камней? это странно.. но ладно..

Thero ★★★★★
()
Ответ на: Intel рульнул от Camel

это хелловорд не параллелится, а в реальных приложениях всегда есть что раскидать по потокам. вот только 95% погромистов выпадет в кернел паник, когда им говоришь о потоках и б-же упаси при этом еще и намекнуть, что их может быть больше одного!

der_looser ★★
()
Ответ на: комментарий от i36_zubov

В реальном мире всё упирается в скорость последовательных вычислений, бегом читать про Amdahl's law. Xeon phi и обычные xeon с 48 потоков уже есть, но задач за пределами серверов у них нет.

nvidia
()

олько-только осилили 2 ядра

Вообще-то не все задачи можно параллелить. Да еще и на много ядер.

dk-
()
Ответ на: комментарий от WARNING

Т.е. на производительность в одном потоке они забили, это печально.

Ссссо всем ответственностью заявляю, что на производительность в однопотоке при потолке техпроцесса не должны забивать сами программисты. Так то!

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от Harald

звук
звуковые эффекты 3D
ресемплинг какой
одновременное прогрывание разных файлов (+1 поток каждому)

вот уже штуки 4 на звук вышло :)

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от darkenshvein

Это всё и одно ядро не нагрузит, а упирается всё в последовательный цикл «ввод от пользователя->ии/логика->отрисовка->ввод от пользователя».

nvidia
()
Ответ на: комментарий от nvidia

если цикл такой длинный что его не успевает обработать однопоток среднего современного проца 4ггц, то может есть смысл разбить его на два, а?

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от darkenshvein

Потому что последовательная зависимость, если даже раскинуть на несколько ядер, они будут простаивать, ожидая результатов от предыдущего ядра. Так понятно?

nvidia
()

ибо программасты ААА йоба-игр только-только осилили 2 ядра. лишь некоторые 4.

А как же многопоточные Пукан и Прямой хэ 12? Сейчас во все бесплатные* движки, типа Единение 3Д, ПлачДвижок или НириальныйДвижок их поддержку запилят и привет.

atrus ★★★★★
()
Ответ на: комментарий от outtaspace

Что за режим?

Авторазгон под нагрузкой. Уже лет 10 во всех процессорах ПК.

atrus ★★★★★
()
Ответ на: комментарий от atrus

Так проблема то в играх. Надо синхронизировать данные игрового мира и данные 3д графики. А это потоки а сраконька подгорает от них

i36_zubov
()
Ответ на: комментарий от i36_zubov

С этим не спорю, но исправлению кода тоже есть предел.

nvidia
()
Ответ на: комментарий от nvidia

неа, так стало ещё запутаннее. как тогда топовое ядро штеуда уделывает топовый FX-9590, если мегагерц больше? и там и там ведь последовательно выполняются, по твоей логике?

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от darkenshvein

или не совсем всё же последовательно?

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от darkenshvein

Операций за такт больше (ipc), лучше контроллер памяти и кэш (это всё исправить обещают в zen). Частота в отрыве от этого не показатель.

nvidia
()
Ответ на: IBM от dk-

У них

У них ядра огромадные

Там конечно и пять и десять потоков но опять же: почему их пять.потому что проц насасывает на одном потоке

i36_zubov
()
Ответ на: комментарий от nvidia

Я тут где то уже постил сравнение ipc. так вот, оно где то в районе 1-0.7 со времен пня2. Все ухищрения просто для того, чтоб не проваливаться сильно ниже единицы.

i36_zubov
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.