LINUX.ORG.RU
ФорумGames

До сих пор верно ли утверждение, что в играх самой важной является производительность single core, а не общая всех ядер?

 , , ,


0

1

Тут вот подбиваю результаты тестирований, Ryzen 7 9700X, при разнице в цене ~x2 с Core Ultra 9 выглядит в однопотоке очень не плохо.

Ответ на: комментарий от unclestephen

Режим энерговируса это частое явление, если что. Вот тут видео без этого дела. Правда в разложенном окне добавляется несколько ватт, если что. И это все-таки с андервольтом. Без него разница могла быть в два с плюсом раза и тут может даже технологический процесс не затащить. Как на видеокартах, когда старое поколение снижает частоты на 100-300 Мгц, чтобы ужаться в ограничение по потреблению. То есть реальная разница может быть примерно такой и какой-нибудь удачный чип 12-го - 14-го поколения может равняться 285К. Игры по-тупому могут жарить процессор и VRM платы потому что им кажется что все в порядке. И это при всего-то около 60 кадрах. Поэтому я настоятельно рекомендую уделить внимание настройке напряжений андервольтом.

https://rutube.ru/video/private/bf07080400f16117d4004ff3d0c9125e/

А вот обычное видео, правда вначале идет легкий режим когда видеокарта работает пассивно. Это такой стеб над Unreal Engine 5 с RX 6500 XT, которую видеокартой не считают, но люди не особо ценят юмор что можно не упарываться в максимум кадров.

https://rutube.ru/video/211074eeebb57e06561392ecce5a731d/

anonymous
()
Ответ на: комментарий от Byers

Я не спорю, что все это задействовано. Вот только можно ли ткнуть пальцем в часть монитора и сказать - вот первое, а вот второе? А если это убрать, будет заметно?

water_closed
()
Ответ на: комментарий от water_closed

Надо самому увидеть, в dx11 и в dx12 - это просто две разные с точки зрения графики игры.

Byers
()
Ответ на: комментарий от nrader

Ты и прав, и неправ одновременно.

Доступ к исходникам получить можно. https://dev.epicgames.com/documentation/unreal-engine/downloading-source-code-in-unreal-engine

Он просто под EULA (под защитой боевых юристов), но найти баг в исходниках и зарепортить его разработчику движка можно.

qa
()
Последнее исправление: qa (всего исправлений: 1)
Ответ на: комментарий от unclestephen

Когда имеешь дело с нашими техноблоггерами и видишь что-то такое, как использование Load Line Calibration для снижения потребления в режиме Offset сразу понимай что это технический уровень да считай что у всех, кроме может быть тех кого не знаем. Load Line Calibration только в режиме Adaptive + Offset + VFPoint трогать стоит, потому что базового оффсета недостаточно на малых частотах. При поломанном как у меня сейчас он полностью вырубает режим оффсета с активным в том числе оффсетом и LLC используется уже вместо него. Видимо это баг, но я уже неделю пытаюсь добиться реакции от MSI, чтобы подтвердить что они поняли что это за баг. То есть в норме должно быть понижение LLC, чтобы оффсет либо совпал с режимом Adaptive + Offset, либо превысил его. Просто снимать руководство когда биос поломан это жесть какая-то. Наши техноблоггеры при этом считают нормой заявлять типа вот на AMD на новых биосах задержка памяти на 10 нс выше, что же поделать и типа так и надо тестировать на поломанном биосе. Так что вот такого шального бреда - вагонищи или точнее вообще все что я видел. Фиксом он тоже там лупит по ядрам. При этом использует топовые платы вроде как, хотя топовые платы это топовые чипсеты и другие режимы работы соответственно, а не простой оффсет или фикс.

https://rutube.ru/video/7bc5421232a973b638800a406ec42549/?t=841&r=plwd

Единственный кто приблизился к разгадке андервольта это Gerkon, хотя он тоже запутался в подставной функции Lite Load. Вот тут объясняет на примере 13700К разницу разгона с андервольтом и хотя бы правильно понимает что нужен именно андервольт и что воздушного кулера вполне достаточно. Это просто чуть ли не чудо для меня было обнаружить такой уровень здравомыслия.

https://rutube.ru/video/a4fea808c179e7ccb8cd17714a4a877e/

anonymous
()

Давайте уже говорить о конкретной игре. У каждой свои требования. Общего решения на всех нет. Процессор с большим числом ядер может работать медленней.

jura12 ★★★
()
Ответ на: комментарий от byko3y

Ну вообще я четко писал, что речь шла именно о сферическом геймдев разработчике, причем не обязательно на UE.

Юнити, например, доступа к исходникам не даёт, кроме как за отдельную, причем нифига не символическую плату. Причем для того чтобы их не только почитать, а еще иметь право потом скомпилить, плата еще выше. А на ней, на секундочку, сделано дофига игр.

Плюс даже если конкретный движок даёт сорсы, они могут быть, например, на другом языке относительно того, который движок применяет для игровой логики. Или еще какие-то подводные камни, из-за которых штат программистов, работающий над обычной игровой логикой, туда не станет лезть, просто забив на некритичные проблемы.

nrader
()
Ответ на: комментарий от jura12

Процессор с большим числом ядер имеет больший кеш. Эффект 3D кеша для однопотока получается, потому что ему много не скормить получается. Много медленных ядер как у FX это проблема программистов и тут поэтому была ссылка на видео, которое называется «Он вам не фуфыкс» где разбирается строение и почему такое происходит, а в общем из-за тупых разработчиков, которые почему-то не умеют в многопоток. Видео 9 лет, а поменялось ровно 0, а AMD FX это внезапно 15 лет как уже на рынке, а разрабы все также жутко лагают, не то что как двоечники, а еще хуже - это уровень шимпанзе когда они новое выучить не могут.

anonymous
()
Ответ на: комментарий от nrader

Вообще это обычное дело когда язык один, а библиотеки на Си или Rust. Ржавой для типа безопасной работы с памятью. Язык тут не всегда принципиален, потому что можно и на плюсах нафигачить многопоток, но другое дело что не умеют. Игровую логику как раз пишут на скриптах, потому что хрен знает что ты выберешь. Практически это должен быть уровень shell, а на деле получается мутотень, которая тормозит игровой процесс. Движки могут не давать исходники и это не повлияет никак на игру, которая написана отдельно от программирования, используя возможности движка. То есть не имея никаких ограничений самом движка все равно пишут отвратительный код как правило. Причем на консолях, которые AMD FX на пониженных частотах это все работает нормально в отличие от самого AMD FX например. Это же консоли спасли AMD от банкротства когда они лагали с архитектурой процессоров. То есть уже давно существует острая необходимость писать код адекватно, но разработчики этого старательно не делают - значит не умеют. Именно это важно - то что это все значит.

anonymous
()
Ответ на: комментарий от anonymous

Много медленных ядер как у FX это проблема программистов

Нет. Там у некоторых ядер были общие блоки. То есть ядер 8, а блоков всего 4. Это некритично для компиляции например, но с остальным не так хорошо.

vbcnthfkmnth123 ★★★★★
()
Ответ на: комментарий от vbcnthfkmnth123

Еще один. Блоки ядер парами это не полное разделение функций, но по смыслу это именно ядра, аналогичные современным малым ядрам у интела, которые работают блоками по 4 ядра. В любом случае они требуют работы всех восьми потоков на восьмиядерниках, чтобы задействовать свои ресурсы, так что погляди пожалуйста видео «Он вам не фуфыкс» прежде чем продолжать кидаться заявлениями.

anonymous
()
Ответ на: комментарий от z0idator

Вот здесь то что старательно не заметили техноблоггеры, а иеено объем L2 кеша. Даже на топовой RTX 3090 это 6 мегабайт, а у RTX 5070 Ti это 48 мегабайт. Соответственно кеш видеокарты отчасти компенсирует нехватку кеша процессора. Все же это прибавка 36 мегабайт кеша в общую копилку. А у популярной 3070 там всего 4 мегабайта. То есть 3D кеш как бы его ни нахваливали меньше стал нужен. AMD же вкорячили кеш L3 на 32 мегабайта для RX 9060 XT и 64 мегабайта дали RX 9070 XT. Если бы это был кеш L2 это было бы круто, а так в винде фигня, в линуксе получше, но тоже как-то неуверенно из-за того что это только L3, да еще и память не крутая GDDR7. L3 должен быть сильно медленнее L2. На ARC B580 всего 18 мегабайт кеша L2, хотя L1 вдвое больше и интелы видимо пытались заткнуть проблему L2 кеша кешем первого уровня. Выглядит круто, но на деле крайне зависимо от процессора получилось без аппаратного блока распределения нагрузки. Но ядер то в играх обычно более чем хватает, так что это еще не так страшно и еще может взлететь, хотя аппаратный блок обязателен, если бы не разница в цене. Причем есть вероятность что нагрузку могут брать на себя малые ядра, но это неточно и все равно за 20К у нее нет соперников, но на линуксе она пока что не блещет, хотя это не такой мрак как когда они начинали. В общем неудачное решение AMD явно в целях удешевления может и сработало, но наши продаваны укажут всем что надо брать зеленые карты и не выеживаться. Там прямо жесткие установки что надо проталкивать интел и нвидию, а люди думают там правда лучше. Нет, просто их десятилетиями навязывали. Сейчас же интел хороши потреблением ядер при большом их числе, а на видеокарту мощностей ядер явно хватит в играх. Кроме того мощность расчетная 190 ватт, но обычно потребление сильно ниже у видеокарт, а это внезапно долговечность должна быть выше. А то люди забыли про майнинг, но напрячь карту для которой нагрузка это две трети потребления это же офигенно и слабенько влияет на ее живучесть. И вполне есть вероятность что они как процессоры делают на десятилетия, так и видеокарты будут жить. Столько интересных нюансов, а обзорщики все как один трындят одно и то же. Офигеть уникальные личности. Офигеть разные. Тут целые стратегии вокруг выстраивания системы можно выстроить с заточкой на что-либо и только жизнь покажет чья стратегия была лучше. А техноблоггеры орут про то что сейчас, будто им будущее открыто. Они там были,все видели и точно знают что говорят. Я тут видео блондинки наткнулся. Мать ее она кому-то комп собирала, облажалась и взяла дорогую память и в пару к тому вместо X3D процессора под игры взяла шестиядерник, потому что бюджет. Никогда так не делайте. 3D кеш стоит впереди - процессор самое главное в системе. От него все остальное зависит. Быстрая память потом как-нибудь, но можно ее и не брать для 3D камней.

RTX 3090

https://www.techpowerup.com/gpu-specs/geforce-rtx-3090.c3622

RTX 5070

https://www.techpowerup.com/gpu-specs/geforce-rtx-5070.c4218

ARC B580

https://www.techpowerup.com/gpu-specs/arc-b580.c4244

anonymous
()
Ответ на: комментарий от anonymous

аналогичные современным малым ядрам у интела, которые работают блоками по 4 ядра

Я говорю именно про работу на одном ядре по отдельности. Предположим у тебя есть игра Crusader Kings 2. Она заточена под работу на 3-х ядрах. Если её запустить на например 8350 то она будет как говно работать, потому что блоки общие. А если взять и запустить её на процессоре с одними малыми ядрами(E-core), то такой фигни не будет. Так что приравнивать общие блоки(FX) и малые ядра(E-core) большая-большая ошибка

vbcnthfkmnth123 ★★★★★
()
Последнее исправление: vbcnthfkmnth123 (всего исправлений: 1)
Ответ на: комментарий от vbcnthfkmnth123

Что ты несешь? Если 3 потока разнести по разным модулям можно добиться большей производительности, потому что кеш L2 по блокам делится. И как раз малое число потоков это признак самого поганого уровня программирования. Но и это может не помешать на настольных системах, потому что ATX формат в то время включал как правило два слота PCI Express и можно сделать парную графику, которая может сильно сбить требования к процессору. Ты очень зря думаешь что играм много надо. Проблема в синхронизации также в старых играх, отчего NTSYNC добавленный в новые версии Protong GE, но пока не в основную ветку может в разы увеличить производительность равно как и парная графика. Если убрать тонны тормозящих, а скорее стопорящих циклов может получиться все намного лучше чем ты думаешь то как оно должно работать. Добавь сюда еще Vulkan и разнос может быть просто колоссальный. Я вообще не склонен верить на слово, поэтому еще раз показываю как работает Quake Champions, который ты сам найти можешь как работает у других и там даже RTX 3070 запросто может пасовать. Было 13-88 кадров, стало 300 на видео, а на деле вот на днях проверял было 320-420 кадров в секунду. Пойди найди что-то лучше не на топовых видеокартах. И это игра, которую закончили делать только в 2022 году. Там же есть проценты нагрузки по ядрам, потребление - все есть.

https://rutube.ru/video/a9eb7dfc3fada0242e02465c299e9c3b/

anonymous
()

Если в игре всё летает/прыгает и сталкивается то скорее да ибо физику не так просто распараллелить а значит никто не будет этим заниматься, если в игре важен поиск пути то шансов больше его распараллелить. Но это опять надо заниматься.

ya-betmen ★★★★★
()
Ответ на: комментарий от anonymous

Что ты несешь? Если

Crusader Kings 2 запусти и увидишь. Просто на практике увидел, что эта игра работает как говно на AMD FX 8350 и работает нормально на AMD Athlon 300GE PRO. Раньше думал что проблема именно в том что для неё используется интеловская библиотека многопоточности, но на AMD Athlon 300GE PRO производительность значительно выросла. Так как производительность single-core по тестам у AMD FX 8350 и у AMD Athlon 300GE PRO практически одинаковая, то делаю вывод что проблема тут именно в общих блоках у ядер.

P.S. Проверял это все на линуксе, игра нативная.

vbcnthfkmnth123 ★★★★★
()
Последнее исправление: vbcnthfkmnth123 (всего исправлений: 1)
Ответ на: комментарий от vbcnthfkmnth123

Ну значит наверное кто-то что-то сделал криво. Игра должна работать на Pentium 4. Я может и сподоблюсь запустить на П4 эту игру, но очевидно что проблема могла быть либо в драйвере, либо в материнской плате. Эта игра в принципе должна идти на одном ядре нормально. AMD 3500+ это поколение до двух ядер типа Athlon X2 5200+, которые были аналогичны Core и там производительность гораздо ниже производительности AMD FX. Проблема точно не в производительности процессора. Когда у тебя втрое больше чем необходимо это какие-то баги могут быть, но скорее всего заморочка с драйвером.

Pentium® IV 2.4 GHz or AMD 3500+, 2 GB RAM, 2 GB free hard drive space, NVIDIA® GeForce 8800 or ATI Radeon® X1900 video card
anonymous
()
Ответ на: комментарий от anonymous

Эта игра в принципе должна идти на одном ядре нормально

Она и работала нормально, пока её не обмазали DLC, так что они лезть из ушей стали. Так что разрабам пришлось добавлять поддержку 64 бита и многоядерности, иначе движок бы вообще не вытягивал даже запуск игры с DLC.

Требования к видеокарте там не особо большие, но там много расчетов, так как кроме тебя там все остальные тоже делают ходы в реалтайме.

vbcnthfkmnth123 ★★★★★
()
Последнее исправление: vbcnthfkmnth123 (всего исправлений: 1)
Ответ на: комментарий от vbcnthfkmnth123

Ну так DLC это не сама игра. У меня Athlon X2 5200+ с GTX 260 Skyrim запросто тянул, а тут игра сильно проще. Где супер офигенный Skyrim и где Crusader Kings. Для этой игры восьмиядерник это ультимативный оверкилл любых требований к процессору. Тут только проблемы с драйверами могут вылезти и заморочки на корявых DLC.

anonymous
()
Ответ на: комментарий от vbcnthfkmnth123

Я даже не буду париться лишний раз этим, потому что это не изобразит ничего, потому что у меня железо слишком мощное. Но вот как пример тебе восьмиядерный FX-8300 даже без разгона выдает играбельный ФПС в Киберпанке. А я напомню что вот это требовательная к процессору игра. Та игра рядом не стояла. Вот тут нужен грамотный разгон восьмиядерника. Что там за цифры без разгона все равно, потому что это главная фишка AMD с тех пор когда разгон стал нормой. То есть шестиядерный FX-6100 имел низкую частоту, но это не значит что нельзя поднять частоту с 3100 Мгц хоть до 5 Ггц в зависимости от качества материнской платы. И даже этот процессор мог бы вытащить играбельный ФПС даже в Киберпанке. Ты даже не представляешь какую мелочь ты продвигаешь как нечто сложное.

https://rutube.ru/video/63f6e55d81f4ad853e16e2cf4503fc7c/

anonymous
()
Ответ на: комментарий от vbcnthfkmnth123

Нашел я FX-6100 в киберпанке и да, он правда тащит игру. На кольце меньше 60-ти кадров, а вот съехав с самой загруженной области все отлично и играть можно с комфортом. А ведь это еще даже не 8 ядер. Как ты их там называл? Тормозные да?

https://www.youtube.com/watch?v=7VdT1ukUK44

Ну раз тормозные, то сравни их с Phenom II X4 965 у того же чувака в разгоне. Я вот вижу что FX быстрее. Внезапно правда? А ведь это даже не 8 ядер.

https://www.youtube.com/watch?v=98n3uOVD2UY

anonymous
()
Ответ на: комментарий от byko3y

А что там разработчики стали уже игры под Linux делать? Мне кажется всё так же тестируют всё с nvidia и под оффтопиком, а если в линуксе заработает, то это хорошо, не заработает, то и фиг с ним. Как думаешь, разработчиков DXVK/VK3D/Wine что больше волнует, работа дефолтной конфигурации Intel+Nvidia или война с багами в том, что даже в оффтопике может из коробки забагованным быть?

peregrine ★★★★★
()
Ответ на: комментарий от z0idator

Красные когда у них пошли проблемы после RX 500-й серии пригласили того кто разрабатывает серверные процессоры. Ну он и сделал все как процессорах. Этот кеш большой призван к тому, чтобы покрыть разницу в скорости памяти между GDDR6 и GDDR7. Все ровно так же как в случае x3D процессоров. Очень подозреваю что такие процессоры это его затея. Просто фишка тут в том что Intel не стали резать шину и просто добавили чипов, сделав шину на 192 бита и им необязательно иметь большой кеш L2. Зато кеш L1 они напихали в 5 мегабайт, что очень круто выглядит и кеш L2 без 3-го. По идее это самый агрессивный ход, потому что главное загрузить данные и какой-то залаг может и не произойти, если допилить драйверы. То есть ставка на долгую затею. Если бы в RX 9060 XT и RX 9070 XT шина была больше это сократило бы разницу с GDDR7, но они видимо не очень верили в свою затею и сделали лишь вид деятельности. Вроде лучше предыдущего поколения, но как-то неуверенно. Потому что перерабатывать надо что-то для меньших задержек. Линукс умеет хорошо в параллельную работу и драйвер превосходит виндовый, но это выглядит как околопредельный уровень реализации теоретического потенциала. Чип у Nvidia при этомменьше, так что шанс отвала у них тоже меньше, но они как и красные почти всегда жрут на максимум. А вот синие имея чип сильно больше почему-то сдержаннее себя ведут. Да, с накладками, но цена слишком хорошая. И опять же синие только для полноценных компов с парной графикой, иначе в простое они жрут много, хотя зеленые тоже печки в простое. То есть AMD хороши как единственная видеокарта с низким потреблением. стоимость владения никто не отменял. Почти как с мотоциклами ситуация когда дорого мотоцикл может стоить в обслуживании в разы дешевле. Так что Intel и AMD очень хороши сами по себе, хотя AMD схалявили, но линукс это исправляет, так что пофиг, а поддержку синих в 7-е ядро подвезли получше, так что смотреть надо близко ли к винде уже или как. Зеленые выглядят как жуткие халявщики, выезжающие в производительности на памяти, то есть там потенциалу взяться неоткуда. Надо было AMD за такие деньги делать 256-512 бит шину в RX 9060 XT. Но сейчас не инженеры правят балом, а упоротые маркетологи, которым пофиг на конечную производительность. 16 линий на подкачке не спасут AMD, хотя они первыми вернули линии. Но это то же самое как сосед маркетолог перестал срать под дверь. Молодцы, похвально, но этого откровенно мало за такую цену. Продавать то такую карту если что придется виндузятникам. Так что все сложнее чем просто одна деталь, хотя догадка верная. Это все должно хорошо работать в комплексе. Это как женщина, если не представит кого-то в роли мужа, отца и друга, то вряд ли она за муж пойдет, хотя никто не запрещает ей думать местом которое чувствует или чешется, но такой выбор будет сомнительным, поэтому я придерживаюсь того что когда нет оптимума выбирать то что дешевле. И опять же парная графика у меня уже есть, так что от синих прожоров в простое я не пострадаю.

anonymous
()
Ответ на: комментарий от peregrine

Как думаешь, разработчиков DXVK/VK3D/Wine что больше волнует, работа дефолтной конфигурации Intel+Nvidia или война с багами в том, что даже в оффтопике может из коробки забагованным быть?

Дело в том, что в DXVK трансляция происходит между радикально различными типами API. С одной стороны это хорошо, потому что игры под DXVK бегают быстрее, чем на старых драйверах для оффтопика, с другой стороны это плохо, потому что не всё идеально совместимо.

Если же брать игры VKD3D/DX12 с какими-нибудь последними штуками аля трассировки лучей. то тут, действительно, многое зависит от родного драйвера, потому что другие драйвера в эту трассировку просто не умеют.

Учитывая то, что у меня Ryzen+Nvidia работают в адаптивном режиме с отключеним видеокарты при неиспользовании и offload-ом по запросу, можно говорить о том, что этап «сделать универсальный клей подо все карточки» уже пройден, и далее уже важно качество самого драйвера видюхи, а не процессоры.

byko3y ★★★★★
()
Ответ на: комментарий от byko3y

Отключение видяхи nvidia без нагрузки до сих пор не реализовано. (все эти наследники bumblebee и nvidia prime это совершенно не то, что в оффтопике сделано. Там нет перезаходов в систему для переключения карточек, как у optimus-manager и нужды ручками делать prime-run имя игрушки тоже нет) У тебя машина времени? Скажи, что там в будущем. Хотя бы по технологиям, какие всё ещё не заблокированы?

peregrine ★★★★★
()

важнее силы однопотока будет только способность правильно раскидывать 2 три дополнительных потока так чтобы не было мучительно больно.. но это по большей части софтовый прикол. а так для большинства игр за глаза хватает и довольно средней синглкор производительности большая видяха кэш и память чаще будут горлышком ныне.

Thero ★★★★★
()

Я отвечу относительно универсально, не обязательно про игры.

Задачи, выполняемые на компьютере, обычно делятся на те, которые требуют пропускную способность и на те, которые требуют низкое время отклика.

Самый простой пример задачи, требующей пропускную способность, это HTTP сервер с какой-то логикой. Нам не критично время индивидуального ответа каждому клиенту, нам важно обслужить как можно больше клиентов. Обработка каждого запроса происходит в отдельном потоке. Такие задачи, обычно, превосходно масштабируются увеличением числа ядер. В общем смысле это серверные нагрузки. Поэтому типичный мощный сервер это безумное число ядер, огромный объём оперативной памяти, но при этом индивидуально ядро будет довольно медленное.

Задачи, которые требуют низкое время отклика, это в общем смысле десктопные нагрузки. Например я в калькуляторе ввёл 2 + 2, нажал = и мне хочется, чтобы калькулятор побыстрей вычислил сумму. Я не вычисляю сто тысяч сумм одновременно, мне нужна только одна сумма и она мне нужна максимально быстро. Пример с калькулятором, конечно, утрирован, но, думаю, чуть понятна.

Игры это как раз задача, требующая низкое время отклика. У движка есть 16 мс, чтобы нарисовать кадр. Если не успел - изображение дёргается. А в последние годы пошла мода на 144 Гц мониторы и выше, там требования к отрисовке кадра и вовсе запредельные.

Иногда получается такие задачи распараллелить. Но в целом, как правило, если такая задача упирается в процессор, то упирается она как раз в одно ядро. Да, другие ядра при этом задействуются, но апгрейд процессора с 16 ядер до 32 ускорения не даст. А даунгрейд процессора с 16 ядер до 8 чуть более быстрых - скорей всего даст.

Поэтому на десктопе всегда важна максимальная производильность одного ядра. При этом, конечно, число ядер должно быть адекватно окружающей действительности. Не стоит сегодня использовать одноядерный процессор. На мой взгляд 4 ядра это комфортный минимум. Потому, что какие-то усилия для распараллеливания писатели программ прилагают и совсем игнорировать эти усилия тоже не стоит.

И для серверов бывают задачи, где критично время отклика. И для десктопов бывают программы, где паралелльность будет задействоваться до любого предела. Но в целом - так.

vbr ★★★★★
()
Последнее исправление: vbr (всего исправлений: 1)
Ответ на: комментарий от peregrine
$ lspci | grep 01:00.0
01:00.0 VGA compatible controller: NVIDIA Corporation GA106M [GeForce RTX 3060 Mobile / Max-Q] (rev a1)
$ cat /sys/bus/pci/devices/0000:01:00.0/power_state
D3cold
$ prime-select query
on-demand
$ cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module  535.288.01  Tue Nov 18 18:26:41 UTC 2025

Что с лицом?

Там нет перезаходов в систему для переключения карточек, как у optimus-manager и нужды ручками делать prime-run имя игрушки тоже нет

С вот этим немношк сложно. Gnome имеет какую-то часть поддержки настройки видеокарты. Потому что проблема не в том, чтобы её включить, в том, чтобы выбрать, когда она включена, а когда - нет. Например, Steam умеет сам определять нужную видеокарту. Lutris тоже сам умеет. Просто запуск нативного приложения не активирует нужную видеокарту.

PS: ну и может быть со стимом я немножко прибрехнул:
sh -c «__NV_PRIME_RENDER_OFFLOAD=1 __VK_LAYER_NV_optimus=NVIDIA_only __GLX_VENDOR_LIBRARY_NAME=nvidia steam %U»
В принципе, то же самое можно сделать через «gamemoderun steam %U»

byko3y ★★★★★
()
Последнее исправление: byko3y (всего исправлений: 2)
Ответ на: комментарий от vbr

Иногда получается такие задачи распараллелить. Но в целом, как правило, если такая задача упирается в процессор, то упирается она как раз в одно ядро. Да, другие ядра при этом задействуются, но апгрейд процессора с 16 ядер до 32 ускорения не даст. А даунгрейд процессора с 16 ядер до 8 чуть более быстрых - скорей всего даст.

Современные движки аля UE5 настолько всё пытаются скинуть с главного потока, что он оказывается чуть ли не самым простаивающим. Конечно, тут зависит от реализации логики игры, но в целом идея. думаю, ясна.

И я ещё раз напоминаю, что современные центральные процессоры чудовищно неэффективны, потому в графике вопрос скорее в том, насколько процессор «не мешается» в работе.

byko3y ★★★★★
()
Ответ на: комментарий от byko3y

Современные движки аля UE5 настолько всё пытаются скинуть с главного потока, что он оказывается чуть ли не самым простаивающим. Конечно, тут зависит от реализации логики игры, но в целом идея. думаю, ясна.

А какая разница, какой поток «главный». Наскидываются и будет «второстепенный» поток ограничивать производительность. Хотя скорей всего в большинстве игр FPS в видеокарту будет упираться и все эти разговоры про процессор не слишком важны.

Тут скорей может помочь архитектура из разряда тройной (или тридцатерной) буферизации. Когда в один момент времени считаются куча кадров параллельно: следующий, следующий за ним и тд. Так, чтобы когда подошло время рисовать кадр - он уже был бы готов и ещё следующие десять кадров. Пока эти десять кадров рисуются - просчитались следующие десять. Тогда просадка во времени просчёта одного кадра не важна, пока суммарная производительность остаётся на уровне. Но при таком подходе игра будет казаться слегка неотзывчивой, реагировать будет с запозданием. Тут тоже можно какие-то варианты придумывать, например предсказывать действия пользователя и сбрасывать конвеер просчитанных кадров только если предсказание оказалось слишком неудачным.

vbr ★★★★★
()
Последнее исправление: vbr (всего исправлений: 2)
Ответ на: комментарий от byko3y

on-demand

ЧТД, т.е. через prime-run, всё правильно, ручками можно запускать на интеграшке, автоматом только то, о чём озаботились девелоперы через те же скрипты с prime-run

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 1)
Ответ на: комментарий от peregrine

ЧТД, т.е. через prime-run, всё правильно, ручками можно запускать на интеграшке, автоматом только то, о чём озаботились девелоперы через те же скрипты с prime-run

Ну, и чо тебе не нравится? Мне под виндой тоже приходилось делать «запустить с видеокартой» или ковырять настройки нвидии.

byko3y ★★★★★
()

ну как минимум cs2 и gta v требуют наличие четырех ядер процессора, так что не сказал бы, что одно ядро тут играет какую-то роль. причем этим играм не так важно, какой частоты каждое ядро, главное чтоб минимум было четыре ядра, а это довольно таки старые игры, я уже не говорю про новые.

hrenmalin
()
Ответ на: комментарий от anonymous

Купил амд 8500G и пожалел.

Надо было брать полноценный проц, а не g-огрызок. 1ххх, 3ххх, 5ххх, 7ххх, 9ххх.

Включил режим EXPO в биосе, чтобы память использовалась на заявленной частоте производителя, а не на заниженной. Скорость возросла десятикратно.

AZJIO
()
  • Markdown
Пустая строка (два раза Enter) начинает новый абзац. Знак '>' в начале абзаца выделяет абзац курсивом цитирования.
Внимание: прочитайте описание разметки Markdown.
Используйте Ctrl-Enter для размещения комментария