LINUX.ORG.RU

Бутылочные горлышки в _архитектурах_ видеокарт?

 


0

1

Возьмем для примера сравнение http://gpu.userbenchmark.com/Compare/AMD-RX-550-vs-Nvidia-GTX-950/3925vs3510

Можно заметить выигрыш скорости на одном показателе в 2 раза, когда как другой даже меньше на 1%, другие же показатели, тоже, относительно «Gravity» разнятся по скорости в 2 раза!
Это что за разбалансировка производительности между картами такая? Будет ли «Splatting» в случае GTX 950 бутылочным горлышком? Или это наоборот, RX 550 так не сбалансирована? Как я понимаю, на баланс этих показателей и отсутствие бутылочных горлышек влияет количество шейдерных процессоров, блоков текстур, растеризации, пропускная способность памяти, частоты и т.д.

Так в каких случаях имеют место быть бутылочные горлышки, а каких - кривая архитектура?

Ответ на: комментарий от Quasar-Napilnik_CPY

This benchmark tests a GPUs ability to use two features in Direct3D: render target array and geometry shader.

этот бенчмарк еще дальше от реальных игровых приложений, чем 3DMark и Blender, и не показывает ровным счётом ничего. это как замеры пиковой производительности с помощью FMA3

Ford_Focus ★★★★★
()
Ответ на: комментарий от Ford_Focus

Ну хорошо, софт, так софт. Nvidia опять победила. Но тогда резон AMD выпускать более мощное железо по той же цене? Перенаправить потоки финансирования с железячного отдела в софтовый они не пробовали?

Quasar-Napilnik_CPY
() автор топика
Ответ на: комментарий от Quasar-Napilnik_CPY

Перенаправить потоки финансирования с железячного отдела в софтовый они не пробовали?

пробуют понемногу. вкладываются в GPU Open, сотрудничают с Blizzard и (внезапно!) Ubisoft. просто у них эти «потоки» не такие уж и жирные, чтобы революции устраивать

Ford_Focus ★★★★★
()
Ответ на: комментарий от Quasar-Napilnik_CPY

Была игра PUBG ее сделали так чтоб она работала максимально медленно на всех видеокартах(и выглядела хуже квейка3 из 99)

Нвидиа, а вслед за ней АМД выпустили драйвера «под игру» где весь тот треш что шлет игра видеокарте, собирается и «оптимизируется» так чтоб производительность игры вырасла в 2 раза

пример на «записи на жесткий диск»
вот есть софтина(PUBG) которая пишет десять-тысячь-миллионов--маленьких файлов(запросов в видеокарту) за «фрейм»
и все работает невероятно медленно и диск(видеокарта) всегда нагружен на 100% и «кеш диска» используется очень слабо
оптимизация на урвне ядра-ОС:
если имя софтины==софтина_PUBG то собираем сто-тысячь(в зависимоти от размера кэша диска этой модели) запросов вместе не отправляя на диск, и диск за раз пишет не 1байт, а сто тысячь за тоже время что и один, потому что «такая технология этого диска»
и все софтина стала работать более чем в 10 раз быстрее с меньшей нагрузой на диск

вопросы-почему эта оптимизация делается на уровне ядра-ОС, а не на уровне софта

«заговора» нет, просто так вышло

также работает с «эксклюзивами» под видеокарту, на одной модели НвидиаXXX есть суперфункция которая работает супербыстро, ее девелоперы начинают использовать, но на следущей модели NvidiaYYY эта функция вообще перестает работать, или работает невероятно медленно (сегодня это касается старых игр на первых версиях DX9, они работают порой медленнее чем на старых 128мб видеокартах)

Перенаправить потоки финансирования с железячного отдела в софтовый они не пробовали?

невозможно успорить все... из за того что видеокарты «слишком слабые» делают упор в пару наиболее востребованных функций, больше не имеет смысла, через 5 лет мощности будут как минимум в 2 раза больше, со своими подводными камнями...
тоесть коротко-сейчас «подводных камней» слишком много чтоб фиксить их все на уровне драйвера или железа, и фиксят лишь пару наиболее востребованных

missxu
()
Ответ на: комментарий от Ford_Focus

Железо с потенциалом на дальнейшее ускорение - очень даже хорошо. Но тут писали, что в определенных моментах оно итак бомба в 100 крат быстрее конкурентов, как так? Что за чудо-кадры у них там сидят?

Quasar-Napilnik_CPY
() автор топика
Ответ на: комментарий от Quasar-Napilnik_CPY

в 100 крат быстрее конкурентов

Нвидия ускоряет шейдеры «подменой функций на заранее известный результат», наприме есть функция рандома, на основе расчета фрактала от числа, и нвидия вместо этого расчета просто выдает готовое число
в более высоких и сложных расчетах шейдера это тоже работает(порой удивительно даже становиться)

по факту Нвидиа карты должны быть слабее в 2-3 раза аналога от АМД,тоесть выдавать в 2-3раза меньше ФПС на шейдерах, но по факту АМД выдают меньше ФПС порой в разы, из за «шаблонной оптимизации» в Нвидии

но если нужны «настоящие расчеты» еще нешаблонизированные или которые невозможно подогнать под шаблон(майнеры или CUDA) тут Нвидиа и проседает в разы на фоне АМД

missxu
()
Ответ на: комментарий от missxu

«шаблонной оптимизации» в Нвидии

Это запатентовано? AMD в своих игровых картах не может это использовать и ставить железо слабее?

Quasar-Napilnik_CPY
() автор топика
Ответ на: комментарий от Quasar-Napilnik_CPY

Сейчас он тебе выдаст рекурсивное неопровержимое доказательство вроде «денег же нет».

anonymous
()
Ответ на: комментарий от Quasar-Napilnik_CPY

Это запатентовано? AMD в своих игровых картах не может это использовать и ставить железо слабее?

это неправильно, и многие игровые шейдеры ловят «баги» из за этого, когда шейдер написан правильно но не работает на паре моделей карт Нвидии, приходиться делать обходы в таких шейдерах(что еще замедляет работу в том числе других карт)

в случае с шейдерами это просто «мало заметно» и Нвидиа делает неполные кадры, мухлюет с FBO(фреймбуфером)...

Нвидиа делает чтоб «картинка для глаз была неразличной» между тем что должно быть и «фейковым оптимизированным результатом»

АМД просто не прибегает к этому подходу

missxu
()
Ответ на: комментарий от missxu

АМД просто не прибегает к этому подходу

Корпорация добра прямо

Quasar-Napilnik_CPY
() автор топика
Ответ на: комментарий от anonymous

в пример могу привести этот шейдер написанный Нвидией https://github.com/danilw/Castle-game/blob/master/glsl/nvfxaa.glsl

(для всех платформ не только ПК)

там прописаны ifdef-ы и многоуровневые if-ы на сотни вариантов
тоесть этот шейдер работает по разному на разном разрешении и разных картах самой Нвидии

missxu
()
Ответ на: комментарий от Quasar-Napilnik_CPY

потоме что АМД пишут драйверы по принципу:
если (GL_функция) используется, то делаем ее реализацию

если (GL_функция) не используется, то возвращаем 0(дефолтное пустое значение чтоб не крашить пограмму, типо у нас все работает)

и вот выходит новая GTA5 на ПК, и работает на всех Нвидиах, но не на Радеоне(так и было неделю гдето)
и не из за «скрытых оптимиаций», а тупо потому что GTA5 испльзует «новые» функции DX10 и DX11 которые просто не реализованны в драйвере Радеона

в 99% новых игр и почему они не работают на радеонах пока новый драйвер не выйдет именно в этом

ругать в сторону «кривущего АМД драйвера на линуксе» в томже, там еще меньше GL функций реализованно чем под винду

missxu
()
Ответ на: комментарий от Quasar-Napilnik_CPY

а баги зависят от игры

постоянно привожу в пример CEMU и Dolphin-emulator и Xenia

там таааакие страдания девелоперы преодолевали, делая это все работоспособных под Радеон, шо ужас(сотни кода по обходу кривостей радеона)

могу добавить DXVK но там немного страданий, код слишком простой, но и там сделан «спецкод» для радеонов

missxu
()

бери кароче RX 580

это аналог GTX 1080, по названию ясно, только дешевле!

а можно вообще взять RX VEGA - это уже аналог Титана
и запомни раз и навсегда что АМД дешевле, лучше, надёжнее и холоднее конкурентов
а ещё они качественые опенсорс драйвера делают
а если кто-то тебе будет говорить что это не так значит это жидомаркетолог!

anonymous
()
Ответ на: комментарий от kaaa

разработчика AMD

Да ладно?

забанили

Он как мегабакс и Эдичка? Принципиально не заходит даже после разбана?

Deleted
()
Ответ на: комментарий от missxu

сегодня это касается старых игр на первых версиях DX9, они работают порой медленнее чем на старых 128мб видеокартах

Ой, пруфы дайте!

tiinn ★★★★★
()
Ответ на: комментарий от missxu

оооо, вот эта проклятая фича нвидии с VBO. помню, как на штеуде и амд работала отрисовка через glMultiDrawIndirect а на нвидии хрен, пустой экран. зато в цикле работает.

i36_zubov
()
Ответ на: комментарий от kaaa

Скотинку, разработчика AMD, забанили, а остальные диванные теоретики.

Да он там уже сто лет как не работал

Deleted
()
Ответ на: комментарий от tiinn

Ой, пруфы дайте!

все UE3 игры(тормоза ниже 60ФПС на топовых современных картах), более старые Halo(фпс ниже 30 на всех картах Нвидии начаиная с 2008 года), многи старые движки даже опенсурс не буду вспоминать

missxu
()
Ответ на: комментарий от i36_zubov

шейдеры весят килобайты, ну может десяток килобайт

ссылку на шадертой давать? там сотни если не тыщи шейдеров что свободно по 1гб+ потребляют

missxu
()
Ответ на: комментарий от t184256

Ты бы сразу написал, что ничерта не смыслишь, а то я, как дурак, сижу второй пост уже читаю. Тьфу.

главное написать что я дурак(пруфов не надо), все остальное не важно

сразу видно пятизвездочника с лора, ставлю класс

missxu
()
Ответ на: комментарий от missxu

UE3 игры

BioShock Infinite - за сотку фпс даже под пинуксом, маня. И упираться такое древнее говно может сугубо в процессор. Ты вообще ничего не смыслишь в то, о чём рассуждать пытаешься.

anonymous
()
Ответ на: комментарий от missxu

главное написать что я дурак(пруфов не надо)

Ну зачем ты так. Ты очень грамотно и аргументировано доказал, что ты дурак, не придерёшься.

redgremlin ★★★★★
()
Ответ на: комментарий от missxu

Давай, у меня как раз больше. Только нормальных, пожалуйста.

Хотя не факт что проблема не в вебне будет.

anonymous
()
Ответ на: комментарий от missxu

* Средний интеллект участников треда удвоился *

redgremlin ★★★★★
()
Ответ на: комментарий от i36_zubov

Как мне кажется, он имел в виду что они аллоцируют в памяти сотни гигабайт. Но мне что-то сложно представить столь комплексный шейдер, скорее кривой и с нулевой оптимизацией. Тем более чтобы его использовали где-то в индустрии (это там где в требованиях какая-никакая работоспособность на встройках).

anonymous
()
Ответ на: комментарий от NiTr0

а ничего, что direct compute используется для рассчета физики вместо physx? :)

Раньше, во времена PhysX, видеокарта в играх выступала сугубо для обработки графики. Вот я и написал, что у Nvidia был резон добавить лошадок сверх меры в своих игровых картах. Сейчас же да, времена и картина необходимого количества мощностей изменилась

Quasar-Napilnik_CPY
() автор топика
Ответ на: комментарий от NiTr0

всяко лучше чем 1/32.

Насколько я знаю, FP64 в играх никак не задействуется - кастрировать можно с лихвой

Quasar-Napilnik_CPY
() автор топика
Ответ на: комментарий от Quasar-Napilnik_CPY

а причем тут замшелые времена печ8800? речь о async computing в dx12. в который нвидия не умеет, умеет только эмулировать его.

NiTr0 ★★★★★
()
Ответ на: комментарий от missxu

Зачем пруф, я просто в комментарий тебе добавил

missxu (19.07.2018 12:05:25) Бутылочные горлышки в _архитектурах_ видеокарт? (комментарий)

чтобы вдруг если еще раз уши развесил, то хоть спорить не начал бы.

t184256 ★★★★★
()
Ответ на: комментарий от i36_zubov

да ничего там не аллоцируют

фреймбуферы не жрут память, текстурки копируемые шейдером не жрут память, многократное использование текстурок не жрет память, очень интересно

охуж эти лоровские теоретики

ах,да ес че,минимальный размер скомпилированного шейдера(уровня хеловорд) начинается от 100кб(мои шейдеры на 8к строк в скомпилированном виде до 500кб весят)

если щас вылупиться умник поясняющий мне разницу компиляции интерпретации и байткода, сразу пошлю куда подальше

missxu
()

Что такое «баланс»?

Вот в видеокарте для майнера ROP-блоки — абсолютно лишние. И RAMDAC — лишние, и TMU тоже лишние. Получается, все карты не сбалансированные?

i-rinat ★★★★★
()
Ответ на: комментарий от Quasar-Napilnik_CPY

дык речь о современных картах. и сейчас таки амд более перекачана вычислительными блоками и прочими плюшками.

NiTr0 ★★★★★
()
Ответ на: комментарий от i-rinat

Вот в видеокарте для майнера

Речь про игровые, сбалансированные для игровых движков.

http://gpu.userbenchmark.com/Compare/AMD-RX-550-vs-AMD-RX-560/3925vs3926

Почему в RX 560 значительно увеличители только Parallax (+75%) и Gravity (+90%) по отношению к RX 550? Не приведет ли это к дисбалансу производительности; не станут ли MRender (+11%) и Splatting (+8%) бутылочным горлышком? Вот я о чем.

Quasar-Napilnik_CPY
() автор топика
Ответ на: комментарий от NiTr0

Перекукуружена. Лепят не исходя из реальной работы железа а каких-то всратых идей.

anonymous
()
Ответ на: комментарий от Quasar-Napilnik_CPY

Речь про игровые, сбалансированные для игровых движков.

Слово «сбалансированные» просто не имеет никакого смысла. На уровне «что-то там» его ещё как-то можно интуитивно пытаться понять. Но «сбалансированность» не является объективным показателем.

i-rinat ★★★★★
()
Ответ на: комментарий от Quasar-Napilnik_CPY

Почему в RX 560 значительно увеличители только

Ты не с той стороны на это смотришь, это не с младшей наращивали блоки а с топовой урезали до самой младшей. Сперва была спроектирована RX580, а затем в зависимости от процента брака тех или иных частей при производстве решали какие части и насколько урезать для младших видеокарт.

V1KT0P ★★
()
Ответ на: комментарий от i-rinat

Слово «сбалансированные» просто не имеет никакого смысла.

Допустим, если картам из низшего сегмента поставить не 64-bit память, а 128-bit - их производительность в играх возрастет гораздо значительней, чем даже если им увеличить число блоков, а это значит, что выбранная ширина шины данных карт - очень несбалансированный параметр для игровых движков

Quasar-Napilnik_CPY
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.