LINUX.ORG.RU

Ответ на: комментарий от dann

Тогда, зачем покупать, если есть арендованные мощности типа Амазона?

vvn_black ★★★★★
()

Ставишь задачу.
Понимаешь возможные ресурсы компьютера.
Накладываешь первое на второе.
Пересчитываешь деньги.
Покупаешь.

Есть вычислительные потоки, есть ОЗУ и есть хранилище. ОЗУ берёшь столько, чтобы задача поместилась. Остальное по финансам.

targitaj ★★★★★
()
Ответ на: комментарий от Deleted

Ага. А если я измерил: программа работает на i7 gen. 4 за время t0. Утверждение: «Приложение будет работать на i7 gen. 8 за время t1 <= t0,» --- слишком неаккуратное?

dann
() автор топика
Ответ на: комментарий от dann

С помощью знания устройства компьютера и возможностей комплектующих.

targitaj ★★★★★
()

Это примерно как конструктор-дизайнер по наитию рисует форму самолёта или корабля. Так же строятся мосты и здания.

Да всё так делается на первой итерации. А потом ты делаешь расчёты по сопромату, аэродинамике и т.п. Если расчёты показывают что «Годно» - то делаем. Не годно - сидим и перерисовываем.

Так же и с компами. Но там пропускная способность шин, объём кеша, количество ядер и средняя скорость исполнения команд, количество каналов памяти и её объём. Здесь тоже нужно быть опытным «художником» своего дела.

HIS
()

ну вот с условным 8-битным контроллером, у которого фиксированная тактовая частота и известное время исполнения каждой инструкции, это довольно легко

на условном i7 тоже в теории можно всё рассчитать, но тут слишком много факторов нужно учитывать (ОС, прерывания, кэши, наличие других параллельно запущенных программ, оптимизации компилятора, поведение контроллера памяти и овердохрена другого)

Harald ★★★★★
()
Ответ на: комментарий от dann

Очень интересно узнать, что тебе понятно?

HIS
()
Ответ на: комментарий от dann

Если у неё есть код на GPU, то весьма, весьма неаккуратное.

next_time ★★★★★
()
Ответ на: комментарий от upcFrost

Это не поможет, т.к. асм для современных процов - высокоуровневый код, который внутри проца ещё дальше оптимизируется.

next_time ★★★★★
()

Есть попугаи(flops, iops), но точный подсчёт очень маловероятен. Имхо, можно прикинуть максимум порядок.

Я уж молчу про то, что если алгоритм действительно утилизирует железо, то там может быть мульён оптимизаций, начиная от повышения локальности данных, заканчивая программированием встроенной fpga или переносом параллелящихся операций на gpu или более специализированный сопроцессор.

pon4ik ★★★★★
()
Ответ на: комментарий от dann

Слишком неаккуратное. Нет гарантий, что конкретно твоя программа на ген 8 будет выполняться быстрее, чем ген 4.

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.