LINUX.ORG.RU
ФорумTalks

аферисты в сколькове

 


2

4

Предыстория: Я пилю свой gpu, основой которому служит мелкий dsp(600k транзисторов, 16 блоков fpu, 8 fadd + 8 fmul) Патентуем, поэтому ищу related патенты и инфу. И вот гугол приносит вот это:

http://multiclet.com/community/boards/5/topics/151?r=160#message-160

Наглых гадов спрашивают: как вы боретесь с тиристорным пробоем? А они даже не понимают о чём вообще речь. Почему это не разгоняют?

☆☆☆

Ответ на: комментарий от ckotinko

Это всё офигительно. А теперь я вангую главный недостаток твоего умножителя — он не существует в кремнии и не будет существовать в кремнии ни в какой разумной перспективе, за одним единственным исключением — если эти два года ты не писал свой FPU для библиотеки элементов, которую производитель-«foundry» будет предоставлять собственно разработчикам готовых устройств.

Ты два года писал FPU потранзисторно. В ынтерпрайзе обычно стоят задачи другого уровня, а именно: за два года написать процессор (а не один-единственный его блок), отладить, верифицировать, запустить на основе ПЛИС, и запустить в производство. Это первое. Второе — запуск в производство имеет ограниченный бюджет, и самыми дешёвыми будут ASIC на стандартных массивах с нанесёнными литографией межсоединениями, следующими по стоимости — ASIC на стандартных библиотечных элементах, и самыми дорогими — full custom, с индивидуально нарисованными слоями литографии от первого до последнего. Разность в стоимости подготовки к производству — от нескольких тысяч долларов до нескольких миллионов для full custom.

Надеюсь, я смог в общих чертах пояснить разницу между людьми, которые делают коммерческие продукты, и людьми, которые just for fun колхозят fpu на транзисторах.

prischeyadro ★★★☆☆
()
Ответ на: комментарий от ckotinko

Слы, бро. А может ты еще лучше сможешь? ну там за 50к например?

Как там, в 1975 году? Всё ещё приходится экономить каждый транзистор? У нас тут в 2013 транзисторы никто не считает ограниченным ресурсом, и все ищут, какими бы архитектурными решениями повысить производительность, сколько транзисторов эти архитектурные решения бы ни требовали. Префиксные сумматоры вот изобрели, которые требуют больше транзисторов, чем обычные сумматоры с переносом разрядов, зато там не надо ждать, пока при суммировании последовательный перенос через все разряды пробежит.

prischeyadro ★★★☆☆
()
Ответ на: комментарий от another

у мну проект какой есть. я не буду хвастаться ибо это гнусно. нет пока полного симулятора и только-только поборол проблемы с llvm.

но с этих я охереваю. у них же прямо заявляется ложь. настолько очевидная что охереть. плюс нет компилятора когда есть llvm. это звездец. это полный звездец. за что им платят, дайте эти 11 лямов мне, я за полгода gpu и dsp сделаю. мне тупо времени не хватает изза работы. ну не мне, так нуждающимся, я перебьюсь

а тут омфг. ну они же явно лгут. кто там эксперты? они охерели, без вопросов такое пропускать?

ckotinko ☆☆☆
() автор топика
Ответ на: комментарий от prischeyadro

внезапно я знаю про ускорение переноса. ожешь не строить из себя охеренного гуру. внезапно нет смысла гнать сумматор т.к. его скорости хватает а умножатор отстает.

внезапно, для ололо может и не лимитированы транзисторы. на то вы и ололо. для мну важно что мы меньше cortex a-9 в 15 раз.там где уместится арм, там наших ядер будет 8, и каждое дернет неон вдвое, тем более что у них madd а у нас раздельно сложение и умножение.

ckotinko ☆☆☆
() автор топика
Последнее исправление: ckotinko (всего исправлений: 1)
Ответ на: комментарий от ckotinko

Я тебе объяснить пытаюсь (в ироничной форме, да), что экономия транзисторов и оптимизация скорости вещи прямо не связанные, первое важно только для колхозников, и при этом может противоречить второму.

prischeyadro ★★★☆☆
()
Последнее исправление: prischeyadro (всего исправлений: 3)
Ответ на: комментарий от prischeyadro

я чего то пропустил или маски составлют из готовых кусков?

по моему нет. их делают и важно тут только колво камней на пластину и размер элемента который можно потерять при печати.

ckotinko ☆☆☆
() автор топика
Ответ на: комментарий от ckotinko

а тут омфг. ну они же явно лгут. кто там эксперты? они охерели, без вопросов такое пропускать?

Страница на сайте Сколково про мультиклет: http://community.sk.ru/net/1110026/

Они проходят по ведомству кластера ко(с)мических технологий: http://community.sk.ru/foundation/space/p/team.aspx На этой же странице есть список экспертов.

Руководитель кластера: http://ru.wikipedia.org/wiki/Жуков,_Сергей_Александрович

another ★★★★★
()
Ответ на: комментарий от prischeyadro

экономия транзисторов x10 легко позволит работать аки gpu. речь идет не о процентах. 10% от арма

ckotinko ☆☆☆
() автор топика
Ответ на: комментарий от ckotinko

Самые дешёвые ASIC — это заготовки с архитектурой типа ПЛИС, на которые наносятся 1-2 дополнительных слоя межсоединений. Подготовка стоит копейки (пример — EasyPath от XIlinx).

ASIC на библиотечных элементах и full costum ASIC требуют изготовления всех слоёв, но разница в цене, существующая между ними, находится там, куда ты ещё не добрался (и не доберёшься) — в переносе транзисторов на топологию с тщательнейшей верификацией всего и вся и потерями огромных денег на малейших косяках, вылезающих на топологических решениях, которые приходится делать самому, а не брать в готовом верифицированном виде у производителя.

prischeyadro ★★★☆☆
()
Ответ на: комментарий от prischeyadro

я знаю об этом. блин, задолбал. я знаю как оно делается. если речь идет про 600к транзисторов при 16 fpu то речь явно не про easypath.

ckotinko ☆☆☆
() автор топика
Ответ на: комментарий от ckotinko

Ну да. Очень интересно читать сравнение реально существующих и работающих армов и некоего убердевайса, для которого ещё даже топологии нет (и процесс разработки которой может дать результаты в диапазоне от приемлемого до вообще неработоспособного).

prischeyadro ★★★☆☆
()
Ответ на: комментарий от prischeyadro

топология там такая что 71% проца это тупо sram. остальные части предельно просты, разве что умножатор обхакан. ибо жирно 27*27 множить. взаимосвязей далеких нет вообще.

так что на данном этапе я уверен в херовине. и ищо раз говорю: я не разраб железа. Я не уберменш. я все это пилю по выходным. если мы получим грант с сколково, мы наймем человкоторые шарят.

потом будет IP-core. потом камень. арма будем бить размером, нех было у ибма fpu брать

ckotinko ☆☆☆
() автор топика

и я сразу говорю что это gpu а не cpu. gpu который может рубить непараллельные проги. ветвления. switchи. циклы оптом. похеру. проц придуман после того как на интеле затормозил continous collision detection. он выдерживает жесткое ветвление, паралеление, simd и т.д.причем дешево т.к. вырос из fpga. просто на fpga не сделать double, там умножаторы мелкие

ckotinko ☆☆☆
() автор топика
Ответ на: комментарий от ckotinko

Ну, всяко удачи. Зачем только пургу гнать на людей, которые грант уже получили и живое устройство сделали, всего лишь из-за того, что они не пилили его от уровня транзисторов, а делали, как это обычно принято. Тебе же лучше (если своё устройство осилишь, и оно будет на уровне транзисторов превосходить то, что используется в индустрии).

prischeyadro ★★★☆☆
()
Ответ на: комментарий от prischeyadro

есть две реализации. одна за 5 другая за 8. за 8 умеет пикселы множить. там 3 множатора стоят 7*14 на двойной частоте. на другой 9*27 на утроенной частоте. double множится за 5 клоков, 3 клока тупит на умножителе.float за 2. в fpu хакнутый формат внутри, 34/66 бит. так что посткоррекция на выгрузке.

ckotinko ☆☆☆
() автор топика
Ответ на: комментарий от prischeyadro

я бы и не обратил. но по ссылке они стебут чела, который рад.безопасностью занимается. и даже не понимают что им бы молчать и не гавкать лучше

ckotinko ☆☆☆
() автор топика
Ответ на: комментарий от prischeyadro

я все понимю про проблемф своего проца, там будут тупняки на множестве указателей. там же кеш l1 с ручным управлением. точнее кеша данных нет вообще. т.е. говнокод будет адски тупить. зато в жабе gc будет работать на одном из 8 ядер параллельно и не паузить мир

ckotinko ☆☆☆
() автор топика

Ну аферисты — фиг с ними.

А что у вас за gpu? Что умеет? 2d? 3d?

Можете в двух словах архитектуру обрисовать? Как построена память, в частности? (Сколько каналов, портов, где текстуры, где фреймбуфер, какова пропускная способность? Филлрейт, в конце концов?)

GolemXIV
()
Ответ на: комментарий от ckotinko

при чем здесь плис, если у ней умножители уже сделаны как аппаратные блоки. ну, разработал ты умножитель, патентуй и, если он действительно такой эффективный, то люди из TSMC мимо не пройдут и добавят его в свои либы. после этого любой сможет его юзать в своем asic`е и никуда ему твои транзисторы не уперлись

registrant ★★★★★
()
Ответ на: комментарий от ckotinko

Кстати, в Сколково их с грантом послали и не раз. Они только участник проекта пока.

another ★★★★★
()
Ответ на: комментарий от registrant

wallace tree сто лет как известна. что тут патентовать? в столбик счет тоже не я придумал. смысл проца брать не гигагерцами(один хер не выйдет) а диким количеством

ckotinko ☆☆☆
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.