LINUX.ORG.RU

Выпущен первый в мире 1000-ядерный процессор KiloCore

 kilocore


2

2

Микрочип, содержащий тысячу независимых программируемых процессорных ядер, был разработан командой специалистов из факультета электронной вычислительной техники Университета Калифорнии. Энергоэффективный чип KiloCore имеет максимальную скорость вычислений 1,78 триллионов операций в секунду и содержит 621 миллион транзисторов. Устройство было представлено на Симпозиуме по технологии СБИС 2016 в Гонолулу 16 июня.

«Насколько нам известно, это первый в мире 1000-ядерный чип, который также является процессором с наиболее высокой тактовой частотой, когда-либо созданный в университете» — сообщил Беван Баас, профессор электронной и компьютерной инженерии, возглавлявший команду разработчиков. Согласно анализу группы Бааса, ни один из ныне созданных в мире чипов не содержит более 300 ядер, а большинство из них были созданы для исследовательских целей.

Каждое ядро способно запускать собственную небольшую программу независимо от других, что является принципиально более гибким подходом, чем SIMD (одиночный поток команд, множественный поток данных), используемый в графических процессорах GPU. Идея заключается в разбитии приложения на множество маленьких кусочков, каждый из которых может работать параллельно на разных процессорах, обеспечивая высокую пропускную способность с меньшим потреблением энергии.

«Поскольку каждое ядро имеет независимую друг от друга тактовую частоту, оно может за ненадобностью отключиться для дальнейшей экономии энергии» — сообщил аспирант Брент Бониенстел, который разработал основную архитектуру устройства.

Также Баас сообщил, что чип является самым энергоэффективным многоядерным процессором из ныне существующих. Все 1000 ядер могут совершать одновременно 115 млрд операций, потребляя при этом только 0,7 Вт, которые может обеспечить одна батарейка типа АА. Таким образом, KiloCore работает в 100 раз эффективнее, чем любое современное вычислительное устройство.

Для чипа уже разработаны приложения, которые включают в себя беспроводное кодирование/декодирование, обработку видео, шифр и другие задачи, в которых используется большое количество параллельных данных, например различное научное ПО и центры обработки данных.

Источник

>>> Подробности (оригинал статьи)

★★★★

Проверено: Klymedy ()
Последнее исправление: Wizard_ (всего исправлений: 6)

Ответ на: комментарий от tailgunner

Что ты называешь «традиционной шиной»?

это название придумал крон73...

Ну, HyperTransport является packet-switched.

... и если бы это написал крон73, то его придумка имела бы смысл, а так похоже он на чисто маркетинговых понтах считает TrueNorth прогрессом

и QPI, кстати, тоже, а ее по слухам содрали c Alpha_21364; правда мне не известно, использовалась ли QPI для более сложного роутинга, чем по кольцу (ну там звезда или еще сложнее)

если бы я придумывал термин «традиционная шина», то исключил бы из нее хотя бы часть packet-switched шин, если не все сразу

www_linux_org_ru ★★★★★
()
Ответ на: Наглое 4.2 от ckotinko

насчет 0.7 вт: пусть из 621млн транзисторов, 500млн - логика(т.е. они core): ток утечки примерно ~300nA/um. ширина затвора примерно ~50нм. ширина всех затворов 500М*50n=25 метров. Ток утечки = 7.5 ампера. Умножим на 1.2 вольта: 9 ватт.

и сколько по-твоему должны жрать в простое на токе утечки процы с 5Г транзисторов? 90 ватт? а при работе?

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от www_linux_org_ru

как ты тогда объяснишь наличие диодов с током утечки менее 1 nA?

Одиночный диод таковым сделать - раз плюнуть.
А в процессорах сейчас основная проблема - subthreshold leakage. Это одна из причин перехода на FinFET.

devl547 ★★★★★
()

Сообщение удалено tailgunner по причине 7.1 Ответ на некорректное сообщение (авто) (0)

Ответ на: комментарий от www_linux_org_ru 22.06.2016 2:38:47 если речь идет о «достаточности мощности», то человеку очевидно

Ты совсем потерял нить. В топикстарте не было ничего про «достаточно мощности». Было: «требуется 0,7 Вт энергии – столько же, сколько в батарейке АА». На что было предложено попробовать запитать автомобиль от элемента «AA». Без граничных условий. Я показал, что запитать, в принципе, можно. Твои нынешние танцы вокруг практичности задач не имеют к началу ветки отношения.

нет, это ты потерял нить

предложение «попробовать запитать автомобиль от элемента «AA»» было высказано в том расчете, что его прочтет человек, а не тупой ai

Твои нынешние танцы вокруг практичности задач не имеют к началу ветки отношения.

имеют, и совершенно прямое

допустим, мы используем эти процы для фотика для почти беспотерьного сжатия гигантских фоток, выдаваемых с частой 5 штук/с, и для поддержки их постоянной работы требуются 4 батарейки АА, что нормально; пусть в результате фотик может 2 часа выдавать очередь из 5 снимков в сек, т.е. его возможности 7200*5 снимков

пусть есть другие процы, которым требуется в 4 раза большая мощность, и которым для того же требуется 16 батареек, что в фотик не запихнуть уже

так вот фотоаппарат на вторых процах будет *существенно* хуже с потребительской точки зрения вовсе не потому, что он потенциально сможет выдавать всего лишь 1800*5 снимков (пользователю что 1800*5, что 7200*5 одинаково много), а потому, что второй фотоаппарат не сможет выдать очередь даже в течение 3 секунд

или чтобы он смог, ему придется ставить кондер, а включаться он будет как китайское дерьмо — пока кондер не зарядится, фотик недоступен

и все равно очередь из 5 минут по 5 кадров/с он не выдаст (кондера не хватит), а это может быть критично, например при съемке драки после футбола

еще раз: фотоаппарат на вторых процах будет *существенно* хуже с потребительской точки зрения именно из-за повышенных требований второго проца к мощности, а вовсе не из-за повышенных требований второго проца к общей запасенной в батарейках энергии

сейчас ясно, почему мощность играет роль?

з.ы. еще можно заменить 5 кадров/сек на 30 кадров/сек для съемки видео с суперкачеством

www_linux_org_ru ★★★★★
()
Последнее исправление: www_linux_org_ru (всего исправлений: 7)
Ответ на: комментарий от devl547

Одиночный диод таковым сделать - раз плюнуть. А в процессорах сейчас основная проблема - subthreshold leakage. Это одна из причин перехода на FinFET.

это в том смысле, что при FinFET утечка будет 30na/um, т.е. в 10 раз меньше, чем у скотинко?

а если нет, то как делают процы в 5Гтранзисторов?

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от ckotinko

эффективность килокора на 100 мегагерцах около 6 пикодж на настоящую операцию

этого не хватит 1 бит в SRAM записать.

а вот тут https://www.researchgate.net/profile/David_Bol/publication/278014445_Sleep_wa... говорят про Ecycle в 2.2 pJ; тоже нагло врут, да?

www_linux_org_ru ★★★★★
()
Последнее исправление: www_linux_org_ru (всего исправлений: 2)
Ответ на: комментарий от KRoN73

на тему мощности и батареек ответ вот: Выпущен первый в мире 1000-ядерный процессор KiloCore (комментарий)

Кстати, чип работает на частоте 1 кГц, но производит 46 млрд. операций с синапсами в секунду. При этом потребляет 70 мВт.

откуда дровишки?

в http://paulmerolla.com/merolla_main_som.pdf говорится о 70мВт, но *вовсе* не в том случае, когда выдается 46G SOPS

While not a direct comparison, TrueNorth can deliver 46 billion SOPS per Watt for a typical network and 400 billion SOPS per Watt for networks with high spike rates and high number of active synapses (section S8)

«46 billion SOPS per Watt», a не «per 70mW»

www_linux_org_ru ★★★★★
()
Последнее исправление: www_linux_org_ru (всего исправлений: 2)
Ответ на: комментарий от www_linux_org_ru

ну молодец, обломал скотинку, целых три бита запишут. вот теперь запануют!

ckotinko ☆☆☆
()
Ответ на: комментарий от www_linux_org_ru

ток утечки я брал с europractice. к слову 300nA/um это для 40nm, я еще по дружески посчитал. 28 течет сильнее. и да, решается эта проблема power gatingом, когда вход по питанию закрывают более широкозатворным транистором и открывают только для поработать.

И это мы еще потребление DDR3-4 не считали. А слабо еще ампер на 64битную шину выложить? 1.2 вольта*(64+22)/(Rtt*1.6) для LPDDR4 например.

ckotinko ☆☆☆
()
Последнее исправление: ckotinko (всего исправлений: 1)

А оно крузис/жьта5 потянет ???

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.