science-misis 13 июл 2016 в 15:14

Скрытое состояние вещества ускорит работу компьютера в 10 раз

2 мин

35K

Блог компании Университет МИСИСНаучно-популярноеФизикаБудущее здесь

+29

Комментарии 97

nkie 13 июл 2016 в 15:23

Ну все, теперь тантал подорожает. А если серьезно, какое напряжение нужно приложить чтобы состояние переключилось?

mrMidas 13 июл 2016 в 16:25

Подозреваю что весьма не скоро т.к. типичное время между научным исследованием и розничным рынком на сегодня больше 5 лет…

geisha 13 июл 2016 в 16:53

Значительно больше: поскольку в данном случае речь о материале для электронике, точкой отсчета является изобретение силиконового транзистора (1954). Кроме того, исследований об этих материалах вагон и маленькая тележка: есть гораздо более перспективные, стабильные и безопасные кандидаты. Но статья (не эта, в Nature Comms) и эффект интересные.

-4

immaculate 13 июл 2016 в 16:59

«кремниевого» или именно «силиконового»?

+10

geisha 13 июл 2016 в 17:02

Поскольку статья в Nature именно «силиконового». (шютка)

Если ваш вопрос действительно требует ответа — гуглите изобретение твердотельного тразистора.

cattheblack 13 июл 2016 в 17:18

<зануда>
Силиконовый транзистор — это самое то для бинарного кода! И обязательно в корпусе из железиума и ванадиума, да стоимостью в биллион!
</зануда>

hdfan2 14 июл 2016 в 09:12

Силиконовый транзистор — такой же, как кремниевый, но большой, округлый и приятно пружинит.

Sleepwalker_ua 13 июл 2016 в 20:19

<ирония >
К черту золото, скупаем тантал
< /ирония>

А кстати, интересно. Кремния у нас на планете хоть пятой точкой ешь, все равно хватит еще ну ооооочень надолго. А вот тантала. боюсь, маловато. Какова будет цена итоговая?

kefirfromperm 14 июл 2016 в 09:18

Добыча измеряется тысячами тонн в год. Стоит гораздо дешевле золота, которое тоже активно используется в электронной промышленности.

Visphord 14 июл 2016 в 11:00

учитывая, что раньше(да и сейчас вроде?) из него делали конденсаторы в больших количествах — на память то уж точно хватит.

Sleepwalker_ua 15 июл 2016 в 10:35

ну конденсаторы и из других материалов делали. Танталовых на самом-то деле не так уж и много, и стоят они прилично дороже. А тут делать оперативку, которую пускать в массы… Думаю, она будет в любом случае дороже, чем кремниевая теперешняя.

RuddyRudeman 13 июл 2016 в 16:13

1 пикосекунда на переключение — это порядка 1ТГц тактовой частоты? Практического смысла в такой быстрой памяти не много, пока что то кардинально новое не заменит кремниевые транзисторы, потому что ни записывать ни читать с такой скоростью обычные процессоры не смогут.

LoadRunner 13 июл 2016 в 16:18

Это лишь потолок скорости. С какой скоростью будут переключать это состояние на самом деле — от материала уже не зависит, не он будет «бутылочным горлышком».
Вопрос в том, как это собираются делать, чтобы это действительно использовалось в компьютерах. И когда.

ivan386 13 июл 2016 в 16:40

Может тогда процессор из него сделают?

Siper 13 июл 2016 в 16:58

Задерка памяти — основной тормоз сейчас. При случайном доступе процессор ждет сотню тактов пока данные появятся.

woonem 17 июл 2016 в 13:09

RAM тоже надо ждать?

НЛО прилетело и опубликовало эту надпись здесь

a5b 17 июл 2016 в 21:11

Еще больше:
https://gist.github.com/jboner/2841832 "Latency Numbers Every Programmer Should Know"
Кэш L1 — 0.5 нс (на самом деле 4-5 тактов)
Кэш L2 — 7 нс (на практике 12 тактов)
Кэш L3 — ?? (30-36 тактов)
Память — 100 нс (порядка 60 нс, ~150-200 тактов)
Чтение 4 КБ с SSD — 150 000 нс (~полмиллиона тактов; лучшие на NVMe — ~60 000 нс)
Чтение с HDD — 10 000 000 нс (~30 миллионов тактов, ждем ~1 поворота пластин)

Даже если единичные элементы памяти будут записывать бит за 1 пс, потребуется к каждому добавить селектор (транзистор, диод, какой-то нелинейный элемент; у DRAM/NAND/NOR — транзистор, у SRAM — пары транзисторов) для возможности организации массивов с выбором элементов. Затем — организовывать элементы с селекторами в массив, создать схемы адресации, записи, вычитывания. В массивах с необходимой для практического использования емкостью (доли гигабита — несколько гигабит), чтобы служебные схемы занимали не более десятков процентов от площади будут использоваться длинные линии адресации/вычитывания в большом количестве, их придется точно так же заряжать через мощные ключи перед чтением. На это уйдет заметное время. Считанные из массива данные необходимо пересылать по крайней мере на несколько сантиметров, любые шины добавят задержек (на сериализацию/десериализацию и физическую передачу на 2/3 c). Данные попадут в Uncore, затем в кэш L3, и задержка L3 прибавится к задержкам памяти.

НЛО прилетело и опубликовало эту надпись здесь

Mad__Max 18 июл 2016 в 22:53

У меня на AMD Phenom II, т.е. полностью другая платформа от другого производителя и на несколько лет старше — задержки почти такие же как у sumanai на скриншоте выше: 0,9/2,7/8,4/53 нс для L1/L2/L3/RAM. Или 3/9/29/180 тактов ЦП
Так что можно считать их типовыми для более-менее свежих поколений х86.

mbrdancer 13 июл 2016 в 17:39

Ну вообще в высокопроизводительных вычислениях, например, сейчас главный ограничивающий фактор — именно латентность памяти (сейчас имею в виду задачи, которые могут крутиться без MPI).
Все оптимизации, которые нам буквально пару недель назад демонстрировали и которым обучали, — направлены на сокращение количества обращений к памяти как таковой. Ускорение за счет оптимизации такого рода даже в моих неумелых руках на некоторых задачах достигало 30x.
У других слушателей на тестовой задаче было и 100x, и больше.

+12

NetBUG 13 июл 2016 в 21:10

А что за задачи? Есть ссылка на курс/туториал?

a5b 13 июл 2016 в 19:05

1 пикосекунда на переключение — это порядка 1ТГц тактовой частоты?

Нет, даже если один транзистор переключается за 1 пс, то это еще не позволяет достичь тактовой частоты схемы в 1 ТГц. Для применяемых на практике схем за такт должен переключиться целый каскад логических элементов (см FO4; Horowitz also cited claims of ~7 FO4 for a fast 64 bit adder… The multiplier is reported here as possessing a multiplication latency of 23.3 FO4).

Транзисторы, изготовленные по тонким техпроцессам уже имеют скорости переключения порядка единиц пс: http://www.siliconcr.com/images/siliconcr_finfet_design_sept12_2015.pdf "Peak fT (transition frequency)… 10nm FinFET has a peak fT in excess of 500GHz!", длительность каждого FO4 — порядка 10 пс "The typical FO4 delay in the most advanced processes is <10ps!".

coturnix19 14 июл 2016 в 10:46

Вот меня давно интересует, возможно ли создавать чипы из множества маленьких кусочков синхронных внутри но не между собой? Расстояние распространения сигнала за 10пс это 3е8м/с*10е-12с=3*10е-3м=3мм., т.е. блоки физическим размером порядка 1мм Или даже полностью асинхронными?

Правда, насколько я слышал, что то похожее было в приснопамятном четвертом пне, где какие-то блоки внутри работали на удвоенной частоте, правда это привело только к росту производительности тепла и только, значит ли это что идея не верна?

woonem 18 июл 2016 в 22:58

Похоже на нейросеть

НЛО прилетело и опубликовало эту надпись здесь

NetBUG 13 июл 2016 в 21:09

Меня скорее волнует энергия на переключение, не получится ли такая память прожорливее DRAM :)

woonem 13 июл 2016 в 21:55

Что, свет дорогой?

rPman 13 июл 2016 в 22:27

нет, теплоотвод

CrazyRoot 14 июл 2016 в 09:28

Вы странный человек, вам тут предлагают гибрид ноута и русской печки, а вам не нравится. Это же какая выгода — включил ноут, обогрел дом. :)

andrrrrr 14 июл 2016 в 22:32

лучше уж генерацией биткоинов греть.

AlexanderG 15 июл 2016 в 10:30

И в одну зиму я реально так грелся. Майнингом, если холодно становилось, то еще и на основной машине игрушки запускал.

NetBUG 14 июл 2016 в 04:16

И очень хочется, чтобы ноутбук, который будет сохранять состояние памяти после выключения, разряжался не намного быстрее ноутбука с DRAM.

uazure 14 июл 2016 в 12:08

После выключения эта танталовая память хранит состояние и не потребляет энергии, если я все правильно понял. ДРАМ же нужно периодически обновлять. Так что в режиме сна новая память получше будет. А вот сколько надо энергии чтоб её переключать — это действительно важный вопрос.

Vjatcheslav3345 14 июл 2016 в 12:56

Есть ещё вариант — если можно переключать состояние проводник/диэлектрик, то можно основным лазерным лучом, как на экране телевизора, строить на пластине из такого материала нужную схему электронного устройства, а вспомогательными — заставлять работать её элементы — не нужна эта схема — перестроим её во что то другое, например память, стала не нужна и высвободившаяся площадь была отдана процессорам, Ещё, например, можно будет писать программы, которые «компилируются» не в машкод а в электронные схемы и работают со скоростью «железа»

RiseOfDeath 14 июл 2016 в 13:06

Вы почти изобрели ПЛИС

Jeka_M3 15 июл 2016 в 09:12

Intel уже проводит эксперименты с гибридами: Intel Core i7 + Altera Arria 10, Intel Xeon E5-2600 v4 + Altera Arria 10

habrahabr.ru/company/intel/blog/282570

woonem 17 июл 2016 в 13:16

Alteria Arria 10 использует тантал?

-1

Jeka_M3 17 июл 2016 в 14:18

Нет, речь была не про тантал. Это был ответ на то, что человек предложил использовать технологию, которая очень похожа на ПЛИС. А я написал, что ПЛИС уже начали встраивать в процессоры. Тантал там пока не используется.

Jeka_M3 17 июл 2016 в 14:23

Для ПЛИС как раз пишут программы, которые «компилируются» в электронные схемы (языки Verilog, VHDL).

AlexanderG 15 июл 2016 в 10:31

И самоперестраиваемые PU. Понадобилось памяти — отрастил себе память, запущена куча потоков — отрастил ядер.

-1

woonem 17 июл 2016 в 13:19

Думаю из этой штуки будут делать постоянную память и если станет мало памяти — придется жертвовать процессором xD

rPman 13 июл 2016 в 22:26

Внутри чипа, локальные области могут работать на других частотах, активно используя хотя бы ту же длину проводников для организации разной задержки… т.е. как вам инструкция, способная за такт обработать килобайты-мегабайты данных, внутри самого чипа памяти,… да пофиг, хоть и в кеш памяти процессора.

-1

napa3um 13 июл 2016 в 23:38

В процессорах можно будет полностью отказаться от кеша, например. Думаю, у процессоров тоже появится потенциал к увеличению производительности за счёт упрощения архитектуры.

-1

woonem 17 июл 2016 в 13:25

Мечты… Реализации не дождемся :( Тем более с такими температурными требованиями. Как показывает личный опыт, большинство таких новостей говорят о продуктах, которые общают появиться лет через 5-10, а когда проходят эти 5-10 лет, все просто забывают.

НЛО прилетело и опубликовало эту надпись здесь

Chudic 13 июл 2016 в 16:32

Как я понял, при комнатных температурах этот эффект не наблюдается. В статье написано:
«Above 165 K, these fluctuations disappear and the switching ratio RHI/RLO eventually disappears completely above 195 K. »
То есть что то вроде сверхпроводимости по применимости в технике?

Goodkat 13 июл 2016 в 17:36

Ну будут суперкомпьютеры и датацентры чуть сильнее подмораживать :)

Dum_spiro_spero 13 июл 2016 в 23:05

Дата-центры надо размещать в Оймяконе и Верхоянске.
http://www.uznayvse.ru/interesting-facts/samyie-holodnyie-goroda-v-rossii.html

Goodkat 13 июл 2016 в 23:58

Если бы это было кому-то надо, размещали бы уже.

geisha 13 июл 2016 в 17:49

Вот не надо, сверхпроводимость вполне себе используется, поэтому и несколько Нобелевских премий дали.

DrBAXA 13 июл 2016 в 16:32

Самое интересное что она будет энергонезависимой и сверхбыстрой одновременно.

ra3vdx 13 июл 2016 в 20:00

Хотел пошутить про Шредингера, но передумал и пошутил)

+12

toteKopf 13 июл 2016 в 21:10

dbanet 14 июл 2016 в 14:05

-1

Zerstoren 14 июл 2016 в 23:17

hdfan2 14 июл 2016 в 09:18

От шуток про Шредингера хочется и смеяться, и плакать одновременно.

Mad__Max 14 июл 2016 в 18:16

Так кто мешает? Входите в суперпозицию и наслаждайтесь шуткой, пока никто не ~~видит~~ наблюдает.

sim-dev 13 июл 2016 в 16:32

Основа всей современной вычислительной техники — триггер, т.е. схема, имеющая 2 устойчивых состояния. Все цифровые транзисторы по сути работают по принципу выключателя, т.е. либо проводят, либо не проводят ток. Новое вещество, судя по всему, обладает именно такими свойствами: сверхскоростной триггер и/или переключатель. Так что если на самом деле все так, как написано, и данные структуры можно будет создавать в виде привычных нам кристаллов-чипов, то это означает новый виток производительности именно ВСЕЙ вычтехники, а не только накопителей.

saboteur_kiev 13 июл 2016 в 17:09

Пока не известны подробные детали, сложно сказать какой может быть минимальный размер устройства.
Но энергонезависимая RAM Это конечно интересный поворот.

RiseOfDeath 14 июл 2016 в 09:49

Привет быстрому старту и куче новых методов «Frost Attack», или как она там называется.

amiluik 13 июл 2016 в 16:56

Прошло 10 лет, оперативная память на дисульфиде тантала используется повсеместно, но программы тормозят все равно!
(вскрыть в 2026 году и проверить правильность прогноза)

+19

LekaOleg 13 июл 2016 в 17:53

И GTA-8 не тянет!))

-1

НЛО прилетело и опубликовало эту надпись здесь

Banzeg 14 июл 2016 в 00:21

Half-Life 3 все еще обещают

НЛО прилетело и опубликовало эту надпись здесь

Mad__Max 14 июл 2016 в 18:18

Да — пропустили начало ветки, которая задает рамки что все происходит через 10 лет, т.е. в 2026м году. Когда начали обещать не уточняется.

НЛО прилетело и опубликовало эту надпись здесь

Siper 13 июл 2016 в 18:39

на дисульфиде тантала говорите… нееет, будет старая добрая DDR6 (с большими радиаторами) и то не повсеместно
(вскрыть в 2026 году и проверить правильность прогноза)

НЛО прилетело и опубликовало эту надпись здесь

Siper 14 июл 2016 в 23:31

Я оптимист

rPman 13 июл 2016 в 22:32

Персональных компьютеров не будет, а будут дубовые терминалы к огромным датацентрам, на столько огромным (читай богатым) что датацентры будут сами проектировать (аутсорс конечно) и производить специализированную электронику по своим (читай под конкретную нагрузку и задачи) стандартам и требованиям. И такие мелочи как охлаждение до нуля будет абсолютной нормой.
(вскрыть в 2026 году и проверить правильность прогноза)

p.s. частникам для приватности придется довольствоваться старой тормозной техникой а юрики свои минидатацентры будут заказывать (именно под ключ, как сейчас мини ядерные реакторы 'делают' — привезли, закопали и 20 лет гарантия с обслуживанием)

ChALkeRx 16 июл 2016 в 21:51

Нет, будут очень компактные вычислительные устройства, объединённые в распределённую сеть. В т.ч. носимые, в виде тех же украшений хотя бы. Толстые сервера будут, конечно, но они будут решать несколько другие задачи.

Это если из нас скрепок не понаделают, конечно =).

rPman 17 июл 2016 в 12:03

Не соглашусь с вами.
К сожалению 10 лет слишком маленький срок для решения более сложной проблемы — сетевого (а в вашем случае, беспроводного) доступа.
Если оконечный терминал имеет очень низкие требования к качеству связи (не очень широкий канал даже по нынешним меркам и низкие требования к латенси, за исключением шлемов VR конечно, но это особая ниша как раз в следующие 10 лет) то нода распределенной вычислительной сети требует очень высокие параметры, как пропускной способности так и латенси.

И электропитание конечно!

olegkrasnov 14 июл 2016 в 08:21

Больше позитива. Система грузится 10-20 секунд. Фотошоп около ~5. Раньше надо было минутами ждать. Весь софт на моём пятилетней давности компе летает. Скоро можно будет голосом говорить компу чего надо и смотреть как он быстренько за вас делает работу.

woonem 17 июл 2016 в 13:40

Странно, у меня наверно ПК из будущего, правда PS 15 сек, не 5 ждать
Ок гугл всё решит :D

woonem 17 июл 2016 в 13:45

Скорее 5-классники будут соревноваться у кого за сколько ms включается ПК и будут ОСь подрезать и оптимизировать. А потом спорить, что точности секундомера не хватает.

vvmk 13 июл 2016 в 19:46

Одно слово.
MRAM.
Имеет преимущества перед обычной DRAM.
Коммерческий продукт, а не теоретические разработки и где оно?
А тут пока только теория с этим дисульфидом…

Dum_spiro_spero 13 июл 2016 в 23:15

Ну… не будем такими пессимистами.
Хотя десятикратное преимущество элементарно съедается дальнейшей цепочкой. Дальше дело за технологией, а еще дальше — за рынком.
Пусть память будет в десять раз быстрее, и будет стоить в два раза дороже — сколько раз подумает потенциальный покупатель?
Хотя для серверного и HPC сегментов — однозначно полезно.
Самое главное, что смущает — что это сделано у нас, а не в недрах Самсунга или IBM. Т.е. довести изобретение до промышленности у нас вряд ли смогут. Самое эффективное для развития этой идеи — увы — всей научной группе продаться какой-либо конторе и там доводить до ума. Или если все опубликовано — то в той же IBM могут быстренько воспроизвести и возможно запатентовать. Что печально.

Kameleon3107 13 июл 2016 в 22:37

Реальность — иллюзия, вселенная — голограмма, скупай тантал, пока!

copyhold 14 июл 2016 в 09:45

КДПВ — такое гикпорно

edd_k 14 июл 2016 в 11:11

А как именно «ускорит работу компьютера в 10 раз»?

Vespertilio 14 июл 2016 в 12:30

Как было сказано выше https://geektimes.ru/company/science_misis/blog/278422/#comment_9433834 память основной тормоз в сложных вычислениях.

edd_k 14 июл 2016 в 12:40

Как было сказано там же, ускорения в 30-100 раз можно добиться просто изменив код.

Это не отменяет того факта, что фразы «ускорит работу памяти» и «ускорит работу компьютера» не являются взаимозаменяемыми.

Vespertilio 14 июл 2016 в 12:50

Если уменьшить задержки памяти в 10 раз, то и простой процессора уменьшится в 10 раз, а значит общая производительность увеличится в 10 раз и это аппаратное решение, работающее в любом случае. Код выше не просто меняют, там хаки оптимизации и вообще приведен как пример насколько сильно влияют задержки памяти, и тут сразу несколько нюансов. Не любой код можно просто взять и изменить уменьшив обращения к памяти, далеко не всегда и не везде делают такую оптимизацию да и саму оптимизацию. Ну и в любом случае даже оптимизированный код все равно получит эти самые в 10 раз меньшие задержки.

edd_k 14 июл 2016 в 13:09

>> Если уменьшить задержки памяти в 10 раз, то и простой процессора уменьшится в 10 раз, а значит общая производительность увеличится в 10 раз и это аппаратное решение, работающее в любом случае.

Только логика рассуждений ошибочная.

Пусть X — суммарное время простоя, Y — время полезной нагрузки в течение 1 сек. Т.е. X + Y = 1 (или Y = 1 — X)
Если X уменьшить в 10 раз, то получим X/10 + Y = 1 (или Y = 1 — X/10)
Т.е. новый Y отличается от старого Y в (1 — X/10) / (1 — X) раз. Вот и найдите, каким должен быть X, что бы эта дробь равнялась 10.

X = 10/11.

Вывод: когда процессор простаивает 10/11 времени, а трудится 1/11 времени, только в этом случае уменьшение простоя в 10 раз увеличит работу в 10. Не беретесь же вы утверждать, что такое соотношение труда и безделия — норма в целом?

Vespertilio 14 июл 2016 в 13:21

Ну естественно ускорение коснется только работой под нагрузкой, во время бездействия и ускорять нечего. Плюс кратность ускорения будет плавать в зависимости от интенсивности использования памяти.

edd_k 14 июл 2016 в 13:45

Вы не поняли. Утверждение «сокращение задержек памяти в 10 раз увеличит производительность процессора в 10 раз» корректно только в случае, когда вычислитель 10/11 времени ждет данных из памяти, чтобы потом совсем немножко «работнуть». Разве так обычно происходит?

RiseOfDeath 14 июл 2016 в 14:14

Зависит от задачи. Если надо выполнять матан над большими объемами данных, то да.

-1

edd_k 14 июл 2016 в 14:17

Так в том то и дело, что фраза «ускорит работу компьютера в 10 раз» НЕ зависит от задач )))

Vespertilio 14 июл 2016 в 14:17

Если верить утверждениям выше, что задержки памяти — это основной тормоз системы, то получается так. В случайном доступе память очень тормозит, стократно по сравнению с последовательным.

Mad__Max 14 июл 2016 в 18:27

В современных процессорах даже на сложных задачах достигается скорость до 50-70% от теоретически возможной. Куча кэшей разных уровней, буферов и предсказателей ветвлений/анализаторов кода, внеочереодное исполнение инструкций и т.д. не зря больше половины кристалла занимают — все они как раз нужны для максимальной загрузки исполняющих устройство и минимизации ожидания(задержек) памяти.
Т.е. даже ускорение работы памяти в 100 раз не может дать увеличения скорости вычислений более чем в 2 раза.

Другое дело, что при такой быстрой памяти можно будет большую часть кэша и буферов из процессора выкинуть и освободившуюся площадь и "транзисторный бюджет" потратить на что-то более полезное в следующих поколениях процессоров. Хотя бы еще ядер налепить на том же размере кристалла как самый простой вариант.
Но и в этом случае эффект от 10 кратного ускорения памяти будет намного меньше 10 раз.

Vespertilio 14 июл 2016 в 19:03

Я не спорю, много чего придумывается чтобы закрыть или нивелировать слабые места. Однако вот даже со всем этим на реальном примере описанном выше оптимизации давали приросты в десятки и даже стократ. Причем все эти аппаратные алгоритмы prefetch'и и буферы уверен работали. По мне так даже 2х кратный прирост это колоссально, при том что сейчас борются за доли процента.

asmodeusta 14 июл 2016 в 15:33

Допустим в 10 раз ускорят скорость записи, а скорость чтения тогда какая? И каким способом будет чтение этой памяти? Ничего не сказано?

GarryC 15 июл 2016 в 14:42

Да какое на фиг ускорение и перспективы. Под воздействием луча лазера — как Вы собираетесь луч таскать по микросхеме, чтобы попасть в нужный элемент? Вариант с количеством лазеров, равным количеству элементов памяти, не предлагать.
Эта технология могла бы иметь преимущество перед упомянутой MRAM, у которой есть фатальный недостаток — разрушаеющее чтение, но адресация все портит.

woonem 17 июл 2016 в 14:33

Кажется лазер используют только для облегчения проведения эксперимента, на деле можно использовать электричество (не уверен на счёт сказанного, только предположение).

AndrewTishkin 20 июл 2016 в 21:00

как Вы собираетесь луч таскать по микросхеме

Как в дисковом приводе, не?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий