Как стать автором
Обновить

Комментарии 97

Ну все, теперь тантал подорожает. А если серьезно, какое напряжение нужно приложить чтобы состояние переключилось?
Подозреваю что весьма не скоро т.к. типичное время между научным исследованием и розничным рынком на сегодня больше 5 лет…
Значительно больше: поскольку в данном случае речь о материале для электронике, точкой отсчета является изобретение силиконового транзистора (1954). Кроме того, исследований об этих материалах вагон и маленькая тележка: есть гораздо более перспективные, стабильные и безопасные кандидаты. Но статья (не эта, в Nature Comms) и эффект интересные.
«кремниевого» или именно «силиконового»?
Поскольку статья в Nature именно «силиконового». (шютка)

Если ваш вопрос действительно требует ответа — гуглите изобретение твердотельного тразистора.
<зануда>
Силиконовый транзистор — это самое то для бинарного кода! И обязательно в корпусе из железиума и ванадиума, да стоимостью в биллион!
</зануда>
Силиконовый транзистор — такой же, как кремниевый, но большой, округлый и приятно пружинит.
<ирония >
К черту золото, скупаем тантал
< /ирония>

А кстати, интересно. Кремния у нас на планете хоть пятой точкой ешь, все равно хватит еще ну ооооочень надолго. А вот тантала. боюсь, маловато. Какова будет цена итоговая?
Добыча измеряется тысячами тонн в год. Стоит гораздо дешевле золота, которое тоже активно используется в электронной промышленности.
учитывая, что раньше(да и сейчас вроде?) из него делали конденсаторы в больших количествах — на память то уж точно хватит.
ну конденсаторы и из других материалов делали. Танталовых на самом-то деле не так уж и много, и стоят они прилично дороже. А тут делать оперативку, которую пускать в массы… Думаю, она будет в любом случае дороже, чем кремниевая теперешняя.
1 пикосекунда на переключение — это порядка 1ТГц тактовой частоты? Практического смысла в такой быстрой памяти не много, пока что то кардинально новое не заменит кремниевые транзисторы, потому что ни записывать ни читать с такой скоростью обычные процессоры не смогут.
Это лишь потолок скорости. С какой скоростью будут переключать это состояние на самом деле — от материала уже не зависит, не он будет «бутылочным горлышком».
Вопрос в том, как это собираются делать, чтобы это действительно использовалось в компьютерах. И когда.

Может тогда процессор из него сделают?

Задерка памяти — основной тормоз сейчас. При случайном доступе процессор ждет сотню тактов пока данные появятся.
RAM тоже надо ждать?
НЛО прилетело и опубликовало эту надпись здесь

Еще больше:
https://gist.github.com/jboner/2841832 "Latency Numbers Every Programmer Should Know"
Кэш L1 — 0.5 нс (на самом деле 4-5 тактов)
Кэш L2 — 7 нс (на практике 12 тактов)
Кэш L3 — ?? (30-36 тактов)
Память — 100 нс (порядка 60 нс, ~150-200 тактов)
Чтение 4 КБ с SSD — 150 000 нс (~полмиллиона тактов; лучшие на NVMe — ~60 000 нс)
Чтение с HDD — 10 000 000 нс (~30 миллионов тактов, ждем ~1 поворота пластин)


Даже если единичные элементы памяти будут записывать бит за 1 пс, потребуется к каждому добавить селектор (транзистор, диод, какой-то нелинейный элемент; у DRAM/NAND/NOR — транзистор, у SRAM — пары транзисторов) для возможности организации массивов с выбором элементов. Затем — организовывать элементы с селекторами в массив, создать схемы адресации, записи, вычитывания. В массивах с необходимой для практического использования емкостью (доли гигабита — несколько гигабит), чтобы служебные схемы занимали не более десятков процентов от площади будут использоваться длинные линии адресации/вычитывания в большом количестве, их придется точно так же заряжать через мощные ключи перед чтением. На это уйдет заметное время. Считанные из массива данные необходимо пересылать по крайней мере на несколько сантиметров, любые шины добавят задержек (на сериализацию/десериализацию и физическую передачу на 2/3 c). Данные попадут в Uncore, затем в кэш L3, и задержка L3 прибавится к задержкам памяти.

НЛО прилетело и опубликовало эту надпись здесь

У меня на AMD Phenom II, т.е. полностью другая платформа от другого производителя и на несколько лет старше — задержки почти такие же как у sumanai на скриншоте выше: 0,9/2,7/8,4/53 нс для L1/L2/L3/RAM. Или 3/9/29/180 тактов ЦП
Так что можно считать их типовыми для более-менее свежих поколений х86.

Ну вообще в высокопроизводительных вычислениях, например, сейчас главный ограничивающий фактор — именно латентность памяти (сейчас имею в виду задачи, которые могут крутиться без MPI).
Все оптимизации, которые нам буквально пару недель назад демонстрировали и которым обучали, — направлены на сокращение количества обращений к памяти как таковой. Ускорение за счет оптимизации такого рода даже в моих неумелых руках на некоторых задачах достигало 30x.
У других слушателей на тестовой задаче было и 100x, и больше.
А что за задачи? Есть ссылка на курс/туториал?
1 пикосекунда на переключение — это порядка 1ТГц тактовой частоты?

Нет, даже если один транзистор переключается за 1 пс, то это еще не позволяет достичь тактовой частоты схемы в 1 ТГц. Для применяемых на практике схем за такт должен переключиться целый каскад логических элементов (см FO4; Horowitz also cited claims of ~7 FO4 for a fast 64 bit adder… The multiplier is reported here as possessing a multiplication latency of 23.3 FO4).


Транзисторы, изготовленные по тонким техпроцессам уже имеют скорости переключения порядка единиц пс: http://www.siliconcr.com/images/siliconcr_finfet_design_sept12_2015.pdf "Peak fT (transition frequency)… 10nm FinFET has a peak fT in excess of 500GHz!", длительность каждого FO4 — порядка 10 пс "The typical FO4 delay in the most advanced processes is <10ps!".

Вот меня давно интересует, возможно ли создавать чипы из множества маленьких кусочков синхронных внутри но не между собой? Расстояние распространения сигнала за 10пс это 3е8м/с*10е-12с=3*10е-3м=3мм., т.е. блоки физическим размером порядка 1мм Или даже полностью асинхронными?

Правда, насколько я слышал, что то похожее было в приснопамятном четвертом пне, где какие-то блоки внутри работали на удвоенной частоте, правда это привело только к росту производительности тепла и только, значит ли это что идея не верна?
Похоже на нейросеть
НЛО прилетело и опубликовало эту надпись здесь
Меня скорее волнует энергия на переключение, не получится ли такая память прожорливее DRAM :)
Что, свет дорогой?
нет, теплоотвод
Вы странный человек, вам тут предлагают гибрид ноута и русской печки, а вам не нравится. Это же какая выгода — включил ноут, обогрел дом. :)
лучше уж генерацией биткоинов греть.
И в одну зиму я реально так грелся. Майнингом, если холодно становилось, то еще и на основной машине игрушки запускал.
И очень хочется, чтобы ноутбук, который будет сохранять состояние памяти после выключения, разряжался не намного быстрее ноутбука с DRAM.
После выключения эта танталовая память хранит состояние и не потребляет энергии, если я все правильно понял. ДРАМ же нужно периодически обновлять. Так что в режиме сна новая память получше будет. А вот сколько надо энергии чтоб её переключать — это действительно важный вопрос.
Есть ещё вариант — если можно переключать состояние проводник/диэлектрик, то можно основным лазерным лучом, как на экране телевизора, строить на пластине из такого материала нужную схему электронного устройства, а вспомогательными — заставлять работать её элементы — не нужна эта схема — перестроим её во что то другое, например память, стала не нужна и высвободившаяся площадь была отдана процессорам, Ещё, например, можно будет писать программы, которые «компилируются» не в машкод а в электронные схемы и работают со скоростью «железа»
Вы почти изобрели ПЛИС
Intel уже проводит эксперименты с гибридами: Intel Core i7 + Altera Arria 10, Intel Xeon E5-2600 v4 + Altera Arria 10

habrahabr.ru/company/intel/blog/282570
Alteria Arria 10 использует тантал?
Нет, речь была не про тантал. Это был ответ на то, что человек предложил использовать технологию, которая очень похожа на ПЛИС. А я написал, что ПЛИС уже начали встраивать в процессоры. Тантал там пока не используется.
Для ПЛИС как раз пишут программы, которые «компилируются» в электронные схемы (языки Verilog, VHDL).
И самоперестраиваемые PU. Понадобилось памяти — отрастил себе память, запущена куча потоков — отрастил ядер.
Думаю из этой штуки будут делать постоянную память и если станет мало памяти — придется жертвовать процессором xD
Внутри чипа, локальные области могут работать на других частотах, активно используя хотя бы ту же длину проводников для организации разной задержки… т.е. как вам инструкция, способная за такт обработать килобайты-мегабайты данных, внутри самого чипа памяти,… да пофиг, хоть и в кеш памяти процессора.
В процессорах можно будет полностью отказаться от кеша, например. Думаю, у процессоров тоже появится потенциал к увеличению производительности за счёт упрощения архитектуры.
Мечты… Реализации не дождемся :( Тем более с такими температурными требованиями. Как показывает личный опыт, большинство таких новостей говорят о продуктах, которые общают появиться лет через 5-10, а когда проходят эти 5-10 лет, все просто забывают.
НЛО прилетело и опубликовало эту надпись здесь
Как я понял, при комнатных температурах этот эффект не наблюдается. В статье написано:
«Above 165 K, these fluctuations disappear and the switching ratio RHI/RLO eventually disappears completely above 195 K. »
То есть что то вроде сверхпроводимости по применимости в технике?
Ну будут суперкомпьютеры и датацентры чуть сильнее подмораживать :)
Дата-центры надо размещать в Оймяконе и Верхоянске.
http://www.uznayvse.ru/interesting-facts/samyie-holodnyie-goroda-v-rossii.html
Если бы это было кому-то надо, размещали бы уже.
Вот не надо, сверхпроводимость вполне себе используется, поэтому и несколько Нобелевских премий дали.
Самое интересное что она будет энергонезависимой и сверхбыстрой одновременно.
Хотел пошутить про Шредингера, но передумал и пошутил)
+1
-1
От шуток про Шредингера хочется и смеяться, и плакать одновременно.

Так кто мешает? Входите в суперпозицию и наслаждайтесь шуткой, пока никто не видит наблюдает.

Основа всей современной вычислительной техники — триггер, т.е. схема, имеющая 2 устойчивых состояния. Все цифровые транзисторы по сути работают по принципу выключателя, т.е. либо проводят, либо не проводят ток. Новое вещество, судя по всему, обладает именно такими свойствами: сверхскоростной триггер и/или переключатель. Так что если на самом деле все так, как написано, и данные структуры можно будет создавать в виде привычных нам кристаллов-чипов, то это означает новый виток производительности именно ВСЕЙ вычтехники, а не только накопителей.
Пока не известны подробные детали, сложно сказать какой может быть минимальный размер устройства.
Но энергонезависимая RAM Это конечно интересный поворот.
Привет быстрому старту и куче новых методов «Frost Attack», или как она там называется.
Прошло 10 лет, оперативная память на дисульфиде тантала используется повсеместно, но программы тормозят все равно!
(вскрыть в 2026 году и проверить правильность прогноза)
И GTA-8 не тянет!))
НЛО прилетело и опубликовало эту надпись здесь
Half-Life 3 все еще обещают
НЛО прилетело и опубликовало эту надпись здесь

Да — пропустили начало ветки, которая задает рамки что все происходит через 10 лет, т.е. в 2026м году. Когда начали обещать не уточняется.

НЛО прилетело и опубликовало эту надпись здесь
на дисульфиде тантала говорите… нееет, будет старая добрая DDR6 (с большими радиаторами) и то не повсеместно
(вскрыть в 2026 году и проверить правильность прогноза)
НЛО прилетело и опубликовало эту надпись здесь
Я оптимист
Персональных компьютеров не будет, а будут дубовые терминалы к огромным датацентрам, на столько огромным (читай богатым) что датацентры будут сами проектировать (аутсорс конечно) и производить специализированную электронику по своим (читай под конкретную нагрузку и задачи) стандартам и требованиям. И такие мелочи как охлаждение до нуля будет абсолютной нормой.
(вскрыть в 2026 году и проверить правильность прогноза)

p.s. частникам для приватности придется довольствоваться старой тормозной техникой а юрики свои минидатацентры будут заказывать (именно под ключ, как сейчас мини ядерные реакторы 'делают' — привезли, закопали и 20 лет гарантия с обслуживанием)

Нет, будут очень компактные вычислительные устройства, объединённые в распределённую сеть. В т.ч. носимые, в виде тех же украшений хотя бы. Толстые сервера будут, конечно, но они будут решать несколько другие задачи.


Это если из нас скрепок не понаделают, конечно =).

Не соглашусь с вами.
К сожалению 10 лет слишком маленький срок для решения более сложной проблемы — сетевого (а в вашем случае, беспроводного) доступа.
Если оконечный терминал имеет очень низкие требования к качеству связи (не очень широкий канал даже по нынешним меркам и низкие требования к латенси, за исключением шлемов VR конечно, но это особая ниша как раз в следующие 10 лет) то нода распределенной вычислительной сети требует очень высокие параметры, как пропускной способности так и латенси.

И электропитание конечно!
Больше позитива. Система грузится 10-20 секунд. Фотошоп около ~5. Раньше надо было минутами ждать. Весь софт на моём пятилетней давности компе летает. Скоро можно будет голосом говорить компу чего надо и смотреть как он быстренько за вас делает работу.
Странно, у меня наверно ПК из будущего, правда PS 15 сек, не 5 ждать
Ок гугл всё решит :D
Скорее 5-классники будут соревноваться у кого за сколько ms включается ПК и будут ОСь подрезать и оптимизировать. А потом спорить, что точности секундомера не хватает.
Одно слово.
MRAM.
Имеет преимущества перед обычной DRAM.
Коммерческий продукт, а не теоретические разработки и где оно?
А тут пока только теория с этим дисульфидом…
Ну… не будем такими пессимистами.
Хотя десятикратное преимущество элементарно съедается дальнейшей цепочкой. Дальше дело за технологией, а еще дальше — за рынком.
Пусть память будет в десять раз быстрее, и будет стоить в два раза дороже — сколько раз подумает потенциальный покупатель?
Хотя для серверного и HPC сегментов — однозначно полезно.
Самое главное, что смущает — что это сделано у нас, а не в недрах Самсунга или IBM. Т.е. довести изобретение до промышленности у нас вряд ли смогут. Самое эффективное для развития этой идеи — увы — всей научной группе продаться какой-либо конторе и там доводить до ума. Или если все опубликовано — то в той же IBM могут быстренько воспроизвести и возможно запатентовать. Что печально.
Реальность — иллюзия, вселенная — голограмма, скупай тантал, пока!
КДПВ — такое гикпорно
А как именно «ускорит работу компьютера в 10 раз»?
Как было сказано выше https://geektimes.ru/company/science_misis/blog/278422/#comment_9433834 память основной тормоз в сложных вычислениях.
Как было сказано там же, ускорения в 30-100 раз можно добиться просто изменив код.

Это не отменяет того факта, что фразы «ускорит работу памяти» и «ускорит работу компьютера» не являются взаимозаменяемыми.
Если уменьшить задержки памяти в 10 раз, то и простой процессора уменьшится в 10 раз, а значит общая производительность увеличится в 10 раз и это аппаратное решение, работающее в любом случае. Код выше не просто меняют, там хаки оптимизации и вообще приведен как пример насколько сильно влияют задержки памяти, и тут сразу несколько нюансов. Не любой код можно просто взять и изменить уменьшив обращения к памяти, далеко не всегда и не везде делают такую оптимизацию да и саму оптимизацию. Ну и в любом случае даже оптимизированный код все равно получит эти самые в 10 раз меньшие задержки.
>> Если уменьшить задержки памяти в 10 раз, то и простой процессора уменьшится в 10 раз, а значит общая производительность увеличится в 10 раз и это аппаратное решение, работающее в любом случае.

Только логика рассуждений ошибочная.

Пусть X — суммарное время простоя, Y — время полезной нагрузки в течение 1 сек. Т.е. X + Y = 1 (или Y = 1 — X)
Если X уменьшить в 10 раз, то получим X/10 + Y = 1 (или Y = 1 — X/10)
Т.е. новый Y отличается от старого Y в (1 — X/10) / (1 — X) раз. Вот и найдите, каким должен быть X, что бы эта дробь равнялась 10.

X = 10/11.

Вывод: когда процессор простаивает 10/11 времени, а трудится 1/11 времени, только в этом случае уменьшение простоя в 10 раз увеличит работу в 10. Не беретесь же вы утверждать, что такое соотношение труда и безделия — норма в целом?
Ну естественно ускорение коснется только работой под нагрузкой, во время бездействия и ускорять нечего. Плюс кратность ускорения будет плавать в зависимости от интенсивности использования памяти.
Вы не поняли. Утверждение «сокращение задержек памяти в 10 раз увеличит производительность процессора в 10 раз» корректно только в случае, когда вычислитель 10/11 времени ждет данных из памяти, чтобы потом совсем немножко «работнуть». Разве так обычно происходит?
Зависит от задачи. Если надо выполнять матан над большими объемами данных, то да.
Так в том то и дело, что фраза «ускорит работу компьютера в 10 раз» НЕ зависит от задач )))
Если верить утверждениям выше, что задержки памяти — это основной тормоз системы, то получается так. В случайном доступе память очень тормозит, стократно по сравнению с последовательным.

В современных процессорах даже на сложных задачах достигается скорость до 50-70% от теоретически возможной. Куча кэшей разных уровней, буферов и предсказателей ветвлений/анализаторов кода, внеочереодное исполнение инструкций и т.д. не зря больше половины кристалла занимают — все они как раз нужны для максимальной загрузки исполняющих устройство и минимизации ожидания(задержек) памяти.
Т.е. даже ускорение работы памяти в 100 раз не может дать увеличения скорости вычислений более чем в 2 раза.


Другое дело, что при такой быстрой памяти можно будет большую часть кэша и буферов из процессора выкинуть и освободившуюся площадь и "транзисторный бюджет" потратить на что-то более полезное в следующих поколениях процессоров. Хотя бы еще ядер налепить на том же размере кристалла как самый простой вариант.
Но и в этом случае эффект от 10 кратного ускорения памяти будет намного меньше 10 раз.

Я не спорю, много чего придумывается чтобы закрыть или нивелировать слабые места. Однако вот даже со всем этим на реальном примере описанном выше оптимизации давали приросты в десятки и даже стократ. Причем все эти аппаратные алгоритмы prefetch'и и буферы уверен работали. По мне так даже 2х кратный прирост это колоссально, при том что сейчас борются за доли процента.
Допустим в 10 раз ускорят скорость записи, а скорость чтения тогда какая? И каким способом будет чтение этой памяти? Ничего не сказано?
Да какое на фиг ускорение и перспективы. Под воздействием луча лазера — как Вы собираетесь луч таскать по микросхеме, чтобы попасть в нужный элемент? Вариант с количеством лазеров, равным количеству элементов памяти, не предлагать.
Эта технология могла бы иметь преимущество перед упомянутой MRAM, у которой есть фатальный недостаток — разрушаеющее чтение, но адресация все портит.
Кажется лазер используют только для облегчения проведения эксперимента, на деле можно использовать электричество (не уверен на счёт сказанного, только предположение).
как Вы собираетесь луч таскать по микросхеме
Как в дисковом приводе, не?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий