На скрине в статье видны BTB, BHT, RAS -- это механизмы Branch Target Buffer, Branch History Table и Return Address Stack. Конкретно в этом куске кода наверно отыграет branch target buffer -- фактически маленькая ассоциативная память (кэшик), которая по program counter выдаёт сохраненный ранее адрес перехода.
Другой вопрос, как быть с предсказателями ветвлений, если они не могут предсказать безусловный переход?
Подскажите, осциллограммы строились на первой итерации цикла или нет? По идее, на первой итерации у предсказателя должна быть осечка, ведь он ещё не встречался с этим циклом, ещё не обучен.
То есть втрое лучше по тактам умножаем на втрое хуже по частоте = никакого улучшения.
Улучшение может быть по энергопотреблению, частота ведь в разы ниже. Может оно будет экономить батарею в десятки раз. Зависимость между частотой и энергопотреблением ведь квадратичная.
развод на бабки VC ничуть не менее аморален, чем развод на бабки пенсионеров по телефону
Всё же деятельность VC подразумевает риски. VC по идее должны уметь немного отсеивать зёрна от плевел.
SpaceX делают ракеты и подчиняются законам США. По ним, теоретически, эти ракеты рассматриваются как оружие или связанные технологии. В результате, есть запреты на разглашение этой инфы и например, для работы в SpaceX надо гражданство США.
Может быть китайский суперкомьютеры тут не учитывается.
Они и не учитываются, Китай перестал подаваться в TOP500 (не хотят светить возможности) и имеет 2 экзаскейл суперкомпьютера. Китай кое-что светит в Gordon Bell Prize.
Xilinx не раскрывает детали реализации этого механизма, поэтому единственное что можно утверждать наверняка - появление метастабильности внутри этой схемы может привести к непредсказуемым последствиям.
Кстати, подсказки есть, один из ведущих инженеров Xilinx на форумах намекал на реализацию.
Ещё раз по поводу вашего "бага", так изображаются шины. Щёлкните уже правой кнопкой по шине и выберите пункт dissolve, тогда среда нарисует вам отдельные провода, щёлкните combine и получите обратно шину. В мануале по Schematic Viewer SUG755E это есть.
По-видимому, именно этот механизм и сформировал бренды “японский магнитофон”, “швейцарские часы” и “английские учёные”. Эта экстраполяция потребительского опыта, его перенос с товара на фирму-производитель, на отрасль в целом или на тот или иной регион и формирует механизм конкуренции в остальных слоях.
Подскажите, а как же конкурентный ромб Портера? Неужели всё можно сводить к субъективному восприятию отдельного товара? Может "японский магнитофон" потому бренд, что там сошлись звёзды: поставщики, покупатели, кадры, конкуренция в отрасли? Может сильные бренды выковываются там, где формируются сильные кластера связанных отраслей и сходится ряд прочих факторов?
Ну и выкупать свои же акции - это вообще "интересное" решение. Так можно прийти к ситуации когда Акционерное общество принадлежит только самому себе, если Все акции оно же и выкупило.
Так делают например, когда считают, что компания недооценена на бирже, а также когда хотят делать вещи с большим горизонтом планирования, которые не поймут на бирже в краткосрочной перспективе. Такое делал DELL, когда Майкл Делл решил сделать компанию на некоторое время снова частной.
Про open-source к сожалению не знаю; но слышал, что раньше были соревнования по алгоритмам P&R и победители попадали в современные тулы, проприетарные и не очень.
Да, действительно, пардон, не посмотрел, что там у человека Latch, а не LUTы используются. Но сути замечания сильно не меняет: для хоть сколько-нибудь контролируемого тайминга в подобных экспериментах ресурсы лучше прибить констрейнтами, иначе результаты будут очень существенно отличаться в зависимости от того, как P&R всё разложило в этот конкретный раз на кристалле.
А в чём состоит баг? Вы подключили отладчик (analyzer oscilloscope), из-за которого вашу схему не сносит синтезатор. К нему же подключен и ваш осциллятор, поэтому его тоже не сносит и он там отдельным квадратиком стоит, тактируя отладчик. А analyzer oscilloscope на схематике не отображается. Схема верна.
А скорости различаются, потому что как и написано в цитате с вики:
строго-самосинхронные схемы предъявляют очень жесткие требования к внутренней структуре ПЛИС
физически на плисине ваши два эксперимента раскладываются на разные LUT-ы, длины путей между которыми отличаются и вносят существенную разницу в скорость осцилляции вашей штуки. Чтобы немножко контролировать процесс, прибейте констрейнтами ваши триггеры к конкретным LUT-ам внутри ПЛИС.
На скрине в статье видны BTB, BHT, RAS -- это механизмы Branch Target Buffer, Branch History Table и Return Address Stack. Конкретно в этом куске кода наверно отыграет branch target buffer -- фактически маленькая ассоциативная память (кэшик), которая по program counter выдаёт сохраненный ранее адрес перехода.
Понятно, спасибо.
Подскажите, осциллограммы строились на первой итерации цикла или нет? По идее, на первой итерации у предсказателя должна быть осечка, ведь он ещё не встречался с этим циклом, ещё не обучен.
Для полупроводниковых САПР будет хороший буст от L3-кэша. Вот старые замеры про 3D-cache на эту тему от AMD.
Улучшение может быть по энергопотреблению, частота ведь в разы ниже. Может оно будет экономить батарею в десятки раз. Зависимость между частотой и энергопотреблением ведь квадратичная.
Всё же деятельность VC подразумевает риски. VC по идее должны уметь немного отсеивать зёрна от плевел.
Ясно, спасибо.
Если не секрет, почему выбрали TCAM для реализации FIB?
SpaceX делают ракеты и подчиняются законам США. По ним, теоретически, эти ракеты рассматриваются как оружие или связанные технологии. В результате, есть запреты на разглашение этой инфы и например, для работы в SpaceX надо гражданство США.
Мне показалось, что после санкций на Huawei решили не подставлять свои прочие детища.
Они и не учитываются, Китай перестал подаваться в TOP500 (не хотят светить возможности) и имеет 2 экзаскейл суперкомпьютера. Китай кое-что светит в Gordon Bell Prize.
Кстати, подсказки есть, один из ведущих инженеров Xilinx на форумах намекал на реализацию.
Классная статья!
Инференс DSP-слайсов и когда он не работает :)
Спасибо, очень познавательно!
Да, поведенческая экономика местами шатает устои, доводилось как-то читать про неё.
Ещё раз по поводу вашего "бага", так изображаются шины. Щёлкните уже правой кнопкой по шине и выберите пункт dissolve, тогда среда нарисует вам отдельные провода, щёлкните combine и получите обратно шину. В мануале по Schematic Viewer SUG755E это есть.
Интересная статья.
Подскажите, а как же конкурентный ромб Портера? Неужели всё можно сводить к субъективному восприятию отдельного товара? Может "японский магнитофон" потому бренд, что там сошлись звёзды: поставщики, покупатели, кадры, конкуренция в отрасли? Может сильные бренды выковываются там, где формируются сильные кластера связанных отраслей и сходится ряд прочих факторов?
Так делают например, когда считают, что компания недооценена на бирже, а также когда хотят делать вещи с большим горизонтом планирования, которые не поймут на бирже в краткосрочной перспективе. Такое делал DELL, когда Майкл Делл решил сделать компанию на некоторое время снова частной.
Про open-source к сожалению не знаю; но слышал, что раньше были соревнования по алгоритмам P&R и победители попадали в современные тулы, проприетарные и не очень.
Они не замкнуты, а объединены в шину. Рассматривайте их как пучок проводов.
Да, действительно, пардон, не посмотрел, что там у человека Latch, а не LUTы используются. Но сути замечания сильно не меняет: для хоть сколько-нибудь контролируемого тайминга в подобных экспериментах ресурсы лучше прибить констрейнтами, иначе результаты будут очень существенно отличаться в зависимости от того, как P&R всё разложило в этот конкретный раз на кристалле.
А в чём состоит баг? Вы подключили отладчик (analyzer oscilloscope), из-за которого вашу схему не сносит синтезатор. К нему же подключен и ваш осциллятор, поэтому его тоже не сносит и он там отдельным квадратиком стоит, тактируя отладчик. А analyzer oscilloscope на схематике не отображается. Схема верна.
А скорости различаются, потому что как и написано в цитате с вики:
физически на плисине ваши два эксперимента раскладываются на разные LUT-ы, длины путей между которыми отличаются и вносят существенную разницу в скорость осцилляции вашей штуки.
Чтобы немножко контролировать процесс, прибейте констрейнтами ваши триггеры к конкретным LUT-ам внутри ПЛИС.