• Сумбурные размышления о будущем технологии FPGA
    +1
    Да, сейчас это модная тема, называется embedded vision. Главное слово тут embedded, потому что никаких особых проблем с алгоритмической точки зрения нет — бери OpenCV и радуйся. Проблема только в энергопотреблении. Поэтому все люди, варящиеся в этой кухне, смотрят либо в сторону ASIP, либо в сторону процессоров с заточенными под это DSP-расширениями. Если есть время и желание, очень рекомендую посмотреть вот этот вебинар: Case study: Designing an application-specific multicore system for pedestrian detection, using Processor Designer. Это то, про что я говорил — люди понимают, что нужна программируемость и производительность, но, к сожалению, FPGA здесь никак не годится, поэтому изобретают другие способы.

    Я, наверное, уже утомил всех в этой ветке разговорами про энергопотребление, однако этот параметр, по моим ощущениям (а мне приходится общаться с десятками компаний-разработчиков микросхем) вышел на первое место, обогнав площадь кристалла и производительность (кому она теперь нужна, когда любой микроконтроллер можно разогнать до 1ГГц на 22нм техпроцессе?)
  • Сумбурные размышления о будущем технологии FPGA
    +1
    Декодирование аудио делают на аудиопроцессорах. Для самых наикрутейших аудиоформатов типа DTS HD достаточно двухядерного DSP-процессора, работающего на частоте всего в несколько сотен МГц, потребляющего несколько милливатт и занимающего на кристалле столько же места, сколько 100 LUT-ов в ПЛИСе. Форматы можно менять как перчатки.

    Поэтому я уверен на 99% что ПЛИС никогда не будут использоваться в масс-маркете. Помимо высокого энергопотребления у них есть еще один недостаток — цена. Разумеется, для ускорения научных расчетов им нет конкурентов, но это 0,001% рынка.
  • Сумбурные размышления о будущем технологии FPGA
    0
    А что такое высокопроизводительные вычисления сейчас? Шифрование? Обработка пакетов? Видео? Компьютерное зрение? Давно прошли те времена, когда эти функции в ASIC-ах делали на hard-coded логике, сейчас модны всякие ASIP, которые обеспечивают некоторую степень программируемости, поэтому больше нет нужды делать ASIC под каждый конкретный алгоритм. Погуглите, например, LDPC
    ( Low-density parity check code ), которые теперь повсеместно используются не только во всяких LTE, но и во многих SSD, где алгоритм меняется по мере износа диска. Допустим, я делаю какой-нибудь аццкий ускоритель на FPGA — я вижу, вы занимаетесь чем-то подобным — как часто в реальной жизни возникает нужда кардинально менять алгоритмы за время жизни продукта?
  • Сумбурные размышления о будущем технологии FPGA
    0
    Я же не спорю, что их активно используют, когда нет денег сделать нормальную микросхему :) И вообще, я ПЛИСы люблю, с них начинал и до сих пор кое-что на них делаю, правда в моей области они используются исключительно для прототипирования ASIC-ов.
  • Сумбурные размышления о будущем технологии FPGA
    0
    FPGA очень много жрут электроэнергии, просто неимоверно много. Поэтому их применение всегда будет очень ограниченным. Как мне кажется, индустрия движется в сторону гетерогенных систем, т.е. противоположную от реконфигурируемых. Проще добавить в систему десять модулей, каждый из которых делает что-то свое (не исключено, что с некоторой степенью свободы, т.е. это может быть специализированный процессор), и отключать ненужные для экономии энергии. Транзисторы нынче дешевы.
  • Наборы команд должны быть свободны: доводы за RISC-V
    0
    Ну я лично знаю как минимум одну широко известную в узких кругах 32-битную архитектуру, где можно конфигурировать ширину шины адреса в пределах от 16 от 32 бит.

    Что касается RISC-V, то из вашей ссылки действительно следует, что разрядность архитектуры будет зависеть от реализации, что само по себе звучит как бред. Господа в очередной раз пытаются усидеть на трех стульях одновременно, создав универсальную архитектуру на все случаи жизни. По логике, за ней должна последовать универсальная ОС, покрывающая весь спектр от RTOS до мэйнфрэймовых операционок.
  • Наборы команд должны быть свободны: доводы за RISC-V
    0
    Регистровые окна живут и здравствуют. И очень популярны во встроенных системах, критичных ко времени обработки прерываний.
  • Наборы команд должны быть свободны: доводы за RISC-V
    0
    вообще-то разрядность архитектуры и режимы адресации — разные вещи.
  • Наборы команд должны быть свободны: доводы за RISC-V
    0
    Они 64-битную архитектуру предлагают для IoT, где люди каждый пикоджоуль считают?
  • Взгляд на 10G Ethernet со стороны FPGA разработчика
    +2
    Разница между Altera и сопоставимым семейством Xilinx глазу не заметна. Среди контор, занимающихся прототипированием своих ASIC-ов на ПЛИСах, они используются одинаково часто — так что выбор действительно это определяется другими факторами (например, у вас офис в Калифорнии по соседству).

    Раньше у Альтеры было преимущество поддержки констрэйнов в настоящем формате SDC (том, который жрет Design Complier), так что не надо было переписывать одно и то же два раза. Но теперь Xilinx тоже этот формат поддерживает (правда только для седьмой серии и только в Vivado и еще зачем-то назвали его FDC). Но для тех, кто ASIC-и не делает, это не столь важно.

    Ладно, открою страшную тайну. Альтера дешевле :) Поэтому ее все любят.
  • Tickle научит детей и подростков создавать собственные игры и приложения под iOS
    +1
    Первым уроком программирования должно быть написание «Hello World». Вторым — приседание/отжимание столько раз, сколько байт получилось в коде в первом уроке. Только это поможет увеличить количество достойных работников IT-сферы.
  • Intel Embedded – процессоры вокруг нас
    +1
    Расскажите лучше, какие действительно встраиваемые процессоры от других разработчиков использует Интел.
  • NVIDIA представила 64-разрядный Tegra K1 процессор с двумя ядрами Denver
    0
    сложно сказать наверняка, но походу процессор делает из ассемблера ARM ассемблер ARM, т.е. там нет собственного внутреннего представления. Оптимизация заключается в том, что они разворачивают циклы, переставляют команды местами, переименовывают регистры и т.д., т.е. заменяют исходный код на такой же, но жестоко оптимизированный по быстродействию в ущерб размеру. В принципе, подобную оптимизацию делают и обычные суперскалярные процессоры (разве что циклы они не разворачивают) — но Нвидия надеется получить профит за счет гораздо большего «окна» (обещают в пять раз большее окно, около тысячи команд).
  • NVIDIA представила 64-разрядный Tegra K1 процессор с двумя ядрами Denver
    0
    Тем не менее, в той статье, которую мы тут обсуждаем, A15 назван «3-way superscalar», что, похоже, намекает на то, что считается именно количество декодируемых за такт команд.
  • NVIDIA представила 64-разрядный Tegra K1 процессор с двумя ядрами Denver
    0
    Это точно восемь команд из одного потока, или по одной команде из восьми потоков?
  • NVIDIA представила 64-разрядный Tegra K1 процессор с двумя ядрами Denver
    +1
    Из комментариев к оригинальной статье:

    In other words, it is an in-order VLIW core with a dynamic recompiler ARM emulator in firmware. Like the old «x86» chips from Transmeta. Interesting design choice, we'll see how well it works in practice.
  • NVIDIA представила 64-разрядный Tegra K1 процессор с двумя ядрами Denver
    +7
    А причем здесь CUDA?

    Кстати, ответ на мой вопрос нашелся в оригинале статьи. И должен сказать, что автор перевода просто выкинул самое интересное. Читайте оригинал, и желательно в это время сидеть на чем нибудь твердом, чтоб не упасть…
  • NVIDIA представила 64-разрядный Tegra K1 процессор с двумя ядрами Denver
    +2
    Что-то терзают меня сомнения насчет 7-wide superscalar. В свое время (конец 80-х) были проведены исследования, по результатам которых оказалось, что нет никакого смысла делать суперскалярные машины, способные выполнять больше 3-4 команд одновременно. Причем это число зависит исключительно от кода, который выполняется на процессоре, а точнее, от instruction-level parallelism в этом коде (т.е., грубо говоря, от количества идущих друг за другом ассемблерных команд, независимых друг от друга, которые можно выполнить параллельно).

  • Временной анализ FPGA или как я осваивала Timequest
    0
    Может я чего-то не уловил, но если «есть некий внешний регистр», который тактируется от совершенно другого тактового сигнала (т.е. является асинхронным по отношению к регистру внутри FPGA), то путь между этими регистрами должен быть объявлен как false path — нет абсолютно никакого смысла задавать input delay. Input delay имеет смысл только тогда, когда тактовые сигналы для «внутреннего» и «внешнего» триггеров синхронные. В противном случае, как правильно написано в документе по ссылке, есть неиллюзорный шанс загнать «внутренний» триггер в метастабильное состояние. Вот только никакими SDC-констрэйнами избавиться от этого нельзя, от метастабильности избавляются путем добавления синхронизаторов.
  • Плис Achronix – опыт освоения
    0
    К сожалению, архивчик не могу. Ибо процессор не бесплатный и мне надают по голове даже за нетлисты
  • Плис Achronix – опыт освоения
    0
    Итак, засунул я один маленький процессор в Simplify Premier 2013.09-1 и синтезировал его для Virtex7 XC7VX330T и Speedster22iHD1000

    Законстрэйнил на 120МГц. Физический синтез не использовал.

    Результаты для разных спидгрэйдов:

    Virtex -1 — 85 МГц (5070 LUT-ов, 2123 триггеров и 8 RAM-блоков) — самый медленный спидгрэйд
    Virtex -2 — 104МГц (5127 LUT-ов, 2195 триггеров и 8 RAM-блоков)
    Virtex -3 — 96 МГц (5011 LUT-ов, 2052 триггеров и 8 RAM-блоков) — самый быстрый спидгрэйд

    Speedster С3 — 53 МГц (7249LUT-ов, 2116 триггеров и 8 RAM-блоков) — самый медленный спидгрэйд
    Speedster С2 — 60 МГц (7266 LUT-ов, 2083 триггеров и 8 RAM-блоков)
    Speedster С1 — 71 МГц (7338 LUT-ов, 2138 триггеров и 8 RAM-блоков) — самый быстрый спидгрэйд
  • Плис Achronix – опыт освоения
    0
    Времянка после синтеза и после трассировки сильно различается?
    А то у меня Симплифай есть, а бэкэнда нет, но что-то захотелось засунуть процессор в эту ПЛИСину, сравнить с другими вендорами.
  • Минпромторг заказывает разработку отечественного процессора
    +2
    Ну тут можно поспорить. Учитывая, что скорее всего куплен готовый четырехядерный АРМ, разработка которого заняла несколько сотен человеколет, то эта часть не только самая важная, но и самая большая (тем более что A57 продается в комплекте с шинами и L2-кэшом).

    С другой стороны, даже если считать, что процессор — это черный ящик, то все равно остается большой простор для творчества и куча возможностей накосячить. Так что разрабатывать там есть чего.
  • Минпромторг заказывает разработку отечественного процессора
    +1
    Покупки айпи и аутсорса бэк-энда. Причем доля покупного айпи, как я уже упоминал, может доходить до 90% — но все же оставшиеся 10% делают сами, чтобы хоть чем-то отличаться от конкурентов. То есть это все довольно просто, если есть деньги. Проблема в том, что в каком-нибудь Израиле, который на карте-то не найдешь, таких фирм десятки, а у нас по пальцам пересчитать, при том, что это все отнюдь не rocket science.
  • Минпромторг заказывает разработку отечественного процессора
    0
    Ну мне по долгу службы приходится общаться с большим количеством зарубежных фирм, разрабатывающих собственные микросхемы с нашими IP-ядрами, и я вижу, что такая бизнес-модель имеет место быть и даже очень популярна. Видимо, крадут не все или не у всех, либо считают, что на воровстве нетлистов особо не наживешься.

    Серьезные фирмы, конечно, все делают сами. У них на то имеются ресурсы. Покупать лицензии на кучу тулзов для бэк-энда, чтобы выпускать одну микросхему в год, экономически не выгодно (по крайней мере, за пределами России — у нас-то возможны всякие чудеса).
  • Минпромторг заказывает разработку отечественного процессора
    0
    Вообще-то синтез — это не бэк-энд. По крайней мере, я его под бэк-эндом не имел в виду. Обычно люди, у которых мало денег, делают так: покупают IP-блоки, синтезатор и библиотеку стандартных ячеек, добавляют 10% своего RTL-кода, собирают этот конструктор, синтезируют и получившийся нетлист шлют китайцам / индусам, чтобы те уже за них все остальное доделали. Потом, когда микросхема разошлась по миру и принесла много денег, пару китайцев и индуса выкупают из рабства, сажают в соседней комнате и покупают им собственный ICC.
  • Минпромторг заказывает разработку отечественного процессора
    0
    Ну главное, все-таки — RTL (и аналоговщина, если есть). Все ноу-хау там. Дальше уже дело техники, а какую библиотеку подсунуть синтезатору — 40, 28 или 14нм — это дело десятое.

    В любом случае, я больше чем уверен, что никакой жути типа процессорных ядер, контроллеров DDR памяти и тому подобного Т-Платформы сами не разрабатывают. Что, разумеется, их заслуг не умаляет — сейчас весь мир так работает (и зарабатывает) — разумеется, если тираж микросхемы ну хотя бы миллион экземпляров :)
  • Минпромторг заказывает разработку отечественного процессора
    0
    Про то, что я там работаю. А «официальный» прайс — это не истина в последней инстанции, всегда можно поторговаться. Тем более, что бэк-энд можно вообще аутсорсить (многие буржуины так делают).
  • Минпромторг заказывает разработку отечественного процессора
    +1
    Ну это вряд ли… я уж не знаю, что такого можно у нас купить на 40 миллионов :)
  • Минпромторг заказывает разработку отечественного процессора
    +3
    Зачем эта штука T-Платформам — я могу представить, замена интеловских процов на 64-битные армы действительно выглядит перспективно для суперкомпьютеров.
    Но зачем она Минпромторгу и Роснано? Зачем им нужна какая-то микросхема — она ведь сама по себе работать не будет. Ее надо припаять на плату, засунуть в корпус… Какое до всего этого дело государству? Если государству нужны коммутаторы, маршрутизаторы и расплывчатая «вычислительная техника» — так надо их и заказывать, и пусть тот, кто на это дело подпишется, сам выясняет, сколько ядер и какой техпроцесс должен быть у процессора и где его взять — купить или самим пытаться разработать. Какой-то нелепый микро-менеджмент.
  • Минпромторг заказывает разработку отечественного процессора
    +4
    Пруф есть? 1,2 миллиарда рублей — это меньше 40 миллионов баксов. Бюджет, достаточный лишь для того, чтобы купить готовые IP-ядра у ARM'а и прочих вендоров и собрать из них SoC.
  • MMU в картинках (часть 1)
    0
    Да, закралась неточность. Вместо «Поиск может быть реализован как аппаратно, так и программно — через обработчик исключения, называемого страничной ошибкой (page fault)» следует читать «Поиск может быть реализован как аппаратно, так и программно — через обработчик исключения, называемого промахом TLB (TLB miss)».

    Соответственно, в случае программно реализованного поиска проход по иерархии таблиц (PGD->PMD->PTE в вашем случае) осуществляет обработчик промаха TLB (и уже из него можно прыгнуть в обработчик page fault-а). В случае аппаратно реализованного поиска в MMU добавляется специальная логика, которая делает то же самое, но быстрее. Но такое железо гораздо сложнее и вдобавок жестко завязано на конкретную структуру таблиц, то есть могут возникнуть проблемы с поддержкой операционок с нестандартной иерархией таблиц.
  • Теплый ламповый звук
    0
    Конкретно в этой ветке обсуждение началось с ремонта компьютерных блоков питания, разумеется к усилителям низкой частоты все это имеет мало отношения.
  • Теплый ламповый звук
    0
    На «этой» — это на той, на которой появится высокий импеданс из-за выкинутого электролита. Поскольку спектр широкий (я и не утверждал обратного) — то скорее всего эту частоту он захватит, появятся помехи по питанию, а дальше уже зависит от обстоятельств.

    Хоть убейте, не вижу принципиальной разницы между керамикой и электролитами. Отличаются только характеристиками. Поэтому, разумеется, можно обойтись исключительно керамикой. Вопрос в том, сколько её понадобится и сколько это будет стоить.
  • Теплый ламповый звук
    0
    Товарищ Фурье утверждал, что меандр все-таки имеет кое-что общее с гармоническим сигналом.

    И несмотря на то, что весь этот промискуитет, как вы выразились, действительно трудномоделируем, тем не менее он все-таки моделируем. И хочу вас заверить, активно моделируем. Практически вся современная цифровая техника прочно засела в СВЧ-диапазоне, и ни одну микросхему с каким-нибудь PCIe не запускают в производство, не промоделировав ее каким-нибудь 3D Field Solver'ом, решающим уравнения Максвела.

    Что касается графиков, которые я тут понарисовал, то можете погуглить Power Distribution Network или Power Integrity.
  • Теплый ламповый звук
  • Теплый ламповый звук
    +1
    Платы, где земля сделана дорожками, не требовательны к импедансу цепей питания, поэтому можно двигать дорожки их как угодно (в разумных пределах — стараясь все-таки оставить какое-то подобие решетки, чтобы меньше фонило), при условии, что они достаточно толстые. На платах, которые действительно требовательны, земля сделана одним, а то и несколькими слоями.

    Если кондер этот выкусить кусачками — схема продолжит работать до тех пор, пока процессору не понадобится много тока именно на это частоте. И для этого ему совершенно не обязательно работать на частоте, скажем, 500кГц. Каждый раз, когда процессору понадобится много тока, сначала он возьмет его из паразитной емкости транзисторов, из которых он сделал. Она маленькая, но может отдать ток мгновенно. Надолго ее не хватит — но после нее в дело вступают конденсаторы побольше и «помедленнее» (то есть с минимальным импедансом, смещенным к более низким часотам). Например, керамические конденсаторы по 0,01мкФ, припаянные прямо на выводы питания микросхемы. Еще какое-то время процессор протянет на них. Потом придет очередь танталов, которые расположены подальше от выводов питания, потом — электролитов, и наконец, начиная с десятков килогерц, ток начнет отдавать сам блок питания. Так вот, если вы выкинете тот самый несчастный электролит, импеданс действительно изменится в узком диапазоне — сверху он будет «прикрыт» танталами и керамикой, снизу — блоком питания. Но только именно когда танталов не хватит, а блок питания еще не успеет раскочегартися, ваш процессор и заресетится.

    Что касается последовательных и параллельных резисторов, то поверьте, я рисовал эквивалентные схемы и гораздо сложнее, и все они вели себя примерно одинаково. Вот, например, схема для электролита TAJA106K016R из документации и для него же с дополнительной паразитной индуктивностью в 10нГн.

  • Теплый ламповый звук
    0
    Забыл добавить, что на графиках по вертикальной оси — импеданс в Омах. Чем ниже график — тем лучше.
  • Теплый ламповый звук
    +5
    Вот не поленился я и включил LTspice. Итак, имеем идеальный 100мкФ электролит в вакууме — зеленый график. Потом добавляем к нему паразитную индуктивность 1нГн (припаяли наш элекролит прямо к слоям земли и питания), получили синий график. Потом приподнимаем наш электролит на три миллиметра — индуктивность становится примерно 10нГн. Смотрим красный график. Начиная с пятисот килогерц в импеданс цепи питания с приподнятым электролитом в 10 раз больше. Если номинальное напряжение на процессоре 1,1В, минимально допустимое на 10% меньше, т.е. 1В, а пиковое потребление 10А, то очевидно, что импеданс должен быть меньше (1,1-1)/10=0,01Ом, причем желательно — во всем диапазоне частот (а процессор работает, скажем, на 1ГГц).

    Конечно, помимо электролита ведь есть еще керамика. Ок, добавим десять жирных керамических конденсаторов по 1мкФ каждый, включенных параллельно:

    На частоте в 500кГц импеданс цепи питания с приподнятым на 3мм электролитом в 1000 раз выше. Ваш процессор выключился. Кончно, можно добавить еще горсточку 10мкФ танталовых конденсаторов. Однако в любом случае я бы не был столь категоричен, утверждая, что курить ничего не надо.
  • Теплый ламповый звук
    0
    Ну отлично, керамика, разумеется, там стоит, и танталы стоят. Но когда левая часть графика уплывет влево из-за увеличившейся паразитной индуктивности, кто даст гарантию, что импеданс цепи питания не превысит пределы в отдельно взятом частотном диапазоне и напряжение на процессоре не просядет, когда он внезапно включит, скажем, блок вычислений с плавающей точкой? Можете рискнуть.