ITI_Capital Dec 4 2015 at 15:54

Разработка торговых систем под FPGA: Плюсы, минусы и анализ архитектуры существующей библиотеки

7 min

16K

ITI Capital corporate blogProgramming*

+12

Comments 10

insekt Dec 4 2015 at 16:28

> GPU также не могут предложить значительное быстродействие.

Можете чуть подробнее почему GPU не помогает?

nerudo Dec 4 2015 at 16:54

Может от того, что в GPU нет встроенного ethernet-контроллера? И нет большого объема данных для векторизуемых вычислений.

voidnugget Dec 5 2015 at 08:44

И GPU из-за накладных расходов на коммуникацию не сможет обеспечить задержки на обработку запросов в наносекундах.

evnuh Dec 4 2015 at 17:26

На скоростях, когда ты читаешь напрямую байты после обработки ацп сетевой картой ещё недоехавших udp пакетов у вас просто не остаётся выбора, когда начинать считать. Его (пакет с данными) нужно обсчитывать уже сейчас, а не дожидаться, пока процессор заберёт с сетевой карты данные, положит в память. дёрнет ваш GPU, тот очухается, заберёт данные и начнёт их считать.

insekt Dec 4 2015 at 17:55

Так а что мешает из NIC данные сразу в GPU отдавать? Через тот же PCI-E.

evnuh Dec 4 2015 at 18:57

Так можно, да. Я даже думаю что кто-нибудь так и делает. Насчёт GPU не уверен, а вот что впихивают сопроцессор и по PCI-e передают (что, по-сути, тоже самое) слышал.
Но, опять же, FPGA быстрее. Быстрее него только ASIC.

voidnugget Dec 5 2015 at 09:26

ASIC'и нужно руками собирать по кусочкам, автоматизированные трассировщики могут очень много шлака инкрустировать.
По этому бывают очень часто случаи когда ванильное FPGA гораздо шустрее плохо спроектированного ASIC'a, по моим личным наблюдениям это где-то 6 из 10 проектов :)

btw сейчас очень часто для HFT используют Virtex 7 и заказывают обрезку FPGA до CPLD у самого Xillinx'a, вместо изготовления ASIC'ов.

mezastel Dec 5 2015 at 18:56

А что дает обрезка до CPLD?

voidnugget Dec 5 2015 at 19:34

У CPLD плотность выше так как ячейки попроще, и с тем же тех процессом можно впихнуть больше.
А для трейдеров всякие DSP и прочие сигнало-непотребства, характерные для FPGA, — не нужны, по этому их целесообразно порезать. Да и режут не полностью, часть LUT'a остаётся FPGA'шной. Да и выхлоп качественных FPGA после травки вафли стремится к нулю, а вот с CPLD ситуация проще так как потеря даже 30% ёмкости погоды не сделает — в массовом производстве обходится дешевле минимум в 2-3 раза.

TimID Dec 6 2015 at 01:05

В отличие от GPU, «процессор» на FPGA не алгоритмичен. Он обрабатывает не байты и вектора последовательными командами, а сигналы, буквальные нули и единицы на линиях данных. Фактически, «идеальный ПЛИС-процессор» может провести все расчёты за один такт. Если нужные данные будут загружены, конечно. В топике как раз говорится, что все данные уже в памяти…