Как стать автором
Обновить

Комментарии 59

Вы на датасете от Медведева обучали что-ли?!)
Почему мы захотели поддержать Эльбрус?

Это единственный российский процессор, хотелось понять, как с ним обстоят дела, насколько легко с ним работать.
Мы подумали, что государственным организациям может быть интересно, чтобы российское ПО, которое мы разрабатываем, работало на российском железе.
И конечно, нам было просто интересно, т. к. Эльбрус это VLIW-процессор, то есть, процессор с длинными инструкциями, и таких полноценных, общего положения, процессоров в мире нет.


— Мы очень хотим уютных госзаказиков за деньжищи налогоплательщиков
Ну так-то это не стыдно же хотеть деньжищи? Или стыдно?
Слишком уж много там вьется коррупционных схем вокруг наших с вами деньжищ, перераспределяемых чиновниками с низкой социальной ответственностью, так что в эту серую зону обычно ходят руководствуясь не только здоровым коммерческим интересом, но и готовностью закрывать глаза на нарушения закона, а то и готовностью участвовать в этих схемах откатами, как, например, поступает Касперский
Деньжищи будут разворованы независимо от того, что на них приобретают — Intel или Эльбрус. С Эльбруса хоть что-то в виде з/п профильным специалистам внутри страны заплатят.
Деньжищи будут разворованы независимо от того


Вопрос не в том, будут ли, вопрос в том, что лично вы (я, они) готовы (не готовы) принимать в этом участие
А лично они (технические специалисты фирмы, к которым вы адресовали свою филиппику) и не будут — также, как лично не принимают участие в этом технические специалисты Intel, AMD, Oracle etc.
Мне кажется, что пост составлен с большим учетом нетехнического интереса в уме.
В любом случае разница между «освоили Эльбрус — сможем выполнять госзаказы» и «освоили Эльбрус — сможем красть» реализуется никак не на уровне технических специалистов.
Спорить с очевидным сложно, тем более, что я обратного и не утверждал никогда
Вы же написали
Вопрос не в том, будут ли, вопрос в том, что лично вы (я, они) готовы (не готовы) принимать в этом участие
Т.е., предполагалось заведомое участие техспецов в коррупции.
Моя реплика касается не «заведомого участия техспецов в коррупции», а вопросу морального выбора, встающего как перед предпринимателями, так и перед специалистами. Мне правда нужно почитать вам вслух или вы прекратите приписывать одним словам значение других?
Если речь не идет о заведомом участии в коррупции, то в чем, собственно, моральный выбор, встающий перед специалистами? Между чем выбирать предлагается?
Начнем с того, что о технических специалистах заговорили вы. Пост генерального директора != пост технического специалиста, даже если по совместительству директор таковым является

Я отказываюсь с вами спорить, так как сама суть спора вокруг каких-то абстрактных специалистов вами навязана и никак фактически не связана ни с публикацией, ни с моими комментариями

То, что это увлечение Эльбрусом попахивает коррупционными деньгами, подсказала мне моя интуиция, однако достаточно было погуглить и выясняется, например, связь семьи постера с семьей Касперского, всплывают уже полученые государственные заказы.

www.cnews.ru/news/top/2019-08-23_startap_syna_igorya_ashmanova

Сказки Булонского леса о чистоте помыслов я приглашаю вас далее рассказывать не мне, я отвечать вам не буду, sapienti sat
Начнем с того, что о технических специалистах заговорили вы.
Но вы к этому претензий не предъявляли, напротив — постулировали моральный выбор, «встающий как перед предпринимателями, так и перед специалистами». Если в части предпринимателей всё ясно, то про специалистов хотелось бы разъяснений.
То, что это увлечение Эльбрусом попахивает коррупционными деньгами, подсказала мне моя интуиция
Ну раз интуиция, то тут не поспоришь
связь семьи постера с семьей Касперского...
Я человек старомодный (презумпция невиновности, бремя доказательств, нелюбовь к революционному правосознанию и учёту происхождения — вот это вот всё), так что предполагал, что обвиняя кого-то в намерении совершить преступление, вы будете оперировать несколько более весомыми аргументами. Ошибся — бывает.
«однако достаточно было погуглить и выясняется, например, связь семьи постера с семьей Касперского»


Оказывается, мало, совершенно недостаточно гуглить. Ведь нужно ещё включать голову.
Иначе получается совершенно чудовищная лажа.
Вроде вот этой.

Какая ещё «связь постера с семьёй Касперского»? Что вообще за «семья Касперского»? Как может быть с ней «связан» Станислав Ашманов?
Какая связь несуществующих пока «госзаказов» на нейронный движок под Эльбрус, которые вообразил себе комментатор, и грантом РВК на платформу виртуальных собеседников для бытовой техники?

Но это ж не главное, «в главном-то он прав (с)».
Ведь всё плохо и будет только хуже!

Вместо того, чтобы, наконец, порадоваться за нашу страну, что есть созданная с нуля национальная нейронная платформа, и она заработала с национальным же процессором — надо пробурчать, что всё раскрадут!
До этого можно было бурчать, что ничего своего нет; теперь можно бурчать, что всё равно всё украдут.
Ну посоветуй компилятор под WLIW, пообсуждай методы оптимизации, выясни причины, почему на Интеле настолько быстрее. Но нет — нет смысла! Вообще нет смысла делать что-то отечественное!

Аноним же хорошо знает сказки Булонского леса!
А что там в этих сказках говорят о том, когда в государственные ведомства коррумпированные чиновники покупают за государственные деньги технику от Интела, ИБМ, ставят ПО от Микрософта, Оракла, Гугла, ИБМ — там, конечно же, нет откатов и коррупции?

Вообще, самые большие откатчики в ИТ-отрасли, в том числе в России — именно эти компании, названные выше.
Здесь тоже не мешало бы включить голову.

Ну да ладно, в общем, всё понятно.
Забавно слышать совет «включать голову» от человека, публично поддерживавшего стариковщину. Как там англичанка, всё гадит, Игорь Станиславович?
Забавно слышать совет «включать голову» от человека, публично поддерживавшего стариковщину. Как там англичанка, всё гадит, Игорь Станиславович?

Аргумент — прямо в точку, по сути, невероятной силы, несомненно достойный такого технического ресурса, как Хабр.
НЛО прилетело и опубликовало эту надпись здесь
Каково это делать продукт, который будет потом использован против тебя же, или деньги не пахнут?
А представьте, что вдруг какой нибудь nginx работает на сервере в Роскомнадзоре!
Или кто-то делает Аста Линукс, а ее потом генералу ФСБ в компьютере установят.
Ужас же!
Вы перекручиваете.
Nginx изначально разработан для людей. Поэтому, как контраргумент, не проходит.
Эльбрус же разработан только гос сектора и военных.
А с учетом того, при каком режиме живём, и их желанием внедрить массово распознование лиц, чтобы подавлять протесты и обеспечить себе и друзьям-коррупционерам вечное пребывание у власти, минусить должны как раз вас, а не saag
Да ладно! Внедрять массовое распознование лиц хочет прежде всего бизнес: например, вот "Две столичные сети кофеен ввели систему распознавания лиц покупателей",
Для чего им это нужно не берусь судить, но правительства государств, конечно задумаются о своем использовании.
Вообще все, что придумывают инженеры для блага человечества, потом правительства и военные переиспользуют для своих нужд. Так что, не изобретать теперь ничего?
ага, только россия и бизнес.
как бикини и северный полюс.

Не, ну если совести совсем нет, как читается в вопросе первого комментария, можно изобретать, конечно, эти репрессивные инструменты для режима. Главное только потом не удивляться, чем это аукнется в перспективе и для самих изобретающих.

В здоровых странах эти инструменты используются действительно для борьбы с преступностью. В стране курильщика — для подавления оппозиции и удержания власти.
Любопытно узнать, для сборки C/C++ кода подбирали опции компилятора для максимальной производительности или компилировали просто в -O3 режиме? Вдобавок, можно ускориться с использованием профиля. В хелпе всё это (подобно gcc) должно быть.
А какой будет результат, если столько же усилий потратить на ускорение системы на Intel Core i7 7700?
Вот тоже подумал про это…
Есть подозрение, что на i7-7700 уже ускоренный описанными в статье методами код. Они же для Intel используют специальный интеловский бэкенд, а Intel обращает большое внимание на производительность своих продуктов.

Для Intel это уже сделано, только усилий (в условных человеко-часах) потрачено на пару порядков больше.

А картинки подобраны, чтобы максимально лизнуть?
Максимально глубоко.
Ещё интересно бы узнать стоимость Intel Core i7 7700 и стоимость «более мощного сервера на Эльбрус 8С», к которому вам дали доступ, и который в 2 раза медленнее i7.
В темах про эльбрус это все уже обсуждалось, и не раз. Само собой дороже стоит. И никак иначе, чтоб предлагать дешевле надо делать больше, а больше делать можно когда есть покупатели в таких количествах.
habr.com/ru/news/t/465219/#comment_20559073
habr.com/ru/news/t/465219/#comment_20558333
НЛО прилетело и опубликовало эту надпись здесь
А почему Путин только под номером 4?
Отсылка к «китайской» 4.
А вдруг под номером 1 всё же Навальный… %)

Конспиролухи расскажут что под 1-3 (0-3?) Истинные Правители (Ну или разработчики, admin aka H. Finch, mr. J. Reese, Sameen Shaw, Root).

Работал с TI DSP ядрами на VLIW архитектуре (C674x) — могу порекомендровать:
1. Использовать intrinsics — они должны поддерживаться компилятором. У TI, к примеру, хорошая документация по их использованию.
2. Генерировать ассемблерный дамп компиляции, где обычно указываются распараллеленные компилятором операции, а так же число тактов на их выполнение.
НЛО прилетело и опубликовало эту надпись здесь
И всё же очень странно, что numpy настолько тормозил. Хорошо бы разобраться, в чём там дело.
очень вероятно, что при сборке не включилась оптимизация из-за неизвестной архитектуры
Хотя у нас небольшая библиотека (у TensorFlow порядка 2 млн строк, у нас – 100 тысяч), мы лучше по скорости – немного, но лучше =)

Очень сильное заявление, а пруфы есть? и что даже с tensorflow поверх tensorRT сравнивались?

НЛО прилетело и опубликовало эту надпись здесь
Недостаточно, чтобы президента России узнавали все люди в мире, его также должны узнавать все компьютеры ;)
НЛО прилетело и опубликовало эту надпись здесь
Почитайте, пожалуйста, что такое BLAS.

Такие библиотеки существуют под каждый процессор. EML – пример такой библиотеки. Ещё специализированный пример – mklDNN для Intel – предоставляет ускоренные программные ядра для операций, нужных для нейросетей. Python сам по себе, конечно, ни на одном процессоре не даёт максимальной скорости работы этих операций. Если подключиться к таким библиотекам – рост скорости очень большой.

Здравствуйте! Подскажите, пожалуйста, как именно подключить cblas_sgemm вместо numpy в модулях на python? В документации МЦСТ ничего о cblas_sgemm нет, да и в numpy тоже. Очень много людей будет в восторге, если покажете как. Спасибо!

Все-таки непонятен глубинный смысл идеи портирования ИИ и нейросетей, в частности, на архитектуру Эльбруса. Есть более современные архитектуры и типы устройств, которые далеко продвинулись в области машинного обучения и инференса. Последний идеально работает на стиках NCS2, есть Google Coral, UP Board AI на Myriad X, FPGA и многое другое. Возможно, правильным было бы направление не адаптации современных решений под устаревшую архитектуру, а разработка архитектуры под современные решения.

Если уж сильно хочется, можно повторить тензорный процессор на ПЛИС'ах. Будет свой ускоритель ИИ на отечественной аппаратной базе. Опять же есть Tesnorflow, который замечательно компилируется в OpenCL и отлично исполняется на ПЛИС'ах (например, Mustang F100 и подобные).
На FPGA ускоритель? Да там любая архитектура общего назначения будет быстрее хотя бы из-за частоты: сравните частоту 250МГц FPGA (я о более скоростных не слышал) и 1,5ГГц «Эльбруса» (ну или с 4ГГц Intel).
А так да, разработка тензорного процессора по сравнением с портированием на процессор общего назначения будет эффективнее… но гораздо дороже.
Оно же не в один поток работает, как процессорное ядро…
На исследования в области систем параллельного выполнения задач уже потрачено много ресурсов. Но реально распараллеливать получается только узкий круг задач. Зачастую накладные расходы на распараллеливание перекрывают преимущества многоядерности. Та же самая оркестровка может требовать большее количество вычислительных мощностей, чем результат от ее применения.

FPGA с нужным количеством входов и заранее определенным алгоритмом всегда будет выгоднее, чем многопроцессорные системы. Плюс исполнение на FPGA детерминировано по времени, что позволяет работать в реальном времени, что крайне актуально для видеоаналитики.
Ускоритель ИИ (обучение или инференс). Тот же самый Mustang F100, о котором писали выше. Их нельзя сравнивать по частоте. Тактовая частота и скорость исполнения инструкций — это совершенно разные вещи. Смысл в том, что на ПЛИС'е может быть набор собственных инструкций, которые выполняют конкретно твой код (который на процессоре общего назначения может потребовать несколько миллиардов тактов). На обычном CPU это будет набор типовых инструкций, а на ПЛИС'е — конкретно необходимая в данном месте операция.

Так, все операции с уровнями нейронных сетей (тензорных вычислений) строятся на BLAS. Для CUDA — cuBLAS, Intel — MKL и т.д. FPGA позволяет реализовать большую часть библиотечных операций на аппаратном уровне, вместо того, чтобы загружать процессор общего назначения математическими преобразованиями.

Спасибо)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий