Comments / Profile of M00nL1ght / Habr

How to become an author

Александр @M00nL1ght

Lead iOS engineer / Machine learning engineer

Profile Publications 5Comments 47Bookmarks 20

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 18:27

Все с вами ясно, пустил в коменты на свою голову) вам заняться нечем? Так пишите свои статьи на чисто «похайпить», я вам что мешаю? Мне на это абсолютно все равно, не судите по себе других. Повторюсь, статья о том, как собрать Rust + С + CUDA и прописать зависимости, что бы все работало, а не о том как писать на CUDA, это все написано в самом начале. Это даже не статья, это небольшой туториал, все это так же отмечено в самом начале под заголовком, прочтите внимательно еще раз.

0

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 18:11

Когда будете писать свою статью назовете её как захотите. Я больше спорить с вами не буду, потому что у меня сложилось впечатление, что вы просто придираетесь к словам и к постановке предложений, ищите какой то тайный смысл в них.

0

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 16:57

Это ничего не изменит.

Изменит)

И даже если принять вашу логику — кернелом будет gpu_dot, но вы её не вызываете — вы вызываете обёртку над gpu_dot.

Если принять мою логику то gpu_dot будет кернелом а уже эту функцию я могу вызвать из раст) Так что если принять мою логику то это изменит кое что.

Ну это принципиальный момент. По-сути из статьи можно выкинуть cuda и ничего не изменится, т.к. статья чисто про вызов сишной функции из раста.

Этот туториал в том числе можно использовать как инструкцию для вызова обычного си кода из раст, в комментариях это уже упоминалось, посмотрите выше. В статье рассказывается как писать и собирать Rust + С + CUDA C.

+1

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 16:07

Не могу ничего сказать по поводу AMDGPU, посмотрите в сторону OpenCL если вам нужно более платформо-независимое решение.

+1

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 16:03

Нельзя. Это вызов обёртки dot, которая вызывает обёртку, которая вызывает кернел. dot никоим образом не вызвает кернел.

Эту обертку поверх обертки можно убрать, не принципиально, тут уже на ваш вкус и зависит от архитектурного решения вашего приложения. В статье приведен лишь пример не более.

Поэтому как это не называй — это обычный вызов сишной функции из раста. Этот вызов никак не связан с cuda, вообще никак.

Да, это обычный вызов сишной функции в которой мы можем писать CUDA код (а можем и не писать, можем ее вообще не вызывать), спорить не буду, можете называть этот вызов функции как вам удобно)

0

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 15:38

Конечно, формально это вызов си-функции которая вызывает кернел, из раста нарямую нет смысла вызывать функцию кернела, просто потому, что помимо самого кернела, если вы посмотрите внимательно в файл dot_gpu.cu, есть предшествующий код в виде инициализации памяти на GPU, копирование переменных в GPU и тд, это все уже относится к СUDA.

Так что вызов си-функции обвязки из раста в которой находится CUDA-зависимый код в том числе вызов самого кернела и которая возвращает результат работы кернела, можно грубо назвать «вызовом кернела из раста».

+1

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 12:11

Так и надо сделать если писать полноценное приложение. Код из данного туториала конечно нельзя использовать в реальных задачах, да и зачем, ведь он просто считает произведение векторов, ничего полезного по сути он не делает. Это всего лишь небольшой пример, инструкция, как соединить Rust и CUDA. Далее на основе этого уже можно брать и писать «правильный» и «безопасный» unsafe код, оборачивать еще дополнительно во все то, что нужно.

+1

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 10:39

Здесь:

unsafe {
  gpu_res = dot(v1.as_mut_ptr(), v2.as_mut_ptr(), VEC_SIZE);
}

+1

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 09:10

Вообщем да, вы правы, видел подобное, например тут и тут. Но честно говоря, я так не делал, мне проще и понятней написать кернел код на чистом CUDA C. Да и даже в статье, что я выше скинул говорится, что на данный момент поддержка nvptx и CUDA в частности делается с большими костылями и не совсем стабильная. Если есть еще какая то новая инфа по этому поводу буду рад ее услышать.

0

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 08:48

.cpp не ради iostream и cout, .cpp вообще здесь не ради чего то, в нем нет глубокого смысла и необходимости, можно вообще все запихнуть в один файл .c и написать в нем и функцию обертку которая будет вызываться из Rust и CUDA кернел. Я это сделал просто так, дабы показать возможность линковки нескольких исходных файлов (.cpp в частности) в добавок ко всему.

+1

Пишем на Rust + CUDA C

M00nL1ght Apr 16 2019 at 08:42

1. Нет, не получится. Код для вычисления на GPU все так же пишется на CUDA C. Да и честно говоря не вижу смысла переносить CUDA на Rust если достаточно в данном случае написать кернел для необходимых вычислений, вызвать этот кернел из Rust и результат вернуть обратно.

2. Не совсем понял при чем тут stub/mock и макось. Если это то о чем я подумал, то оно вроде вообще не имеет привязки к операционной системе. Поэтому все что вы хотите сделать, все возможно. На Rust/С/С++/CUDA можно писать и запускать на разных платформах, главное собрать правильно.

0

Пишем на Rust + CUDA C

M00nL1ght Apr 15 2019 at 23:36

По сути да. И не только сишных, и с++ — шных тоже. В случае с CUDA самое главное это прописать пути к исполняемым файлам, что бы Rust корректно подгрузил их как динамическую либу.

+1

Пишем на Rust + CUDA C

M00nL1ght Apr 15 2019 at 23:33

Одного поста не хватит, что бы описать программирование с использованием CUDA. В данной статье я лишь показал как использовать CUDA и Rust вместе. И как заметили выше сама по себе CUDA используется как обычно. А так, возможно, в дальнейшем еще опишу некоторые интересные моменты именно программирования CUDA в связке с Rust.

+4

Как я свою онлайн игру создавал. Часть 1: Работа с сетью

M00nL1ght Jan 14 2019 at 15:49

Я думаю, если бы вы все расписали как описали в коментарии, было бы намного лучше. С пояснениями и объяснениями, что зачем и почему. Тогда и читалось бы все легче и было бы еще интересней. Все таки чужой код читать с нуля (пусть и с коментами) не всем нравится, надо ведь потратить время, что бы в нем разобраться. Ну а если все разжевать словами и уже потом приводить примеры кода, будет понятней и человек возьмет только то, что ему надо из статьи, и не будет тратить время на разбор чужого кода.

+6

Как я свою онлайн игру создавал. Часть 1: Работа с сетью

M00nL1ght Jan 14 2019 at 14:59

Мне кажется, вы не совсем правильно понимаете что такое статья. Статья — не исходник, в ней должно быть описание задачи словами и желательно детальное.

Или где вы такие «статьи» видели в которых один код, на гитхабе?

+4

Mixture Density Networks

M00nL1ght Dec 29 2018 at 14:50

Дело в том, что плотность y не зависит от классификатора, это задано самой «природой» данных. А классификатор учится эту «природу» моделировать.

0

Mixture Density Networks

M00nL1ght Dec 26 2018 at 11:54

Да, наверное следовало больше раскрыть теорию MDN. Правда там уже особо нечего раскрывать, оно все выводится из формулы 5, по сути это loss функция для обучения. pi(x) — не подбирается, оно имеет вид распределения поэтому и получается из softmax функции.

pi = F.softmax(self.pi(x), dim=1)

pi(x) — обучается, собственно как и mu(x) как и sigma_sq(x), опять же на основе формулы 5. Реализация ее приведена в коде в статье.

А вот это:

self.pi = nn.Linear(layer_size, coefs)
self.mu = nn.Linear(layer_size, out_dim*coefs) # mean
self.sigma_sq = nn.Linear(layer_size, coefs) # variance

По сути выходные слои для этих трех обучаемых значений.

Ну гридсерч тут не поможет точно. pi(x) — это не параметр который находится гридсерчем, это один из слоев нейронной сети. Да и «просто застекать» не выйдет, ведь стекинг, бустинг и прочее все таки предназначены для других задач. А тут немного другая именно архитектура сетки (ее выходных слоев).

0

Mixture Density Networks

M00nL1ght Dec 26 2018 at 11:05

они и есть слишком хорошие, они же сгенерированы из периодической функции синуса + плюс некий разброс или шум. И в данном случае проблема переобучения не важна. Тут речь идет о том как моделировать mixture distributions.

0

Mixture Density Networks

M00nL1ght Dec 26 2018 at 09:06

Mixture Density это один из типов выходного слоя нейронных сетей, если вкратце, с помощью него можно работать с данными в которых смешанно несколько распределений сразу, это его основная особенность. Собственно и задачи на практике могут бать разными, такие, когда природа данных подразумевает, что данные смешанные и не однородные, например речь. пример 1 или пример 2.

0

Multi-output в машинном обучении

M00nL1ght May 21 2018 at 18:24

Это я понял по названию. Но! Первое непонятно зачем в начале описан Imputer, он предназначен для предобработки данных все таки, а не для предсказаний чего либо. Если же ставится задача восстановления части упущенных данных, путем анализа существующих, необходимо уже разделение датасетов на разные части, и вообще другая задача, Imputer тут тоже не при чем.

Во второй части «описаны» мульти-регрессоры, но как то смутно все. Что, зачем, каким образом предсказывается не очень понятно, это не описано словами, просто представлен кусок кода. Если была цель описать, что в sklearn существует такая возможность, то опять же как то все не явно и сухо, в документации по моему больше инфы.

В итоге, что я лично увидел, взяли какой-то датасет, что то там импортнули с sklearn-а, получили какую-то точность предсказания и все. Поэтому и написал, что плохо понял о чем статья.

0

2