All streams
Search
Write a publication
Pull to refresh
1
0
Norraxx @Norraxx

User

Send message
С большинством согласен, остальное разбирать не хочу, спать пора…

ЗЫ: Вы согласны, что программировать на графические карты намного интереснее, чем для процессоров? :-)
Я огорчён… Думал, что будет хоть что-то об OpenCL, а вы здесь даже термины из CUDA берёте… + пора понимать, что у nVidia OpenCL это скопированная CUDA подточеная под OpenCL стандард, а так у них как всё было, так и осталось, может только стандард IEEE 754 научили.
И приводите ограничения не к технологии OpenCL а к самой структуре графических процессоров и работы с графической памятью.

1рвое ограничение это логичное ограничение, всегда 1 kernel спускается на 1 compute unit (субпроцессор в мултипроцессоре), если ваша программа спускается в маленьком количестве волокон, значит надо задуматься.
К 2рому ограничении: графический чип ожидает light weighted кернелы, которые будут быстро обрабатывать только одну маленькую информацию, тй. если вам надо МНОГО информации, используйте локальную память, а только потом лезьте в глобальную, иначе вы работаете со скоростью глобальной памяти.
С 6стым ограничением не согласен. Это можно точно также сказать, что процессор лезет в рам, когда нет чего-то в кеши. Просто это лимит, а с ним надо как-то бороться. Самый логичный способ это и есть записать в рам. Вообщем-то бы было в полне логично, если-бы это можно было предотвратит на уровне компилирования.
Рвать много ифок в кернелы, так это зло…

А также: OpenCL это стандард, платформа, спецификация и API. Ничего об OpenCL здесь не сказанно.

И на собственной шкуре знаю, что не проблема перехрустеть там что-либо, проблема загрузить БЫСТРО информацию по PCI-Express в графическую карту… Я дольше ждал то, когда туда скопируется 256 мб данных, чем их обрабатывать… Даже и не спрашивайте почему 256 мб, а не больше…
Я когда-то мучал мозг этой статьёй. Очень приятное занятие! :-)
ИМХО, написание прогаммы в ОпенЦЛ займёт примерно в 2-3 раза дольше времени…
парсер лох…
Вы должны сами оптимализировать код (векторы, функции, итд..), у OpenMP за вас это делает компилятор. Когда кернел подргужается, компилируется или подгружается сразу скомпилированным, тогда это тоже время жрёт.
У ОпенМП всё уже в бинарном виде.
Кстати, предлагаю следующую статью сделать по мотивам www.cmsoft.com.br/index.php?option=com_content&view=category&layout=blog&id=99&Itemid=150.

ПС: изнасиловать в большое анальное отверстие карму! 2 комента посылаю 10 минут… ппц!
Это смешные тесты! Потому, что OpenCL вы должны >>сами
Я в университете писал на OpenCL. А так в практике мне не разрешают такие «бешенства» использовать, потому, что если я уйду, никто не сможет удерживать продукт. Планирую себе найти работу в будующем с OpenCL.
Хотите смотреть на граф с разницами в один или два процента? Google.
OpenMP будет немного быстрее, у него немножко другая архитектура. Но не на десятки процентов.
Спасибо за ответ.

Если бы вы рассказали как кернелы спускаются, тогда бы наверное упомянули и об синхронизации на стороне хоста. Потому, что часто кернелы надо пускать несколько (тысяч) раз подряд с разными размерами локальной / глобальной группы.

Меня все-равно радует, что хоть кто-то об и на OpenCL пишет! Я бы тоже писал, да меня с моей критикой слили в унитаз.
Хотелось бы следующую статью и потом следующую!
Я может и немного строго, но всетаки душа хочет качества, когда разговор идёт об OpenCL.
«Так же быстрой памятью является „__privatE “. Это память к которой имеет доступ только отдельный поток (work-item). Всего на поток выделяется 32 регистра этой памяти.»…
Одкуда вы взяли 32 регистра? Приватная и локальная память очень совместимы, часто локальная это сумма всех приватных. Причём и это тоже не всегда правда. На каждом HW поразному…

«Вторая процедура (использующая оптимизацию) выполняется в 35 раз быстрее.»
На каком HW? ctrl+c & ctrl+v?

А где синхронизация с хоста?

«Сэмплер — это штука, которая будет оптимизировать вашу работу с изображением. У него есть три параметра:,, .»… запятая запятая и точка?

Это не введение, это что-то не продуманное с кучей скопированных примеров с сайта с которого вы учились :-).

Я проголодался…
WOW бесплатно? Близард опять на иглу посадить следующую волну игроков!
Смешной-же хабр, а я думал что здесь много умных людей :-)
Я в первый раз встретил что-то подобное, рассказал в фирме, вся фирма в ахуе восторге! Весь день крутили на проекторе на стенке в кухне лекции. Прекрасный проект!
Насколько это влияет на добавление других ограничений? Из того что я понял мы только написали какую-то функцию и «зарегистрировали» её, с тем, что то что эта функция вернёт так добавим в SQL, а вот как с другими ограничениями, JOINами итд… влияет-ли это на структуру SQL вопроса? Или это все транспарентно?
Хочу видет эту клавиатурку работать у нормального програмиста, который весь день проводит в закрытом помещении без света, и переодически падающей чашкой кофе на клаву…
Да здесь всё просто, человеку хотелось похвастаться тем, что из-за того, что ему SQL не хотелось учиться, он лучше сделает какую-то бороду, которая на чуть больше проектах создаст мега трафик, где будет выдавать всю «базу даннух» сразу и отображать её потом яваскриптом, по частях.

Information

Rating
Does not participate
Location
Praha, Hlavni Mesto Praha, Чехия
Date of birth
Registered
Activity