Comments / Profile of dem0n3d / Habr

Дмитрий Баранов@dem0n3d

Пользователь

ProfileArticlesPostsNewsComments181

Учет финансов при помощи Personal Finances

@dem0n3d Mar 28 2012 at 06:34

Версия для андроида была бы отличным дополнением. Особенно с возможностью распознавания чеков.

Быстрое сжатие изображений по алгоритму JPEG на CUDA

@dem0n3d Mar 26 2012 at 09:30

т.е. на тех устройствах, что поддерживают double, а я в своем первом комментарии я явно написал про одинарную точность. Я не говорю что double плох, но его поддерживают не все устройства и его обработка требует больше тактов…

Быстрое сжатие изображений по алгоритму JPEG на CUDA

@dem0n3d Mar 26 2012 at 09:19

На счёт ссылок не знаю, я в свое время сам писал, и не счёл сложность темы достойной публикации и обсуждения, уж больно просто вопрос решался на OpenCL+Qt. Но если очень интересно могу поискать и выложить свои наработки.
Про ошибку смотрите ниже.
На самом деле, про скорость я не спорю, это вполне логично что Nvidia нарочно урезает производительность конкурирующего стандарта по сравнению со своей проприетарной технологией, просто Вы не привели пруфа. Куда важнее, что OpenCL работает и на картах AMD и на любых CPU, а CUDA этим похвастаться не может.

Быстрое сжатие изображений по алгоритму JPEG на CUDA

@dem0n3d Mar 26 2012 at 09:14

Речь шла не только о Fermi. Посмотрите Table C-1, там есть оговорка:
0 for compute capability ≥ 2 when compiled with -prec-div=true
2 (full range), otherwise
и подробнее в C.2.1. Если коротко, то смысл в том, что округление с точностью 0 ulp можно получить только на устройствах с нативной поддержкой double и только при указании опции компилятора -prec-div=true. В остальных случаях будет 2 ulp. Я в подробности не вникал, т.к. больше не увлекаюсь Nvidia но, очевидно, в этом случае компилятор просто приводит float к double для достижения необходимой точности.

Анализируем Twitter при помощи R

@dem0n3d Mar 18 2012 at 06:58

впервые воспользовался функцией «избранный комментарий», спасибо!

Быстрое сжатие изображений по алгоритму JPEG на CUDA

@dem0n3d Mar 14 2012 at 19:41

Про OpenCL хорошо сказано, главное без пруфа, я сразу поверил! А еще не указан главный (на мой взгляд) недостаток GPU — низкая точность деления чисел с плавающей запятой одинарной точности, т.е. вы не получите один результат запустив алгоритм, использующий операции деления, на CPU и GPU. Решается использованием double.

У Selectel авария

@dem0n3d Mar 4 2012 at 06:22

значит не облако ни разу

Visual Studio vNext для разработчика игр

@dem0n3d Feb 3 2012 at 10:50

Ух ты, почти как в Blender'е!

Ubuntu Unity — светлое будущее против консерватизма

@dem0n3d Nov 28 2011 at 06:59

Чтобы быть объективным нужно хотя бы с KDE сравнить…

QR-код для потерянных ключей

@dem0n3d Oct 7 2011 at 14:19

Нашедший может сделать дубликат, а потом просто проследить за человеком, которому вернул ключи.

-2

Продолжение истории с UEFI Secure Boot

@dem0n3d Sep 24 2011 at 16:51

А на ARM-ситемах W8 тоже будет требовать эту (или подобную) защиту? (в ARM не разбираюсь)

HeidiSQL — клиент к mysql/mssql серверам

@dem0n3d Aug 24 2011 at 12:27

Это — секретная информация!

HeidiSQL — клиент к mysql/mssql серверам

@dem0n3d Aug 24 2011 at 11:29

Нет, не согласен :)

HeidiSQL — клиент к mysql/mssql серверам

@dem0n3d Aug 24 2011 at 09:31

Я что-то пропустил? Зачем SQL-клиенту нужна поддержка SSH-туннелей, когда SSH может пробрасывать порты на локальный хост?

-2

Preloaders.net — теперь с поддержкой APNG

@dem0n3d Aug 10 2011 at 10:46

Начать — с изучения Canvas и библиотек для работы с ним.
Продолжить — WebGL.
Закончить — WebCL.

Preloaders.net — теперь с поддержкой APNG

@dem0n3d Aug 10 2011 at 10:35

именно так.

Preloaders.net — теперь с поддержкой APNG

@dem0n3d Aug 10 2011 at 08:47

3. А на клиенте кто мешает создавать?

OpenCL: мы дождались — версия 1.1 от nVidia, а что нового?

@dem0n3d Aug 6 2011 at 10:22

Global work-offset which enable kernels to operate on different portions of the NDRange — самое ожидаемое нововведение 1.1, по крайней мере для меня. Я сам очень удивился когда не обнаружил такой возможности в 1.0. А столкнулся я с этим при реализации метода Гаусса (собственно, то же самое справедливо почти для любого прямого метода решения СЛАУ). Идея в том, что на каждом шаге обрабатываемая часть матрицы становится всё меньше (на одну строку сверху и один столбец слева). Вот здесь как раз глобальный офсет и нужен.
Порылся в спеках, обнаружил что оно уже есть в 1.1, и что у Nvidia вроде бы уже есть pre-release drivers. Недолго думая, запросил эти драйвера, но Nvidia захотела чтобы я что-то там доказал… Решил, что оно того не стоит (я думал что готовые драйвера выйдут как минимум на полгода раньше), в итоге ядра дополнились конструкциями вида:
if(x < i || y < i) return; // где i — номер шага, а x,y — глобальные id

С Днём системного администратора!

@dem0n3d Jul 29 2011 at 09:44

С праздником!!!

Использование GPGPU для сжатия данных (Часть I)

@dem0n3d Jul 16 2011 at 06:21

Не хватает тестов OpenCL на CPU и CPU+GPU вместе.

1 2 ...

5 6

8 9 10