Comments / Profile of algotrader2013 / Habr

@algotrader2013

User

Собрать сервер для глубокого обучения за пол ляма может и ребенок. Или нет?

algotrader2013 Mar 26 2021 at 10:48

Кстати, из интересного, тепло от 4*1080ti + 2*10 core Xeon в 1 юнитном корпусе Gigabyte отводится успешно. Своими глазами видел и поразился сему чуду инженерной мысли. Правда, корпус столь глубок, что из некоторых стоек морда на 5 см торчит)

Собрать сервер для глубокого обучения за пол ляма может и ребенок. Или нет?

algotrader2013 Mar 26 2021 at 10:46

Думал об этом. Но, не похоже на такой кейс, ибо, в таком случае во главе угла стояло бы количество карт на один хост, а автор к этому относился довольно свободно. Ибо, межхостовое соединение сопоставимых скоростей с даже PCIE x4 стоит очень дорого и тоже отнимает PCI лейны.

Собрать сервер для глубокого обучения за пол ляма может и ребенок. Или нет?

algotrader2013 Mar 26 2021 at 08:25

Мысль очень простая, — вы утверждаете, что хотите иметь 16 PCI лейнов на карту (вашими словами, 16 полосную автостраду по процессора для каждой карты). Это даёт пропускную способность в около 16 гигабайт в секунду на одну карту. Раз вам это надо, значит есть, где такой поток данных вне карты получить. Диск вам выдаст 1/32 этого потока. Значит, не диск. Ещё есть вариант 100G ethernet, но он тоже не упоминается.
Значит, данные будет генерировать процессор по некоторым алгоритмам. Если вы берете 4 карты, то на каждую идёт аж 3 ядра. Вопрос, как Вы собираетесь с 3х ядер генерировать такой поток?

Как я нашел в публичном доступе исходники нескольких сервисов ФНС

algotrader2013 Mar 25 2021 at 22:36

Так а вышло в итоге чужие данные дернуть? Или хоть как-то заабузить апи?

«Представь, что ты нашел решение, про которое можешь сказать: оно лучшее в мире» — интервью с создателем ClickHouse

algotrader2013 Mar 25 2021 at 22:22

Ясно, спасибо
И в итоге и джойн есть, и кликхаус тормозит (на джойне). Хотя, та же вертика, с которой, по сути, КХ скопирован по идеям, и которую по бенчмаркам (не использующим джойн) уделывает в разы, с джойном справляется неплохо, и даже имеет высокоэффективный merge join, который обгоняет hash.

Собрать сервер для глубокого обучения за пол ляма может и ребенок. Или нет?

algotrader2013 Mar 25 2021 at 21:44

Спасибо, интересно, но, как человек, как имевший опыт в написании кода под CUDA для монте-карло симуляции, так и участвовавший в создании сервера для работы этого кода в проде, так и не понял, откуда столь догматичная уверенность в том, что
1) слабый процессор вполне ок (а 12 ядер, это, увы, слабый процессор)
2) нехватка лейнов это вообще не ок
3) слабый SSD (даже не NVMe) это ок

Очевидно, что лейны нужны для передачи данных между камнем и картой. Очевидно и то, почему майнерам хватает одного лейна (у них камень лишь раздает задания и получает результаты), а геймерам надо все и сразу (текстуры протолкнуть в карту).

А вот в Вашем случае, не зная архитертуры, я вижу несколько вариантов, но все они противорячат Вашим требованиям
1) Ваш софт поднимает огромный объем данных с диска (или записывает после обработки), после чего гонет его в карту без преобразования на CPU, после чего карта делает быструю операцию, сопоставимую по скорости с подъемом данных -> лейны нужны ок, проц слабый ок, ваш SSD не ок. Нужен NVMe, а лучше много NVMe. Скорость SATA SSD на порядки ниже скорости пропихивания данных через лейны в карту. Ваша шина будет простаивать. Чтобы напихать четыре карты хотябы в половину пропускной способности, Вам надо около 30GB/s поток данных с диска или сети. Просто представьте на минутку себе такой поток. Я видел почти, но все же меньший поток на 4х процессорном сервере с батареей из датацентровых NVMe. Он обслуживал аналитическую СУБД, и обошелся владельцу в $70K. Да и то, подобный поток там возникал предельно редко, и, ограничь пиковый поток раза в 4, обшая производительность системы упала бы не более, чем на 5%.
2) Ваш софт делает тяжелое задание, по времени сильно большее, чем пропихивание данных в карту, и/или сохранение на диск после работы -> вам лейны не нужны. Берете майнерский риг с 1 PCI lane per GPU и вперед. Как никак, не надо думать, что такой конфиг это совсем убого. Это около 1GB/s на карту, то есть, перфоманс двух ваших дисков. Получаете предельно эффективное соотношение cost for GPUs/total cost.
3) Ваш софт делает небольшое поднятие данных с диска, значительное раздувание объема поднятых данных на CPU и быструю операцию на GPU. Тогда диск ок, лейны нужны, CPU не ок. Вы, скорее всего, не сможете 12-ядерным камнем накормить все карты и станут в очередь за заданием.

Вообщем, я отлично понимаю Вас, как человек, любящий железо и возню с ним, и не приемлющий конфигураций, которые рубят теоретический перфоманс на корню. Но, считаю, раз речь идет о бизнесе, при чем не об абстрактном создании «суперкомпьютера под столом» для абстрактного заказчика, то, как минимум, надо рассуждать не категориями

тогда как показывает практика, например, для игр, при использовании восьми линий, она теряет 5% производительности, а при использовании четырех — уже около 20-30% или больше.

а провести тесты, взять Excel и попробовать накидать калькулятор производительности вашего софта, учесть реальные потребности в потоках данных диск->проц, проц->карта, карта->проц, проц->диск.

Как решали шашки

algotrader2013 Mar 25 2021 at 09:20

Ну а стал бы играть, будучи тяжелобольным, было бы лучше? Выигрышем у человека в таком состоянии Шеффер гордился бы и считал бы честной победой?

Софт пожирает мир. Закат универсальных CPU

algotrader2013 Mar 24 2021 at 14:15

Похоже, просто тормозящий прогресс, и тянущий за собой чемоданы говна, x86 наконец-то должен умереть и дать жить и развиваться другим, возможно, похоронив при этом интел (туда им и дорога). Лично мне это стало понятно ещё несколько лет назад, увидев скорость, с которой js бенчмарки проходит iPhone Х, в котором проц был уже несколько летней давности к моменту выхода.
А сейчас дело доводят до конца Apple с М1 и AWS со своими гравитонами.
А так то с процессорами общего назначения все хорошо. Linux скоро будет работать в каждой стиральной машине, ибо тупо проще взять low-end arm, чем что-то выдумывать. Подозреваю, что и в той же тесле их тоже достаточно. Врядли управляющий софт работает на чем-то экзотическом.

-5

algotrader2013 Mar 23 2021 at 11:58

А есть принципиальная причина? Более, чем уверен, что если бы не было мощного глубоко запрятанного блокера, давно уже или в Яндексе реализовали б, или кто-то бы Альтинити задонатил за это.

50 оттенков жёлтого. Проверяем на практике технологию Retrobright

algotrader2013 Mar 23 2021 at 11:33

Рис. 21. Ничто не вечно под луной…

Понятно… Для предпродажной подготовки сгодится

algotrader2013 Mar 23 2021 at 09:10

Вот, все же, до сих пор не понимаю, почему раз в КХ все работает столь быстро, в нем столь убоги джойны. Broadcast join вообще отсутствует как таковой.
Почему все проприетарные конкуренты (BigQuery, Redshift, Vertica) с похожими принципами и подходами вопрос решили, а Clickhouse way — городить велосипеды из костылей с применением внешних in-memory кешей и смотрящего на них словаря просто, чтобы, например, посчитать
group by account_id, когда факты льются с кукой, а связка кука-> account может прийти после записи факта.

Microsoft хочет выкупить Discord более чем за $10 млрд

algotrader2013 Mar 23 2021 at 08:01

Интересно, почему MS, рубя бабло и обладая компетенцией в корп секторе, пытается скупать модно-молодежные темы? Диверсификация?

Однажды Microsoft забанила всю мою страну за читерство

algotrader2013 Mar 22 2021 at 08:39

Вместо того, чтобы перещупывать бд картинок на песочнице Asirra, человек просто сохранил себе локально все картинки с petfinder с меткой кот/собака, спарся этот сайт.
Да, они по размеру не пиксель в пиксель с капчей, но для более сложного хеша это не проблема

Однажды Microsoft забанила всю мою страну за читерство

algotrader2013 Mar 20 2021 at 08:39

Кажется, я читал уже когда-то о взломе капчи с котами и собаками. И там человек поступил проще — спарсил сайт-первоисточник

Обзор HPE Nimble или практический опыт использования. Все ли так хорошо, как заявляет производитель?

algotrader2013 Mar 19 2021 at 20:34

Так а можно для тех, кто в танке? Зачем подобным оборудованием пользоваться в принципе, когда показатели целой полки в разы проигрывают одному nvme диску? Чем это лучше софтверного raid10 поверх nvme? Не выйдет, ли, что маржа энтерпрайз вендора НРЕ, делающего энтерпрайз решения для ультрабогатых клиентов перекроет выигрыш на дедупликации, сжатии, и прочих плюшках полки?

Власть огня или как горит информация

algotrader2013 Mar 19 2021 at 08:21

При правильном использовании облачных объектов, — нет, не сможет сгореть;)
К примеру, в спецификации S3 сразу написано, что данные хранятся в нескольких датацентрах. Есть ещё ряд продуктов, где такая репликация идёт по умолчанию.
Но, лично меня беспокоит, что там другая есть проблема, — сложность их инфраструктурного софта столь высока, что рано или поздно может софтверный баг привести к чему-то большому и необратимому

Власть огня или как горит информация

algotrader2013 Mar 18 2021 at 19:09

Интересно, произойдёт ли когда-то массовый сбой с потерей даже бекапированных данных в AWS, GCP, или Azure?

О локальных проблемах, когда AWS тупо отнял доступ к виртуальным дискам и их бекапам у клиента с премиум поддержкой, мотивировав это порчей данных, тут уже как-то писали (тогда клиент решил, что, видимо, чужие данные попали на его диск, и AWS предпочёл меньший зашквар с потерей данных большему с расглашением).

Сейчас началась антидатацентровая истерия во многих бизнесах после OVH, и публичные облака в очередной раз срубят бабло. Но интересно, к чему приведёт слепая вера людей в их непогрешимость.

Я купил 300 казахских доменных имён с эмодзи и создал свой почтовый сервис

algotrader2013 Mar 17 2021 at 09:30

Типа под фишинг?

Боль разработчика: «Никогда не давайте пользователям бесплатный тариф»

algotrader2013 Mar 16 2021 at 21:03

И как на тендере покупали, например, тот же таск-трекер или среду разработки?

Боль разработчика: «Никогда не давайте пользователям бесплатный тариф»

algotrader2013 Mar 15 2021 at 22:22

Насколько знаю, инициация чарджбека, — это добрая воля банка-эмитента, а у клиента нет возможности инициировать его мимо банка, если банк отказал, что в СНГ делать любят (разве что, если ты какой-то платиновый клиент, то могут поднапрячься).
Так что, на пункте «зайти в банк» акт отмщения может и закончиться

1 2 3 4

6 7 ...

58 59