Pull to refresh
-2
0
Stas Tukalo @StasTukalo

DS

Send message

Так не важно, есть смысл или нет и в чем он. Важно понять что работа- это не про твои смыслы, а про продажу твоих навыков и времени. И со смыслами надо разбираться во внерабочее время и на собственные деньги, а не ожидать, что с твоими смыслами будет разбираться начальник или коллектив. Такое ожидание- чистой воды инфантилизм.

Отличный пример, коллега. Лучший я считаю. Все россказни инфантильных слюнтяев о выгорании- это как раз случаи, когда этим слюньтяям банально наскучило. Потому-что основные потребности вроде как закрыты, а хочется еще чего-то непонятного. Я это целиком и полностью списываю на личную слюньтяйскую инфантильность, которая проявляется в том, что человек сам для себя не понимает, чего он хочет от работы, и ждет от работодателя и абстрактной работы решения и исполнения своих скрытых проблем и хотелок, в которых зачастую сам себе не отдает отчета (как правило- прокачки чсв в том или ином виде) . Если человек достаточно осознан, то он понимает, за что он работает- за деньги, с помощью которых он уже потом и сам будет решать и исполнять все свои проблемы и желания. И такому человеку не нужны постоянные похвалы, мотивационные тренинги и прочая хренотень, ему нужен нормальный рабочий процесс и достойная зарплата.

Есть некоторая начальная строка, нам необходимо добавить к ней один или несколько случайно выбранных символов из заданного набора, чтобы хеш полной строки имел особый вид. В нашем конкретном случае будем использовать sha256

Рисёчеры в МТС работают над перебором ключей к биткойн-кошелькам? ))

А как вы вычисляли этот самый "абсолютный" курс? Индекс бикмака распространили на чтото более широкое? Собственно, я зашел сюда, заинтригованный "абсолютным" курсом. У тут- облом))

Спасибо за статью. Сейчас пойду искать вашу предыдущую.

мне не комфортно торговать модели, которые каждый год надо полностью переучивать

Вот это очень странно. Переучивать раз в год? Я считаю, что в наш век наоборот нужно учить модели как можно чаще, чтобы учесть самые последние настроения рынка. Благо, для того чтобы поставить такое обучение "на поток" сейчас доступно абсолютно всё. Поэтому пусть переучиваются перманентно, с каким-то небольшим шагом по времени, привязанным даже не к рабочему таймфрейму, а исключительно к мощности ML-оборудования.

Интересно было бы узнать, почему вы не придерживаетесь такого мнения?

Успехов вам!

Добавили в конфигуратор выделенных серверов новую GPU-карту: NVIDIA RTX A2000 6Gb GDDR6. Ее можно арендовать за 6000 ₽/мес. 

rtx A2000 стоит 59тр. Вы за нее хотите 6тр в месяц. Даже майнеры сейчас имеют окупаемость карт в 25 месяцев. Вы же хотите уложиться в 10. Жадновастенько.

Интересно, что же вы такое делаете, что вам надо добавлять в файл такие гигантские списки, которые вызывают Аут оф мемори ??

Как правильно заметил коллега выше- "Аут оф мемори здорового человека" в питоне - это подготовка больших массивов данных в пандасе и последующее их запихивание, например, в нейросеть.. вот на эту тему было бы интересно расширить кругозор..

Текст предполагает читателя глубоко в теме

Ну как бы да. Это весьма специфичный текст про весьма специализированные устройства для очень небольшого количества весьма узких специалистов. Не вижу в этом ничего плохого. Можно сравнить с текстом по настройке карбюратора гоночного болида для работы на спирту в условиях высокой влажности - странно ожидать что этот текст станет популярным у массового читателя))

Ну именно 3090 я стараюсь особо не держать выше 70 градусов. Вопрос, а как вы мониторите температуру именно чипов памяти? Я всегда полагался на утилиты типа nvidia-smi / nvtop / gpustat и особо не знал беды

GPU-Z с какогото момента начала иметь эту возможность. Для 3090 и а5000 оно работает. Ну это под виндой. Под линуксом вот ниже коллега порекомендовал косвенный метод с флагом SW Thermal Slowdown , за что ему спасибо- не знал о нем.

В статье не шло речи про домашнее или офисное применение

Слушайте, а если мы говорим про "недомашнее" и "неофисное" применение- то какой смысл в 3090? я бы даже и а5000 не стал рассматривать (если не предполагается майнить в простоях между МЛ.. я бы брал пассивные тесла и не думал бы ни о чем плохом. Какой смысл запихивать в специализированный сервант карточки для гейминга или для раб.станций, если ценник одинаков?

Это интересный инсайд. Я когда смотрел цены, не особо много искал альтернативных поставщиков.

Авито ими кишит. Но рынок крайне стремный- много мошенников. Из московских организаций покупал а5000 у "Срв-трейд" в Щелково в белую. Также покупал у одного питерского продавца на авито. Если что- обращайтесь, дам его контакт. Но в целом конечно рынок стремный- встречаешься как дурак с кучей денег с непонятными людьми, покупаешь кота в мешке.. брр.. но вроде пока все хорошо)

А как вы решаете вопрос с райзерами на таком риге? У меня с ними опыт пока не очень для DL

В целом как и Вы. Тоесть условные 80 процентов райзеров идут в помойку. На винде даже не нужно начинать нагружать гпу- зачастую в лог валится огромный поток ошибок pci-e устройства сразу после загрузки.

Колега выше вон посоветовал интересную штуку на базе slim-SAS-овских кабелей. Судя по его отзыву с нормальным кабелем эта штука хорошо держит частоты, но ценник- мама дорогая! 250 евро за райзер там получается. 10 карт- 2500 евро.. Я свой мл-дл делаю на свои кровные и честно говоря меня душит жаба..

Сетевые карточки и коммутаторы на >> 10 гигабит относительно тяжело найти

Вы тут не правы. И 10, и 40 и 56 гбпс сейчас часто встречаются на авито- и карты и свичи. Естественно это стоит дороже чем гигабит, но абсолютно доступно тем, кто может купить а5000. Ищите по производителю "melanox". Сам все собираюсь себе закупить это дело, но пока вроде справляется гигабитный ethernet.

Спасибо. Незнал о том что есть такое. Правда цена кусается- за райзер в сборе придется отдать 250 евро..

Здравствуйте, коллега! Спасибо за статью! Есть несколько замечаний к Вашему подходу. Также некоторые утверждения о ценах спорны, хотя рынок очень живой.

1. Самая главная претензия- Вы совершенно не поинтересовались температурой памяти под нагрузкой:

1.1. В данном поколении карт именно чипы памяти перегреваются, а не чип гпу. Например, на 3090 при вычислительных задачах чип гпу может иметь температуру менее 65 градусов, а чипы памяти при этом работать на предельной для себя температуре в 105 и даже в 110 градусов. Страшно представить, какая температура у памяти будет, если гпу раскочегарен до 85 градусов.

1.2. Если сравнивать промышленные квадры а5000 с геймерскими 3090 - то основное отличие именно в температуре памяти (подозреваю, что дело в качестве чипов - на геймерские идет отбраковка) - на квадрах память сильно холоднее (80-85 градусов), чем на 3090 (100-110 градусов). Насколько быстро убиваются чипы, работающие на предельно разрешенных производителем температурах, думаю объяснять не нужно. Сам я этот момент по началу пропустил, потому что на момент выхода 3090 не было еще возможности смотреть температуру чипов памяти. А какогда она появилась и я увидел разогретость памяти до 110 градусов- я перестал рассматривать геймерские карты (3090) для вычислений - даже если они превосходят немножко по вычислительной мощности- они имеют все шансы быстро умереть.

1.3. TESLA А10 также не вариант для не-серверного применения, ибо сколхозить достойное охлаждение не получится (я пытался приспособить пару тесл К80 для домашнего пользования - ничего хорошего не получается- или перегрев или воет, как боинг на взлете); Естественно, всегда есть вариант запихнуть их в соответствующий серверный корпус, но это будет очень громко и для дома или офиса не подходит;

  1. Про цены. Абсолютный лидер на данный момент - это А5000. Стоит она в районе 210тр (никак не 280, которые указал автор), если брать десяток- то можно найти дешевле. 3090 же стоит дороже 300тр. Брать 3090 за больший ценник, при ее более низком качестве - для меня странно. Единственный плюс у 3090 - это гарантия, если брать ее в ДНС и , возможно, лучшая ликвидность на вторичном рынке, но это не точно)) А5000 приходится покупать без гарантии у продавцов, которые таскают из Китая. Тут вопрос спорный - если эксплуатировать в хорошем температурном режиме - то карты работают 3+ года и только потом начинают помирать. Во всяком случае, так было на предыдущих поколениях. Поэтому я решил брать без гарантии, но дешевле. Брать А4000 или А2000 я смысла не вижу - карты с объемом памяти менее 24Гб я не рассматриваю, хотя это все таки должно определяться задачей.

  2. Момент про то, сколько карты занимают "слотов" - мне кажется странным делать на этом хоть какой-то акцент. Мы говорим о применении вне дата центров, насколько я понял. Поэтому считаю, что запихивать такие карты в бытовые корпуса- так плотно как вы это показали на последних фотографиях - недопустимо. Между картами должен быть продуваемый ощутимый зазор -задняя сторона карты должны обдуваться, иначе начинается перегрев памяти. Поэтому, как бы это пошло не звучало и не выглядело, типичный майнерский риг из двенадцати палочек- самая удачная конфигурация для размещения карт в домашнем и офисном применении.

Успехов Вам!

По большому счету я тоже придерживаюсь мнения что управлять государством и миром должны алгоритмы- без коррупции, с явной выгодой для народа и тд.. Но локально- пока мы не доросли технологически. Нейросети иногда обучаются настолько .. даже не "криво", а скорее странно, то только диву даешься. Возьмите например матрикснет яндекса- у них в обучении принимает участие порядка четырех сотен признаков сайта - и регулярно кто-нибудь выкладывает обнаруженную "странность" в виде повышенного влияния на положительную ранжируемость какого-то совершенно бредового признака, типа наличия "буквы на красном фоне в подвале сайта справа", получившегося изза того, что "так совпало".. Страшно представить, что будет если это пойдет разруливать судебные дела.

Хотя- при правильном методологическом подходе (как асессоры у тогоже яндекса) - возможно все это и не так страшно. Но нужно понимать, что противоборствующие в суде стороны будет стараться очень сильно захламить и зашумить входы. В общем- я бы не взялся строить такую систему.. хотя нет, вру - взялся бы с удовольствием.

Интересный момент Вы затронули, Игорь. Как человек, работающий с данными, я бы всё таки проголосовал за сохранность всех данных об объекте, по крайней мере тех, которые влияют на принятие решений (а в разрезе глубокого обучения это означает вообще все доступные данные). А вот дискриминирующую окраску, которая может быть вызвана интерпретацией этих данных людьми, - с ней, да, надо как-то уметь работать. Интересно, о каком пункте анкеты шла речь - погашенная судимость? Не представляю, что такого могло попасть в поле HR-менеджера.. (если можно- скажите пару слов) ?

Ну видимо да. Я подергался и успокоился. При современной дешевизне бушных Xeon-ов особых проблем нет пока.

Да, вы совершенно правы- воркеры не завершаются- это зацикленный обработчик бесконечного входящего потока данных. Программа ждет появления данных в бд, обрабатывает и кладет в другую бд и так бесконечно. Как-то не хотелось бы этот процесс прерывать, но даже если и прерывать- то я не вижу как это поможет делу.. и почему перезапущенный воркер будет работать более оптимально, если при предыдущем запуске он работал не так..

Здравствуйте.
Имею два вопроса:
1. Почему обучение ведется на цпу а не на гпу? Если можно поподробнее пожалуйста.

2.
используются датасеты большого размера и те данные, которые не помешаются в EPC анклава, хранятся в RAM в зашифрованном виде и для доступа к этим данным используется очень затратная операция EPC swapping

Мне одному кажется что это какойто лютый мазохизм? Это требование регулятора? Зачем это? От кого скрываются датасеты?

Заранее признателен за развернутые ответы.

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Date of birth
Registered
Activity