Articles / Bookmarks / Profile of yurixi / Habr

Юрий@yurixi

Программист

ProfileArticles25Posts1NewsComments447

@GRADDATA Mar 18 at 09:53

Оптимизация промышленных видеокарт для машинного обучения и нюансы тюнинга на примере A30, A100, L4 и L40s

Medium

10 min

1.5K

VK corporate blogVK Tech corporate blogCloud services * Video cardsCloud computing *

Tutorial

Чтобы эффективно осваивать вложенные в покупку или аренду GPU ресурсы, важно использовать весь потенциал видеокарт. Первые сложности возникают при настройке оборудования в контексте его потенциальных возможностей. С одной стороны — недостаточная утилизация ресурсов, с другой — бесконечное горизонтальное масштабирование и кратное удорожание ИТ-инфраструктуры.

В этой статье мы разберем базовые принципы и настройки оптимизации проверенных моделей GPU, чтобы эффективнее справляться с задачами машинного обучения. Посмотрим, как настраивать драйверы и библиотеки, управлять памятью, активировать Tensor Cores для ускорения вычислений, использовать технологию MIG для распределения задач и проводить разгон GPU для получения максимальной производительности. Следуя этим рекомендациям, вы сможете ускорить вычислительные процессы и сократить затраты на оборудование, увеличив эффективность работы с большими данными. Разбираться будем на примерах популярных моделей NVIDIA: A30, A100, L40s и L4.

Хочу больше знать

+34

@milena-gazdieva Mar 11 at 07:42

Как несбалансированный оптимальный транспорт помог нам сделать поиск барицентров распределений устойчивым

Hard

8 min

997

AIRI corporate blogMachine learning * Artificial IntelligenceAlgorithms * Mathematics *

Case

Привет! Меня зовут Милена Газдиева, я являюсь научным сотрудником Института AIRI, а также инженером-исследователем и аспиранткой Сколтеха. Мои научные интересы лежат в области разработки генеративных моделей на основе оптимального транспорта (optimal transport, ОТ) и их приложений к различных задачам. Мы с коллегами добились успехов в повышении устойчивости таких моделей, и одна из наших статей по этой теме была принята на престижную конференцию по искусственному интеллекту ICLR 2025, которая в этом году будет проходить в Сингапуре. Сегодня я расскажу об этой работе, в рамках которой мы разработали метод оценки барицентров (взвешенных средних) распределений, устойчивый к различным выбросам и дисбалансам в данных.

Что это означает и зачем нужно — читайте далее.

@lokey Mar 9 at 13:41

Как ошибается ИИ, если за ним плохо следят

4 min

Artificial IntelligenceHistory of ITPopular scienceThe future is here

Retrospective

ИИ – это очень здорово и удобно. Он уже спасает жизни, штрафует за преступления, помогает делать весёлые картинки и видеоролики (посмотрите только на рекламу Сбера к 8 марта). Однако, за искусственным интеллектом нужен глаз да глаз, потому что он иногда выдаёт такие штуки, что становится стыдно или страшно.

Предлагаю рассмотреть несколько примеров – про оштрафованного адвоката, запутанного Евгения Онегина, про робота, склоняющего пациента к роскомнадзору, сексизм при отборе кандидатов на работу и другие.

А в комментарии присылайте самые яркие и бредовые случаи – чтобы мы собрали полный список.

+37

@AndrewMikhailov Dec 26 2017 at 04:05

Service Workers. Инструкция по применению

9 min

174K

2ГИС corporate blogWebsite development * Programming * Client optimization * JavaScript *

Количество выходов в интернет с мобильных устройств ежегодно растёт на 2-4% в год. Качество связи не успевает за такими темпами. Как итог, даже самое лучшее веб-приложение обеспечит ужасный опыт, если пользователь не сможет его загрузить.

Проблема в том, что до сих пор нет хорошего механизма управления кэшем ресурсов и результатов сетевых запросов. В своей статье я хочу рассказать как Service Worker (SW) может помочь в решении этой задачи. Объясню в формате рецептов — какие элементы и в какой пропорции смешать, чтобы получить нужный результат, исходя из задачи и требований.

Поехали!

+54

@dalerank Feb 28 at 18:26

Game++. Building arcs

Easy

24 min

History of ITProject management * Games and game consolesGame development * C++ *

Прежде чем рассказать про архитектуры игровых движков, я подумал, что будет полезно немного рассказать о том, как я понимаю архитектуру ПО и как это связано с играми. Во-первых, они (архитектуры) есть, чтобы бы там не врали про игрострой. Во-вторых, их оказывается больше одной. Это, возможно, поможет вам понять, почему остальные статьи написаны в таком порядке, или без какого-то порядка. В худшем случае, когда вас втянут в спор о том, насколько отвратительны (или, наоборот, потрясающе гениальны) отдельные игровые движки и их архитектуры, у вас будет пара аргументов и понимание что к чему.

Символично, что статья про архитектуру игрового движка появилась после того, как было рассказано про строки, мультипоток, применение алгоритмов: просто оно так и в жизни получается, мы сначала пишем код, редактор, игру - костяк проекта обрастает мясом, и тут нас догоняют проблемы, на которые все забивали, потому что надо было выдать хоть что-то похожее на работающий вариант. Но от того, что мы забивали на проблемы и заметали их под коврик беклога, проблемами быть они не перестали.

Вы не получите из статьи знаний об аллокаторах, контейнерах, или математике, стоящей за физикой игры. Так-же я не ставлю целью научить вас, как применять A* разбиение в поиске пути неписей или моделировать реверберацию комнаты. Вместо этого есть размышления о коде между всем этим. И даже не столько про написание кода, сколько о его организации.

+24

@FireKnight Mar 2 at 07:00

Личность изначально находится в конфликте с социумом. И как мне с этим жить?

Easy

5 min

1.3K

Reading roomLifehacks for geeks

“Дорогой, личность изначально находится в конфликте с социумом - разве тебе это не понятно?”. И в тот момент я словно подвис. Единственное, что пришло мне в голову - “Почему мне никто не сказал этого раньше?”

Мой разбор этого явления - психология, философия и выводы. И картинки в стиле киберпанк, потому что.

Давай глянем, что там

@alexandra_sky Mar 18 2021 at 10:14

Vulkan. Руководство разработчика. Графический конвейер

14 min

21K

C++ * CGI * Programming * 3D-graphics * Game development *

Tutorial

Translation

Я переводчик в IT-компании CG Tribe, и я продолжаю выкладывать перевод руководства к Vulkan API (vulkan-tutorial.com).

Сегодня я хочу поделиться с вами переводом первых двух глав раздела, посвященного графическому конвейеру (Graphics pipeline basics), — Introduction и Shader modules.

Содержание

1. Вступление

2. Краткий обзор

3. Настройка окружения

4. Рисуем треугольник

5. Вершинные буферы

6. Uniform-буферы

Layout дескрипторов и буфер
Пул дескрипторов и сеты дескрипторов

7. Текстурирование

Изображения
Image view и image sampler
Комбинированный image sampler

8. Буфер глубины

9. Загрузка моделей

10. Создание мип-карт

11. Multisampling

FAQ

Читать дальше →

@Andrey2008 Jan 28 at 10:58

Путеводитель C++ программиста по неопределённому поведению

Hard

3 min

7.6K

PVS-Studio corporate blogC * C++ * Delirium codingCompilers *

$Путеводитель C\+\+\ программиста по неопределённому поведению$

Вашему вниманию предлагается полный список разделов электронной книги (12 из 11 :)), посвящённой неопределённому поведению. Книга не является учебным пособием и рассчитана на тех, кто уже хорошо знаком с программированием на C++. Это своего рода путеводитель C++ программиста по неопределённому поведению, причём по самым его тайным и экзотическим местам. Автор книги — Дмитрий Свиридкин, редактор — Андрей Карпов.

Читать дальше →

+54

@ItwithMisha Jan 22 at 09:14

Старики будут править IT

Easy

6 min

78K

IT careerReading room

Opinion

Периодически на просторах интернета натыкаюсь на различные мнения по-тому, что в "Нарнии для разработчиков" нельзя находиться людям, которые уже преодолели барьер в 30 лет. И вообще этим людям пора либо перейти в менеджмент или запускать процесс само-утилизации и просто исчезнуть, для того, чтобы "молодые, успешные" 20 летние сеньоры пришли и начали перфомить так, что 30 летнему деду и не снилось.

Но так ли - это на самом деле, что более молодой разработчик может в базовых задачах выдавать большую производительность или вообще хотят ли текущие зумеры идти работать в айтишечку, чтобы перфомить? Давайте разберемся.

+244

736

@Tavalik Jan 11 2024 at 05:01

Помогаторы разработчика 1С

17 min

54K

1C *

Digest

Всем привет.

Данная статья написана по моему выступлению на Infostart Event 2022, на котором я рассказал об инструментах и «лайфхаках», которые использую в своей работе и которые, как мне кажется, помогают сделать работу разработчика 1С проще, удобнее, а главное, эффективней. Многие вещи, возможно, покажутся вам очевидными или совсем простыми. Но часто я вижу, что разработчики пренебрегают ими, а ведь именно такие «мелочи» и делают нашу жизнь проще.

+16

@ENRUStudio Jan 21 at 14:21

Как написать грамотный гайд: правила для техписов и разрабов

Easy

20 min

4.3K

Нетология corporate blogIT careerContent-marketing * Technical Writing * Development Management *

Tutorial

Translation

Большинство гайдов по программному обеспечению написаны трагически плохо.

В них не хватает важной информации, и это мешает пользователям повторить описанные в руководстве процессы. Иногда автор исходит из скрытых предпосылок, которые не соответствуют ожиданиям читателя.

Но есть и хорошая новость: научиться писать грамотные руководства проще, чем вы думаете. Следуйте нескольким простым правилам, и ваши тексты будут выделяться на фоне повсеместной посредственности.

Прочитать →

+18

@TalismanChet Jan 8 at 21:30

Honey — я устал #2

Medium

8 min

Research and forecasts in IT * Learning languagesProgramming * System Programming * Industrial Programming *

Analytics

Помнится, давненько я писал статью про свой язык программирования. Мало кто её одобрил, да и я по мере накопления опыта продолжал метаморфоз своей затеи. В этой статьи я отвечу на заданные вопросы, расскажу о том, как идея родилась заново, какие у меня планы, проблемы и так далее по списку.

@myoffice_ru Jan 6 at 11:28

Собрал в одном большом гайде всё, что хотел бы знать, когда изучал язык C

27 min

37K

МойОфис corporate blogC * Programming *

Tutorial

Translation

Очевидный факт: язык C — это основа большого количества современных экосистем программирования. Он обеспечивает фундамент многих операционных систем, базовых библиотек и системных инструментов. При этом все еще не существует единого ресурса, который последовательно и связно отвечает на важные вопросы, возникающие при изучении C: окружающая экосистема разработки языка, выбор инструментов, переносимость кода, управление зависимостями и глубокие аспекты работы.

Своим постом автор Jenny Jam* пытается заполнить этот пробел. Он рассуждает, когда C — идеальный выбор, а когда лучше обратиться к другим языкам. Описывает, как настроить среду разработки и выбрать инструменты, разобраться в версиях, особенностях сборки и тонкостях работы с библиотеками.

Цель статьи — упорядочить представление о языке C и его экосистеме, и, конечно, дать практические советы, которые пригодятся в реальных проектах.

*Обращаем ваше внимание, что позиция автора может не всегда совпадать с мнением МойОфис

+52

@DedaVova Dec 31 2024 at 13:06

Ещё раз о великой границе между материей и сознанием

Easy

3 min

1.8K

IDX corporate blogCyberpunkInformation Security *

Opinion

По древней традиции, корни которой уже и старожилы с запущенной амнезией не упомнят, перед Новым Годом хочется сказать что-нибудь значительное и ободряющее, тем более, что в этом году ханука совпала с католическим рождеством и кроет Новый Год как бык овцу. Это символичное совпадение разных календарей в очередной раз дает слабую надежду на то, что разодранный в лоскуты мир одумается и начнет отползать от пропасти. Товарищи, мы станем братья и все такое.

Буквально на днях я закончил читать тетралогию ПВО по вселенной Transhumanism Inc. Оказалось, что я запустил это дело и не читал не только последний роман “Круть”, но и предыдущие два — “KGBT”+ и “Путешествие в Элевсин”. Этот пост я помещу в хаб “Информационная безопасность” с тэгом “кибербез” хотя бы на том основании, что в последних двух романах главный герой — это заместитель начальника службы безопасности корпорации Transhumanism Inc. Маркус Зоргенфрей (нет, не еврей, но с российскими корнями, то есть предки жили в Добром государстве в эпоху позднего карбона). Поскольку вся корпорация Transhumanism Inc. предоставляет услуги цифровой жизни за пределами физических тел (в банке), такая классификация поста будет оправдана.

Несмотря на то, что при чтении всей тетралогии я нередко ржал как помешанный, но прорыдавшись, поневоле задумывался о вопросах вполне профессиональных. Например, начальник СБ адмирал-епископ Ломас рассказывает своему заместителю, что удалось запереть в банке демона зла Ахилла и отключить от нее все информационные потоки, то есть заточить демона в темницу. Обеспокоенный Маркус Зоргенфрей спрашивает, но позвольте, ведь банка с демоном находится в банкохранилище, где обеспечивается электропитание и климатика, а демон хитер и опасен, не может ли он выбраться из банки по электрическим проводам или по слаботочке? Нет, успокаивает его адмирал Ломас, не сможет, потому что именно здесь проходит великая граница между материей и сознанием. Похихикав, я задумался, что же это мне напоминает из недавнего опыта. И тут меня как молнией ударило и я опять начал бешено хохотать как Паниковский перед гирями, когда тот сообразил, что они золотые.

@kciray Jan 1 at 09:26

Фундаментальная математика — теория всего в IT и не только. Теория типов и формализация в Coq

38 min

9.8K

Mathematics * Machine learning * Functional Programming * Algorithms * Artificial Intelligence

У нас есть 3 "теории всего" - научная картина мира (все сводится к законам физики), информатика (все сводится к битам) и фундамент математики (все сводится к логике). Именно фундамент математики представляет особый интерес, так как он является фундаментом для двух других фундаментов и имеет глубокий философский смысл. Последние 2 года я сильно им увлекся и проделал довольно большую работу по углубленному изучению теории типов (Calculus of Constructions), и готов поделиться результатами, а также рассказать о девяти направлениях, где можно применить это на практике. Очень многое получилось лучше, чем я планировал. Изначально перспективы были не очень понятными, и поэтому я не рассказывал друзьям и коллегам про мою работу в этом направлении и называл это «Секретный Проект». Но теперь, когда многое прояснилось и получилось, можно поделиться успехом. Собственно, в этой статье я расскажу вам не только про сам фундамент математики, а еще его связь с ежедневной работой программиста, а также с Computer Science/Data Science и AI/ML. Я вам нарисую большую и красивую картину, на которой все понятно и логически следует из маленького набора правил выведений типов (11 штук) и аксиом теории множеств (9 штук).

У нас есть 3 фундамента математики — теория множеств (удобна для человека), теория типов (удобна для компьютера) и теория категорий (не знаю, зачем она вообще нужна). Они примерно одинаковой мощности и одну можно выразить внутри другой. Особый интерс представляет именно теория типов, тк ее довольно легко можно запрограммировать внутри компьютера и использовать как строгий фундамент для других теорий, который не дает совершить ошибку и проверяет каждое ваше действие.

+46

331

@Ingirov Dec 25 2024 at 05:45

«Снова упала?» Как поднять самооценку и зачем мы сравниваем себя с другими, даже если от этого больно

Easy

5 min

16K

Lifehacks for geeksBrainIT career

Что общего между сервером и самооценкой и в чем между ними разница? Общего то, что они падают, а разница в том, что поднимают их по-разному. Поговорим о том, как поднять самооценку и почему сравнение себя с другими, не баг, а фича.

+21

@tech_priestess Nov 18 2023 at 15:06

Вкатываемся в Machine Learning с нуля за ноль рублей: что, где, в какой последовательности изучить

Easy

26 min

462K

Machine learning * Studying in ITIT careerArtificial Intelligence

Tutorial

Всем доброго времени суток. Я давно обещала выложить сюда подробный гайд на тему того, как можно изучать Machine Learning самостоятельно, не тратя деньги на платные курсы, и, наконец, выполняю свое обещание. Надеюсь, этот гайд станет подсказкой, которая поможет найти правильное направление новичкам, которые хотят погрузиться в нашу область.

+156

@Anatoly_NN Dec 5 2024 at 11:14

Синтаксис, синглтон и смертельный ромб в С++: взгляд опытного разработчика на C

Medium

15 min

6.1K

YADRO corporate blogC * C++ * Programming *

Review

✏️ Wiiner Technotext 7

Давайте знакомиться: меня зовут Анатолий Семятнёв, я и моя команда разрабатываем ПО для опорных сетей 5G в YADRO. В IT-сфере работаю давно, и мой опыт в основном связан с языком С: занимался Board Support Package (BSP) и драйверами, много работал с операционной системой QNX.

До того, как начал полноценно работать на С++, сталкивался с языком в нулевые, писал на С++98. Тем не менее все это время я краем глаза поглядывал, что происходит в С++, и хотел вернуться к программированию на этом языке. Читал книги, делал пет-проекты, смотрел записи конференций и митапов по С++. А когда пришел в YADRO, стал писать на С++.

Мне с ходу дали большую фичу для имплементации, я писал много кода, и получал комментарии от коллег. В этом материале собрал все, что изучил или вспомнил по итогам код-ревью. Что рассмотрим в статье:

• Ключевые концепции — explicit, final, default, string — и как их использовать.

• Инициализацию мемберов с помощью пустого брейс-листа.

• Синглтон Майерса в корутинах.

• «Смертельный ромб» и все, что связано с виртуальным наследованием.

+54

@DedaVova Nov 29 2024 at 09:37

Как понять нейронные сети? Часть 2

Easy

17 min

1.5K

IDX corporate blogArtificial IntelligenceMachine learning * Popular science

Review

Начало обзора здесь.

Первые необъяснимые результаты

Восьмая глава в каком то смысле переломная для всей истории эволюции глубоких сетей, рассказанной в книге. Здесь тревожные звоночки, которые звенели раньше, превращаются в первые проблемы работы с моделями, которые мы даже объяснить не можем, а можем только высказать какие-то предположения.

Сама глава посвящена оценке качества модели, обученной на учебном наборе данных. Качество понимается как точность предсказаний, сделанных моделью на проверочном, тестовом наборе.

В довольно простой задаче распознавания рукописных цифр, используя хорошо известную базу MNIST (60 тысяч обучающих образцов и десять тысяч тестовых) в упрощенном варианте MNIST-1D (всего 4000 обучающих образцов). Каждый упрощенный образец дискретизируется в 40 точках и на каждый из сорока входов модели подается горизонтальное смещение точки образца (поэтому набор данных и называется MNIST-1D). В модели два слоя по 100 элементов в каждом. Для оптимизации используется стохастический градиентный спуск. По ходу обучения ошибка классификации образцов, подаваемых на вход плавно снижается до нуля. Однако ошибки на тестовом наборе, которые начинают снижаться, дойдя до 40%, остаются на этом уровне. Значение функции потерь при этом даже увеличивается, приближаясь к единице, что означает, что модель делает те же ошибки, но с большей уверенностью.

На простых регрессионных моделях исследуются три источника ошибок (шум, дисперсия и смещение) при генерации тестовых данных и предлагаются методы сокращения дисперсии (за счет увеличения количества тестовых данных) и смещения за счет увеличения мощности модели (с шумом ничего поделать нельзя). При этом еще существует баланс дисперсии и смещения — увеличивая мощность модели, чтобы сократить ошибку смещения, мы получаем увеличение дисперсии как компоненты ошибки. Это значит, что для каждой модели существует некоторая оптимальная мощность для заданного объема обучающих данных.

@jurassimo Nov 21 2024 at 16:41

Пишем свою Diffusion модель с нуля

Medium

12 min

10K

Machine learning * Artificial IntelligencePython * Mathematics *

FAQ

Всем привет, думаю у вас на слуху разного рода Diffusion модели последние 2 года. На его основе генерируют реалистичные изображения и видео, поэтому мне захотелось копнуть поглубже и узнать какова кроличья нора...

Меня зовут Юра, я - разработчик, фаундер и ML энтузиаст, также пишу свои заметки в своем ТГ канале. Я решил разобраться и понять, как устроена Diffusion модель внутри, понять ее математику и постараться объяснить и разложить ее на пальцах. Ну и конечно пописать код, который (спойлер) заработал. На гифке изображены примеры итоговых картинок на моей финальной модели.

Если вам тоже интересно, то читайте дальше

+47

3 4 ...

16 17