Articles / Bookmarks / Profile of Pashtetikus / Habr

Pavel Danilov @Pashtetikus^{read⁠-⁠only}

User

ProfileBookmarks265

masalova_yy Aug 20 2024 at 07:01

Очень простая и даже местами детская задача — во что она превратилась

9 min

12K

НЛМК ИТ corporate blogIndustrial Programming*Project management*

Сепараторы, вид сверху

Сначала в карьере что-то бахает, потом мы дробим осколки породы на более мелкие части — примерно 5,7 мм. Наша задача — вынуть из руды все магнитные компоненты. Это мы делаем в магнитно-гравитационных сепараторах. Сначала большие дробилки превращают булыжники руды в гальку, потом — в зерно. Валковые прессы ещё больше истирают руду, которая затем идёт в шаровую мельницу, где она измельчается до стадии, когда магнитные составляющие практически полностью отделяются. В шаровой мельнице используется вода, 95 % которой добавляется на разных этапах. В итоге эту воду всё равно надо как-то «отжимать», и её удобно использовать как среду для мокрой магнитной сепарации.

Сепараторщик — человек с очень хорошим цветовым зрением. Время от времени он смотрит на цвет жидкости в МГС и «на глаз» определяет статус процесса: цвет от светло-бежевого до коричневого говорит о нормальной работе сепаратора. А если цвет становится более тёмным — это значит, что сепаратор начинает «хвостить» и пора вмешаться.

Поскольку отличить на глаз #996512 от #BF6009 легко, а вот от #88551F довольно сложно, на производстве предложили прикрутить к сепаратору колориметр. Это спасло бы от того, что они «хвостят», то есть подняло бы КПД на пару процентов и защитило от излишнего износа в нерасчётных режимах работы.

Читать дальше →

+58

greck Sep 10 2022 at 09:31

1. Теория информации + ML. Энтропия

9 min

21K

Mathematics*Machine learning*Statistics in IT

Tutorial

Теория Информации и Machine Learning мне видятся как интересная пара областей, глубокая связь которых часто неизвестна ML инженерам, и синергия которых раскрыта ещё не в полной мере.

Начнём с базовых понятий Энтропии, Информации в сообщении, Mutual Information, пропускной способности канала. Далее будут материалы про схожесть задач максимизации Mutual Information и минимизации Loss-а в регрессионных задачах. Затем будет часть про метрику Фишера, геодезические и градиентные методы, и их связь с гауссовскими процессами.

+14

konstantin-s-yakovlev Mar 26 2024 at 13:02

Много-агентное планирование траекторий в децентрализованном режиме: эвристический поиск и обучение с подкреплением

Medium

17 min

4.2K

AIRI corporate blogAlgorithms*Machine learning*Artificial Intelligence

Привет! Меня зовут Константин Яковлев, я научный работник и вот уже более 15 лет я занимаюсь методами планирования траектории. Когда речь идет о том, чтобы построить траекторию для одного агента, то задачу зачастую сводят к поиску пути на графе, а для этого в свою очередь обычно используют алгоритм A* или какие‑то из его многочисленных модификаций. Если же агентов много, они перемещаются в рабочем пространстве одновременно, то задача (внезапно) становится несколько более сложной и применить напрямую A* не получится. Вернее получится, но лишь для небольшого числа агентов (проклятье размерности, куда деваться). Тем не менее для централизованного случая, т. е. для случая, когда есть один (мощный) вычислитель, с которым связаны все агенты и который всё про всех знает, решить задачу много‑агентного планирования можно достаточно эффективно. Можно даже находить оптимальные решения для умеренного количества агентов за относительное приемлемое время (например, порядка 1 секунды на современном десктопном PC для 30–50 агентов).

Если же говорить о децентрализованном случае, т. е. о том случае, когда агентам необходимо действовать индивидуально (например, нет устойчивой связи с центральным контроллером), опираясь лишь на собственные (локальные) наблюдения и опыт, то с хорошими решениями задачи становится гораздо сложнее. Когда я говорю «хорошие решения», я имею в виду прежде всего такие алгоритмы, которые бы давали стройные теоретические гарантии в общем случае. Хотя бы гарантии того, что каждый агент дойдёт (за конечное время) до своей цели. Тем не менее, задача интересная и специалисты из индустрии и академии её пытаются решать.

В этом посте я расскажу о наших свежих наработках в этой области, а именно о гибридном методе, которые сочетает в себе принципы классического эвристического поиска (A*) и обучения с подкреплением (PPO). Метод получился неплохим, превосходящим многие современные аналоги по результатам экспериментов, а соответствующая статья была принята на The 38th AAAI Conference on Artificial Intelligence (пока доступен только препринт). Это одна из топовых академических конференций по искусственному интеллекту, которая в этом (2024) году проходила в Канаде (спойлер: я сам визу получить не успел, но моим коллегам и со‑авторам, кто имел ранее выданные Канадские визы, удалось принять личное участие и достойно представить нашу науку на мировом уровне).

Итак, поехали!

+27

re9ulus Mar 19 2024 at 07:00

Quantization Deep Dive, или Введение в современную квантизацию

Medium

16 min

31K

Яндекс corporate blogProgramming*Algorithms*Machine learning*Artificial Intelligence

✏️ Technotext 2023

Привет! Меня зовут Василий Землянов, я занимаюсь разработкой ML-инфраструктуры. Несколько лет я проработал в команде, которая делает споттер — специальную маленькую нейросетевую модельку, которая живёт в умных колонках Яндекса и ждёт от пользователя слова «Алиса». Одной из моих задач в этой команде была квантизация моделей. На пользовательских устройствах мало ресурсов, и мы решили, что за счёт квантизации сможем их сэкономить — так в итоге и вышло.

Потом я перешёл в команду YandexGPT. Вместо маленьких моделей я стал работать с очень крупными. Мне стало интересно, как устроена квантизация больших языковых моделей (LLM). Ещё меня очень впечатляли истории, где люди берут гигантские нейросети, квантизируют в 4 бита и умудряются запускать их на ноутбуках. Я решил разобраться, как это делается, и собрал материал на доклад для коллег и друзей. А потом пришла мысль поделиться знаниями с более широкой аудиторией, оформив их в статью. Так я и оказался на Хабре :)

Надеюсь, погружение в тему квантизации будет интересно как специалистам, так и энтузиастам в сфере обучения нейросетей. Я постарался написать статью, которую хотел бы прочитать сам, когда только начинал изучать, как заставить модели работать эффективнее. В ней мы подробно разберём, зачем нужна квантизация и в какой момент лучше всего квантизовать модель, а ещё рассмотрим разные типы данных и современные методы квантизации.

+81

avdayvdov Dec 24 2023 at 13:48

Как возникают и развиваются стандарты систем связи: рассматриваем на примере 6G

Easy

17 min

8.7K

Samsung corporate blogDevelopment of communication systems*Network standards*Cellular communication

Review

Все слышали о поколениях мобильной связи, и сокращения 4G, 5G, а может быть даже и 6G уже у всех на слуху. Но чем определяется смена технологических поколений, кто решает, что новое поколение уже наступило? Как так вышло, что вроде бы 5G массово еще не используется, а уже начинают говорить про 6G? И кто создает стандарты, по которым потом живет мир?

В этой статье я рассказываю о трендах шестого поколения мобильной связи (6G) исходя из моего опыта разработки подобного рода систем, а также участия в создании современных стандартов связи в комитете 3GPP — фактически единственной организации в мире, которая разрабатывает спецификации для систем связи различных поколений.

+24

petuhoff Jun 2 2020 at 22:11

Введение в теорию автоматического управления. Основные понятия теории управления техническим системами

15 min

197K

CAD/CAM*Matlab*System Analysis and Design*Systems engineering*Industrial Programming*

Публикую первую главу лекций по теории автоматического управления, после которых ваша жизнь уже никогда не будет прежней.

Лекции по курсу «Управление Техническими Системами», читает Козлов Олег Степанович на кафедре «Ядерные реакторы и энергетические установки», факультета «Энергомашиностроения» МГТУ им. Н.Э. Баумана. За что ему огромная благодарность.

Данные лекции только готовятся к публикации в виде книги, а поскольку здесь есть специалисты по ТАУ, студенты и просто интересующиеся предметом, то любая критика привествуется.

Читать дальше →

+33

119

Viktor_Osadchiy Sep 28 2023 at 06:52

Как управлять финансами, чтобы выйти на раннюю пенсию, а не в окно

Medium

7 min

24K

Finance in IT

Сегодня поговорим о банальных вещах: надо мыть руки перед едой, регулярно делать зарядку и получать доходы от инвестирования. Кто выполняет все три условия, может дальше не читать, с остальными будем обсуждать жидкое мыло с кремом и примеры “инвестирования” в 2023 г.

Надо отметить, что под инвестированием будут рассматриваться и спекуляции, условное отличие этих понятий в сроках и способах применения денег.

100

tarmalonchik Mar 7 2023 at 14:15

Сказ о том как pet-project превратился в небольшой пассивный доход (часть 2)

Easy

4 min

7.3K

Network technologies*Go*DNS*Programming*

Case

Первая Часть

Предыдущая часть закончилась неудачной балансировкой, которая не решает практически никаких проблем. В комментариях кто-то спросил, почему я не использовал балансировку на уровне DNS. Так вот, я ее использовал. Оказалось, что c помощью DNS записей можно организовать балансировку Round Robin. Для этого в конфигурации Wireguard всего лишь нужно использовать доменное имя вместо IP адреса.

+19

DuMoH112 Feb 12 2021 at 05:36

Краткая история о том, как развернуть веб-сервер Flask в docker контейнере

6 min

29K

МегаФон corporate blogFlask*Programming*Python*

Tutorial

Для чего вообще нужен docker контейнер? Обычно, во время разработки, для каждого проекта вы настраиваете своё окружение. Но вот произошла такая ситуация: что-то случилось с вашим компьютером и приходится переустанавливать операционную систему(ОС). Соответственно, чтобы запустить ваш проект, необходимо настраивать окружение заново. Бывает ещё гигантское количество ситуаций, которые сводятся к одной проблеме - настройка окружения для разработки.

ffriend Mar 19 2018 at 09:42

Про вероятности

11 min

45K

Data Mining*

Tutorial

(source)

Иногда мне приходится рассказывать другим людям как работает машинное обучение и, в частности, нейронные сети. Обычно я начинаю с градиентного спуска и линейной регрессии, постепенно переходя к многослойным перцептронам, автокодировщикам и свёрточным сетям. Все понимающе кивают головой, но в какой-то момент кто-нибудь прозорливый обязательно спрашивает:

А почему так важно, чтобы переменные в линейной регрессии были независимы?

или

А почему для изображений используются именно свёрточные сети, а не обычные полносвязные?

"О, это просто", — хочу ответить я. — "потому что если бы переменные были зависимыми, то нам пришлось бы моделировать условное распределение вероятностей между ними" или "потому что в небольшой локальной области гораздо проще выучить совместное распределение пикселей". Но вот проблема: мои слушатели ещё ничего не знают про распределения вероятностей и случайные переменные, поэтому приходится выкручиваться другими способами, объясняя сложнее, но с меньшим количеством понятий и терминов. А что делать, если попросят рассказать про батч нормализацию или генеративные модели, так вообще ума не приложу.

Так давайте не будем мучить себя и других и просто вспомним основные понятия теории вероятностей.

Читать дальше →

+29

ZlodeiBaal Jun 15 2020 at 08:03

Самая сложная задача в Computer Vision

13 min

75K

Recognitor corporate blogPython*Artificial IntelligenceMachine learning*Image processing*

Tutorial

Среди всего многообразия задач Computer Vision есть одна, которая стоит особняком. К ней обычно стараются лишний раз не притрагиваться. И, если не дай бог работает, — не ворошить.
У неё нет общего решения. Практически для каждого применения существующие алгоритмы надо тюнинговать, переобучать, или судорожно копаться в куче матриц и дебрях логики.

Статья о том как делать трекинг. Где он используется, какие есть разновидности. Как сделать стабильное решение.

+127

Laggg Aug 11 2022 at 11:00

Data Science Pet Projects. FAQ

13 min

62K

Open Data Science corporate blogData Mining*Artificial IntelligenceMachine learning*Project management*

Привет! Меня зовут Клоков Алексей, сегодня поговорим о пет-проектах по анализу данных. Идея написать эту статью родилась после многочисленных вопросов о личных проектах в сообществе Open Data Science (ODS). Это третья статья на Хабре, до этого был разбор алгоритма SVM и анонс крутого NLP курса от ребят из DeepPavlov. В этой статье вы найдете идеи для новых петов и другие полезности. Итак, разберем частые вопросы и дадим определение пет-проекта:

Зачем делать пет-проекты?
Из каких этапов может состоять разработка пет-проекта?
Как выбрать тему и найти данные?
Где найти вычислительные ресурсы?
Как завернуть работающие алгоритмы в минимальный прод?
Как оформить презентабельный вид проекта?
Как и зачем искать коллабораторов?
Когда проходит ODS pet project хакатон?
Где посмотреть примеры пет-проектов и истории участников ODS?

Читать дальше →

+43

mana_aka_forcesh Jul 12 2022 at 09:00

Обзор архитектур image-to-image translation

Medium

13 min

«Норникель» corporate blogMachine learning*Mathematics*Image processing*Algorithms*

Привет, Хабр! Я работаю инженером компьютерного зрения в направлении искусственного интеллекта компании Норникель. Мы разрабатываем и внедряем модели с применением машинного обучения на наши производственные площадки.

В скоуп наших проектов попадают как системы, управляющие (или частично управляющие) технологическим процессом (например, флотация или плавка), так и системы промышленного машинного зрения, которые по сути представляют из себя одну из разновидностей датчиков.

В этой статье я расскажу про основные архитектуры генеративных сетей для задачи перевода изображения из одного домена в другой (image-to-image translation). В конце расскажу, для чего именно мы применяем синтетические данные и приведу примеры изображений, которых нам удалось достичь. Но перед погружением в данную тему рекомендую ознакомиться с тем, что такое свёрточная сеть, U-Net и генеративная сеть. Если же Вы готовы, поехали.

+12

TilekSamiev Jun 29 2022 at 10:36

Первый высокопроизводительный пластиковый процессор стоимостью в 1 цент

7 min

37K

Timeweb Cloud corporate blogThe future is hereComputer hardwareManufacture and development of electronics*CPU

30-40 лет назад, когда персональные компьютеры были ещё в новинку, а интернета как такового не было, пионеры вычислительной технологии предсказывали, что в будущем электронные чипы станут настолько дешёвыми, что они будут повсюду — в домах, в транспорте, даже в человеческом теле. Для того времени эта идея казалась фантастической, даже абсурдной. ПК тогда были очень дороги и в большинстве своём даже не подключались к интернету. Мысль о том, что миллиарды крохотных чипов когда-нибудь станут дешевле семечек, казалось нелепой.

Десятилетиями технари обещают мир, где абсолютно каждый объект, с которым мы будем сталкиваться — мебель, посуда, одежда — будет обладать «умом» благодаря сверхдешёвым программируемым процессорам. Если вам интересно, почему этого до сих пор не произошло, то это потому, что никто не построил работающие процессоры, которые можно было бы производить миллиардами стоимостью в 1 цент каждый.

Со временем абсолютно всё вокруг нас станет «умным». Производители, не сделавшие свою продукцию «умной», в какой-то момент будут вытеснены с рынка конкурентами, которые успели это сделать. Одним из путей добиться таких дешёвых микропроцессоров, являются микрочипы из пластика.

Читать дальше →

+33

105

Makoomaky Jun 30 2022 at 14:35

Контекстные многорукие бандиты для рекомендации контента, или Не Бернулли единым

17 min

13K

VK corporate blogData Mining*Algorithms*Mathematics*Machine learning*

Tutorial

Technotext Winner 2022

Привет, Хабр! Меня зовут Александр Сухочев, я занимаюсь машинным обучением и руковожу командой рекомендаций и развития сервисов ВКонтакте. Сегодня хочу поделиться нашим опытом и результатами внедрения контекстуальных многоруких бандитов для рекомендации контента на примере игр и стикеров.

Статья состоит из четырёх частей, переходите сразу ко второй или третьей, если знакомы с проблематикой, или читайте по порядку, чтобы составить полную картину:

Введение расскажет о том, какие бывают подходы к построению рекомендательных систем и при чём здесь многорукие бандиты — это раздел для тех, кто раньше не был знаком с данным подходом.

Основные алгоритмы решения задачи многорукого бандита: эпсилон-жадный подход, сэмплирование Томпсона, Upper Confidence Bound.

Алгоритм контекстных многоруких бандитов — о контекстных многоруких бандитах и способе их обучения в частном случае, который мы использовали в нашем решении.

Заметки о практической реализации — о тонкостях внедрения, бизнес-требованиях и результатах на примере сервиса рекомендации игр и стикеров.

+55

skillfactory_school Jul 13 2020 at 09:21

Объясняем p-значения для начинающих Data Scientist’ов

9 min

273K

Skillfactory corporate blogBig Data*Mathematics*Studying in IT

Translation

Я помню, когда я проходил свою первую зарубежную стажировку в CERN в качестве практиканта, большинство людей все еще говорили об открытии бозона Хиггса после подтверждения того, что он соответствует порогу «пять сигм» (что означает наличие p-значения 0,0000003).

Тогда я ничего не знал о p-значении, проверке гипотез или даже статистической значимости.

Я решил загуглить слово — «p-значение», и то, что я нашел в Википедии, заставило меня еще больше запутаться…

При проверке статистических гипотез p-значение или значение вероятности для данной статистической модели — это вероятность того, что при истинности нулевой гипотезы статистическая сводка (например, абсолютное значение выборочной средней разницы между двумя сравниваемыми группами) будет больше или равна фактическим наблюдаемым результатам.
— Wikipedia

Хорошая работа, Википедия.

Ладно. Я не понял, что на самом деле означает р-значение.

Углубившись в область науки о данных, я наконец начал понимать смысл p-значения и то, где его можно использовать как часть инструментов принятия решений в определенных экспериментах.

Поэтому я решил объяснить р-значение в этой статье, а также то, как его можно использовать при проверке гипотез, чтобы дать вам лучшее и интуитивное понимание р-значений.

vlakir May 24 2022 at 19:59

Асинхронный python без головной боли (часть 1)

14 min

380K

Python*Programming*

Tutorial

Почему так сложно понять asyncio?

Асинхронное программирование традиционно относят к темам для "продвинутых". Действительно, у новичков часто возникают сложности с практическим освоением асинхронности.

Но будь я автором самого толстого в мире учебника по python, я бы рассказывал читателям про асинхронное программирование уже с первых страниц. Вот только написали "Hello, world!" и тут же приступили к созданию "Hello, asynchronous world!". А уже потом циклы, условия и все такое.

Съешь красную таблетку

+135

PatientZero Feb 14 2022 at 13:33

Что вообще значит «прослушивать порт»?

8 min

42K

Information Security*Server Administration*Network technologies*

Translation

В углу здания студенческого клуба есть кофейня, и в углу этой кофейни сидят два студента. Лиз стучит по клавиатуре потрёпанного древнего MacBook, который ей подарил брат перед отъездом в колледж. Слева от неё на диване Тим пишет уравнения в пружинном блокноте. Между ними стоит наполовину пустая кружка с кофе комнатной температуры, из которой Лиз время от времени потягивает напиток, чтобы не заснуть.

На другом конце кофейни бариста оторвался от своего телефона, чтобы окинуть взглядом помещение. Один наушник вставлен в ухо, второй висит, телефон воспроизводит видео с заданием, выданным на лекции по кинематографии. В кофейне, где работают студенты, есть неписанное правило: в ночную смену сотрудники могут пользоваться длинными промежутками между клиентами, чтобы выполнять домашние задания. Кроме Тима и Лиз в помещении по одиночке сидит ещё пара студентов, уже много часов сосредоточенно смотрящих в свои ноутбуки. Вся остальная часть кофейни пуста.

Тим останавливается на половине строки, вырывает лист из блокнота, комкает его и кладёт рядом с небольшой горкой других скомканных листов.

Читать дальше →

+52

stroikaveka Feb 1 2022 at 07:03

Ускорители

31 min

22K

Reading roomEnergy and batteriesPhysicsChemistryThe future is here

С древнейших времён пытливый человеческий ум пытался проникнуть в тайны окружающего его мира. Из чего сделано яблоко? Почему камень твёрдый, а металл гнётся? До какой степени мы можем делить яблоко? Состоит ли оно из мириадов маленьких яблочек или же его образуют частицы, совсем на него не похожие?

В своих попытках найти базовые кирпичики, составляющие весь окружающий мир, человечество совершило грандиозное путешествие от простейшей арифметики до невозможных для человеческого мозга вычислений, и от разрезанного яблока до многокилометрового коллайдера.

Читайте об ускорителях

+42

frobeniusfg Aug 12 2020 at 21:04

Основы линейной регрессии

13 min

209K

Mathematics*Machine learning*

Здравствуй, Хабр!

Цель этой статьи — рассказать о линейной регрессии, а именно собрать и показать формулировки и интерпретации задачи регрессии с точки зрения математического анализа, статистики, линейной алгебры и теории вероятностей. Хотя в учебниках эта тема изложена строго и исчерпывающе, ещё одна научно-популярная статья не помешает.

! Осторожно, трафик! В статье присутствует заметное число изображений для иллюстраций, часть в формате gif.

Читать дальше →

+18

2 3 ...

13 14