Статьи / Закладки / Профиль atmur / Хабр

Антон Тмур @atmur

Наставник в Яндекс.Практикуме.

Профиль Публикации 1Комментарии 5Закладки 10

simflin 5 окт 2023 в 10:00

Нейронные сети для планирования движения беспилотных автомобилей

16 мин

16K

Блог компании ЯндексАлгоритмы*Машинное обучение*Искусственный интеллектТранспорт

Лучший Техноавтор 2023

Планировщик движения беспилотного автомобиля — это алгоритм-помощник, который общается с другими участниками движения посредством манёвров. То есть он действует так, чтобы другим было понятно, куда поедет беспилотник, и сам по действиям других пытается определить, кто куда будет двигаться и почему.

В диалоговых системах совсем недавно произошла революция из-за появления ChatGPT. В беспилотных автомобилях революции, к сожалению, пока не произошло, но если это случится, то как раз в той области, про которую будет мой рассказ.

Под катом — детальный разбор логики движения беспилотника, примеры свёрточных и трансформерных архитектур моделей для предсказания движения и много формул для расчёта вероятных траекторий других машин и пешеходов. А ещё я расскажу, в чём преимущества машинного обучения перед эвристиками и чем может помочь Reinforcement Learning.

+55

Flokis_guy 17 мая в 14:20

Интуитивное понимание пространств и ядер в машинном обучении: Часть 1

Сложный

9 мин

9.1K

Data Mining*Математика*Машинное обучение*Искусственный интеллект

Туториал

При изучении темы ядер (kernel) в ML/DS программы вузов, роадмэпы и видео на YouTube обычно рассматривают её через призму SVM, не говоря уже о всеми любимых курсах:). Казалось бы, это неплохо: вот тебе краткое объяснение и модель, которая использует ядра. Но, увы, в этих областях желательно понимать многие процессы интуитивно, так сказать — «тяжело в учении, легко в бою». К тому же, эта тема нечто большее, чем просто метод; она позволяет связать многие вещи в машинном обучении в единую картину через пространство, что я и хочу показать в этой статье.

+20

aldrchist 19 апр в 11:01

Как мы тестируем беспилотные автомобили с помощью симуляций

Простой

12 мин

5.8K

Блог компании ЯндексБлог компании Конференции Олега Бунина (Онтико)Машинное обучение*Искусственный интеллектТранспорт

Всем привет! Это Александр Чистяков из команды беспилотных автомобилей Яндекса. Мой доклад посвящён симуляторам: что это, зачем, как это устроено изнутри и какие в симуляции есть подводные камни, неожиданные парадоксы. Также расскажу, с помощью каких алгоритмических или архитектурных решений мы со всеми этими парадоксами боремся.

+27

nrsharip 18 мар в 17:32

Основные типы распределений вероятностей в примерах

Средний

15 мин

26K

Python*Алгоритмы*Математика*Статистика в ITИнфографика

Из песочницы

Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения на сайте, нажатий на целевые кнопки, покупок товаров является обычным и необходимым явлением. Любые изменения в пользовательском опыте на сайте компании (внешний вид, структура, контент) приводят к изменениям в работе пользователя и, как результат, изменения наблюдаются в собираемых данных. Важным элементом анализа изменений данных и его фундаментом является использование основных типов распределений случайных величин, от понимания которых напрямую зависит качество оценки значимости наблюдаемого изменения. Рассмотрим их подробнее на наглядных примерах.

+58

re9ulus 19 мар в 10:00

Quantization Deep Dive, или Введение в современную квантизацию

Средний

16 мин

21K

Блог компании ЯндексПрограммирование*Алгоритмы*Машинное обучение*Искусственный интеллект

✏️ Технотекст 2023

Привет! Меня зовут Василий Землянов, я занимаюсь разработкой ML-инфраструктуры. Несколько лет я проработал в команде, которая делает споттер — специальную маленькую нейросетевую модельку, которая живёт в умных колонках Яндекса и ждёт от пользователя слова «Алиса». Одной из моих задач в этой команде была квантизация моделей. На пользовательских устройствах мало ресурсов, и мы решили, что за счёт квантизации сможем их сэкономить — так в итоге и вышло.

Потом я перешёл в команду YandexGPT. Вместо маленьких моделей я стал работать с очень крупными. Мне стало интересно, как устроена квантизация больших языковых моделей (LLM). Ещё меня очень впечатляли истории, где люди берут гигантские нейросети, квантизируют в 4 бита и умудряются запускать их на ноутбуках. Я решил разобраться, как это делается, и собрал материал на доклад для коллег и друзей. А потом пришла мысль поделиться знаниями с более широкой аудиторией, оформив их в статью. Так я и оказался на Хабре :)

Надеюсь, погружение в тему квантизации будет интересно как специалистам, так и энтузиастам в сфере обучения нейросетей. Я постарался написать статью, которую хотел бы прочитать сам, когда только начинал изучать, как заставить модели работать эффективнее. В ней мы подробно разберём, зачем нужна квантизация и в какой момент лучше всего квантизовать модель, а ещё рассмотрим разные типы данных и современные методы квантизации.

+81

kashokhin 14 янв в 14:31

Mamba. От начала до конца

Средний

5 мин

25K

Машинное обучение*Искусственный интеллект

FAQ

Из песочницы

Во времена повсеместного заполонения трансформерами, которые пожирали в себя все больше и больше кремниевых чипов; когда казалось, что лучше уже не будет и за каждый новый токен нужно платить в квадрате от предыдущих, в эту холодную зимнюю пору появилась она - Мамба.

+27

kmoseenk 25 авг 2023 в 13:46

Чтобы ускорить работу Numba и кода NumPy, нужно понять, как работают процессоры

11 мин

6.6K

Блог компании OTUSPython*

Туториал

Перевод

Если вам нужно ускорить обработку NumPy или просто сократить использование памяти, попробуйте компилятор Numba just-in-time. С его помощью можно писать код на языке Python, который во время выполнения компилируется в машинный код. Это позволяет получить прирост скорости, сопоставимый с приростом, который можно получить на C, Fortran или Rust.

По крайней мере, так считается в теории. На практике же код на Numba может быть не быстрее, чем эквивалент NumPy. Но если лучше понимать, как работают процессоры, можно добиться большего. Эти знания помогут более широко использовать любой компилируемый язык. В этой статье мы:

• Рассмотрим простую задачу обработки изображений.

• Попытаемся (поначалу безуспешно) ускорить ее с помощью Numba.

• Рассмотрим, почему современные процессоры такие быстрые, и каковы возможности компиляторов.

• Опираясь на полученные знания, скорректируем наш код так, чтобы он выполнялся в 25 раз быстрее по сравнению с первоначальной версией.

+22

murat_apishev 12 дек 2023 в 16:25

О методах позиционного кодирования в Transformer

Сложный

10 мин

11K

Машинное обучение*Искусственный интеллектNatural Language Processing*

Обзор

Лучший Техноавтор 2023

Обзор методов кодирования позиций токенов в нейросетевых моделях Transformer с упором на обработку длинных текстов. Для тех, кто учит и использует LLM, и для всех интересующихся.

+24

Sagidullin 8 дек 2022 в 15:50

Что такое MLOps? Самый подробный текст про работу с ML-системами, который вы найдете в интернете

25 мин

28K

Блог компании SelectelDevOps*IT-инфраструктура*Высокая производительность*Машинное обучение*

Технотекст 2022

В этом материале мы подробно разбираем концепцию MLOps. Более того, делаем это тремя способами. Сначала теоретически — через самую толковую, на наш взгляд, схему MLOps. Затем — концептуально, через артефакты, которые заложены в подходе. И наконец, через понимание MLOps как информационной системы.

Сохраняйте текст в закладки, потому что на данный момент это, возможно, самое полное описание MLOps на русском языке (и не перевод очередной англоязычной статьи!). Подарим мерч Selectel тому, кто пришлет ссылку на более развернутое описание концепции в комментариях.

Читать дальше →

+43

atmur 14 дек 2022 в 15:05

Поиск в глубину, поиск в ширину, алгоритмы Дейкстры и А* — это один и тот же алгоритм

7 мин

18K

Блог компании Яндекс ПрактикумАлгоритмы*Учебный процесс в ITКарьера в IT-индустрии

В алгоритмических задачах на графах мы часто используем четыре известных алгоритма: Поиск в ширину или глубину, алгоритмы Дейкстры и А*. Разбираемся, почему на деле это один и тот же алгоритм.

+29

Нейронные сети для планирования движения беспилотных автомобилей

Интуитивное понимание пространств и ядер в машинном обучении: Часть 1

Как мы тестируем беспилотные автомобили с помощью симуляций

Основные типы распределений вероятностей в примерах

Quantization Deep Dive, или Введение в современную квантизацию

Mamba. От начала до конца

Чтобы ускорить работу Numba и кода NumPy, нужно понять, как работают процессоры

О методах позиционного кодирования в Transformer

Что такое MLOps? Самый подробный текст про работу с ML-системами, который вы найдете в интернете

Поиск в глубину, поиск в ширину, алгоритмы Дейкстры и А* — это один и тот же алгоритм

Информация

Специализация