Статьи / Профиль kirillbykov2 / Хабр

Быков Кирилл @kirillbykov2

Аналитик-разработчик, Python

Хабр Карьера

ПрофильСтатьи8ПостыНовостиКомментарии10

kirillbykov2 12 авг в 08:46

ML Q & AI. Глава 6. Уменьшение переобучения при помощи настройки моделей

Средний

8 мин

313

Искусственный интеллектМашинное обучение *

Перевод

← Предыдущая глава |

Допустим, мы обучаем классификатор при помощи обучения с учителем и уже применили к датасету различные методы для уменьшения переобучения. Как можно улучшить модель или цикл обучения, чтобы добиться еще более заметного эффекта?

Наиболее эффективные методы борьбы с переобучением включают в себя различные техники регуляризации, такие как Dropout и сокращение весов. Как правило, модели с большим количеством параметров требуют больше тренировочных данных для успешного обобщения. Поэтому иногда уменьшение размера модели может помочь снизить степень переобучения. Наконец, одним из самых действенных способов борьбы с переобучением является создание ансамблей моделей. Однако этот метод иногда связан с повышенными вычислительными затратами.

В этой главе мы обсудим ключевые идеи и методы, которые помогают снизить переобучение при помощи модификации моделей, и сравним их между собой. В заключение мы обсудим, как выбрать между различными техниками уменьшения переобучения, включая те, о которых мы говорили в предыдущей главе.

kirillbykov2 30 июл в 08:47

ML Q & AI. Глава 5. Уменьшение переобучения при помощи данных

Средний

3 мин

445

Искусственный интеллектМашинное обучение *

Перевод

← Предыдущая глава | Следующая глава →

Предположим, что мы обучаем классификатор при помощи обучения с учителем и замечаем, что он страдает от переобучения. Какие существуют основные подходы для уменьшения переобучения путем модификации или дополнения данных?

Переобучение - достаточно широко распространенная проблема в машинном обучении, возникающая, когда модель слишком точно подстраивается под тренировочные данные. В результате она начинает учитывать шум и выбросы, а не взаимосвязи данных. Из-за этого модель хорошо работает на тренировочных данных, но плохо справляется с новыми или тестовыми. В идеале мы бы хотели полностью избежать переобучения, однако на практике это не всегда реально. Поэтому мы стараемся минимизировать его влияние на модель настолько, насколько это возможно.

Наиболее успешные методы, направленные на уменьшение переобучения, основаны на сборе большего количества высококачественных размеченных данных. Однако, если затраты на получение дополнительных размеченных данных оказываются неоправданными, мы можем рассмотреть варианты, такие как аугментация существующих данных или использование неразмеченных данных для предварительного обучения.

kirillbykov2 24 июл в 19:09

ML Q & AI. Глава 4. Гипотеза о лотерейном билете

Средний

3 мин

599

Искусственный интеллектМашинное обучение *

Перевод

← Предыдущая глава | Следующая глава →

О чем говорит гипотеза о лотерейном билете, и чем она полезна на практике, если оказывается верной?

Гипотеза о лотерейном билете — это идея, которая появилась в 2018 году в контексте обучения нейронных сетей. Она утверждает, что в случайно инициализированной нейронной сети существует подсеть (или «выигрышный билет»), которая, если ее обучить независимо, сможет достичь такой же точности на тестовом датасете, как и полная сеть после такого же количества шагов обучения. Авторы гипотезы — Джонатан Франкл и Майкл Карбин.

В этой главе мы подробно рассмотрим гипотезу лотерейного билета. Сначала мы шаг за шагом разберемся, как она работает, а затем обсудим прунинг весов — один из ключевых методов, который позволяет создавать более компактные сети. Этот процесс является частью методологии, основанной на гипотезе лотерейного билета. В конце главы мы проанализируем практические применения и ограничения данной гипотезы.

kirillbykov2 18 июл в 07:43

ML Q & AI. Глава 3. Few-Shot Learning

Средний

3 мин

594

Искусственный интеллектМашинное обучение *

Перевод

← Предыдущая глава | Следующая глава →

Что такое few-shot learning (обучение, FSL)? Чем оно отличается от традиционной процедуры обучения с учителем?

Few-shot обучение представляет собой особый вид обучения с учителем для небольших тренировочных датасетов с очень низким отношением количества примеров на класс. В традиционном обучении с учителем модель тренируется, пробегаясь по тренировочному сету, при этом она всегда видит один и тот же фиксированный набор классов. В few-shot обучении мы работаем с опорным множеством, из которого формируем несколько тренировочных заданий. Из этих заданий мы собираем тренировочные эпизоды, где каждое тренировочное задание состоит из различных классов.

kirillbykov2 11 июл в 07:53

ML Q & AI. Глава 2. Self-Supervised Learning

Средний

5 мин

694

Машинное обучение * Искусственный интеллект

Перевод

← Предыдущая глава | Следующая глава →

Self-supervised обучение - это процедура предварительного обучения, которая позволяет нейронным сетям использовать большие объемы неразмеченных данных в supervised стиле. В этой главе мы сравним self-supervised обучение с трансферным, схожим методом для предварительного обучения моделей, и рассмотрим практические приложения SSL. Также обсудим основные категории self-supervised обучения.

kirillbykov2 3 июл в 04:44

ML Q & AI. Глава 1. Эмбеддинги, латентные пространства и представления

Средний

4 мин

2.6K

Машинное обучение * Искусственный интеллект

Перевод

Следующая глава →

Известный эксперт в области машинного обучения и ИИ Себастьян Рашка был добр бесплатно поделиться с миром своей уникальной книгой о фундаментальных вопросах в области современного машинного обучения, которая рассматривает и изучает вопросы создания эффективных архитектур для глубинного обучения. В книге рассматриваются 30 важных аспектов этой сферы в максимально доступной и понятной форме: каждый вопрос рассмотрен как небольшая, но интересная статья подобно тем, что мы читаем здесь, на Хабре. Отсутствие такой книги в русскоязычном сегменте - большое упущение, поэтому верю, что серия переводов этой книги будет полезна хабровчанам.

kirillbykov2 12 июл 2016 в 23:19

Сражаясь с БЭМ: 10 основных ошибок и как их избежать

13 мин

89K

CSS * HTML * JavaScript *

Перевод

Не важно, узнали ли вы о БЭМ только сейчас, или следите за ним с самого начала, вы, возможно, уже оценили столь полезную методологию. Если вы не знаете, что такое БЭМ, я рекомендую прочитать вам об этом на сайте БЭМ перед тем, как продолжить чтение этой статьи, потому что я буду использовать термины, которые предполагают базовое понимание этой CSS методологии.

Эта статья нацелена на людей, которые уже используют БЭМ и желают использовать его более эффективно, а также на тех, кто хочет узнать о нем больше.

Читать дальше →

+22

kirillbykov2 8 июл 2016 в 13:49

Улучшение путей взаимодействия пользователя (user flow) через переходы по странице

9 мин

18K

JavaScript * Клиентская оптимизация *

Из песочницы

Пост является переводом статьи "Improving User Flow Through Page Transitions" со Smashing Magazine о создании плавных переходов. Автор этой статьи, Луиджи Де Роза, является фронт-энд разработчиком в EPIC. Далее повествование будет идти от лица автора статьи. Приятного чтения.

Читать дальше →

+14

ML Q & AI. Глава 6. Уменьшение переобучения при помощи настройки моделей

ML Q & AI. Глава 5. Уменьшение переобучения при помощи данных

ML Q & AI. Глава 4. Гипотеза о лотерейном билете

ML Q & AI. Глава 3. Few-Shot Learning

ML Q & AI. Глава 2. Self-Supervised Learning

ML Q & AI. Глава 1. Эмбеддинги, латентные пространства и представления

Сражаясь с БЭМ: 10 основных ошибок и как их избежать

Улучшение путей взаимодействия пользователя (user flow) через переходы по странице

Информация

Специализация