Pull to refresh
68.49
ITMO
IT's MOre than a University

Список ресурсов по машинному обучению. Часть 1

Reading time 3 min
Views 29K
Original author: ujjwalkarn


Ранее мы говорили о разработке системы квантовой связи и о том, как из простых студентов готовят продвинутых программистов. Сегодня мы решилие еще раз (1, 2) взглянуть в сторону темы машинного обучения и привести адаптированную (источник) подборку полезных материалов, обсуждавшихся на Stack Overflow и Stack Exchange.

Генетические алгоритмы

  • SO: генетические алгоритмы и искусственные нейронные сети;
  • SO: генетические алгоритмы и генетическое программирование;

Классификация

  • SO: когда выбирать классификатор;

Линейная регрессия

  • SE: что такое одинаковая дисперсия ошибок модели линейной регрессии;
  • SE: в чем разница между линейной регрессией y на x и линейной регрессией x на y;
  • SE: интерпретация plot.lm() в R;
  • SE: интерпретация графика квантиль-квантиль;
  • SE: интерпретация графиков Residuals vs Fitted;
  • SE: как обрабатывать аномальные значения;

Логистическая регрессия

  • SE: получение предсказанных значений Y;
  • SE: остатки в логистической регрессии;
  • SE: различия между логистической регрессией и пробит-регрессией;
  • SE: псевдо R-квадрат и логистическая регрессия;
  • SE: как вычислить псевдо R-квадрат;

Проверка модели с помощью повторной выборки

  • SE: разделение набора данных в R;
  • SE: оценка c расщеплением выборки в R;
  • SE: обучение с полным набором данных после перекрестной проверки;
  • SE: самый лучший метод перекрестной проверки;
  • SE: оценка дисперсии при перекрестной проверке по k-блокам;
  • SE: может ли перекрестная проверка заменить контрольную выборку;
  • SE: выбор количества блоков при перекрестной проверке по k-блокам;
  • SE: перекрестная проверка для композиционного обучения;
  • SE: как перекрестная проверка решает проблему переобучения;
  • SE: почему работает бутстрэп;
  • SE: статистический бутстрэп для выбора и оценки модели;
  • SE: использование перекрестной проверки и бустрэпа для оценки ошибки предсказания;
  • SE: что использовать для оценки эффективности классификации – перекрестную проверку или бутстрэп;
  • SO: перекрестная проверка по k-блокам в R;

Глубокое обучение

  • SO: в чем разница между тренировочными, проверочными и тестовыми наборами данных;
  • SO: руководство по созданию нейронных сетей;
  • SO: FAQ по нейронным сетям;

Нейронные сети прямого распространения

  • SO: роль смещений в нейронных сетях;
  • SO: выбираем количество скрытых слоев и узлов;
  • SO: выбираем количество скрытых слоев и узлов;
  • SO: выбираем количество скрытых слоев и узлов;
  • SO: простая реализация нейронной сети;

Обработка естественного языка

  • SE: alpha и beta в ЛРД;
  • SO: кластеризация строк;
  • SO: кластеризация текста с использованием расстояния Левенштейна;

Метод опорных векторов

  • SE: самые популярные вопросы о методе опорных векторов;
  • SE: что такое метод опорных векторов;
  • SE: принципы метода опорных векторов;
  • SE: сравнение метода опорных векторов и деревьев классификации;
  • SE: метод опорных векторов и логистическая регрессия;
  • SE: сравнение метода опорных векторов и логистической регрессии;
  • SE: когда использовать метод опорных векторов, а когда логистическую регрессию;
  • SE: в чем разница между методом опорных векторов и логистической регрессией;
  • SE: оценка важности переменных в методе опорных векторов;
  • SE: зачем нужно шкалирование по Платту;
  • SO: в каком случае метод опорных векторов оказывается лучше нейронных сетей;
  • SO: сравнение метода опорных векторов и нейронных сетей;

Деревья решений

  • SE: слабая сторона деревьев решений;
  • SE: как алгоритмы обучения на основе деревьев решений обрабатывают недостающие значения;
  • SE: деревья решений практически всегда являются бинарными, так ли это;
  • SE: что такое отклонение;
  • SO: сравнение алгоритмов реализации деревьев решений по сложности или производительности;
  • SO: «обрезка» ветвей деревьев в R;
  • SO: как извлечь структуру дерева из функции ctree;
  • SO: какова энтропия и объем получаемой информации при построении деревьев решений;

Случайный лес

  • SE: оценка важности переменных в случайных лесах;
  • SE: сравнение значения R-квадрат двух моделей случайного леса;
  • SE: почему случайный лес не обрабатывает отсутствующие значения в предсказателях;
  • SE: извлекаем данные из алгоритма случайного леса;
  • SE: вопросы по реализации случайного леса на R;
  • SO: реализация случайного леса на R;
  • SO: вопросы по реализации случайного леса на R;

Алгоритмы бустинга деревьев

  • SE: глубина дерева;
  • SE: параметр n.minobsinnode в R;

Композиционное обучение

  • SE: композиционные модели с caret;
  • SE: бэггинг, бустинг, стэкинг;
  • SE: материалы по реализации методов композиционного обучения;

Размерность Вапника — Червоненкиса

  • SE: методы композиционного обучения повышают размерность Вапника – Червоненкиса;

[Часть 2]
Tags:
Hubs:
+23
Comments 0
Comments Leave a comment

Articles

Information

Website
en.itmo.ru
Registered
Founded
Employees
Unknown
Location
Россия
Representative
itmo