Invision Sep 29 2010 at 16:20

Классификация данных методом опорных векторов

4 min

152K

Data Mining*

From sandbox

+74

Comments 27

sgzmd Sep 29 2010 at 18:08

Хороший, годный пост на хорошую, правильную тему.

Invision Sep 29 2010 at 19:48

Спасибо!

UFO landed and left these words here

dufft Sep 29 2010 at 19:26

«Задача классификации (или, как ее иногда называют, задача кластеризации)»

Есть разница. При классификации набор классов задан с самого начала, по-моему.

Invision Sep 29 2010 at 19:47

Вы правы, при классификации классы почти всегда известны изначально. Однако же, не всегда.

UFO landed and left these words here

Invision Sep 29 2010 at 20:24

Поправил, спасибо за уточнение.

chupvl Jan 16 2011 at 00:47

В Desicion trees совсем другой алгоритм и совсем другие задачи, поэтому нельзя утверждать что они используются только для классификации, так же как и SVM может использоваться для многих задач: классификации, кластеризации, предсказания свойства

albedo Sep 29 2010 at 19:29

Вот тут www.csie.ntu.edu.tw/~cjlin/libsvm/ есть практический пример и демо

Invision Sep 29 2010 at 20:44

Вроде бы у них на сайте были еще разные интересные data sets для тестирования классификатора.

UFO landed and left these words here

Invision Sep 29 2010 at 20:42

Я еще планирую про классификатор RVM (Relevance Vector Machine) написать. А после этого можно и обзорно-сравнивающую статью сделать.

Indalo Sep 30 2010 at 03:03

Про RVM было бы интересно. В целом +1.

multik Sep 30 2010 at 07:15

А где видео?

Invision Sep 30 2010 at 07:20

Наверное, браузер по каким-то причинам не отображает. Оригинальная ссылка вот.

multik Sep 30 2010 at 07:29

Спасибо. Теперь кстати и браузер отображает.

lightcaster Sep 30 2010 at 08:11

Автору плюс. Скажите, а есть ли какие-нибудь критерии выбора ядра. Я имею ввиду какие-либо аналитические методы. Или только на-глаз?

lightcaster Sep 30 2010 at 09:11

Кстати, на твиттере промелькнуло: 25 типов kernel-функций.

Invision Sep 30 2010 at 09:21

Интересно, надо сохранить на будущее :)
Я не встречал нормальных работающих методов для выбора ядра. Видел лишь пару статей на тему «имеется конкретное ядро с какими-то параметрами. Как выбрать эти параметры наилучшим способом для уменьшения ошибки классификации.»

xsway Oct 2 2010 at 20:16

Если бы еще и kernel можно было всегда выбрать просто все бы задачи по классификации были бы уже решены) Не бывает универсального классификатора к сожалению. Так что kernel функцию придется всегда выбирать в зависимости от задачи. В целом если feature space уже изначально досточно большой обычно используется линейный kernel (что логично).

Когда изучала данную тему мне очень помогли слайды from Andrew Moore www.autonlab.org/tutorials/
(может не самые стильные зато доступные — вообще рекомендую)

Invision Oct 3 2010 at 08:09

Ага, no free lunch theorem :)
Посмотрел слайды, неплохо написано. И многие интересные темы освещены.

rotor Sep 30 2010 at 11:48

Насколько мне известно, некоторые дополнительные материалы по теме можно найти, например, в книге Фукунга К. «Введение в статистическую теорию распознавания образов».
Статья хорошая. Статистические методы распознавания сейчас нередко игнорируются в пользу нейронных сетей, а это не всегда правильно.

Invision Sep 30 2010 at 12:01

Спасибо за ссылку, обязательно гляну.
Да, мне тоже не всегда нравятся нейронные сети :)

chupvl Jan 16 2011 at 00:49

Не blackbox единым…

Terminal May 24 2012 at 14:10

Самая главная статья это В.М. Вапник «The Nature of Statistical Learning Theory»

Terminal May 24 2012 at 14:10

точнее книга

Terminal May 24 2012 at 14:07

Только вот в перечислении ядер зачем-то отделено Гауссово ядро от ядра на основе радиально-базисной функции, хотя они эквивалентны. Пруфлинк