Комментарии 6
Спасибо, полезно! Особенно приятно, что к терминам прилагаются их английские названия!
Мне понравилась статья. Хорошо, что объяснили главные термины и где они применяются.
Спасибо за статью! Хотелось бы побольше узнать про методы выявления аномалий. Жду продолжения!
Спасибо! Очень ждем продолжения с примерами! Такие статьи нужны!
Все задачи, решаемые с помощью ML, относятся к одной из следующих категорий.
А, допустим, машинный перевод, это какой класс?
Все задачи, решаемые с помощью ML, относятся к одной из следующих категорий.
Как вам указали раньше, sequence2sequence, например, в вашу категоризацию не попадает. Как и не попадает большинство генеративных моделей или, к примеру, ранжирование.
При этом задача выявления аномалий зачастую конечной задачей как раз не является — она обычно формализуется через другие задачи.
качество вина при слепом тестировании
Такое удобно формализовать бинарной классификацией или ранкингом, а не регрессией.
Задача кластеризации – распределение данных на группы: разделение всех клиентов мобильного оператора по уровню платёжеспособности, отнесение космических объектов к той или иной категории (планета, звёзда, чёрная дыра и т. п.).
Описать кластеризацию и привести в качестве примера классификацию — это фиаско. Вам бы основы подучить перед написанием гайдов.
Различие лишь в том, что при обучении с учителем есть ряд гипотез, которые необходимо опровергнуть или подтвердить.
Откуда вы эту чушь взяли?
Основные алгоритмы моделей машинного обучения
За этот раздел вообще двойка. Вы мешаете в кучу модели (например, логрег) и алгоритмы построения моделей (МНК), пишете про деревья решений, но описываете не ML-алгоритм, а бизнес-метод с аналогичным названием, и даже не упоминаете про то, что отдельные деревья сейчас никто не использует (повсюду используют ансамбли).
Я уж не говорю про Naive Bayes, который вы явно вытащили из какого-то туториала для начинающих, потому что если бы вы были практикующим ML-инженером, вы бы понимали, что его никто не использует в реальности для упомянутых вами определения спама, рубрикации и тем более распознавания лиц. То же самое касается SVM. Учите матчасть, прежде чем пытаться учить других.
Кластеризировать объекты можно по разным алгоритмам. Чаще всего используют следующие:
… И дальше идет список из случайных бессвязных слов, часть из которых — надмозговой перевод реальных алгоритмов, а часть родилась на задворках сознания автора.
Последний раздел читать не стал, пожалел свою психику. Не пишите, пожалуйста, ничего больше, пока сами не поработаете в ML хотя бы годика два.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Введение в машинное обучение