такие вакансии тоже вряд ли стоит рассматривать всерьёз, только если они не обещают платить нормальную или хорошую зарплату. То, что они поленились потратить 10 минут времени чтобы написать нормальные требования, тоже говорит о вакансии
одним из примеров, может быть маленький датасет, до 100 объектов, с огромным количеством признаков. Есть много задач, например, в Health Sciences где из-за вопросов этики и сложности сбора данных просто невозможно собрать много данных. Сомневаюсь что нейронки покажут приемлемый результат на выборках меньше 100 объектов, а SVM, при правильной настройке, выдаст вполне неплохие результаты. Он на это и был нацелен, чтобы хорошо генерализоваться на маленьких датасетах с огромным количеством признаков.
Вы правы, я исправил статью, добавив более детальное описание. Ответ на ваш вопрос приведен ниже.
Если задать уровень гаммы слишком высоким, тогда в процессе принятия решения о расположении линии будут учавствовать только самые близкие к линии элементы. Это поможет игнорировать выбросы в данных. Алгоритм SVM устроен таким образом, что точки расположенные наиболее близко относительно друг друга имеют больший вес при принятии решения. Однако при правильной настройке «C» и «gamma» можно добиться оптимального результата, который построит более линейную гиперплоскость игнорирующую выбросы, и следовательно, более генерализуемую.
Теоретический смысл в настройке степени «реагируемости» модели к выбросам. Но, этим он не ограничивается.
Согласен. Я никак не хотел устраивать холивар. Для каждого алгоритма есть определенная задача, которую он решает лучше всего. Есть задачи, для решения которых, лучше всего использовать SVM, ввиду ряда факторов, вроде вычислительной простоты SVM относительно нейронок, например. Проще говоря, нет абсолютно «идеального» алгоритма, как и идеального ЯП: каждый рассчитан на решение определенного ряда задач.
«Машинное обучение» тут в том, что алгоритм обучаясь на обучающей выборке, строит такую гиперплоскость, которая бы в дальнейшем помогала классифицировать, если это задача классификации, ранее неизвестный объект по заданным признакам.
Да, полностью согласен. Но когда ты проходишь это задание в реальном времени, и понимаешь что от этого зависит то, где ты проведешь как минимум одно лето, включается мандраж.
На чем решали?
Вывод сразу сделать не получится никак, так как сначала нужно считать все значения чтобы узнать что из себя представляет 100%. Вы, кажется, не совсем поняли условие задания.
Теоретический смысл в настройке степени «реагируемости» модели к выбросам. Но, этим он не ограничивается.
На второй вопрос детальный ответ здесь
На чем решали?
До ЕГЭ я не доберусь) у нас его нет.
А как бы вы решили эту задачу?