Comments / Profile of barmaley

Уверенный пользователь ПК

barmaley_exe Feb 3 2015 at 13:22

За лучшими студентами мы в первую очередь обратились в ведущие физико-математические школы Санкт-Петербурга

Я сам не в теме, но вот есть же школы вроде ЛКШ, кажется там концентрация целевой аудитории максимальна, и именно там нужно «пиариться».

Look

Deep learning и Caffe на новогодних праздниках

barmaley_exe Jan 31 2015 at 13:48

Но при этом не указана архитектура сети

Зачем знать архитектуру сети? Все 3 операции (свёртка, pooling и нелинейное преобразование функцией активации) дифференцируемы, в том самом Стэнфордском туториале даже говорится, как их градиенты посчитать, а уж в каком порядке Вы накидаете этих операций — сугубо Ваше дело.

Можете ещё на черновик книги Y. Bengio, I. Goodfellow, A. Courville посмотреть.

Look

Когда данных действительно много: Vowpal Wabbit

barmaley_exe Jan 25 2015 at 19:24

Online Machine Learning (или активное обучение)

Active Learning это немного другое, там про то, что модель может попросить разметить какой-нибудь ранее неразмеченный пример. Онлайновость, конечно, будет только плюсом в данном случае.

Look

Как начать работу в Kaggle: руководство для новичков в Data Science

barmaley_exe Jan 21 2015 at 08:57

лучшие результаты сейчас показывают деревья решений

Для каких задач? Для некоторых современные нейросети работают очень хорошо.

Look

Искусство Feature Engineering в машинном обучении

barmaley_exe Jan 21 2015 at 08:36

А для речи какие данные используете?

Look

Искусство Feature Engineering в машинном обучении

barmaley_exe Jan 18 2015 at 11:34

word2vec хорошо сработал для рекомендательной системы для соцсетей

Вот про это было бы интересно узнать подробнее. Может статью напишете? Правильно ли я понимаю, что Вы ориентировались на статью Neural Word Embeddings as Implicit Matrix Factorization?

Ну и организацонные вопросы:
— Какие (даже, в каком количестве) вычислительные мощности исползовались?
— Какие данные использовали, как много их было?

Look

Искусство Feature Engineering в машинном обучении

barmaley_exe Jan 18 2015 at 07:55

Я, конечно же, в первую очередь имет в виду задачи обучения с учителем. И тут уж если один из признаков идеально кореллирует с ответом, то надо его вычислять или нет — дело десятое, а пользы от алгоритма, обученного на таком датасете — ноль.

Про преобразование признаков согласен. С другой стороны, настоящее изучение признаков о рассматриваемой сущности (например, человеке в задаче кредитного скоринга) машиной, мне кажется, потребует сильного ИИ, поскольку надо будет знать, какими признаками сущность может обладать, иметь какую-то (физическую) модель решаемой задачи чтобы отличать потенциально релевантные признаки (ведь цвет носков бабушки заёмщика не имеет никакого значения в этой задаче), а потом ещё пойти и как-то их достать, сохранив при этом задачу осмысленной (а не так, что сказать «для предсказания вероятности возвращения кредита мне нужна банковская история этого человека на 5 лет вперёд» или «для предсказания цены квартиры мне нужно знать среднюю цену в радиусе 1м»)

Look

Голова больше, чем мы думаем, а вселенная меньше

barmaley_exe Jan 18 2015 at 07:32

Одной лишь силой воли без физических / химических вмешательств? Круто тогда.

Look

Искусство Feature Engineering в машинном обучении

barmaley_exe Jan 18 2015 at 00:05

Например, алгоритм машинного обучения может выделить части лица на фотографии, но он не сможет сделать сам снимок, равно как и не сможет узнать имя, профессию и прочие данные о человеке.

Эээ, такие «ручные признаки» будут очевидно богаче Deep Learning'овых в плане количества содержащейся в них информации, посему как-то не очень хорошо эти понятия сравнивать. Так, знаете ли, и правильный ответ можно (target) можно в признаки включить, а потом обойтись тривиальным решающим правилом.

Свертка есть признак, как и свёрточные сети в целом. На них можно смотреть как на достаточно общие признаки (ручные, да) для большинства изображений (и других данный сигнальной природы).

Look

Голова больше, чем мы думаем, а вселенная меньше

barmaley_exe Jan 17 2015 at 22:18

А все Ваши части подчиняются Вашей воле? Можете силой воли остановить сердце на пару «тактов» или вбросить немного адреналина в кровь?

Мне кажется, что даже чисто ментальные аспекты (т.е. память, внутренний диалог, интуиция, что бы это ни значило) не целиком подвластны нашей воли (например, попробуйте ни о чём не думать минуту).

Look

Искусство Feature Engineering в машинном обучении

barmaley_exe Jan 17 2015 at 17:37

А что Вы понимаете под признаками? Никто не мешает взять сырые данные (пиксели, например) в качестве признаков. Другое дело, что (в большинстве случаев) осмысленности в таких признаках нет, ибо не было никакой попытки преодолеть "семантический разрыв". С другой стороны, с небольшой предобработкой (вроде нормализации контраста, выделения региона для классификации, бинаризации) для некоторых задач (MNIST, например) даже такие признаки сгодятся для получения «положительного» качества.

Для натуральных (естественных) изображений вроде фотографий всё, конечно, гораздо сложнее. И тут, да, методы DL пока что являются State of the Art.

Look

Искусство Feature Engineering в машинном обучении

barmaley_exe Jan 17 2015 at 16:31

А есть примеры применения Deep Learning вне аудио, видео, картинок и текста? Я вижу все эти области как характеризующиеся тем, что у них есть иерархическая скрутура, когда из низкоуровневыевых признаков собираются высокоуровневые (например, машина «собирается» из колёс, дверей и корпуса, которые, в свою очередь, собираются из различной причудливости контуров).

В задачах же, вроде оценки стомости дома, кажется, просто нет такой иерархической структуры, что сводит на нет все плюсы DL.

Look

Студенческие школы в образовании

barmaley_exe Jan 15 2015 at 12:54

title картинки говорит «Summer School on Complexity Theory (2009)», так что да, пять.

Look

Вероятностное программирование

barmaley_exe Jan 8 2015 at 07:25

Тут, видимо, затесалась терминологическая неточность.

Есть 2 (эквивалентных) способа определить функционал максимального правдоподобия для логистической регрессии (правда, ни в EoSL, ни в PRML второй не упоминается, а в MLAPP только мельком). В одном случае таргеты можно интерпретировать как огрублённые вероятности класса 1 (т.е. y ∈ {0, 1}), а в другом — как метки класса (y ∈ {-1, +1}). В первом MLE приводит нас к настойщей кросс-энтропии в качестве функции потерь, а второй — к той, о которой я писал выше (она же, видимо, используется в статье, на которой основан алгоритм из sklearn).

Так что да, использовать sklearn никак не получится.

Look

Вероятностное программирование

barmaley_exe Jan 7 2015 at 20:13

Мда, что за бред я несу… Регуляризация тут ни при чём.

Look

Вероятностное программирование

barmaley_exe Jan 7 2015 at 20:07

Известную мне логистическую регрессию, где модельная вероятность задаётся как

, можно расширить на вероятностный случай заменив y_i на 2 p(y_i=1) — 1

Тогда

Тогда пары (z_i, sign(2 p(y_i=1) — 1)) дадут датасет, готовый к применению в обычной логистической регрессии.

UPD: Правда, тут не учитываются негативные эффекты от регуляризации, без которой результат вообще был бы идентичен дискретному случаю y = ±1.

Look

Вероятностное программирование

barmaley_exe Jan 7 2015 at 19:22

А почему бы для такой хитрой логистической регрессии просто вектор признаков на соответствующую константу (зависящую от target'а) не домножнить?

Look

Сортировка на односвязном списке за O(nlogn) времени в худшем случае с O(1) дополнительной памяти

barmaley_exe Jan 6 2015 at 22:57

Из университетской сети мне показывают полную статью. Неуниверситетского интернета рядом не оказалось, попробовал зайти туда с машинки в Германии — показали полный текст. А так, в интернете, видимо, так просто этот текст не найти.

В самом алгоритме я пока особо не разбирался, лишь мельком посмотрел на описание и попробовал провести параллели с вышеизложенной версией.

Look

Сортировка на односвязном списке за O(nlogn) времени в худшем случае с O(1) дополнительной памяти

barmaley_exe Jan 6 2015 at 22:03

Первоисточник идеи неизвестен, гугл по этому поводу по большей части молчит

По запросу quicksort without stack мне гугл выдал интересную статью Quicksort without a stack, где в довольно странно выглядящей статье (1986 года) описывается очень похожий алгоритм.

Правда, кажется, тот алгоритм лучше в виду отсутствия необходимости искать максимумы в блоках. В самом деле, если включить pivot в левый от него блок, подлежащий сортировке, то он и будет наибольшим.

Look

Специалисту удалось получить отпечаток пальца министра обороны Германии по фотографии

barmaley_exe Jan 4 2015 at 23:54

Доклад не смотрел, но не вижу ответа на простой вопрос: как он протестировал результат? Методом пристального взгляда?

+10

Look

1 2 ...

7 8

10 11 ...

32 33