Pull to refresh
79
0
Лаида Кушнарева @tech_priestess

Machine Learning Researcher

Send message

Действительно, по умолчанию в sklearn включается быстрая модификация t-SNE ("barnes_hut"), которая работает только для маленького количества измерений. Однако, можно заменить её на стандартную и получить сколько угодно измерений на выходе, если сменить параметр method на "exact", в духе

big_TSNE = TSNE(

        n_components=10,

        method="exact"

    )

Прикольно, не знала о таком способе

Спасибо за ответ и интерес! К сожалению, не встречала курса по ML в таком формате. Создание такого курса требовало бы много усилий и креативности от создателей.
Под "обучением с нуля" в статье действительно имеется в виду, что возможно обучение с нуля, но понятное дело, что при этом потребуется много усилий и времени.
Чтобы стало чуть более понятно, зачем нужны векторы или мат.анализ, можно забежать немного вперед и посмотреть, например, плейлист 3blue1brown с объяснениями того, что такое нейросети: https://www.youtube.com/watch?v=aircAruvnKk&list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi&ab_channel=3Blue1Brown .
Также можно пробовать забежать еще вперед и попробовать посмотреть лекции и порешать задачи из DL School https://stepik.org/course/124070 - фокус этого курса идет именно на прикладные задачи в Deep Learning. Но без математики быстро станет слишком сложно, и придется опять вернуться к векторам.

Если новички с места в карьер начнут учить ВСЮ математику, которая хоть как-то связана с машинным обучением, то есть большой риск никогда не закончить и попросту забросить всё это дело навсегда. Поэтому я обозначила только самые необходимые области, зная которые, можно уже потихоньку начинать работать. Если же в процессе работы появится необходимость изучать другие области - это можно будет делать по ходу дела, основываясь на базе из линала, матана и матстата.

Действительно, определения пока не очень четко сформировались и используются разными людьми по-разному. Но обычно имеется в виду что-то вроде следующего:

- Deep Learning, DL - все, что связано с глубокими нейросетями;
- Machine Learning, ML - все, что связано в принципе с самообучающимися алгоритмами, включая нейросети, но не ограничиваясь ими;
- Для того, чтобы выделить в отдельный класс именно "неглубокие" самообучающиеся алгоритмы - т.е. чтобы назвать отдельным словом ML без DL, иногда используется отдельный термин вроде "Классический ML" (также "shallow ML", "shallow learning" и тому подобное).

Все вышесказанное также в общих чертах написано в статье, в начале раздела "2. Классическое машинное обучение".

- AI - самый размытый термин, под ним подразумевают буквально всё, что угодно, что выглядит как что-то "умное".

3blue1brown - да, это в чистом виде доп.материал, не основа. Но khanacademy, на мой взгляд, все же может дать какую-то базу, там есть и упражнения с подробным объяснением, и какая-то выстроенная программа, зачастую повторяющая университетский курс в очень облегченном варианте, который как раз больше подходит для занятых взрослых людей, которые учатся самостоятельно.

За ссылку спасибо!

Смотря что считать "нейросетью маленькой размерности". Если включать сюда линейную и логистическую регрессию, тогда с натяжкой можно так сказать. Но обычно под классическим машинным обучением как раз подразумевают не-нейросетевые методы.

Первое ваше замечание верное. В конце статьи (то есть, в послесловии) я написала о том, что освоение материалов, рекомендованных в статье, займет в реальности довольно много времени и халявы тут лучше не ждать. По одной легенде, ещё Евклид говорил, что в геометрии нет царских путей, в данной ситуации это тоже применимо. :)

Про разные "нули" в конце статьи тоже упомянуто.

Но касательно заголовка я все же не соглашусь. Я долго думала, как можно назвать эту статью, и такой заголовок показался мне наиболее ёмко отражающим её суть. Нигде не сказано, что путь с нуля за ноль рублей должен быть лёгким.

Насколько я смогла понять из предисловия, основной текст книги был написан даже не в 2006, а в 1998 году, а в 2006 она только докатилась до России. Соответственно, и по содержанию книга выглядит на данный момент серьезно устаревшей. Может быть, она может быть полезной в каком-то очень специфическом случае, но новичкам я бы посоветовала почитать что-то посовременнее.

Картинка взята из доклада, который можно посмотреть по ссылке в описании картинки. Автор доклада действительно имел в виду девопса как часть команд, которые работают с данными и алгоритмами машинного обучения. Я бы это назвала, скорее, MLOps, но не стала портить картинку своим исправлением. Ну, а Data scientist в его терминологии - это зонтичный термин, под который попадают все специализации на картинке. Доклад очень хороший, советую посмотреть (добавлю эти слова к описанию рис. 1)

Спасибо за рассказ! А обучение нейронным сетям вы забросили или нашли другой, хороший курс, лекции или книгу, по которым продолжили учиться?

Я бы не сказала, что это в принципе профанация. Люди же как-то учатся работать в этой области, в том числе, например, в нее нередко переходят программисты или математики, которые не изучали машинное обучение как основную специальность в универитете, а доучивались самостоятельно, в том числе и по разным курсам.
Другое дело, что, действительно, это занимает время, и нужно преодолеть входной барьер в виде понимания основ программирования и некоторых разделов математики (мат.анализ, лин.алгебра, мат.статистика). Эти знания можно спокойно получить из бесплатных источников, но сколько на самом деле времени это займет, зависит от учащегося, его изначального уровня и свободного времени, которое он готов инвестировать.
Поэтому курсам, которые что-то гарантируют за какое-то короткое время я бы, конечно, не доверяла.
Я сама математику и программирование изучила в универе, а вот нейросети уже - по совокупности небольшого спецкурса, лекций Воронцова и курсу Andrew Ng - за который, конечно же, ничего не платила и который тоже упомяну в обзоре с бесплатными обучающими материалами, когда соберусь написать.

Как называются? Давайте посмотрю и добавлю в будущий обзор, если хорошие. Пока что со stepik я более-менее внимательно смотрела только Deep Learning School.

Information

Rating
Does not participate
Registered
Activity

Specialization

Data Scientist, Machine Learning Engineer
Research work
Machine learning
Natural language processing
Python
C++