Как стать автором
Обновить

Полезные материалы по Data Science и машинному обучению, которые помогут пройти сквозь джунгли из терминов

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров24K
Всего голосов 59: ↑59 и ↓0+59
Комментарии15

Комментарии 15

А почему не указали численные методы, исследование операций?

Например исследования Рунге и Кутта в том числе про рост ошибки вычислений или про интерполяцию и экстраполяцию. Тот же симплекс метод, позволяющий очень хорошо оптимизировать и т.д. А ряды Тейлора? Преобразование Адамара, Фурье спектр?

Или теоремы про вычеты конформной функции или...

Да тут нет и половины того, что нужно для правильного прикладывания математики к реальности

Доброго времени суток!

Для правильного прикладывания  математики к реальности здесь нет вообще очень много чего, поскольку "правильное прикладывание  математики к реальности" - довольно широкая тема.

Тема данной статьи была немного более узкой и конкретной.

Если у вас есть ссылки на бесплатные и толковые курсы/статьи/книги/лекции/прочие материалы на обозначенные вами темы, поделитесь ими пожалуйста, я с удовольствием с ними ознакомлюсь!)))

Это не про широту исследования. Одна из работ Рунге и Кутта была про точность вычислений. Т.е. на каждом шаге вычислений накапливается ошибка и еë нужно знать. Сейчас точность чисел в ЭВМ весьма приличная, но и шагов много, гораздо больше. Разрядов меньше - скорость больше - точность хуже.

И вот этот простой аспект, очень узкий никак и нигде не ни на каких курсах не изучается.

Это как пример узкого очень вопроса, но таких узких так много, что в совокупности они шире самого курса.

Я уж не стану вспоминать, что использование float тоже чревато, если не понимать форму хранения.

Я согласен с такими опасениями. Но важно понимать, что современные инструменты DataScience позволяют избежать ошибок, даже не особо разбираясь в вопросе. К слову, вот отличная статья о том, что каждый DataScientist должен знать о вопросе, который Вы затронули - https://diybigdata.net/2016/07/data-science-and-floating-point-arithmetic/ - и там прямо указывается, что в том же Питоне есть средства коррекции этих ошибок встроенные. В кишках numpy/scikit/pandas не копался, но ЕМНИП там это тоже встроено по умолчанию. Поэтому данная тема особо прям на курсах и не изучается.

"Одна из работ" - какая именно?)) Поделитесь пожалуйста или хотя бы скажите название работы, чтобы можно было ее найти и почитать.

Тема действительно довольно интересная и я пока что не сталкивался с ней в курсах, имеющихся в свободном доступе.

Можно, конечно, посмотреть лекцию типа вот такой, но круто было бы почитать первоисточник.

Первоисточник вряд ли найду сейчас.

Это по памяти, я точно помню лекцию, где определяли разрядность расчетов, десятичных!!, так как Рунге и Кутта считали еще на арифмометрах.

спасибо за признание, что решили задачу только со 117 попытки. Стало любопытно, какой же там ответ)

На самом деле там задача-то не очень сложная))

Просто правда нужно было пропустить ее и идти дальше))

Если бы я так сделал, то сэкономил бы себе много времени, сил и нервов))

Статья интересная и полезная, спасибо автору.

Пожалуйста!))

Порекомендовал бы чисто от себя курсы на Coursera от IBM по DataScience, вполне себе очень даже неплохой!

Ну да, тоже норм вариант))

На ютюбчике у IBM тоже есть небольшая подборка по AI Essentials.

Можно начать с нее, а потом пойти на их специализацию на Coursera.

За подборку спасибо, но с ресурсами для обучения не согласен: есть более крутые курсы, в которых придётся реализовывать весь ML с нуля на питоне, например, как в курсах Andrew NG, а по математике есть mathprofi и канал the bright sight of mathematics, где объяснение гораздо круче.

К сожалению, курсы по ML на степике очень поверхностные: да, вам дадут формулы и покажут как писать fit/predict в sklearn, но ни доказательства формул, ни реализации алгоритмов вручную там нет, а юзать алгоритмы как магию без понимания их сути изнутри - просто путь в никуда. Такая же проблема и с mlcourse от ODS.

Не подскажете, пожалуйста, курс для новичков от Andrew NG?

Кстати, я сейчас прохожу один из курсов на Степике, как вы и упомянули, да, он действительно очень простой, но идеален для новичков. Самое то для входа.

Что там идеального в курсах на степике? Если я вас попрошу реализовать дерево решений CART или XGBoost, или хотя бы регрессию с нуля на питоне, вы сделаете это? Никогда, если не пройдете нормальные курсы и не прочитаете норм литературу.

На русском есть mlcourse и хендбуки от яндекса, но это всё шляпа.

Для старта есть курс по ML Andrew NG на курсере и 2 книги: 'introduction to statistical learning' и 'hands-on machine learning'. К сожалению, даже в этих материалах не всегда хватает инфы по реализации, поэтому придётся ещё много чего гуглить.

Изучая ML, про русский язык стоит забыть вообще: тут вас никто ничему не научит, увы - только топовые курсы и книги от топовых компаний и универов, а это всё исключительно на английском.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий