AlfaTeam 21 дек 2022 в 16:50

Подкасты, книги, курс: подборка интересного по Data Science

Простой

5 мин

6.7K

Блог компании Альфа-БанкBig Data*Машинное обучение*Data Engineering*

Обзор

«Роман с Data Science. Как монетизировать большие данные», Роман Зыков

Эта достаточно лёгкая книга, зайдёт в перерывах между чтением жесткого технического чтива или написания кода.

Заголовок явно намекает, что в книге будет не такой большой упор на применяемые технологии и задачи, ведь непосредственно к данным мы подбираемся где-то к главе пятой. Здесь больше упора на интересы бизнеса, менеджерские процессы, работу с командой или собственное развитие.

Но не думайте, что в книге только «мотивационная и менеджерская вода». Совсем нет. Например, вот иллюстрация из главы про MapReduce.

«Считается, что нужно потратить 10 000 часов, чтобы стать очень хорошим специалистом в своей области. Популярное заблуждение. Можно и сто тысяч часов потратить и не стать высококвалифицированным профессионалом. Важно как именно время потрачено, а количество вторично»
«Роман с Data Science. Как монетизировать большие данные», Роман Зыков

На роман вы потратите гораздо меньше времени, но оно уйдёт не зря.

Безгин Алексей

Стажер, Лаборатория машинного обучения Альфа-Банка

The Signal and the Noise: Why So Many Predictions Fail, Nate Silver

На русском называется «Сигнал и Шум: почему многие предсказания сбываются, а другие нет»

Книга написана достаточно просто и понятно. Автор рассказывает о своих исследованиях в области статистики и теории вероятности, которые охватывают различные области человеческой деятельности: спорт, политику и даже прогноз погоды.

Алексей Фирстов

Специалист, Лаборатория машинного обучения Альфа-Банка

«В книге Нейта Сильвера подробно рассказывается о теоретических предпосылках, которые позволили менеджеру “Атлетик” без достаточного финансирования сколотить команду мирового уровня, пользуясь только математикой и любовью к бейсболу. Об этом потом сняли замечательный фильм “Человек, которые изменил все” с Брэдом Питтом»

Написано просто и понятно, но приготовьтесь к долгому и обстоятельному погружению — примерно с 15 века:

«По сути, революция в области информационных технологий совершилась благодаря печатному прессу, а вовсе не микрочипу. Изобретение Иоганна Гутенберга, сделанное им в 1440 г., позволило информации стать доступной широким массам людей, а возникший в результате этого взрыв новых идей привел к неожиданным последствиям и непредсказуемым эффектам»
«Сигнал и Шум: почему многие предсказания сбываются, а другие нет», Нэйт Сильвер.

Никто не ожидал, но вот рандомный факт о книге. Ещё вы узнаете, почему полвека назад прогноз дождя был бинарным событием (либо да, либо нет), а сейчас на фразу «Завтра будет дождь с вероятность 78%» вы даже внимания не обратите. Уже так привычно.

Machine Learning Podcast

Делимся ссылкой на Яндекс.Музыку, но на других платформах подкаст тоже есть.

Machine Learning Podcast позиционирует себя как хаб-знаний, созданный «неспециалистом для неспециалистов». Однако, его можно порекомендовать для накопления технологической насмотренности. Пока едете на учёбу, на работу, в гости или в аэропорт можно послушать про SOTA-подходы к решению многих задач, крутые архитектуры или интервью с профессионалами своего дела, вроде Юры Яровикова или Валеры Бабушкина.

Безгин Алексей

Стажер, Лаборатория машинного обучения Альфа-Банка

«Мой любимый эпизод — выпуск с Иваном Ямщиковым (Yandex & HSE) про архитектуру автоэнкодеров. Некоторые серии подкаста достаточно длинные, но можно слушать их не только в дороге, но и занимаясь делами по дому, на пробежке и в целом везде, где угодно»

SuperDataScience

Раз уж коснулись подкастов, то вот еще один — SuperDataScience. ~~Над названием, видимо, долго не думали:)~~

Алексей Фирстов

Специалист, Лаборатория машинного обучения Альфа-Банка

«Крутой подкаст с очень крутыми гостями, выходит на английском языке. В подкасте гости из топовых компаний рассказывают о своих успехах и неудачах, о том, как они находят по 40 часов в сутках и конечно делятся интересными инсайтами из сферы ИИ. Очень хорошо заходит по дороге на работу, при прогулке и поездке в метро? Уровень гостей, как правило, достаточно высокий, поэтому и английский там очень понятный, без проглатывания кучи слов и звуков, рекомендую»

Курс Deep Learning For Computer Vision EECS 498.008 / 598.008

Подкасты были, теперь курс.

При этом он универсальный: если вы только начинаете изучать Deep Learning или думаете что уже все понимаете в деталях — изучите этот курс, вас ждут большие открытия.

Алексей Фирстов

Специалист, Лаборатория машинного обучения Альфа-Банка

«За 10 лет образования в ВУЗе я видел много хороших лекторов, но Джастин Джонсон (да, он ушел из Стенфорда и больше не преподает cs231n) это следующий уровень, а его презентации к лекциям помогут понять даже самые сложные вещи. Несмотря на название, это больше про general dl, тут расскажут про все архитектуры, техники обучения и дадут ссылки на статьи мирового класса в DL.
А если Вы думаете, что уже большой профессионал — попробуйте порешать их домашки, я думаю мало кто сходу сможет написать и простенький AlexNet, без импорта TF или PyTorch, прописывая forward-backward самостоятельно (да, придется вспомнить математику)»

Программу курса 2022 года можно посмотреть на этой странице. Если сомневаетесь — вот страница с программой, материалами лекций и слайдами еще первого курса 2015-го года.

Deep Learning, Ian Goodfellow and Yoshua Bengio and Aaron Courville

Закончим книгой. Если будете читать её одновременно с предыдущим курсом — получится мощное комбо.

Написанная в период бума глубокого обучения отцами современного ИИ, эта классическая книга успела возрастить уже не одно поколение дата сайентистов. Не стоит переживать из-за ее дедушкинскинского (по стандартам ДЛ) возраста: книга сугубо теоретическая, и содержит детально проработанные описания фундаментальных техник глубокого обучения, которые повсеместно используются и в сегодняшней практике, а также большое количество важных сопроводительных тем, таких как оптимизация и дизайн систем.

Есть как в печатном вариант, так и в бесплатном виде на официальном сайте.

Несмотря на большую глубину материала, он все равно остается лёгким для чтения, однако от читателя требуется некоторая степень математической зрелости и базовые знания в классическом машинном обучении.

Например, чтобы вспомнить линейную алгебру или теорию вероятности из первой главы.

Помогают в чтении примеры, графики и схемы.

Олег Сидоршин

Стажер, Лаборатория машинного обучения Альфа-Банка

«Учитывая теоретический характер книги, я советую использовать её вместе с практическими курсами для углубления понимания применяемых техник. Также эта книга сможет стать отличным первым путешествием в исследовательскую сторону МЛ!
Из недостатков стоит отметить большую любовь авторов к статистике. Из-за этого регулярно происходят попытки сложно и долго впихнуть в статистический фреймворк техники, которые обычно через него не рассматриваются. Это только запутывает читателя: видим статистику — значит читаем осторожно :)»

На этом всё — поделитесь в комментариях, было ли полезно, и чем ещё можно было бы дополнить наш список:)

Статьи, которые могут быть интересны:

Подписывайтесь на Телеграм-канал Alfa Digital — там мы постим новости, опросы, видео с митапов, краткие выжимки из статей, иногда шутим.

Подписывайтесь на Телеграм-канал автора статьи. Делюсь многолетним опытом работы IT-редактора: советы, истории, практики, байки. Иногда несмешно шучу. Иногда смешно. Заходите, если ваша работа связана с текстами.

Теги:

Хабы:

Подкасты, книги, курс: подборка интересного по Data Science

«Роман с Data Science. Как монетизировать большие данные», Роман Зыков

Безгин Алексей

The Signal and the Noise: Why So Many Predictions Fail, Nate Silver

Алексей Фирстов

Machine Learning Podcast

Безгин Алексей

SuperDataScience

Алексей Фирстов

Курс Deep Learning For Computer Vision EECS 498.008 / 598.008

Алексей Фирстов

Deep Learning, Ian Goodfellow and Yoshua Bengio and Aaron Courville

Олег Сидоршин

Полезные ссылки

Программисты всё вымирают и вымирают

Дореволюционный Энциклопедический словарь Брокгауза и Ефрона

Не всё так просто с луддитами, как кажется

Кнопки в автомобиле — это уже роскошь

Великобритания, долги, Южные моря и Исаак Ньютон

Информация