Комментарии 61
> анакондой идет в комплекте куча библиотек
В том числе которые тебе не нужны. И еще такой минус: вывести в продакшн кучу библиотек никто не даст, а при разработке нужна прозрачность — понимание какие библиотеки нужны твоему приложению/скрипту, чтоб потом выкатить правильный requirements
И в анаконде далеко не все, все равно придется пользоваться pip-ом. В итоге 2 входа для либ. А значит труднее контролировать откуда либа пришла.
Я понимаю что вопрос религиозный, но почему не оговориться и предоставить студенту курса альтернативу, а он сам уже решил
вывести в продакшн кучу библиотек никто не даст
это курс не про продакшн, а про машинное обучение
И в анаконде далеко не все, все равно придется пользоваться pip-о. В итоге 2 входа для либ. А значит труднее контролировать откуда либа пришла.
не pip'ом, а conda'ой
Я понимаю что вопрос религиозный, но почему не оговориться и предоставить студенту курса альтернативу, а он сам уже решил
потому что добавление свободы усложняет процесс преподавания, так можно и от языка абстрагироватсья и писать на 1C
почему не оговориться и предоставить студенту курса альтернативу
Если предоставлять альтернативу, неизбежны обиды на различия в версиях. Например: на pandas 0.18.0 всё ок, а на pandas 0.18.1 ни один ответ не принимается. Вот такая свобода действительно усложняет процесс преподавания и поддержки курсов.
Если хочется разграничить, тогда virtualenv + pip
Я джва года жду статью про то, что это за виртуаленвы/пипы/венвы/пайенвы/анаконды/миниконды/изи-инсталлы/etc и как использовать like a pro. Тема холиварная, но хотелось бы понять, в чём различия и выбрать sudo pip3 install себе по вкусу.
помимо этого, например, на mac она себя прописывает питоном по умолчанию, что, как минимум, несколько раздражает, а как максимум может привести к непредсказуемому поведению системного кода;
стоит также добавить, что городить огород с отдельным механизмом conda environment при наличии рабочего virtualenv на мой взгляд — проявление NIH syndrome.
2) Не получается найти канал на slack
Очень наглядно показывают
S3 is experiencing high error rates. We are working hard on recovering.
— Amazon Web Services (@awscloud) February 28, 2017
Если для какогото урока N понадобилось обнвоить сборку — выпустили новый image, предупредили слушателей.
Кому нужны детали что там и как ставилось — читают Dockerfile.
Подключил Docker-контейнер с необходимым ПО. Подробности – в README репозитория. Введение в Docker есть тут на хабре и документация с примерами тоже сойдет.
Про сдачу заданий: заполняете первичный опрос, делаете 1 ДЗ, заполняете опрос по 1 заданию. Указываете реальное ФИО (без опечаток) – оно будет Вашим ID-шником в курсе, на всякий случай еще везде указываете e-mail (один и тот же, лучше тот самый, что в первом опросе). Правильные ответы сразу же вам не показываются, поскольку поддерживается возможность редактирования ответа после посылки (сколько угодно раз до дедлайна). Сразу после дедлайна (по 1 ДЗ – 6 марта 23:59) вам на почту придет ваша оценка.
Подтверждение отправки решения: если при переходе по ссылке с опросом говорится “You've already responded” и ниже “Edit your response”, значит все норм, решение 100% отправилось
Почему надо еще раз заполнять e-mail и ФИО? Это косяк гугл-форм, они не экспортируют, собственно, гугло-почту, с которой был заполнен опрос. Поэтому надо еще раз протащить e-mail и ФИО
1 домашка простая, на разогрев, сейчас там почти все 10-ки и только несколько 9-к.
Рейтинг участников указан в комментарии ниже, вот ссылка. Рассылки не было, насколько мне известно.
Подскажите, пожалуйста, что ни так?
Скрин — http://prntscr.com/egbko0
Поделюсь дополнительными ссылками на материалы по математике, Python и машинному обучению
- базовую математику (мат. анализ, линейную алгебру, оптимизацию, теорвер и стат-ку) можно повторить по этим конспектам YDF & MIPT. Кратко, на русском – то что надо. Если подробно, то матан – Кудрявцев, линал – Кострикин, оптимизация – Boyd (англ.), теорвер и статистика – Кибзун. И конечно, более чем достаточный – список литературы ШАДа. Плюс отличные онлайн-курсы МФТИ и ВШЭ на Coursera
- по Python хватит базового тьюториала типа CodeAcademy, также есть мой репозиторий по Python и базовым алгоритмам и структурам данных. Что-то более продвинутое – это, например, курс питерского Computer Science Center
- по машинному обучению из курсов классика – это Andrew Ng (Stanford, Coursera), на русском отличная специализация МФТИ и Яндекса – "Машинное обучение и анализ данных". O специализации университета Вашингтона тоже хорошие отзывы. Классические книги – "The elements of statistical learning" (Hastie, Tibshirani), "Machine Learning: A Probabilistic Perspective" (Murphy) и "Pattern recognition" (Bishop). Еще интересней – Deep Learning (Goodfellow, Bengio, Courville), там в начале и обзор по математике, и основы машинного обучения, изложенные довольно ясно.
Красивые визуализации:
- Интерактивный учебник по линейной алгебре
- Визуализация градиентного бустинга
- Анимация с методами оптимизации
- Neural Network Playground
- Статья про эффективное использование t-SNE
Разве что рядом впихнуть. Как-то так:
pd.concat([pd.crosstab(df.zero_launches, df.age_unknown,
normalize=True).rename(columns={0: '0_share', 1: '1_share'}),
pd.crosstab(df.zero_launches, df.age_unknown).rename(columns={0: '0_total', 1: '1_total'})], axis=1)
Такое можно сделать из таблицы yorko, поменяв порядок столбцов (.reorder_axis()
) и заюзав мультииндекс, но, может быть, есть и менее костыльное решение.
Вообще ваш скриншот похож на сводную таблицу из экселя, а пандас, по счастливой случайности, тоже умеет в сводные таблицы (pivot
).
UPD: Видеозапись лекции по мотивам этой статьи в рамках нового запуска открытого курса (сентябрь-ноябрь 2017).
За курс, конечно, спасибо, но к сожалению, есть один очень серьёзный недостаток – в нём очень слабо подается математика: много формул без пояснений, отсутствие численных примеров и реализации алгоритмов вручную не дадут полного понимания как алгоритмы работают изнутри, но вообще задумка хорошая.
Местами да, контент «проседает» по качеству, так как авторов много, где-то обозначения не совпадают, где-то просто откровенно слабовата матчасть.
Но тут надо отметить, что матчасть - не самая сильная сторона курса (за этим лучше к авторским курсам обратиться, например, К.В. Воронцова). Курс нацелен на оптимальное сочетание теории и практики. Во время активных сессий были и домашние задания, в том числе и на реализацию алгоритмов (сейчас лучшие задания курса на реализацию ML алгоритмов доступны за донат на патреоне/бусти), и Kaggle соревнования, и проекты. При этом в лекциях затрагивалась и математика, но так чтоб всем было понятно, а не только аспирантам мехмата.
Похоже, что вот здесь
"International plan = False & Customer Service calls < 4 => Churn = 0, else Churn = 1"
ошибка, надо так:
"International plan = False | Customer Service calls < 4 => Churn = 0, else Churn = 1"
Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas