Pull to refresh
3
0
Send message

Как создать свою первую модель машинного обучения на Python

Reading time11 min
Views36K

В этой статье вы узнаете, как создать свою первую модель машинного обучения на Python. В частности, вы будете строить регрессионные модели, используя традиционную линейную регрессию, а также другие алгоритмы машинного обучения.

Читать далее

Взгляд компьютерным зрением на работу коммунальных служб

Level of difficultyMedium
Reading time8 min
Views11K

С помощью обработки данных с уличных камер проанализируем характеристики движения пешеходов. Посмотрим как на их поведение влияет качество работы коммунальных служб. Узнаем насколько сильно замедляет передвижение гололед, и как много шагов нужно, чтобы это выяснить.

Пошагали

Прогнозирование продаж Python. Как находить и сглаживать выбросы с помощью фильтра Хэмплея

Reading time4 min
Views13K

Те, кто работает с временными рядами, часто сталкивается с двумя проблемами. Первая – нет полных данных. Вторая – битые данные, когда встречается много выбросов, шума и пропусков. Редко встречаются случаи, когда всё было бы идеально. И данных много, и можно легко найти нужные. Такое встретишь крайне редко или почти никогда.

Возникает вопрос - как решить эту проблему? Я нашёл решение. Давайте расскажу вам, как я решаю проблему битых данных, выбросов, пропусков. Какие я использовал методы, в чем их отличия, преимущества и какие я считаю самыми лучшими.

Начнём мы с первого метода – фильтра Хэмплея. В этой статье речь пойдёт именно о нём. Я постараюсь как можно проще рассказать о его особенностях и показать всё на наглядных примерах. Приступим.

Читать далее

Как фермеру узнать состояние своих полей по NDVI?

Reading time3 min
Views8.2K

В данной статье я не буду вдаваться в подробности теории, предполагаю, что вы знаете для чего нужен этот индекс. Моя задача - показать, как вам можно его получить.

Читать далее

Привлекаем внимание технологов (и не только «Норникеля»)! Визуализация ML-модели на «архивных» данных

Reading time11 min
Views5.9K

Идет очередной этап работы датасаентиста… обучена ML-модель, которая снизит издержки, повысит эффективность, сделает жизнь лучше, ничего не изменит, зато звучит модно. И вот настало время презентовать результаты ее работы. Если вы, как и я, работаете в промышленности, то на запланированную встречу наряду с менеджерами наверняка пригласят технологов с производства - именно они будут пользователями вашей системы, и успешность проекта может во многом зависеть от их заинтересованности и вовлеченности в совместную работу. Раз надо их заинтересовать, сделаем!

Привет, Хабр! Меня зовут Владимиров Дмитрий, я data scientist в группе анализа данных компании Норникель. Я хочу поделиться тем, как настроить интерактивную визуализацию работы ML-модели использую связку Python+Postgres+Grafana.

Читать далее

В Data Science не нужна математика (Почти)

Reading time6 min
Views92K

Привет, чемпион!

Ребята с «вышкой» всё время умничают, что в Data Science нужна «математика», но стоит копнуть глубже, оказывается, что это не математика, а вышмат.

В реальной повседневной работе Data Scientist'а я каждый день использую знания математики. Притом очень часто это далеко не «вышмат». Никакие интегралы не считаю, детерминанты матриц не ищу, а нужные хитрые формулы и алгоритмы мне оперативнее просто загуглить.

Решил накидать чек-лист из простых математических приёмов, без понимания которых — тебе точно будет сложно в DS. Если ты только начинаешь карьеру в DS, то тебе будет особенно полезно. Мощь вышмата не принижаю, но для старта всё сильно проще, чем кажется. Важно прочитать до конца!
Читать дальше →

Как с применением Power BI создавалась система анализа финансово-хозяйственной деятельности предприятий России и зачем

Reading time31 min
Views7.6K

Данный материал является, своего рода, рефератом, описывающим созданный продукт с применением инструмента Power BI, основанный на открытых статистических данных бухгалтерской отчётности предприятий России. В работе сделана попытка представить совокупность, как единым субъект, реагирующий на изменения, который, тем не менее, можно разложить на региональные составляющие и описывающие деятельность.

В статье показан полный цикл создания (сквозная задача), а также представлена возможность скачать и ознакомиться с продуктом.

Ознакомиться →

Это не гонка, это ультрамарафон: распространение криптотехнологий

Reading time7 min
Views7.5K
imageШирокое распространение криптографических технологий не произойдет одним махом. Нам придется как следует поработать, но будет весело.

Я хотел поделиться с вами некоторыми мыслями о распространении криптотехнологий и о беге на длинную дистанцию. Этот первый пост в рамках нашего блога основан на моем опыте работы с блокчейн-платформой Waves — я работаю там директором по связям с общественностью. Однако сразу оговорюсь, что все написанное далее — мое личное мнение, не отражающее какую-либо официальную позицию. </конец дисклеймера> Я провел почти 3 года в мире криптотехнологий, став свидетелем всех самых лучших и худших событий в этой области, поэтому этот пост также в некоторой степени объясняет, что мне так нравится в Waves и почему я уверен, что останусь в компании надолго.

Недавно я снова начал бегать на длинные дистанции. Я занимаюсь бегом уже 15 лет, однако хроническое воспаление ахиллесовых сухожилий привело к тому, что в последнее время мой показатель еженедельного пробега снизился до однозначного числа. Для меня бег — хорошее средство сохранения остроты ума и общей работоспособности, учитывая тот факт, что этот год выдался для меня ужасным в личном плане, и я понял, что если ничего не поделаю с этой ситуацией, то не дотяну такими темпами и до сорока лет, не говоря уже о семидесяти. И вот несколько месяцев физиотерапии, совершенствования техники с помощью бега босиком и в минималистичной обуви, а также смещения основной нагрузки с пятки на переднюю часть ступни сделали свое дело, и я решил, что пришла пора оформить свое возвращение в бег официально и зарегистрировался на ультрамарафон в конце октября, обещающий стать весьма непростым 8-часовым испытанием.
Читать дальше →

Information

Rating
Does not participate
Registered
Activity