Статьи / Закладки / Профиль Dreamlone / Хабр

Михаил Сарафанов @Dreamlone

Data scientist

Профиль Публикации 6Комментарии 20Закладки 138

asozykin 3 мая 2022 в 11:19

Развертывание моделей машинного обучения. Часть первая. Размещаем Web-приложение в облачной платформе Heroku

11 мин

11K

Облачные вычисления*Машинное обучение*Учебный процесс в ITDevOps*Искусственный интеллект

Туториал

В этой серии статей мы рассмотрим, как на основе готовых моделей создавать приложения, использующие машинное обучение, и организовывать доступ пользователей к ним. Начнем с создания Web-приложения для классификации изображений на Streamlit и развертывания его на облачной платформе Heroku в бесплатном аккаунте. Этот подход подойдет для прототипов и персональных или учебных проектов.

Dreamlone 31 мар 2022 в 14:01

Чистый AutoML для “грязных” данных: как и зачем автоматизировать предобработку таблиц в машинном обучении

14 мин

8.3K

Блог компании Open Data ScienceOpen source*Python*Открытые данные*Машинное обучение*

Обработка табличных данных средствами Python для использования в моделях машинного обучения - что может быть банальнее. Казалось бы. Иногда табличные данные бывают настолько "грязными", что их вычистка занимает гораздо больше времени, чем подготовка самой модели. Так зачем это делать самому, если с этим не хуже справится AutoML...

Ну и насколько они грязные

+13

migeoz 17 мар 2022 в 13:55

Scrum/Agile/Kanban/Lean — как выравнивать процессы, убирать посредников, максимизировать ценность

6 мин

29K

Agile*

Из песочницы

История методик управления проектами

С древнейших времен люди поняли, что для достижения какой-то поставленной цели или задачи гораздо выгоднее, быстрее и эффективнее объединиться. Мамонта в одиночку не завалить, в пещере одному небезопасно и даже урожай одному не собрать. Вместе как минимум - веселее.

olegklimakov 15 мар 2022 в 12:34

Пора релоцироваться

2 мин

96K

IT-эмиграцияКарьера в IT-индустрииИнтервью

Популярные мифы, советы по поиску работы, переезду и полезные ссылки для тех, кто сейчас ищет работу за рубежом или уже нашел и собирается переехать.

+45

263

daniilshat 2 фев 2022 в 22:00

Оформляем README-файл профиля на GitHub

14 мин

227K

GitHub*Социальные сети и сообществаКарьера в IT-индустрии

Летом 2020 года GitHub позволила пользователям создавать персональные README-файлы и с их помощью кастомизировать свои профили. Сама платформа при создании подобного файла предлагает уже готовый шаблон, в который можно вписать свои данные. Но о какой кастомизации может идти речь, если у всех будут одинаково оформленные профили? За почти два года сообщество придумало множество различных способов выделиться и особенно оформить свою страницу на GitHub.

+73

aimfirst 11 янв 2022 в 10:11

JTBD: почему любимая работа вызывает отвращение?

12 мин

24K

Блог компании ГК ЛАНИТУправление продуктом*Управление проектами*Анализ и проектирование систем*

Однажды для знакомства с новым и многообещающим проектом федерального значения меня отправили на стажировку разгребать инциденты на первой линии. Рядом со мной работали молодые ребята, вчерашние студенты. С первого взгляда было видно, что ребята какие-то зашуганные, с постоянной тоской в глазах. Я решил подбодрить одну из своих коллег и начал издалека. На мой вопрос о том, чего она хочет от этой работы, моя визави честно ответила: «Я хотела бы не думать каждый вечер о том, чтобы уволиться».

+73

honyaki 13 янв 2022 в 00:20

Игры прямо в Jupyter Notebook

5 мин

6.5K

Блог компании SkillfactoryЛогические игрыИгры и игровые консолиPython*Ненормальное программирование*

Перевод

Практика в Jupyter Notebook — это основа нашего курса по Data Science. Но интерактивный блокнот можно использовать не только для работы. За подробностями из блога разработчиков Jupyter Notebook приглашаем под кат.

jhw 30 дек 2021 в 14:05

Знакомьтесь: ETNA

5 мин

12K

Блог компании Т-БанкМашинное обучение*

Туториал

Из песочницы

Меня зовут Юля, я разработчик команды ETNA. Расскажу о том, как мы запустили открытый инструмент для аналитики и прогнозирования бизнес-процессов, как он устроен и как его использовать.

В Тинькофф мы часто решаем задачи по прогнозированию: хотим знать количество звонков на линии обслуживания или сколько наличных клиенты снимут в банкомате на следующей неделе. Специалисты по обработке данных и аналитики, которые сталкиваются с проблемами прогнозирования, могут использовать целый ряд различных инструментов для своей работы. Это неудобно и требует времени. Чтобы упростить задачу, мы разработали наш фреймворк.

+18

Drm-a 9 дек 2021 в 17:48

Код ревью с учётом человеческих слабостей

7 мин

11K

Блог компании Delivery Club TechСовершенный код*Git*Управление разработкой*Карьера в IT-индустрии

Проверка кода (code review) — отличный инструмент для повышения качества кода, но он не учитывает один факт: отправляют и просматривают код люди, а они устают, теряют сосредоточенность, ленятся, да и просто испытывают эмоции в самые неожиданные моменты.

Поэтому хочу представить свое видение хороших и плохих практик код ревью с учётом человеческих особенностей.

+23

dantumonskiy 2 дек 2021 в 12:25

Обработка изображений на Python

6 мин

19K

Python*Обработка изображений*

Из песочницы

В процессе этой статьи будет разработан фильтр для изображения, который позволит показать контуры фигур на изображение.

При помощи формул, описанных в статье можно найти значение каждого пикселя опираясь на соседей этого пикселя.

Далее реализация на python с подробными пояснениями.

Итоги работы и полная версия обработанного изображения.

Scoodle 25 окт 2021 в 14:37

Тимлид в 20 или 50 оттенков выгорания

6 мин

18K

Карьера в IT-индустрии

Из песочницы

Эта история обо мне - обычном разработчике, который слишком рано получил то, к чему стремился. Я пишу эту статью с целью, чтобы юные ребята, которые хотят пойти в программирования, понимали, что не все так радужно. Деньги, удаленка, свободное время, востребованность - все это манит, однако у этой медали есть вторая, не самая приятная, сторона, о которой я и хочу рассказать.

+24

itmo_nsslab 15 сен 2021 в 12:26

Как мы “повернули реки вспять” на Emergency DataHack 2021, объединив гидрологию и AutoML

17 мин

2.8K

Open source*Python*ХакатоныМашинное обучение*Искусственный интеллект

Хабр, привет!

Под катом хотелось бы поговорить об опыте участия нашей команды из лаборатории моделирования природных систем Национального центра когнитивных разработок Университета ИТМО в хакатоне Emergency DataHack 2021. И победы в нём :)

NowanIlfideme 17 авг 2021 в 09:45

Структура + предположения > ML? Моделирование продаж байесовскими методами

17 мин

5.4K

Блог компании EPAMPython*Big Data*Машинное обучение*Управление продажами*

Не так давно участвовал в проекте, где мы применяли методы байесовского моделирования для ритейлинговой сети. Тема непростая и интересная. Так как проект под NDA, решил на примере похожего гипотетического проекта показать, как мы решали поставленные перед нами задачи.

Также подробно расскажу об основах Байесовского моделирования. Ну и бонусом, тем кто дочитает до конца и захочет углубиться в эту тему – «куча» ссылок.

itmo 18 июл 2021 в 16:55

Две открытые библиотеки для обучения байесовских сетей и идентификации структуры данных

3 мин

3.2K

Блог компании ИТМОOpen source*Алгоритмы*Математика*Машинное обучение*

В одном из предыдущих материалов мы рассказали о фреймворке для AutoML и библиотеке алгоритмов выбора признаков. На этот раз продолжаем делиться разработками специалистов, магистров и аспирантов Университета ИТМО и представляем вашему вниманию парочку open source инструментов для работы с данными. Как обычно — говорим о них простыми словами и делимся ссылками на публичные репозитории, предоставленными авторами проектов.

MaxRokatansky 14 июл 2021 в 16:36

8 недооцененных команд Git, которые должен знать каждый программист (помимо привычных pull, push, add, commit)

2 мин

22K

Блог компании OTUSGit*Программирование*PHP*

Перевод

Если вы сделали опечатку, когда вводили имя ветки, вам поможет вот такая команда.

itmo 11 июл 2021 в 17:28

Open source в Университете ИТМО: фреймворк для AutoML и библиотека алгоритмов выбора признаков

4 мин

3.9K

Блог компании ИТМОOpen source*Алгоритмы*Машинное обучение*

Мы рассказываем не только о личном опыте учеников, делимся практическими руководствами и публикуем истории студенческих стартапов, но и обсуждаем подходы к развитию карьеры — например, в области машинного обучения и проектирования алгоритмов. Сегодня раскроем последнюю тему с несколько иной стороны и представим вашему вниманию парочку open source фреймворков от представителей ИТМО — со ссылками на репозитории и понятным описанием.

itmo_nsslab 30 мая 2021 в 13:17

Прогнозирование временных рядов с помощью AutoML

16 мин

25K

Open source*Python*Алгоритмы*Искусственный интеллектМашинное обучение*

Хабр, привет!

В лаборатории моделирования природных систем Национального центра когнитивных разработок Университета ИТМО мы активно исследуем вопросы применения автоматического машинного обучения для различных задач. В этой статье мы хотим рассказать о применении AutoML для эффективного прогнозирования временных рядов, а также о том, как это реализовано в рамках open-source фреймворка FEDOT. Это вторая статья из серии публикаций, посвященной данной разработке (с первой из них можно ознакомиться по ссылке).

Все подробности — под катом!

Читать дальше →

itmo_nsslab 23 мая 2021 в 18:22

Как AutoML помогает создавать модели композитного ИИ — говорим о структурном обучении и фреймворке FEDOT

9 мин

8.5K

Блог компании ИТМОМашинное обучение*

В лаборатории моделирования природных систем НЦКР ИТМО мы занимаемся разработкой и продвижением решений в области AutoML. Наши научные сотрудники Николай Никитин, Анна Калюжная, Павел Вычужанин и Илья Ревин рассказывают о трендах и задачах AutoML, плюс — о собственных open-source разработках в этой области.

WhiteBlackGoose 21 сен 2019 в 13:38

50 оттенков matplotlib — The Master Plots (с полным кодом на Python)

39 мин

387K

Matlab*Python*Визуализация данных*Машинное обучение*

Перевод

Те, кто работает с данными, отлично знают, что не в нейросетке счастье — а в том, как правильно обработать данные. Но чтобы их обработать, необходимо сначала проанализировать корреляции, выбрать нужные данные, выкинуть ненужные и так далее. Для подобных целей часто используется визуализация с помощью библиотеки matplotlib.

Встретимся «внутри»!

Читать дальше →

+67

twelveth 17 ноя 2020 в 11:00

Гиперпараметры: как перестать беспокоиться и начать их оптимизировать

11 мин

22K

Блог компании «Антиплагиат»Машинное обучение*Математика*Natural Language Processing*Data Mining*

«Подбор гиперпараметров». Если у вас в голове при произнесении этой фразы прокатились несколько панических атак и непроизвольно задергался глаз, а, возможно, и рука в инстинктивном желании перевернуть стол с криками «Да ну его, этот ваш дата сайнс» (нецензурную брань оставим за скобками), значит вы, как и я, хоть раз пытались обучить ~~наивный байес~~ мало-мальски тяжелую модель на большом объеме данных.

Источник изображения: thecode.media

Размер батча, learning rate, размер того слоя, размер сего слоя, вероятность dropout-a. Страшно? Уже представляете часы (дни) ожидания? А это я еще про количество голов у трансформеров не говорил…

Читать дальше →

+11

1 2 3 4 5