Comments / Profile of andreyds95 / Habr

Андрей Чубин @andreyds95

User

ProfileArticles1PostsNewsComments20

Как мы научили ML-модель выбирать товары для акций в СберМаркете и увеличили ROI скидок в 8 раз

andreyds95 Aug 15 2023 at 08:27

Не очень понятно, как скейлинг объёма продаж помог решить проблему холодного старта ?

Look

Улучшаем прогнозы Facebook* Prophet с помощью LightGBM и Optuna

andreyds95 Jul 25 2023 at 10:27

LightGBM требует определённых Си-шных библиотек, при их отсутствие могут возникать проблемы. Так же иногда бывают конфликты версий этих библиотек. Там у меня в Гите есть requirements.txt, лучше наверное попробовать установить всё из него (соблюдая версии) в venv, используя Python 3.9.

Точнее помочь трудно, так как я не знаю, какая именно ошибка у тебя вылезла ?

Look

Первые шаги в импульсных нейронных сетях

andreyds95 Jul 18 2023 at 19:17

Спасибо, очень интересный пост получился!

Очень неудобно, что нужно знать максимум и минимум у фичи. Это ограничивает обучение на большом объёме данных. И что делать с категориальными фичами? Мне кажется тут должно быть что-то интереснее обычного WOE или Target Encoding

Look

Битва медведей: Pandas против Polars

andreyds95 Jun 1 2023 at 17:55

Основная проблема таких бенчмарков - это то, что они не учитывают, что pyarrow, polars и тд. поддерживают только 60-70% функциональности pandas, что убивает все приросты от повышенной скорости. А если надо обрабатывать огромные объёмы, то для этого давно есть Spark (а уж Spark + Scala вообще топ)

Look

Как начать карьеру в ИТ после вуза: опыт крупной компании

andreyds95 Apr 14 2023 at 07:14

Не знаю, я на свою первую работу пошёл в 24, карьера сложилась неплохо (сейчас мне 28), кмк. Всё индивидуально. Чем раньше начинаешь тем быстрее сгораешь

Look

Какой язык программирования выбрать? Часть 2. Scala

andreyds95 Apr 11 2023 at 07:24

Ну, ты сразу за больное. Даже создатели при переходе со Scala 2 на Scala 3 признали, что с implicit они перемудрили ?

А тут в примере имплиситная монада, видимо, чтобы мозг окончательно взорвался. Вообще в этом примере почти все перемудрёные штуки собрались. Тут тебе и возможность писать методы с условно динамической типизацией, и монады (прикол чисто функциональных языков, в Scala перекочевало из Haskell), и implicit (что они употребляли, когда это придумывали?), и pattern matching, и даже смесь инфиксной и постфиксной нотации.

Look

Что нужно знать на позицию junior Data Science и как подготовиться к собеседованию

andreyds95 Mar 23 2023 at 06:40

Многое из этого действительно очень полезно, но пригодится в единичных случаях (про комплексные числа и диффуры вообще не уверен), не считаем статистику, она будет нужна 100%. Но работодатель вряд ли будет погружаться в теорию на собеседовании, скорее вопросы будут практического характера, так как по моим наблюдениям, много где сеньоры и лиды уже не помнят почти ничего из указаннного (или никогда не знали)

Look

Как я попала на стажировку тестировщиком и осталась в Яндексе

andreyds95 Mar 12 2023 at 09:00

Работал в Яндексе в прошлом году аналитиком-разработчиком, в принципе очень хорошее место для работы, только ппц скучно, так как всё уже отлажено и отлично работает. Даже интересные задачи очень быстро превращаются в рутину. Автору желаю удачи и советую не боготворить Яндекс, как многие сотрудники))

Look

Собеседования в FAANG like компании или почему мы не умеем оценивать кандидатов

andreyds95 Feb 7 2023 at 13:23

Весь подход настроен на тех, кто может сосредоточиться и подготовиться. Навыки второстепенны

Look

Величайшая мистификация 21 века – «Технические собеседования»

andreyds95 Jan 11 2023 at 11:33

Абсолютно не согласен с автором. Техсобесы не всегда нацелены на то, чтобы помучать специалиста, а скорее на то, чтобы понять насколько его опыт релевантен для компании, насколько гибко кандидат может мыслить. В принципе никто и не подразумевает, что на все ответы будет дан правильный ответ, иногда даже неправильный можно зачесть, если кандидат продемонстрировал, что он может рассуждать логически. В этом плане техсобесы не более чем продолжение обычных собесов, никакой игры тут нет.

Look

Я выбрал язык программирования с помощью икигаи, коучей и рефлексии — и это сработало

andreyds95 Jan 9 2023 at 16:36

А разве не DS занимаются ИИ? Просто я сам Data Scientist, мы стараемся избегать громкого выражения «искусственный интеллект», но я не знаю никакой другой профессии, которая была бы ближе к теме ?

Look

Прощай, Data Science

andreyds95 Dec 17 2022 at 15:49

В Сбере докер запрешён для вывода в прод (не знаю правда как в девайсах с этим обстоит дело), политика кибербезопасности, там вообще очень многое под запретом, из-за чего практики MLOps слабо похожи на такие в других местах

Look

Это телефонный разговор: как мы учили модели прогнозировать успех звонка из банка

andreyds95 Aug 26 2022 at 05:46

Спасибо, очень интересная статья.

Заметил небольшую неточность.

А уже на выходе мы получаем вероятность успеха звонка по звуку.

Это не совсем верно. Софтмакс/сигмоида не переводит магическим образом логиты в вероятности. Вот тут можно кратенько узнать почему.

Look

Аэрохоккей, моббинг и котики — коворкинг разработчиков Мир Plat.Form (НСПК)

andreyds95 Aug 22 2022 at 07:30

Я не знаю в чём причина, но думаю в том, что у ребят Wear OS стоит на 100500 месте по приоритету, так как там ЦА в 3,5 человека, и учитывая, что платформа в стадии активного развития

Look

Прогнозирование спроса: как СберМаркет прогнозирует, что вы закажете вечером в пятницу

andreyds95 Aug 21 2022 at 18:45

А как этот метод показал себя по сравнению с Prophet или нейросетевыми решениями вроде GRU, Time Convolutional Network, NBeats или Temporal Fusion Transformer?

Look

Почему айтишники не могут пройти собеседование с эйчаром

andreyds95 Jul 26 2022 at 13:34

Статья точно не заслуживает столько минусов)) Если абстрагироваться от компании-автора статьи, то инфа однозначно будет полезна. В целом это всё вроде бы очевидные вещи, но многие об этом забывают. Даже самый гениальный разработчик не нужен среднестатистической компании, если он не сможет влиться в команду. Я не раз проводил собесы и могу сказать, что развитые софт скиллы и подготовка к собесу (один соискатель даже целую презентацию сделал, чтобы рассказать о себе, на общем фоне даже такое цепляет), могут перекрыть некоторые пробелы по технической части

Look

Предсказание горимости территорий методами машинного обучения на основе географических данных

andreyds95 Jul 11 2022 at 04:43

MinMaxScaler по идее не оказывает вообще никакого влияния на качество вердиктов моделей, основанных на деревьях: RF, XGBoost, CatBoost и тд.

Look

Как нейронка обогнала бустинг, а команда Сбера заняла 1 место в конкурсе Data Fusion Contest 2022

andreyds95 Jul 5 2022 at 05:33

Попробовал представленную библиотеку PyTorch-LifeStream. Интересное решение, но у меня возник такой же вопрос, как и при использовании sberbank-lightautoml. Умышленно ли делается api совершенно непонятным по логике и без учёта устоявшихся паттернов (например, scikit-learn-like api)?

Так же вероятно стоит разнести реализации для pyspark и local, так как без удаления некоторых файлов библиотека не запускается из коробки (хотя эта фича не является основной) (но это уже придирки)

Look

«Независимо от ситуации на рынке стоит учиться на Scala»

andreyds95 Jun 30 2022 at 09:36

Scala классно себя проявляет, если работать с Apache Spark, там даже уже есть классные либы для распределённого ML (Catboost for Spark, XGBoost4Spark, LGBM for Spark и тд.). Но в других задачах ML юзабилити у Scala критически отстаёт от Python

Look

Релиз языка программрования NewLang

andreyds95 Jun 25 2022 at 09:31

Не очень понятны плюсы этого языка над уже существующими вроде Python. Так как синтаксис для тех, кто не заканчивал CS и не работал с C/C++, выглядит очень перегруженным

Look

Information

Specialization