Статьи / Закладки / Профиль Jecki494 / Хабр

Евгений @Jecki494

ML Engineer

Профиль Публикации Комментарии 1Закладки 96

bartenev_ev 24 июн в 10:00

Книжная полка разработчика в эпоху интернета и искусственного интеллекта

Простой

12 мин

11K

Python*Программирование*Профессиональная литература*Учебный процесс в ITБлог компании Яндекс Практикум

Обзор

В мире, где информация постоянно обновляется, а найти что-то можно с молниеносной скоростью, встаёт вопрос: а нужны ли вообще книги для программистов? Ведь в интернете есть множество бесплатных обучающих материалов, туториалов, видеоинструкций и чатов на базе генеративного искусственного интеллекта, которые, казалось бы, могут полностью заменить традиционные источники знаний — книги.

Однако, на мой взгляд, книги всё ещё остаются важным и незаменимым инструментом для изучения программирования, особенно для новичков. В этой статье я, Бартенев Евгений, автор и техлид курсов «Python-разработчик» в Яндекс Практикуме, расскажу, почему я так считаю. А также поделюсь своей подборкой книг как для начинающих разработчиков, так и для тех, кто уже пишет код не первый день.

+14

yakvenalex 2 июл в 15:01

Создание собственного API на Python (FastAPI): Знакомство и первые функции

Простой

20 мин

11K

Python*API*Блог компании Amvera

Туториал

Друзья, приветствую! Данной статьей я планирую начать большой цикл публикаций, в которых я расскажу все, что знаю про FastAPI, начиная от самых простых аспектов и заканчивая более глубокими задачами, такими как JWT авторизация, работа в фоне, валидация данных, правильное подключение базы данных и прочее.

+15

NatalieVT 24 мая в 10:18

Как устроен рекомендательный сервис, который выдерживает 700 тысяч запросов в секунду. Доклад Яндекса

11 мин

15K

Высокая производительность*Анализ и проектирование систем*Блог компании ЯндексМашинное обучение*

«Баннерная крутилка» — один из самых высоконагруженных сервисов в Яндексе. Он умеет переживать 700 тысяч RPS, а иногда и больше. Каждый раз, когда приходит запрос, крутилка должна просмотреть базу из миллиарда документов и выбрать из них самые релевантные для пользователя. При этом выдерживаются весьма жесткие временные рамки: 99% всех запросов обрабатываются менее чем за 200 миллисекунд.

Какими принципами стоит руководствоваться при построении подобных высоконагруженных систем? Как устроены стадии отбора документов? Какое участие в ранжировании принимает ML? Обо всём этом на недавнем мероприятии для разработчиков в Ереване рассказал Артём Ваншулин, руководитель разработки ранжирования в команде баннерной системы. Сегодня мы делимся с сообществом текстовой версией его доклада. Передаём ему слово.

+35

Dasfex 16 мая в 22:40

Многообразие связных списков

Средний

13 мин

8.4K

Программирование*C++*Алгоритмы*

Обзор

Связный список — классическая структура данных, которая позволяет быстрые вставки/удаления, но при этом просаживает другие операции (случайный доступ к элементу). Мы пройдёмся от базовой реализации до других возможных вариаций этой структуры данных и, надеюсь, вместе узнаем что‑то новое. Краем глаза увидим возможные применения связных списков. И в конце, для любителей C++, бонус: использование связного списка для сбора диагностики выделений динамической памяти в вашем коде.

Связать себя со знаниями!

+33

HabrSpar 16 апр в 09:32

35+ бесплатных ресурсов для начинающих разработчиков С++

Простой

7 мин

24K

Программирование*C++*Учебный процесс в ITКарьера в IT-индустрииБлог компании Яндекс Практикум

Дайджест

Привет. Предположим, вы захотели начать изучать языĸ программирования C++ или, возможно, тех материалов, что уже изучили, вам недостаточно.

Я — Савва, программирую уже больше 7 лет, работаю менеджером команды наставников в Практикуме на курсе «Разработчик С++», а с недавнего времени — разработчиком в Positive Technologies. В этой статье мы с вместе с Практикумом собрали леĸции, ĸниги, курсы и всяĸое таĸое, чтобы шансов выстрелить себе в ногу самостоятельно было меньше :) По C++ существуют и другие подборĸи, но, ĸ удивлению, на Хабре их всего две.

+27

odmin227 20 мар в 12:00

Превратите свой пет-проект из хобби в карьеру

Средний

12 мин

24K

Машинное обучение*Учебный процесс в ITРазвитие стартапаКарьера в IT-индустрииИскусственный интеллект

Туториал

Привет, Хабр!

Меня зовут Данил Картушов, в этом посте я расскажу, почему и как именно pet-project'ы могут стать ключом к вашей карьере.

Надеюсь, что после этого поста ты сможешь раскрыть свой потенциал к обучению и по-новому взглянуть на процесс обучения.

Начнем!

+30

Flokis_guy 6 мар в 13:31

WaveSync: Новый путь к нелинейному анализу эмбеддингов

Средний

8 мин

2.7K

Математика*Машинное обучение*Natural Language Processing*

Из песочницы

WaveSync — новый алгоритм для детального, нелинейного и быстрого анализа сходства эмбеддингов и векторов.

Алгоритм является в большинстве задач заменой линейному косиносному сходству. Он позволяет улучшить точность обработки языка и открывает новые перспективы для разработчиков и исследователей в области NLP.

ieBoytsov 17 авг 2022 в 10:58

Персональное ранжирование на Авто.ру: как не потерять главный смысл поиска по параметрам

9 мин

5.3K

Поисковые технологии*Блог компании ЯндексАлгоритмы*Машинное обучение*

Поиск по базе объявлений — совсем не то же самое, что поиск по интернету. Он параметрический, а не полнотекстовый: вы можете с помощью фильтров однозначно определить, что вам нужно, сузив область поиска. Поэтому и ранжирование в нём, на первый взгляд, играет не настолько большую роль — казалось бы, документов или карточек в выдаче не так много, чтобы дополнительно их ранжировать. Но это справедливо для небольшой базы и только для одного поискового сценария.

В параметрическом поиске Авто.ру действует правило: незачем строить за пользователя предположения о том, что он имел в виду. Мы в любом случае покажем все объявления, соответствующие поисковым фильтрам в запросе. Роль движка ранжирования — отсортировать карточки так, чтобы наиболее релевантные для конкретного пользователя оказались выше, не более. Я работаю над этим уже несколько месяцев, сейчас расскажу об устройстве движка и первых результатах.

Читать дальше →

+13

volinski 24 окт 2022 в 14:57

Open Source для MLOps: сравнение популярных решений

6 мин

4.5K

Open source*Блог компании VKОблачные вычисления*DevOps*Облачные сервисы*

Здравствуй, Хабр! Меня зовут Александр Волынский, я занимаюсь разработкой ML Platform в VK Cloud. Наша ML-платформа стала доступна пользователям совсем недавно, некоторые из её компонентов сейчас находятся на этапе бета-тестирования. В этой статье я расскажу, как мы выбирали Open-Source-инструменты для MLOps-платформы, какие решения сравнивали, на каком варианте остановили выбор и почему.

Читать дальше →

+39

maks-sh 30 янв 2020 в 16:15

Туториал по uplift моделированию. Часть 1

9 мин

90K

Data Mining*Машинное обучение*Интернет-маркетинг*Повышение конверсии*Блог компании МТС

Туториал

Технотекст 2020

Команда Big Data МТС активно извлекает знания из имеющихся данных и решает большое количество задач для бизнеса. Один из типов задач машинного обучения, с которыми мы сталкиваемся – это задачи моделирования uplift. С помощью этого подхода оценивается эффект от коммуникации с клиентами и выбирается группа, которая наиболее подвержена влиянию.

Такой класс задач прост в реализации, но не получил большого распространения в литературе про машинное обучение. Небольшой цикл статей, подготовленный Ириной Елисовой (iraelisova) и Максимом Шевченко (maks-sh), можно рассматривать как руководство к решению таких задач. В рамках него мы познакомимся с uplift моделями, рассмотрим, чем они отличаются от других подходов, и разберем их реализации.

Читать дальше →

+27

blondered 11 авг 2023 в 12:45

Дропаем ранжирующие метрики в рекомендательной системе, часть 1: визуальный анализ и popularity bias

Средний

12 мин

6.9K

Машинное обучение*Блог компании Open Data Science

Кейс

Привет, Хабр! Поговорим о RecSys?

Что нужно для построения рекомендательной системы, которая будет полезна бизнесу? Топовые метрики, максимум предсказательной силы, machine learning на полную? Проверим. Сегодня покажу:

• Как (и почему) мы дропнули в 3 раза ранжирующие метрики в пет-проекте по рекомендациям фильмов
• Как искали свой идеальный алгоритм
• Как подобрали релевантные рекомендации на самые разные запросы

Будем говорить обо всех аспектах экспериментов в RecSys: метрики, визуальный анализ, workflow. А результат проверим в онлайн-приложении.

RecSys dive ->

+18

nordwind2013 25 фев 2020 в 19:10

С чего начинается Elasticsearch

14 мин

241K

Поисковые технологии*IT-инфраструктура*Распределённые системы*

Технотекст 2020

Из песочницы

Elasticsearch, вероятно, самая популярная поисковая система на данный момент с развитым сообществом, поддержкой и горой информации в сети. Однако эта информация поступает непоследовательно и дробно.

Самое первое и главное заблуждение — "нужен поиск, так бери эластик!". Но в действительности, если вам нужен шустрый поиск для небольшого или даже вполне себе крупного проекта, вам стоит разобраться в теме поподробней и вы откажетесь от использования именно этой системы.

Читать дальше →

+49

Tutelka 18 окт 2023 в 10:30

Прививка от ошибки выбора: что спросить работодателя «на берегу»

Простой

13 мин

23K

Управление персоналом*Карьера в IT-индустрииБлог компании Yandex Cloud & Yandex Infrastructure

Меня зовут Настя, я руководитель службы инструментов репозитория в Yandex Infrastructure. Больше 15 лет я проработала в IT-индустрии: сначала как разработчик, потом тимлид, техлид, менеджер проектов и руководитель службы. За это время несколько сотен человек рассказали мне о своём карьерном пути: кто-то собеседовался со мной как с нанимающим менеджером, кто-то приходил ко мне на менторинг, кто-то расширял свой нетворк, как теперь модно говорить. Из этих разговоров можно выделить причины недовольства работой, которые я вижу у людей чаще остальных. Одна из главных причин — ошибка выбора вакансии.

В этом посте я собрала исчерпывающий список вопросов к нанимающему менеджеру, которые помогут кандидатам избежать ошибок выбора. И заодно не испортить себе резюме, карьеру и нервную систему.

+44

Jaylla 14 июл 2021 в 13:16

Рекомендательные системы: проблемы и методы решения. Часть 1

14 мин

27K

Алгоритмы*Машинное обучение*Блог компании Prequel

Технотекст 2021

Привет! Я хочу рассказать вам о рекомендательных алгоритмах. Мы в Prequel создаем фильтры и эффекты для редактирования фото и видео. Создаем давно, и постепенно этих эффектов стало очень много. А с ними и пользовательского контента. Мы захотели помочь с выбором из этого многообразия, для чего нам и понадобилась система рекомендаций. Если масштабы вашей системы такие, что пользователям сложно в ней ориентироваться, возможно, что рекомендации могут помочь и вам.

Задуманный систем оказался слишком объемным для одной статьи, поэтому мы разбили его на две части. Перед вами первая, она посвящена постановке задачи и базовым методам решения. В этой части мы разберем коллаборативные модели от матричного разложения (на примере ALS) до neural collaborative filtering. Кроме того, будет небольшой обзор метрик и техник борьбы с проблемой холодного старта.

slivka_83 12 окт 2023 в 11:22

Введение в библиотеку Diffusers и диффузионные модели

Простой

16 мин

9.5K

Python*Data Mining*Big Data*Машинное обучение*Искусственный интеллект

Туториал

✏️ Технотекст 2023

Diffusers — это библиотека от Hugging Face, которая позволяет работать с сотнями предобученных моделей класса Stable Diffusion для создания изображений и аудио.

Всегда хотели стать художником, но у вас лапки? :) Тогда Diffusers этот то, что вам нужно!

В этой статье рассмотрим основные возможности библиотеки, ее компонентов, а также моделей Stable Diffusion в целом.

З.Ы. Подписывайтесь на мой телеграм-канал :)

+11

oasidorshin 10 фев 2023 в 15:58

Как я занял 13 место из 3500+ участников и стал Kaggle Competition Master

Средний

14 мин

11K

Спортивное программирование*Блог компании Альфа-БанкМашинное обучение*Карьера в IT-индустрии

Ретроспектива

✏️ Технотекст 2023

Привет Хабр! Меня зовут Олег Сидоршин, я стажер (с марта буду джуном) в Лаборатории машинного обучения Альфа-Банка. До перехода в коммерческую разработку для практики своих навыков я активно участвовал в Kaggle-соревнованиях.

Этот пост — ретроспектива о крупном соревновании по компьютерному зрению Petfinder Pawpularity Prediction, которое проходило в начале 2022 года. Расскажу, как сражался на одном уровне с Nvidia с их холодильниками, что помогло пережить полет с 400+ места на 13, и конечно же, о главных советах и уроках для улучшения качества ваших ML-систем на соревнованиях и в рабочей практике, даже если у вас почти нет бюджета.

+47

dvlunin 11 авг 2021 в 15:45

Как улучшить ваши A/B-тесты: лайфхаки аналитиков Авито. Часть 1

29 мин

63K

Тестирование веб-сервисов*Аналитика мобильных приложений*Управление продуктом*Блог компании AvitoTech

Всем привет! Я Дмитрий Лунин, работаю аналитиком в команде ценообразования Авито. Наш юнит отвечает за все платные услуги площадки. Наша основная задача — сделать цены на них оптимальными.

Мы не только пытаемся максимизировать выручку Авито, но и думаем про счастье пользователей. Если установить слишком большие цены, то пользователи возмутятся и начнут уходить с площадки, а если сделать цены слишком маленькими, то мы недополучим часть оптимальной выручки. Низкие цены также увеличивают количество «спамовых» объявлений, которые портят поисковую выдачу пользователям. Поэтому нам очень важно уметь принимать математически обоснованные решения — любая наша ошибка напрямую отразится на выручке и имидже компании.

Одним из инструментов для решения наших задач является A/B-тестирование.

nickimpark 19 июл 2023 в 11:36

Единая нейросетевая модель кредитного скоринга

Средний

7 мин

8.3K

Big Data*Блог компании Альфа-БанкМашинное обучение*Искусственный интеллект

Кейс

✏️ Технотекст 2023

Сейчас в Альфа-Банке при построении моделей используется множество различных источников данных. Мы в Лаборатории машинного обучения уже несколько лет применяем нейронные сети на последовательностях для решения задачи кредитного скоринга и построили модели на данных карточных транзакций, транзакций расчетного счета и кредитных историй. Повышение качества в задаче кредитного скоринга позволяет банку выдавать большее количество кредитов при неизменном уровне риска, что напрямую влияет на его прибыль.

Моделей становится все больше, и возникает вопрос: почему бы нам не смешивать модели не на уровне их предсказаний, а на некотором более низком уровне? Эта идея приводит нас к новому способу смешивания - построению единой нейросетевой модели, работающей со всеми источниками последовательных данных и учитывающей их взаимное влияние друг на друга. В этой статье мы расскажем, как нам удалось разработать такую модель и каких результатов она позволяет добиться в задаче кредитного скоринга.

+31

erbanovanastasia 11 июл 2023 в 13:46

Полезные материалы и инструменты для погружения в Flask: выбор сотрудников Selectel

4 мин

8.4K

Python*Блог компании SelectelIT-компанииFlask*

Обзор

Часто Python-разработчики выбирают Flask в качестве «быстрого старта» для создания веб-приложений. Он прост в использовании и имеет много преимуществ перед другими фреймворками — например, легкий синтаксис, удобные шаблоны и инструменты для гибкой настройки сайтов.

Однако у начинающих могут быть трудности в работе с фреймворком. Чтобы свести их к минимуму и помочь с погружением в Flask, наши коллеги собрали полезные материалы. Сохраняйте подборку в закладки и делитесь своими вариантами в комментариях.

Читать дальше →

+19

greck 8 июл 2022 в 13:41

ML для оптимизации цен на основе эластичности по цене

25 мин

19K

Разработка под e-commerce*Машинное обучение*Управление e-commerce*Управление продажами*

Туториал

Кривая эластичности спроса по цене – это то, как продажи зависят от цены.Чем меньше цена, тем больше продаж и наоборот.

В этой статье рассказывается про ML методы получения кривых спроса сразу для сотен тысяч товаров (нейросети, pyTorch), а также как, имея кривые спроса, решать бизнес задачу про баланс оборота и прибыли – в этом нам поможет метод множителей Лагранжа. Что первично – ограничение на прибыль или множитель Лагранжа? Как инженерам объяснить, что такое kvi-товары и товары-герои? Это и многое другое

2 3 4 5

Книжная полка разработчика в эпоху интернета и искусственного интеллекта

Создание собственного API на Python (FastAPI): Знакомство и первые функции

Как устроен рекомендательный сервис, который выдерживает 700 тысяч запросов в секунду. Доклад Яндекса

Многообразие связных списков

35+ бесплатных ресурсов для начинающих разработчиков С++

Превратите свой пет-проект из хобби в карьеру

WaveSync: Новый путь к нелинейному анализу эмбеддингов

Персональное ранжирование на Авто.ру: как не потерять главный смысл поиска по параметрам

Open Source для MLOps: сравнение популярных решений

Туториал по uplift моделированию. Часть 1

Дропаем ранжирующие метрики в рекомендательной системе, часть 1: визуальный анализ и popularity bias

С чего начинается Elasticsearch

Прививка от ошибки выбора: что спросить работодателя «на берегу»

Рекомендательные системы: проблемы и методы решения. Часть 1

Введение в библиотеку Diffusers и диффузионные модели

Как я занял 13 место из 3500+ участников и стал Kaggle Competition Master

Как улучшить ваши A/B-тесты: лайфхаки аналитиков Авито. Часть 1

Единая нейросетевая модель кредитного скоринга

Полезные материалы и инструменты для погружения в Flask: выбор сотрудников Selectel

ML для оптимизации цен на основе эластичности по цене

Информация

Специализация