@Saviour^{read⁠-⁠only}

Пользователь

mastersobg 28 янв 2023 в 12:38

План алгоритмического собеседования: как впечатлить интервьюера и получить работу мечты

13 мин

22K

Программирование * Алгоритмы * Карьера в IT-индустрииИнтервью

При поиске работы программистам часто приходится сталкиваться с алгоритмическим интервью. По моему опыту общения с людьми из индустрии ИТ я заметил, что многие считают, что алгоритмическая секция бинарна: либо алгоритм написан корректно за отведенное время, либо нет. На самом деле всё немного сложнее и во время интервью собеседующий обращает внимание на многие другие аспекты.

Я за свою карьеру имел возможность быть по обе стороны баррикад. С одной стороны я провёл сотни алгоритмических интервью в компаниях, где работал. С другой стороны сам успешно проходил такие интервью и получал оффер в Google, Facebook, Amazon, Uber, Yandex и Mail.Ru.

В этой статье я хочу поделиться с вами как можно структурировать эту секцию, расскажу на что стоит обратить внимание на каждом шаге, как получить дополнительные очки в глазах интервьюера и в целом просто не провалить всё собеседование на ровном месте.

+27

mryab 15 сен 2022 в 09:06

Самая большая BERT-подобная модель на русском, которая поместится на ваш компьютер

7 мин

25K

Блог компании ЯндексМашинное обучение * Искусственный интеллектOpen source * Распределённые системы *

Победитель Технотекст 2022

Привет, это снова Максим Рябинин, исследователь в Yandex Research. В прошлом году я рассказывал на Хабре о том, как вместе с Hugging Face, Университетом Торонто и волонтёрами мы обучили state-of-the-art модель для бенгальского языка и написали об этом статью на конференцию NeurIPS. Теперь хотим поделиться новым результатом: оказывается, технологии для обучения на нестабильном железе находят приложение и внутри привычных всем кластеров.

Используя вычислительную платформу Яндекса, мы обучили RuLeanALBERT — нейросеть, показывающую сравнимые с другими открытыми моделями и где-то даже близкие к state-of-the-art результаты на бенчмарках по пониманию русского языка — Russian SuperGLUE и RuCoLA. Наша модель хотя и имеет миллиарды параметров, но вполне способна вместиться в одну домашнюю GPU: вы можете использовать её в своих проектах для классификации предложений, представления текстов и других языковых задач, не требующих генерации. В статье можно прочитать о подробностях обучения, которые мы реализовали в открытом коде, а чекпоинт теперь тоже доступен всем желающим.

^{Примерно так выглядит процесс обучения на множестве независимых серверов}

Читать дальше →

+52

feanoref 21 мар 2023 в 14:21

Полезные материалы по Data Science и машинному обучению, которые помогут пройти сквозь джунгли из терминов

Простой

8 мин

28K

Блог компании SelectelData Engineering * Искусственный интеллектМатематика * Машинное обучение *

Мнение

Привет, Хабр! Меня зовут Ефим, я MLOps-инженер в Selectel. В прошлом был автоматизатором, ML-инженером, дата-аналитиком и дата-инженером — и уже несколько лет падаю в пропасть машинного обучения и Data Science. Это буквально необъятная сфера, в которой почти нет ориентиров. Основная проблема в том, что разделов математики довольно много и все они, на первый взгляд, нужны в том же машинном обучении.

В этой статье делюсь полезными материалами, которые помогут найти и заполнить теоретические и практические проблемы и основательно подойти к своему профессиональному развитию. Добро пожаловать под кат!

Читать дальше →

+58

Nastaa 4 июн 2023 в 09:01

ML System Design: основные способы деплоя и тестирования моделей машинного обучения в продакшене

6 мин

14K

Тестирование IT-систем * Анализ и проектирование систем * Big Data * Машинное обучение *

Обзор

Перевод

Разберем популярные паттерны проектирования ML-систем для ответа на следующие вопросы:

1. Какой способ выбрать для деплоя модели в production?

2. Как затащить составной ML-пайплайн в real-time сервис?

3. Каким способом тестировать новую версию модели?

Assistant_Branch_Manager 23 мая 2022 в 10:55

Как я готовился к собеседованию на позицию Senior ML Engineer

11 мин

21K

IT-эмиграцияМашинное обучение * Карьера в IT-индустрии

Привет, меня зовут Глеб Зарин, я ML-разработчик. Сегодня я расскажу, как я подготовился к собеседованиям на позицию Senior Machine Learning Engineer и получил работу мечты за рубежом.

+15

dimakarp1996 7 окт 2018 в 15:52

Задача о многоруком бандите — сравниваем эпсилон-жадную стратегию и Томпсоновское сэмплирование

12 мин

27K

Машинное обучение * Повышение конверсии *

Из песочницы

Привет, Хабр! Представляю вашему вниманию перевд статьи Solving multiarmed bandits: A comparison of epsilon-greedy and Thompson sampling.

Задача о многоруком бандите

Задача о многоруком бандите – одна из самых основных задач в науке о решениях. А именно, это задача об оптимальном распределении ресурсов в уcловиях неопределенности. Само название «многорукий бандит» пошло от старых игровых автоматов, которыми управляли при помощи ручек. Эти автоматы получили прозвище «бандиты», потому что после общения с ними люди обычно чувствовали себя ограбленными. А теперь представьте, что таких машин несколько и шанс выиграть у разных машин разный. Раз уж мы взялись играть с этими машинами, мы хотим определить, у какой этот шанс выше и использовать (exploit) эту машину чаще, чем другие.

Проблема в следующем: как нам эффективнее всего понять, какая машина подходит лучше всего, и при этом перепробовать много возможностей в реальном времени? Это не какая-то теоретическая проблема, это проблема, с которой бизнес сталкивается все время. Например, у компании есть несколько вариантов сообщений, которые надо показывать пользователям (в число сообщений, например, входят и реклама, сайты, изображения) так, чтобы выбранные сообщения максимизировали некое бизнес-задание (конверсию, кликабельность и пр.)

Читать дальше →

+10

Makoomaky 30 июн 2022 в 14:35

Контекстные многорукие бандиты для рекомендации контента, или Не Бернулли единым

17 мин

18K

Блог компании VKData Mining * Алгоритмы * Математика * Машинное обучение *

Туториал

Победитель Технотекст 2022

Привет, Хабр! Меня зовут Александр Сухочев, я занимаюсь машинным обучением и руковожу командой рекомендаций и развития сервисов ВКонтакте. Сегодня хочу поделиться нашим опытом и результатами внедрения контекстуальных многоруких бандитов для рекомендации контента на примере игр и стикеров.

Статья состоит из четырёх частей, переходите сразу ко второй или третьей, если знакомы с проблематикой, или читайте по порядку, чтобы составить полную картину:

Введение расскажет о том, какие бывают подходы к построению рекомендательных систем и при чём здесь многорукие бандиты — это раздел для тех, кто раньше не был знаком с данным подходом.

Основные алгоритмы решения задачи многорукого бандита: эпсилон-жадный подход, сэмплирование Томпсона, Upper Confidence Bound.

Алгоритм контекстных многоруких бандитов — о контекстных многоруких бандитах и способе их обучения в частном случае, который мы использовали в нашем решении.

Заметки о практической реализации — о тонкостях внедрения, бизнес-требованиях и результатах на примере сервиса рекомендации игр и стикеров.

+54

greenwo1f 14 авг 2018 в 09:53

Многорукие бандиты в рекомендациях

9 мин

27K

Блог компании AvitoTechМашинное обучение * Алгоритмы * Python * Data Mining *

Всем привет! Меня зовут Миша Каменщиков, я занимаюсь Data Science и разработкой микросервисов в команде рекомендаций Авито. В этой статье я расскажу про наши рекомендации похожих объявлений и о том, как мы улучшаем их при помощи многоруких бандитов. С докладом на эту тему я выступал на конференции Highload++ Siberia и на мероприятии «Data & Science: Маркетинг».

Читать дальше →

+37

Jaylla 14 июл 2021 в 10:16

Рекомендательные системы: проблемы и методы решения. Часть 1

14 мин

43K

Блог компании PrequelМашинное обучение * Алгоритмы *

Технотекст 2021

Привет! Я хочу рассказать вам о рекомендательных алгоритмах. Мы в Prequel создаем фильтры и эффекты для редактирования фото и видео. Создаем давно, и постепенно этих эффектов стало очень много. А с ними и пользовательского контента. Мы захотели помочь с выбором из этого многообразия, для чего нам и понадобилась система рекомендаций. Если масштабы вашей системы такие, что пользователям сложно в ней ориентироваться, возможно, что рекомендации могут помочь и вам.

Задуманный систем оказался слишком объемным для одной статьи, поэтому мы разбили его на две части. Перед вами первая, она посвящена постановке задачи и базовым методам решения. В этой части мы разберем коллаборативные модели от матричного разложения (на примере ALS) до neural collaborative filtering. Кроме того, будет небольшой обзор метрик и техник борьбы с проблемой холодного старта.

Jaylla 20 авг 2021 в 11:55

Рекомендательные системы: проблемы и методы решения. Часть 2

15 мин

28K

Блог компании PrequelАлгоритмы * Машинное обучение * Искусственный интеллект

Привет! Меня зовут Екатерина Ванская, и я занимаюсь data science в компании Prequel. В этой статье я продолжу обзор рекомендательных алгоритмов, которым мы начали в предыдущем моем материале

(вот ссылка на первую часть).

Область рекомендаций усложняется по мере расширения сферы ее применения, с каждым новым вызовом и нюансом использования. По мере увеличения объемов данных и усложнения задач появлялись новые подходы, отличные от рассмотренных ранее простых коллаборативных моделей.

Arnak 24 авг 2023 в 13:16

Как повысить свои шансы пройти ИИ-фильтр на сайтах вакансий

Простой

9 мин

17K

Блог компании getmatchКарьера в IT-индустрииЛайфхаки для гиков

Если вы давно и безуспешно ищете работу на популярных сайтах по трудоустройству, то вы не одиноки. Как известно, рекрутеры выбирают не лучшего, а того, кто лучше всех других подходит под их критерии. Это особенно актуально сейчас, когда работу рекрутеров постепенно заменяет ИИ.

Почти все топовые западные компании его уже используют. Миллионы резюме с LinkedIn, Indeed и ZipRecruiter фильтруются автоматическими ATS-системами, и только потом попадают на глаза человеку. 98,8% компаний из списка Fortune 500 используют такие системы фильтрования кандидатов для оптимизации процесса найма.

Но это можно использовать и в свою пользу. Хотя превращение своего резюме в магнит для ИИ само по себе не гарантирует получение работы, это увеличит вероятность того, что ваше резюме будет рассмотрено. Особенно в крупных компаниях, которые ежедневно фильтруют десятки тысяч кандидатов.

Мы живем в дистопии, где на работу нас начинают выбирать роботы. Можно плакать по этому поводу, а можно попробовать обмануть наших новых оверлордов.

+20

ru_vds 18 фев 2019 в 10:05

Изучаем Python: модуль argparse

6 мин

185K

Блог компании RUVDS.comPython * Веб-разработка *

Туториал

Перевод

Если вы занимаетесь обработкой и анализом данных с использованием Python, то вам, рано или поздно, придётся выйти за пределы Jupyter Notebook, преобразовав свой код в скрипты, которые можно запускать средствами командной строки. Здесь вам и пригодится модуль argparse. Для новичков, привыкших к Jupyter Notebook, такой шаг означает необходимость покинуть зону комфорта и перейти в новую среду. Материал, перевод которого мы публикуем сегодня, написан для того, чтобы облегчить подобный переход.

Модуль argparse

Читать дальше →

+26

Sakhar 13 мар 2021 в 09:42

Играем с CLIP. Создаем универсальный zero-shot классификатор на Android

9 мин

10K

Flask * Искусственный интеллектAndroid * Java * Python *

TLDR: приложение можно скачать и потестить тут

Эта статья является дополненной и сильно расширенной версией моей статьи в TowardsDataScience о создании приложения, использующем новейшую мультимодальную нейросеть от OpenAI

В чем проблема классификаторов?

Многие заметили, что в последние годы все чаще для обработки изображений используется нейросетевой подход.

Dirac 26 янв 2021 в 10:15

Нейронная Сеть CLIP от OpenAI: Классификатор, который не нужно обучать. Да здравствует Обучение без Обучения

18 мин

76K

Python * Программирование * Алгоритмы * Машинное обучение * Искусственный интеллект

Туториал

Можете представить себе классификатор изображений, решающий практически любую задачу, и который вообще не нужно обучать? Это новая нейросеть CLIP от OpenAI. Разбор CLIP из рубрики: Разбираем и Собираем Нейронные Сети на примере Звездных Войн!

Нет данных, нет разметки, но нужен классификатор изображений для конкретной задачи? Нет времени возиться с обучением нейронной сети, но нужно получить классификацию высокой точности? Все это стало возможным. Вам нужно обучение без обучения!

Готов и туториал: Собираем нейросети. Классификатор животных из мультфильмов. Без данных и за 5 минут. CLIP: Обучение без Обучения + код

Подробно и доступно разбираем что такое "обучение без обучения" и саму нейросеть CLIP от OpenAI. Стираем границы между Текстом и Изображением. Внимание: статья подходит под любой уровень: от нулевого до профи. Приятного прочтения!

Поехали!

+28