Как стать автором
Обновить
Сначала показывать

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 5: Поведенческое интервью + Бонусы

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров4.9K

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В предыдущей статье я поделился материалами для подготовки к дизайну систем машинного обучения.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к поведенческому интервью, а также ресурсы, которые не подошли по тематике ни к одной из предыдущих статей.

Читать далее
Всего голосов 9: ↑3 и ↓6+1
Комментарии0

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 4: Дизайн систем машинного обучения

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров7.3K

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor). Мы строим скоринговые (credit scoring), лидогенерационные (lead generation) и антифрод (anti-fraud) модели на телеком данных, а также делаем гео-аналитику (geo-analytics).

В предыдущей статье я поделился материалами для подготовки к этапу по специализированному машинному обучению.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по дизайну систем машинного обучения.

Читать далее
Всего голосов 4: ↑4 и ↓0+4
Комментарии3

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 3: Специализированное машинное обучение

Уровень сложностиСредний
Время на прочтение22 мин
Количество просмотров8.8K

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В предыдущей статье я поделился материалами для подготовки к этапу по классическому машинному обучению.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по специализированному машинному обучению.

Читать далее
Всего голосов 5: ↑5 и ↓0+6
Комментарии2

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 2: Классическое машинное обучение

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров12K

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В предыдущей статье я поделился материалами для подготовки к одному из самых волнительных (для многих) этапов - Live Coding.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по классическому машинному обучению.

Читать далее
Всего голосов 9: ↑9 и ↓0+9
Комментарии0

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 1: Live Coding

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров24K

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В данной статье разберемся что такое live coding интервью и как к нему готовиться.

Материал в первую очередь будет полезен Data Scientist'ам и ML инженерам, при этом некоторые разделы, например, Алгоритмы и структуры данных подойдут всем IT специалистам, которым предстоит пройти секцию live coding.

Читать далее
Всего голосов 10: ↑9 и ↓1+8
Комментарии11

Персонализация тарифного плана для новых абонентов: как оцифровать привлекательность

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров3.2K

В этой статье расскажем про подход к решению задачи о персонализации тарифных планов для абонентов новой базы в рамках CVM-проекта. Поговорим о том, как с помощью ML определить оптимальные параметры тарифа для абонентов с короткой историей, и как посчитать привлекательность полученного тарифа.

Читать далее
Всего голосов 8: ↑3 и ↓50
Комментарии7

Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров11K

Привет, Хабр! Меня зовут Никита, я работаю в Мегафоне аналитиком больших данных. В этой статье я хочу поговорить про временные ряды, а если конкретнее, про использование нейросетей для их прогнозирования. 

В статье мы не только разберем две актуальные архитектуры для прогнозирования, но и применим их на реальных данных. В дополнение к статье вас ждет код, с помощью которого вы легко сможете запустить сетки и применить их для решения своих задач!

Читать далее
Всего голосов 7: ↑7 и ↓0+7
Комментарии9

Hadoop в любой непонятной ситуации. Как выжить кластеру в большой ML команде

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров4.5K

Привет, Habr !

Я работаю инженером по машинному обучению в Мегафоне. Занимаюсь аналитикой данных и являюсь частью команды разработки MLOps платформы. Задача нашей команды состоит в том, чтобы выстраивать и оптимизировать процессы разработки и продуктивизации моделей машинного обучения, предоставлять функционал для основных этапов (сбор данных, MQ/DQ, продуктивизация).

Сегодня поговорим о том, какие сложности могут возникать при работе с кластером Hadoop и какие есть методы для их решения.

Видеозапись по мотивам статьи можно посмотреть здесь.

Эта статья будет интересна аналитикам и инженерам, которые работают с BigData и регулярно сталкиваются с необходимостью продуктивизировать модели на Hadoop.

Читать далее
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

Анализ эффективности кэширования на бэкенде ЛК МегаФон

Уровень сложностиСложный
Время на прочтение8 мин
Количество просмотров3K

По мере расширения функциональности сервиса и роста его аудитории мы неизбежно сталкиваемся с узкими местами в производительности. Прежде чем масштабировать ресурсы для эксплуатации, следует понять, насколько эффективно эксплуатируется текущая конфигурация.

Одним из таких узких мест может стать ваше распределенное хранилище для кэша. Все мы привыкли к тому, что оно нас спасает от тяжелых запросов в БД или обращенийк внешним системам с большой задержкой. Но рано или поздно может возникнуть ситуация, когда конфигурация этого хранилища будет на грани своей оптимальной производительности и в случае высоких нагрузок (аварий, спровоцированных наплывом пользователей или рекламными кампаниями) хранилище может подвести нас.

Как определить, что утилизация ресурсов кэширования происходит оптимально? Что если довольно большая часть нагрузки не приносит реальной пользы, и от нее с легкостью можно избавиться, тем самым разгрузив хранилище? В рамках этой статьи мы оценим эффективность кэширования бэкeнда ЛК МегаФон и расскажем о результатах проведенных мероприятий для оптимизации.

Читать далее
Всего голосов 4: ↑4 и ↓0+4
Комментарии6

Голос в мобильных сетях. От чего зависит качество?

Время на прочтение6 мин
Количество просмотров12K

Привет, Habr!

На связи МегаФон и в данной статье мы подробно расскажем всё про передачу голоса в мобильных сетях.

Что определяет качество речи?
Какие речевые кодеки используются в мобильных сетях и их отличия?
Как оператор измеряет и контролирует качество речи в мобильных сетях?
Какие речевые технологии появятся в сетях 5G?

Читать далее
Всего голосов 8: ↑8 и ↓0+8
Комментарии13

Мобильная связь на колесах

Время на прочтение6 мин
Количество просмотров13K

Хабр, привет)

Сегодня расскажем про мобильную альтернативу базовой станции, ее типы и почему не всегда возможно ее построить. Инженер МегаФона написал «просто о не просто телекоме», поэтому статья будет интересна тем, кто интересуется работой сотовой сети и качеством связи смартфона.

Читать далее
Всего голосов 17: ↑16 и ↓1+19
Комментарии12

Сотовая сеть. Как спланируешь, так абонент дозвонится или нет

Время на прочтение7 мин
Количество просмотров7.4K

Хабр, привет. Я, Сергей, отвечаю за стратегическое планирование инфраструктуры в МегаФоне. Продолжаю серию статей о «непросто телекоме», где сотрудники инфраструктуры рассказывают о связи и своей работе. Статья зайдет тем, кому нравится разбираться в технологиях работы телекома (уровень новичок) и понимать почему связь хорошо или плохо работает. В этой статье расскажу про свою работу в планировании сети. Развею мифы, что работа инженера, - «чинит железки и связь, устанавливает антенны, лазит по крышам и т.д.». В жизни все интереснее.

Читать
Всего голосов 10: ↑9 и ↓1+10
Комментарии10

Игры, в которые играют люди, или Как повысить посещаемость приложения мобильного оператора

Время на прочтение6 мин
Количество просмотров3.9K

Хабр, привет!

Мы — Паша и Катя, лидируем направление геймификации программы вовлечения в МегаФоне. Расскажем про создание мобильных игр в личном кабинете МегаФона, поделимся интересной статистикой и инсайтами. Ответим на вопрос, почему незатейливая геймификация в личном кабинете — успешный проект. Сами не ожидали такого :)

Читать далее
Всего голосов 10: ↑0 и ↓10-10
Комментарии19

Причина и следствие

Время на прочтение13 мин
Количество просмотров5.9K

Мы привыкли, что Machine Learning предоставляет нам большое количество предиктивных методов, которые с каждым годом предсказывают события лучше и лучше. Деревья, леса, бустинги, нейронные сети, обучение с подкреплением и другие алгоритмы машинного обучения позволяют предвидеть будущее все более отчетливо. Казалось бы, что нужно еще? Просто улучшать методы и тогда мы рано или поздно будем жить в будущем так же спокойно, как и в настоящем. Однако не все так просто.

Когда мы рассматриваем бизнес задачи, мы часто сталкиваемся с двумя моментами. Во-первых, мы хотим понять что к чему относится и что с чем связано. Нам важна интерпретация. Чем сложнее модели мы используем, тем более нелинейные они. Тем больше они похожи на черную коробку, в которой очень сложно выявить связи, понятные человеческому разуму. Все же мы привыкли мыслить довольно линейно или близко к тому. Во-вторых, мы хотим понять - если мы подергаем вот эту "ручку", изменится ли результат в будущем и насколько? То есть, мы хотим увидеть причинно-следственную связь между нашим целевым событием и некоторым фактором. Как сказал Рубин - без манипуляции нет причинно следственной связи. Мы часто ошибочно принимаем обыкновенную корреляцию за эту связь. В этой серии статей мы сконцентрируемся на причинах и следствиях.

Но что не так с привычными нам методами ML? Мы строим модель, а значит, предсказывая значение целевого события мы можем менять значение одного из факторов - одной из фич и тогда мы получим соответствующее изменение таргета. Вот нам и предсказание. Все не так просто. По конструкции, большинство ML методов отлично выявляют корреляцию между признаком и таргетом, но ничего не говорят о том, произошло ли изменение целевого события именно из-за изменения значения фичи. То есть, ничего не говорят нам о том - что здесь было причиной, а что следствием.

Читать далее
Рейтинг0
Комментарии3

Почему важно тестить на устройствах, которыми пользуются ваши пользователи, а также немного об Emoji

Время на прочтение7 мин
Количество просмотров5.9K

Почему важно тестить на устройствах, которыми пользуются ваши пользователи, а также немного об Emoji

Привет Хабр! Друзья зовут меня Данил, я web-разработчик в МегаФоне и работаю над системой обработки обращений наших пользователей. А их у нас огромное количество, и я каждый раз удивляюсь богатому русскому языку.

Под катом хочу рассказать о том, как мы внедряли emoji-клавиатуру в нашу систему DARM. С какими проблемами столкнулись и чего нам это стоило. Прочитавшим до конца плюс в карму и оберег от ошибок.

Читать далее
Всего голосов 9: ↑9 и ↓0+9
Комментарии15

Как мы логшипим в Elasticsearch и что думаем о Filebeat

Время на прочтение11 мин
Количество просмотров21K

Привет, я - Эдгар, backend-разработчик личного кабинета МегаФон, поделюсь решением проблемы log shipping-процесса в централизованное хранилище Elasticsearch, которое мы нашли вместе с командой. 

Читать далее
Всего голосов 5: ↑4 и ↓1+6
Комментарии3

«От категорий к векторам», или нестандартное кодирование категориальных данных. Часть 2

Время на прочтение7 мин
Количество просмотров3K

Привет, Хабр! С вами снова Артём, Team Lead Data Scientist из МегаФона. Надеюсь, вам понравилась первая статья серии о нестандартных методах кодирования категориальных данных, где я поделился своим опытом и показал, как с кодированием справляется тематическое моделирование. Во второй части вы узнаете о более сложных подходах. Инсайты могут быть полезны специалистам в Data Science для решения широкого класса задач: от классификации до построения рекомендательных систем.

В путь
Всего голосов 5: ↑5 и ↓0+5
Комментарии0

4 дня из жизни unix-инженера, хроника разработки скрипта

Время на прочтение13 мин
Количество просмотров5.8K

Статья будет полезна unix-инженерам и владельцам информационных систем, которые сталкиваются в своей работе с нехваткой технических данных о серверной нагрузке за длительный период времени.

Я - unix-инженер и расскажу, как мы разрабатывали скрипт по логированию потребления ресурсов сервера процессами, пошагово, в виде фотографии своего рабочего дня. А точнее, четырёх дней: пройдёмся по этапам, начиная с выявления проблемы и заканчивая развертыванием в проде. Параллельно покажу взаимодействие команды на каждом этапе наглядно. Вас ждет скрипт в конце лонгрида).

Итак в путь >>
Всего голосов 4: ↑2 и ↓20
Комментарии14

Упала связь, обрыв на линии и при чем тут собака

Время на прочтение3 мин
Количество просмотров10K

Инсайты телекома. Легкий и позитивный контент для тех, кому интересно погрузиться в будни инженеров МегаФона и узнать, как работает связь. Почему LTE становится EDGE, когда очень нужно.

Спойлер: любишь истории со счастливым концом - дочитай до конца :)

Читать
Всего голосов 18: ↑17 и ↓1+25
Комментарии19

Почему Chapterы не летают

Время на прочтение7 мин
Количество просмотров4.3K

Привет, мы - Agile коучи МегаФона и эта статья посвящена разбору тех трудностей, с которыми мы столкнулись, развивая самоорганизующиеся сообщества в нашей и не только компании. Надеемся, что наш опыт и выводы, которые мы сделали, будут полезны как тем, кто только вступает в ряды Scrum мастеров и коучей, так и более опытным коллегам.

Читать далее
Всего голосов 4: ↑1 и ↓3-2
Комментарии2
1
23 ...

Информация

Сайт
job.megafon.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия