МегаФон / Статьи / Хабр

Как стать автором

ПрофильСтатьи126Посты1Новости13Вакансии20

Extremesarova 9 сен 2024 в 14:59

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 5: Поведенческое интервью + Бонусы

Средний

7 мин

6K

Блог компании МегаФонМатематика*Учебный процесс в ITКарьера в IT-индустрииИнтервью

Роадмэп

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В предыдущей статье я поделился материалами для подготовки к дизайну систем машинного обучения.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к поведенческому интервью, а также ресурсы, которые не подошли по тематике ни к одной из предыдущих статей.

Читать далее

+2

Extremesarova 26 июн 2024 в 11:08

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 4: Дизайн систем машинного обучения

Средний

8 мин

9.3K

Блог компании МегаФонМашинное обучение*Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллект

Роадмэп

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor). Мы строим скоринговые (credit scoring), лидогенерационные (lead generation) и антифрод (anti-fraud) модели на телеком данных, а также делаем гео-аналитику (geo-analytics).

В предыдущей статье я поделился материалами для подготовки к этапу по специализированному машинному обучению.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по дизайну систем машинного обучения.

Читать далее

+4

Extremesarova 19 апр 2024 в 16:41

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 3: Специализированное машинное обучение

Средний

22 мин

12K

Блог компании МегаФонBig Data*Машинное обучение*Учебный процесс в ITКарьера в IT-индустрии

Роадмэп

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В предыдущей статье я поделился материалами для подготовки к этапу по классическому машинному обучению.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по специализированному машинному обучению.

Читать далее

+6

Extremesarova 18 мар 2024 в 13:03

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 2: Классическое машинное обучение

Средний

13 мин

16K

Блог компании МегаФонBig Data*Машинное обучение*Учебный процесс в ITКарьера в IT-индустрии

Роадмэп

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В предыдущей статье я поделился материалами для подготовки к одному из самых волнительных (для многих) этапов - Live Coding.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по классическому машинному обучению.

Читать далее

+9

Extremesarova 21 фев 2024 в 16:33

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 1: Live Coding

Средний

14 мин

31K

Блог компании МегаФонPython*SQL*Алгоритмы*Big Data*

Роадмэп

✏️ Технотекст 7

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В данной статье разберемся что такое live coding интервью и как к нему готовиться.

Материал в первую очередь будет полезен Data Scientist'ам и ML инженерам, при этом некоторые разделы, например, Алгоритмы и структуры данных подойдут всем IT специалистам, которым предстоит пройти секцию live coding.

Читать далее

+8

DariaSatco 16 ноя 2023 в 13:45

Персонализация тарифного плана для новых абонентов: как оцифровать привлекательность

Средний

10 мин

3.6K

Блог компании МегаФонBig Data*Машинное обучение*Искусственный интеллект

Кейс

В этой статье расскажем про подход к решению задачи о персонализации тарифных планов для абонентов новой базы в рамках CVM-проекта. Поговорим о том, как с помощью ML определить оптимальные параметры тарифа для абонентов с короткой историей, и как посчитать привлекательность полученного тарифа.

Читать далее

+1

totsamymatveev 31 окт 2023 в 12:24

Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

Средний

12 мин

13K

Блог компании МегаФонPython*Big Data*Машинное обучение*Искусственный интеллект

Туториал

Привет, Хабр! Меня зовут Никита, я работаю в Мегафоне аналитиком больших данных. В этой статье я хочу поговорить про временные ряды, а если конкретнее, про использование нейросетей для их прогнозирования.

В статье мы не только разберем две актуальные архитектуры для прогнозирования, но и применим их на реальных данных. В дополнение к статье вас ждет код, с помощью которого вы легко сможете запустить сетки и применить их для решения своих задач!

Читать далее

+7

sle_mary 29 сен 2023 в 17:51

Hadoop в любой непонятной ситуации. Как выжить кластеру в большой ML команде

Средний

9 мин

5.5K

Блог компании МегаФонHadoop*Машинное обучение*Big Data*Python*

Туториал

Привет, Habr !

Я работаю инженером по машинному обучению в Мегафоне. Занимаюсь аналитикой данных и являюсь частью команды разработки MLOps платформы. Задача нашей команды состоит в том, чтобы выстраивать и оптимизировать процессы разработки и продуктивизации моделей машинного обучения, предоставлять функционал для основных этапов (сбор данных, MQ/DQ, продуктивизация).

Сегодня поговорим о том, какие сложности могут возникать при работе с кластером Hadoop и какие есть методы для их решения.

Видеозапись по мотивам статьи можно посмотреть здесь.

Эта статья будет интересна аналитикам и инженерам, которые работают с BigData и регулярно сталкиваются с необходимостью продуктивизировать модели на Hadoop.

Читать далее

+2

edgar-dev20 25 авг 2023 в 16:17

Анализ эффективности кэширования на бэкенде ЛК МегаФон

Сложный

8 мин

3.3K

Блог компании МегаФонСерверная оптимизация*Высокая производительность*Распределённые системы*Анализ и проектирование систем*

Туториал

По мере расширения функциональности сервиса и роста его аудитории мы неизбежно сталкиваемся с узкими местами в производительности. Прежде чем масштабировать ресурсы для эксплуатации, следует понять, насколько эффективно эксплуатируется текущая конфигурация.

Одним из таких узких мест может стать ваше распределенное хранилище для кэша. Все мы привыкли к тому, что оно нас спасает от тяжелых запросов в БД или обращенийк внешним системам с большой задержкой. Но рано или поздно может возникнуть ситуация, когда конфигурация этого хранилища будет на грани своей оптимальной производительности и в случае высоких нагрузок (аварий, спровоцированных наплывом пользователей или рекламными кампаниями) хранилище может подвести нас.

Как определить, что утилизация ресурсов кэширования происходит оптимально? Что если довольно большая часть нагрузки не приносит реальной пользы, и от нее с легкостью можно избавиться, тем самым разгрузив хранилище? В рамках этой статьи мы оценим эффективность кэширования бэкeнда ЛК МегаФон и расскажем о результатах проведенных мероприятий для оптимизации.

Читать далее

+4

Valen-rus 15 сен 2022 в 16:40

Голос в мобильных сетях. От чего зависит качество?

6 мин

14K

Блог компании МегаФонРазработка систем связи*Стандарты связи*Сотовая связь

Привет, Habr!

На связи МегаФон и в данной статье мы подробно расскажем всё про передачу голоса в мобильных сетях.

Что определяет качество речи?
Какие речевые кодеки используются в мобильных сетях и их отличия?
Как оператор измеряет и контролирует качество речи в мобильных сетях?
Какие речевые технологии появятся в сетях 5G?

Читать далее

+6

MegaFon 19 мая 2022 в 18:10

Мобильная связь на колесах

6 мин

13K

Блог компании МегаФонСотовая связьСтандарты связи*Разработка систем связи*

Туториал

Хабр, привет)

Сегодня расскажем про мобильную альтернативу базовой станции, ее типы и почему не всегда возможно ее построить. Инженер МегаФона написал «просто о не просто телекоме», поэтому статья будет интересна тем, кто интересуется работой сотовой сети и качеством связи смартфона.

Читать далее

+18

Radioplan 26 апр 2022 в 08:40

Сотовая сеть. Как спланируешь, так абонент дозвонится или нет

7 мин

7.6K

Блог компании МегаФонСтандарты связи*Сотовая связь

Туториал

Хабр, привет. Я, Сергей, отвечаю за стратегическое планирование инфраструктуры в МегаФоне. Продолжаю серию статей о «непросто телекоме», где сотрудники инфраструктуры рассказывают о связи и своей работе. Статья зайдет тем, кому нравится разбираться в технологиях работы телекома (уровень новичок) и понимать почему связь хорошо или плохо работает. В этой статье расскажу про свою работу в планировании сети. Развею мифы, что работа инженера, - «чинит железки и связь, устанавливает антенны, лазит по крышам и т.д.». В жизни все интереснее.

+10

sharapova_k 12 апр 2022 в 07:00

Игры, в которые играют люди, или Как повысить посещаемость приложения мобильного оператора

6 мин

4K

Блог компании МегаФонМонетизация игр*Монетизация мобильных приложений*Дизайн игр*Разработка игр*

Хабр, привет!

Мы — Паша и Катя, лидируем направление геймификации программы вовлечения в МегаФоне. Расскажем про создание мобильных игр в личном кабинете МегаФона, поделимся интересной статистикой и инсайтами. Ответим на вопрос, почему незатейливая геймификация в личном кабинете — успешный проект. Сами не ожидали такого :)

Читать далее

-10

IvanWiz 28 мар 2022 в 11:46

Причина и следствие

13 мин

6.3K

Блог компании МегаФонBig Data*Data Mining*Статистика в IT

Из песочницы

Мы привыкли, что Machine Learning предоставляет нам большое количество предиктивных методов, которые с каждым годом предсказывают события лучше и лучше. Деревья, леса, бустинги, нейронные сети, обучение с подкреплением и другие алгоритмы машинного обучения позволяют предвидеть будущее все более отчетливо. Казалось бы, что нужно еще? Просто улучшать методы и тогда мы рано или поздно будем жить в будущем так же спокойно, как и в настоящем. Однако не все так просто.

Когда мы рассматриваем бизнес задачи, мы часто сталкиваемся с двумя моментами. Во-первых, мы хотим понять что к чему относится и что с чем связано. Нам важна интерпретация. Чем сложнее модели мы используем, тем более нелинейные они. Тем больше они похожи на черную коробку, в которой очень сложно выявить связи, понятные человеческому разуму. Все же мы привыкли мыслить довольно линейно или близко к тому. Во-вторых, мы хотим понять - если мы подергаем вот эту "ручку", изменится ли результат в будущем и насколько? То есть, мы хотим увидеть причинно-следственную связь между нашим целевым событием и некоторым фактором. Как сказал Рубин - без манипуляции нет причинно следственной связи. Мы часто ошибочно принимаем обыкновенную корреляцию за эту связь. В этой серии статей мы сконцентрируемся на причинах и следствиях.

Но что не так с привычными нам методами ML? Мы строим модель, а значит, предсказывая значение целевого события мы можем менять значение одного из факторов - одной из фич и тогда мы получим соответствующее изменение таргета. Вот нам и предсказание. Все не так просто. По конструкции, большинство ML методов отлично выявляют корреляцию между признаком и таргетом, но ничего не говорят о том, произошло ли изменение целевого события именно из-за изменения значения фичи. То есть, ничего не говорят нам о том - что здесь было причиной, а что следствием.

Читать далее

0

danilkinkin 18 янв 2022 в 06:00

Почему важно тестить на устройствах, которыми пользуются ваши пользователи, а также немного об Emoji

7 мин

6.3K

Блог компании МегаФонВеб-разработка*Типографика*Программирование*

Туториал

Почему важно тестить на устройствах, которыми пользуются ваши пользователи, а также немного об Emoji

Привет Хабр! Друзья зовут меня Данил, я web-разработчик в МегаФоне и работаю над системой обработки обращений наших пользователей. А их у нас огромное количество, и я каждый раз удивляюсь богатому русскому языку.

Под катом хочу рассказать о том, как мы внедряли emoji-клавиатуру в нашу систему DARM. С какими проблемами столкнулись и чего нам это стоило. Прочитавшим до конца плюс в карму и оберег от ошибок.

Читать далее

+9

edgar-dev20 23 дек 2021 в 09:00

Как мы логшипим в Elasticsearch и что думаем о Filebeat

11 мин

23K

Блог компании МегаФонАнализ и проектирование систем*Администрирование баз данных*DevOps*

Туториал

Привет, я - Эдгар, backend-разработчик личного кабинета МегаФон, поделюсь решением проблемы log shipping-процесса в централизованное хранилище Elasticsearch, которое мы нашли вместе с командой.

Читать далее

+6

art-glazunov 8 ноя 2021 в 09:31

«От категорий к векторам», или нестандартное кодирование категориальных данных. Часть 2

7 мин

3K

Блог компании МегаФонData Mining*Big Data*Машинное обучение*

Туториал

Привет, Хабр! С вами снова Артём, Team Lead Data Scientist из МегаФона. Надеюсь, вам понравилась первая статья серии о нестандартных методах кодирования категориальных данных, где я поделился своим опытом и показал, как с кодированием справляется тематическое моделирование. Во второй части вы узнаете о более сложных подходах. Инсайты могут быть полезны специалистам в Data Science для решения широкого класса задач: от классификации до построения рекомендательных систем.

+5

Fattakh 5 окт 2021 в 10:20

4 дня из жизни unix-инженера, хроника разработки скрипта

13 мин

5.9K

Блог компании МегаФонСерверное администрирование*Программирование*Системное администрирование*Настройка Linux*

Статья будет полезна unix-инженерам и владельцам информационных систем, которые сталкиваются в своей работе с нехваткой технических данных о серверной нагрузке за длительный период времени.

Я - unix-инженер и расскажу, как мы разрабатывали скрипт по логированию потребления ресурсов сервера процессами, пошагово, в виде фотографии своего рабочего дня. А точнее, четырёх дней: пройдёмся по этапам, начиная с выявления проблемы и заканчивая развертыванием в проде. Параллельно покажу взаимодействие команды на каждом этапе наглядно. Вас ждет скрипт в конце лонгрида).

Итак в путь >>

0

fregatmf 28 сен 2021 в 11:46

Упала связь, обрыв на линии и при чем тут собака

3 мин

11K

Блог компании МегаФонIT-инфраструктура*Беспроводные технологии*Стандарты связи*Сотовая связь

Инсайты телекома. Легкий и позитивный контент для тех, кому интересно погрузиться в будни инженеров МегаФона и узнать, как работает связь. Почему LTE становится EDGE, когда очень нужно.

Спойлер: любишь истории со счастливым концом - дочитай до конца :)

+25

Mozalevsky 25 авг 2021 в 10:00

Почему Chapterы не летают

7 мин

4.5K

Блог компании МегаФонAgile*

Привет, мы - Agile коучи МегаФона и эта статья посвящена разбору тех трудностей, с которыми мы столкнулись, развивая самоорганизующиеся сообщества в нашей и не только компании. Надеемся, что наш опыт и выводы, которые мы сделали, будут полезны как тем, кто только вступает в ряды Scrum мастеров и коучей, так и более опытным коллегам.

Читать далее

-2

1

2 3 ...