Как стать автором
Обновить
Сначала показывать

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 2: Классическое машинное обучение

Уровень сложности Средний
Время на прочтение 13 мин
Количество просмотров 2.2K

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В предыдущей статье я поделился материалами для подготовки к одному из самых волнительных (для многих) этапов - Live Coding.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по классическому машинному обучению.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 1: Live Coding

Уровень сложности Средний
Время на прочтение 14 мин
Количество просмотров 12K

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В данной статье разберемся что такое live coding интервью и как к нему готовиться.

Материал в первую очередь будет полезен Data Scientist'ам и ML инженерам, при этом некоторые разделы, например, Алгоритмы и структуры данных подойдут всем IT специалистам, которым предстоит пройти секцию live coding.

Читать далее
Всего голосов 11: ↑9 и ↓2 +7
Комментарии 2

Персонализация тарифного плана для новых абонентов: как оцифровать привлекательность

Уровень сложности Средний
Время на прочтение 10 мин
Количество просмотров 2.2K

В этой статье расскажем про подход к решению задачи о персонализации тарифных планов для абонентов новой базы в рамках CVM-проекта. Поговорим о том, как с помощью ML определить оптимальные параметры тарифа для абонентов с короткой историей, и как посчитать привлекательность полученного тарифа.

Читать далее
Всего голосов 10: ↑5 и ↓5 0
Комментарии 6

Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

Уровень сложности Средний
Время на прочтение 12 мин
Количество просмотров 7.3K

Привет, Хабр! Меня зовут Никита, я работаю в Мегафоне аналитиком больших данных. В этой статье я хочу поговорить про временные ряды, а если конкретнее, про использование нейросетей для их прогнозирования. 

В статье мы не только разберем две актуальные архитектуры для прогнозирования, но и применим их на реальных данных. В дополнение к статье вас ждет код, с помощью которого вы легко сможете запустить сетки и применить их для решения своих задач!

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Комментарии 9

Hadoop в любой непонятной ситуации. Как выжить кластеру в большой ML команде

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 3K

Привет, Habr !

Я работаю инженером по машинному обучению в Мегафоне. Занимаюсь аналитикой данных и являюсь частью команды разработки MLOps платформы. Задача нашей команды состоит в том, чтобы выстраивать и оптимизировать процессы разработки и продуктивизации моделей машинного обучения, предоставлять функционал для основных этапов (сбор данных, MQ/DQ, продуктивизация).

Сегодня поговорим о том, какие сложности могут возникать при работе с кластером Hadoop и какие есть методы для их решения.

Видеозапись по мотивам статьи можно посмотреть здесь.

Эта статья будет интересна аналитикам и инженерам, которые работают с BigData и регулярно сталкиваются с необходимостью продуктивизировать модели на Hadoop.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Комментарии 0

Анализ эффективности кэширования на бэкенде ЛК МегаФон

Уровень сложности Сложный
Время на прочтение 8 мин
Количество просмотров 2.5K

По мере расширения функциональности сервиса и роста его аудитории мы неизбежно сталкиваемся с узкими местами в производительности. Прежде чем масштабировать ресурсы для эксплуатации, следует понять, насколько эффективно эксплуатируется текущая конфигурация.

Одним из таких узких мест может стать ваше распределенное хранилище для кэша. Все мы привыкли к тому, что оно нас спасает от тяжелых запросов в БД или обращенийк внешним системам с большой задержкой. Но рано или поздно может возникнуть ситуация, когда конфигурация этого хранилища будет на грани своей оптимальной производительности и в случае высоких нагрузок (аварий, спровоцированных наплывом пользователей или рекламными кампаниями) хранилище может подвести нас.

Как определить, что утилизация ресурсов кэширования происходит оптимально? Что если довольно большая часть нагрузки не приносит реальной пользы, и от нее с легкостью можно избавиться, тем самым разгрузив хранилище? В рамках этой статьи мы оценим эффективность кэширования бэкeнда ЛК МегаФон и расскажем о результатах проведенных мероприятий для оптимизации.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 6

Голос в мобильных сетях. От чего зависит качество?

Время на прочтение 6 мин
Количество просмотров 9.8K

Привет, Habr!

На связи МегаФон и в данной статье мы подробно расскажем всё про передачу голоса в мобильных сетях.

Что определяет качество речи?
Какие речевые кодеки используются в мобильных сетях и их отличия?
Как оператор измеряет и контролирует качество речи в мобильных сетях?
Какие речевые технологии появятся в сетях 5G?

Читать далее
Всего голосов 8: ↑8 и ↓0 +8
Комментарии 13

Мобильная связь на колесах

Время на прочтение 6 мин
Количество просмотров 12K

Хабр, привет)

Сегодня расскажем про мобильную альтернативу базовой станции, ее типы и почему не всегда возможно ее построить. Инженер МегаФона написал «просто о не просто телекоме», поэтому статья будет интересна тем, кто интересуется работой сотовой сети и качеством связи смартфона.

Читать далее
Всего голосов 21: ↑20 и ↓1 +19
Комментарии 12

Сотовая сеть. Как спланируешь, так абонент дозвонится или нет

Время на прочтение 7 мин
Количество просмотров 7K

Хабр, привет. Я, Сергей, отвечаю за стратегическое планирование инфраструктуры в МегаФоне. Продолжаю серию статей о «непросто телекоме», где сотрудники инфраструктуры рассказывают о связи и своей работе. Статья зайдет тем, кому нравится разбираться в технологиях работы телекома (уровень новичок) и понимать почему связь хорошо или плохо работает. В этой статье расскажу про свою работу в планировании сети. Развею мифы, что работа инженера, - «чинит железки и связь, устанавливает антенны, лазит по крышам и т.д.». В жизни все интереснее.

Читать
Всего голосов 12: ↑11 и ↓1 +10
Комментарии 10

Игры, в которые играют люди, или Как повысить посещаемость приложения мобильного оператора

Время на прочтение 6 мин
Количество просмотров 3.6K

Хабр, привет!

Мы — Паша и Катя, лидируем направление геймификации программы вовлечения в МегаФоне. Расскажем про создание мобильных игр в личном кабинете МегаФона, поделимся интересной статистикой и инсайтами. Ответим на вопрос, почему незатейливая геймификация в личном кабинете — успешный проект. Сами не ожидали такого :)

Читать далее
Всего голосов 10: ↑0 и ↓10 -10
Комментарии 19

Причина и следствие

Время на прочтение 13 мин
Количество просмотров 5.3K

Мы привыкли, что Machine Learning предоставляет нам большое количество предиктивных методов, которые с каждым годом предсказывают события лучше и лучше. Деревья, леса, бустинги, нейронные сети, обучение с подкреплением и другие алгоритмы машинного обучения позволяют предвидеть будущее все более отчетливо. Казалось бы, что нужно еще? Просто улучшать методы и тогда мы рано или поздно будем жить в будущем так же спокойно, как и в настоящем. Однако не все так просто.

Когда мы рассматриваем бизнес задачи, мы часто сталкиваемся с двумя моментами. Во-первых, мы хотим понять что к чему относится и что с чем связано. Нам важна интерпретация. Чем сложнее модели мы используем, тем более нелинейные они. Тем больше они похожи на черную коробку, в которой очень сложно выявить связи, понятные человеческому разуму. Все же мы привыкли мыслить довольно линейно или близко к тому. Во-вторых, мы хотим понять - если мы подергаем вот эту "ручку", изменится ли результат в будущем и насколько? То есть, мы хотим увидеть причинно-следственную связь между нашим целевым событием и некоторым фактором. Как сказал Рубин - без манипуляции нет причинно следственной связи. Мы часто ошибочно принимаем обыкновенную корреляцию за эту связь. В этой серии статей мы сконцентрируемся на причинах и следствиях.

Но что не так с привычными нам методами ML? Мы строим модель, а значит, предсказывая значение целевого события мы можем менять значение одного из факторов - одной из фич и тогда мы получим соответствующее изменение таргета. Вот нам и предсказание. Все не так просто. По конструкции, большинство ML методов отлично выявляют корреляцию между признаком и таргетом, но ничего не говорят о том, произошло ли изменение целевого события именно из-за изменения значения фичи. То есть, ничего не говорят нам о том - что здесь было причиной, а что следствием.

Читать далее
Рейтинг 0
Комментарии 3

Почему важно тестить на устройствах, которыми пользуются ваши пользователи, а также немного об Emoji

Время на прочтение 7 мин
Количество просмотров 5.3K

Почему важно тестить на устройствах, которыми пользуются ваши пользователи, а также немного об Emoji

Привет Хабр! Друзья зовут меня Данил, я web-разработчик в МегаФоне и работаю над системой обработки обращений наших пользователей. А их у нас огромное количество, и я каждый раз удивляюсь богатому русскому языку.

Под катом хочу рассказать о том, как мы внедряли emoji-клавиатуру в нашу систему DARM. С какими проблемами столкнулись и чего нам это стоило. Прочитавшим до конца плюс в карму и оберег от ошибок.

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Комментарии 15

Как мы логшипим в Elasticsearch и что думаем о Filebeat

Время на прочтение 11 мин
Количество просмотров 17K

Привет, я - Эдгар, backend-разработчик личного кабинета МегаФон, поделюсь решением проблемы log shipping-процесса в централизованное хранилище Elasticsearch, которое мы нашли вместе с командой. 

Читать далее
Всего голосов 8: ↑7 и ↓1 +6
Комментарии 3

«От категорий к векторам», или нестандартное кодирование категориальных данных. Часть 2

Время на прочтение 7 мин
Количество просмотров 2.7K

Привет, Хабр! С вами снова Артём, Team Lead Data Scientist из МегаФона. Надеюсь, вам понравилась первая статья серии о нестандартных методах кодирования категориальных данных, где я поделился своим опытом и показал, как с кодированием справляется тематическое моделирование. Во второй части вы узнаете о более сложных подходах. Инсайты могут быть полезны специалистам в Data Science для решения широкого класса задач: от классификации до построения рекомендательных систем.

В путь
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 0

4 дня из жизни unix-инженера, хроника разработки скрипта

Время на прочтение 13 мин
Количество просмотров 5.6K

Статья будет полезна unix-инженерам и владельцам информационных систем, которые сталкиваются в своей работе с нехваткой технических данных о серверной нагрузке за длительный период времени.

Я - unix-инженер и расскажу, как мы разрабатывали скрипт по логированию потребления ресурсов сервера процессами, пошагово, в виде фотографии своего рабочего дня. А точнее, четырёх дней: пройдёмся по этапам, начиная с выявления проблемы и заканчивая развертыванием в проде. Параллельно покажу взаимодействие команды на каждом этапе наглядно. Вас ждет скрипт в конце лонгрида).

Итак в путь >>
Всего голосов 4: ↑2 и ↓2 0
Комментарии 14

Упала связь, обрыв на линии и при чем тут собака

Время на прочтение 3 мин
Количество просмотров 9.7K

Инсайты телекома. Легкий и позитивный контент для тех, кому интересно погрузиться в будни инженеров МегаФона и узнать, как работает связь. Почему LTE становится EDGE, когда очень нужно.

Спойлер: любишь истории со счастливым концом - дочитай до конца :)

Читать
Всего голосов 27: ↑26 и ↓1 +25
Комментарии 19

Почему Chapterы не летают

Время на прочтение 7 мин
Количество просмотров 3.8K

Привет, мы - Agile коучи МегаФона и эта статья посвящена разбору тех трудностей, с которыми мы столкнулись, развивая самоорганизующиеся сообщества в нашей и не только компании. Надеемся, что наш опыт и выводы, которые мы сделали, будут полезны как тем, кто только вступает в ряды Scrum мастеров и коучей, так и более опытным коллегам.

Читать далее
Всего голосов 4: ↑1 и ↓3 -2
Комментарии 2

«От категорий к векторам» или нестандартное кодирование категориальных данных. Часть 1

Время на прочтение 7 мин
Количество просмотров 4.8K

Привет, Хабр! С вами Артём, аналитик больших данных МегаФона. На работе занимаюсь рекомендательными системами и интересуюсь NLP. Эти две вещи и привели меня к рассматриваемой тут теме, так что садитесь поудобнее, и поехали. Кстати, к статье прилагается код, ищите ссылки внутри.

В путь
Всего голосов 7: ↑6 и ↓1 +5
Комментарии 0
Современные технологии — сфера многообразная. Многие темы в ней бесконечно далеки друг от друга. Невозможно быть экспертом сразу во всех из них, но можно — в какой-то одной. Именно статьи таких экспертов — подробные, сложные, узконаправленные; словом, лучшие — мы собрали для хабравчан в этой коллекции. Выбранные материалы отвечают на все вопросы по своей теме. Показывают, как лучше всего изложить свои знания, если вы профи. И подсказывают, из каких ещё источников читателю получить знания.
Посмотреть коллекцию
Всего голосов 39: ↑35 и ↓4 +31
Комментарии 1

Поиск данных в столбцах таблицы с пагинацией (front-часть)

Время на прочтение 4 мин
Количество просмотров 6.7K

Проблемы поиска данных всегда отличались особенной сложностью и зачастую нестандартностью в подходах. Сегодня я бы хотел остановиться на одной интересной задаче, которую мне пришлось решать совсем недавно во время разработки платформы Интернета вещей. Впрочем, такая задача, может встретиться и на любом другом проекте, где есть динамическая подгрузка данных по REST API. Будь то подгрузка во время пагинации, или во время скроллинга, или как то иначе…

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Комментарии 6

Информация

Сайт
job.megafon.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия