билайн / Статьи / Хабр

ПрофильСтатьи88Посты1Новости41Вакансии3

@yuliakorysheva 28 окт в 08:43

Как мы вырастили ML-фреймворк внутри компании: эволюция, ошибки и инсайты

15 мин

5.7K

Блог компании билайнBig Data * Машинное обучение *

Кейс

Привет, Хабр! Меня зовут Юля Корышева, я разработчик машинного обучения в команде скоринга в билайне. В этой статье расскажу, как за последние пять лет в нашей команде менялся подход к разработке, валидации и поддержке моделей — с какими вызовами мы столкнулись, как их решали и к каким результатам пришли.

@Beeline_tech 21 окт в 09:47

Делаем кастомное параллельное чтение по JDBC в Spark 3.0.1

5 мин

5.1K

Блог компании билайнPython * Data Engineering * Scala *

Привет, Хабр! Мы — команда DATA ОАТС в билайн. В этой статье расскажем о кейсе, когда стандартный Spark JDBC не справился с параллельным чтением огромной таблицы из ClickHouse, и мы написали свой «мини-движок». Под катом — разбор ограничений, схема с пулом потоков на экзекуторах и опыт, который может пригодиться не только для ClickHouse.

@adrozhzhov 19 авг в 08:41

Работа на удалёнке: как начать нахаживать норму шагов

5 мин

7.6K

Блог компании билайнЗдоровьеУдалённая работа

Привет. Я, как со всеми вместе в марте 2020 перешёл на удалёнку, так и продолжаю работать в таком режиме. У него масса преимуществ, но, чтобы поддерживать баланс двигательной активности, надо выходить погулять. Попробую рассказать, как и почему пришёл к текущему режиму прогулок, начав с 3000 шагов в день и придя к миллиону шагов за лето (осень, зиму, вёсну).

@spotlight9k 12 авг в 08:11

Автоматизированная оценка стабильности скоринговых моделей на основе временных рядов метрик

7 мин

4.8K

Блог компании билайнМашинное обучение * Искусственный интеллект

Кейс

Привет, Хабр! Меня зовут Зотов Глеб, я ML-инженер в команде скоринга в билайне. В статье расскажу о том, как не сойти с ума, мониторя десятки графиков вручную.

Скоринговая модель может быть блестящей на этапе обучения, показывать отличные значения всех метрик на кросс-валидации и радовать бизнес на первых неделях после деплоя. Но вжух — и через два месяца валидационные метрики поползли вниз, отклонения по PSI зашкаливают, а product owner уже поглядывает в твою сторону с подозрением.

Проблема? Проблема.

Давайте разберемся, почему так происходит и как можно этого избежать.

@oseveryukhina 22 июл в 08:26

Как автоматизировать обучение ML-моделей и сократить время вывода в прод до двух дней

Средний

9 мин

1.2K

Блог компании билайнМашинное обучение * Искусственный интеллект

Кейс

В прошлой статье мы говорили о подходе к рекомендации сервисов на основании автоматизации расчета склонностей клиентов и единого репозитория предложений. В ней мы углубились в создание репозитория, описание логики категоризации и набора в кампании для коммуникации с клиентами. Сегодня мы подробнее расскажем про наш подход к автоматизации построения и вывода в прод набора моделей.

@nikolaevdevl 17 июн в 10:19

Как мы распилили монолит на микрофронтенды с Vite и не сошли с ума

Средний

9 мин

6.1K

Блог компании билайнВеб-разработка * JavaScript *

Кейс

Наш фронтенд начинался как простой SPA на React, собранный с помощью Vite — типичный монолит с несколькими страницами. Со временем проект оброс новыми функциями и интеграциями и начал становиться всё сложнее в поддержке.

На горизонте появились новые вызовы: к продукту планировалось подключать всё больше независимых сервисов, а значит — ещё больше интеграций и роста кодовой базы. Мы понимали, что нагрузка на инфраструктуру будет только увеличиваться, поэтому решили заранее заложить архитектуру с расчётом на масштабирование.

После изучения разных вариантов мы остановились на подходе микрофронтендов. Хотелось разграничить зоны ответственности между командами и ускорить разработку, не теряя гибкости. В качестве сборщика решили остаться на Vite — он быстро развивался, предлагал отличную DX и поддержку модульной федерации через плагин. Кроме того, важно было сохранить единый репозиторий, чтобы упростить CI/CD и управление зависимостями.

+12

@oseveryukhina 6 июн в 08:07

Рост продаж с одновременным ростом конверсии: подход билайн к внедрению AutoML в маркетинг

Средний

7 мин

929

Блог компании билайнМашинное обучение * Искусственный интеллект

Кейс

Выбрать лучшую рекомендацию для клиента в условиях ограничений коммуникационной нагрузки можно через оценку релевантности продукта, его влияния на ценность клиента для принятия взвешенного решения, а также отклика в каналах взаимодействия.

В Службе персонализации предложений билайн мы занимаемся персонификацией продуктовых предложений до абонента. В статье рассмотрим подход, который мы для этого используем: углубимся в создание единого репозитория предложений и описание логики категоризации и набора в кампании для коммуникации с нашими клиентами.

@Beeline_tech 23 мая в 08:27

Улучшением качества LTE-сети: взгляд изнутри через призму спектральной эффективности

4 мин

1.3K

Блог компании билайнСистемы связи * Сетевые технологии *

Эксперты по оптимизации сети в команде билайн анализируют различных KPI и контролируют соответствие их уровней заданным стандартам качества. Каждый день приходится работать с десятками KPI и искать возможные проблемы на сети. При этом, с голосовым сервисом задача в значительной упрощена: она большей степени зависит от уровня покрытия и в меньшей — от соотношения сигнал-шум, поэтому не становится проблемой с точки зрения ёмкости сети. А с пакетной передачей данных всё не так однозначно.

Постоянное развитие сервисов для пользователей и конкуренция среди операторов предъявляет всё более высокие требования по скорости пакетной передачи данных и задержкам. Задача оптимизатора — максимально раскрыть потенциал имеющихся ресурсов и эффективно их использовать.

Конечно же, при текущей ситуации на сети максимальное количество усилий оптимизатор прикладывает для увеличения скорости передачи данных для абонента в сети LTE.

@SacredDiablo 15 мая в 09:01

Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов

Средний

17 мин

3.4K

Блог компании билайнБлог компании Конференции Олега Бунина (Онтико)Big Data * Data Engineering *

В этой статье мы делимся опытом оптимизации Spark-кода на реальных задачах: рассказываем, как с помощью ручного и автоматического репартицирования ускорить обработку данных, как правильно настраивать оконные функции и запускать множество небольших Spark-приложений внутри одного процесса для экономии ресурсов.

Привет, Хабр! Меня зовут Александр Маркачев и я — Data Engineer команды Голосовой Антифрод в билайн. Расскажу, как борьба с мошенниками может обернуться личным вызовом.

Все техники сопровождаются объяснениями, примерами и рекомендациями для самостоятельного повторения.

+36

@zemskovs 14 мая в 05:54

Как с помощью Typescript я получал свойства React-компонентов

5 мин

2.6K

Блог компании билайнReactJS * TypeScript * JavaScript *

В статье — о том, как мы решили отказаться от PropTypes в пользу TypeScript для автоматического извлечения типов пропсов React-компонентов.

Наши разработчики давно просили эту возможность, справедливо возмущаясь: «Зачем описывать типы дважды — в TypeScript и PropTypes?». Тем более, что аналогичный механизм уже работал в Storybook.

Если вы недовольны текущими решениями для организации библиотек компонентов или просто любите технические кейсы — добро пожаловать под кат!

@adrozhzhov 25 апр в 09:25

Тестируем скорость SSD 1993 года выпуска. На КПК Psion Series 3c, с операционной системой SIBO 16, на языке OPL

7 мин

1.4K

Блог компании билайнХранение данных * Старое железоРазработка мобильных приложений *

Ретроспектива

В середине 2000 я купил Psion 3c для коллекции. Лет через 10 увидел, что его комплектный диск называется SSD — Solid State Disk. На волне тестирования NVME возникла идея, а не протестировать ли скорость SSD-1993? И спустя 20 лет после покупки на этой машинке была написана первая программка.

Что вышло…

+13

@MagnusMeier 9 апр в 08:50

Гайд по overload: как написать один код на Python для разных бэкендов

11 мин

3.7K

Блог компании билайнPython * Машинное обучение *

✏️ Технотекст 7

Разработчики часто сталкиваются с задачами, в которых одна функция должна работать с разными типами данных и количеством аргументов. Чтобы каждый раз не создавать множество функций с разными именами, существует перегрузка (overload). Она позволяет использовать одно имя операции для обработки различных комбинаций входных данных. Благодаря перегрузке одна функция может адаптироваться под различные сценарии и делать код лаконичным и понятным.

В статье разберемся, как работает перегрузка в статических и динамических языках программирования. В конце покажу, как и зачем мы реализовали перегрузку на Python своим собственным способом.

@adrozhzhov 27 мар в 11:45

NVME over RoCE. Примеряем на себя

Средний

18 мин

2.2K

Блог компании билайнХранение данных *

Кейс

Так повелось, что по итогам своих опытов с различными технологиями подключения дискового пространства писал сюда небольшие заметки:

Настройка NVME over TCP — для тех, кому надо подключить больше 1 диска единственной конфигурации из всех примеров в Сети.

Попытка разогнать сеть для БД со 100 до 200Гб/c или «failure is always an option».

Настройка iScsi в L3-сети для эффективной утилизации возможностей канала и СХД.

Поскольку появился новый свежий опыт по настройке и тестированию подключения еще одним способом, и все уже собрано для внутренней wiki-статьи, решил продолжить традицию.

@Beeline_tech 24 мар в 09:33

Как упростить работу проектировщикам транспортных сетей с помощью визуализации и аналитических инструментов

6 мин

Блог компании билайнСетевые технологии * Системы связи *

Сеть билайна имеет в своем ресурсе свыше 100 тысяч элементов транспортной сети с 24 уникальными типами транспортных узлов. Управлять ими, проектировать и развивать их достаточно сложно и трудоемко. Чтобы упростить работу проектировщикам и другим пользователям сети, мы создали уникальный программный продукт, аналогов которому нет на рынке, TN Map — интерактивную карту, которая помогает визуально оценивать состояние сетей связи филиалов.

В статье подробно расскажем о функциях и внутреннем устройстве TN Map: разберем сценарии использования продукта и его отличительные особенности.

@Beeline_tech 21 мар в 10:17

Пошагово создаём QR-код

Средний

4 мин

2.3K

Блог компании билайнIT-стандарты * JavaScript * Программирование *

Туториал

Перевод

В этой статье (оригинал представляет собой интерактивное приложение на JavaScript) подробно описывается, как текстовая строка кодируется в символ QR-кода. Она, по сути, объясняет, как устроена внутри моя библиотека генератора QR-кодов.

Пользовательский ввод

Результат генерации QR-кода

Читать дальше →

+10

@adrozhzhov 17 мар в 10:50

Как планы действий помогают нам работать с аварийными ситуациями в критических системах

7 мин

813

Блог компании билайнУправление разработкой * Системы связи *

У билайна есть разношерстный парк Unix-серверов: это AIX, Solaris, где-то есть даже HPUX на итаниуме. Они достаточно надежны, но так как они начали эксплуатироваться давно, вероятность их выхода из строя по мере расходования запаса надежности увеличивается. Часто на таких серверах работают критичные программные продукты, а данные с них хранятся на системах хранения данных (СХД), которые тоже не молодеют.

Сервера питаются электричеством, которое, хотя и резервируется, иногда может дать нестандартный вольтаж, определив который системы защиты обесточат оборудование. Еще возможен внезапный глюк системного софта, например, дисковой подсистемы.

В общем, мы знаем, что если что-то может пойти не так, оно обязательно когда-нибудь так сделает. Для таких случаев у нас есть планы действий в аварийных ситуациях, которые значительно отличаются от типичного плана из интернета. В этой статье расскажу, как мы их разработали и какие корректирующие действия предусмотрены в аварийно-восстановительных работах (АВР).

@kino6052 20 фев в 09:49

Почему долгосрочное планирование не работает в UI-разработке?

Средний

7 мин

581

Блог компании билайнJavaScript * ReactJS * Искусственный интеллектВеб-разработка *

✏️ Технотекст 7

Эта статья была написана для конкурса Технотекст-7 «Тот момент, когда происходит изменение». Тема адаптации UI к меняющимся деталям была выбрана, так как связана с темой конкурса.

Современная UI-разработка живет быстрыми темпами. Мы постоянно создаем и меняем код, чтобы соответствовать новым трендам, но часто это делается «на коленке» и без долгосрочного видения. В итоге уже через пару месяцев все, что казалось суперсовременным, превращается в легаси из-за смены моды фреймворков и других деталей реализации.

В статье расскажу, почему традиционное долгосрочное планирование уже не работает, как можно отделить основную логику от конкретных технологий и какие инструменты помогут быть более гибкими в будущем.

@Beeline_tech 9 фев в 10:42

Confluent Kafka: любовь и ненависть в .NET, часть 2

Средний

11 мин

1.9K

Блог компании билайн.NET * Программирование * Высоконагруженные системы * Хранение данных *

Туториал

Привет! Как и обещала в первой части — теперь про ребалансировки и не только.

Выделяют безотлагательную и совместную ребалансировки.

При безотлагательной ребалансировке пользователи прекращают потребление из партиции, которые им назначены, затем отказываются от права владеть этими партициями, после снова присоединяются к consume group, получают совершенно новое назначение партиций и после этого возобновляют потребление. По сути, это короткое окно недоступности для всей consume group. Длина этого окна зависит от количества пользователей и некоторых параметров конфигурации.

Совместная ребалансировка - это инкрементная ребалансировка, при которой переназначается лишь некоторое подмножество партиций, и пользователи продолжают потребление из тех партиций, которые не были переназначены. Координатор уведомляет пользователей, что они должны будут отказаться от права владения некоторым подмножеством партиций, они прекращают потребление и отказываются от права владения. Затем эти партиции назначаются новым владельцам. Подход может включать несколько итераций, пока не будет достигнуто равномерное распределение. В отличие от безотлагательного подхода, мы не получаем полной недоступности. Это важно для больших consume groups, где балансировка может занять значительное количество времени.

+11

@Beeline_tech 7 фев в 11:51

Confluent Kafka: любовь и ненависть в .NET, часть 1

7 мин

3.1K

Блог компании билайнВысоконагруженные системы * .NET * Программирование * Хранение данных *

Туториал

Всем привет! Сегодня расскажу про Confluent Kafka. Ее любят, ненавидят, но мало кто остается равнодушным.

О себе

Меня зовут Алена, я ведущий разработчик, занимаюсь развитием референсной архитектуры в компании билайн. К основным областям профессиональных интересов можно отнести проблемы распределенных систем, event sourcing и DDD.

В двух словах о Kafka

Kafka - это распределенная платформа для обработки потоков данных, которая используется для построения высоконагруженных решений и обработки данных в реальном времени. По сути, это система, которая может очень быстро и эффективно передавать ваши события. Kafka может работать как на одной машине, так и на нескольких, образующих между собой кластер и повышающих общую эффективность системы. Событием в Kafka может быть любой тип данных, для Kafka это всего лишь последовательность байт. На картинке представлены сущности, которые участвуют в процессе работы с точки зрения архитектуры.

+16

@Beeline_tech 2 фев в 16:08

Семь самых важных научных статей в истории Computer Science

6 мин

7.7K

Блог компании билайнМашинное обучение * Программирование * Сетевые технологии * Читальный зал

Дайджест

Перевод

Прежде чем мы начнём, уточню: да, это субъективный список. Его цель — не закончить обсуждения, а породить их. Эти семь работ (отсортированных по дате публикации) я выделил потому, что они сильно повлияли на современный мир. Каждая из них заслуживает отдельного поста (или даже книги!). Если ваша любимая научная статья не попала в список, до дочитайте до раздела «Бонус» в конце, куда я добавил работы, которым чуть-чуть не хватило до попадания в основной список.

Читать дальше →

+40

2 3 4 5

Как мы вырастили ML-фреймворк внутри компании: эволюция, ошибки и инсайты

Делаем кастомное параллельное чтение по JDBC в Spark 3.0.1

Работа на удалёнке: как начать нахаживать норму шагов

Автоматизированная оценка стабильности скоринговых моделей на основе временных рядов метрик

Как автоматизировать обучение ML-моделей и сократить время вывода в прод до двух дней

Как мы распилили монолит на микрофронтенды с Vite и не сошли с ума

Рост продаж с одновременным ростом конверсии: подход билайн к внедрению AutoML в маркетинг

Улучшением качества LTE-сети: взгляд изнутри через призму спектральной эффективности

Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов

Как с помощью Typescript я получал свойства React-компонентов

Тестируем скорость SSD 1993 года выпуска. На КПК Psion Series 3c, с операционной системой SIBO 16, на языке OPL

Гайд по overload: как написать один код на Python для разных бэкендов

NVME over RoCE. Примеряем на себя

Как упростить работу проектировщикам транспортных сетей с помощью визуализации и аналитических инструментов

Ближайшие события

Пошагово создаём QR-код

Пользовательский ввод

Результат генерации QR-кода

Как планы действий помогают нам работать с аварийными ситуациями в критических системах

Почему долгосрочное планирование не работает в UI-разработке?

Confluent Kafka: любовь и ненависть в .NET, часть 2

Confluent Kafka: любовь и ненависть в .NET, часть 1

Семь самых важных научных статей в истории Computer Science

Информация