Как стать автором
Обновить
98.4
Ростелеком
Крупнейший провайдер цифровых услуг и решений
Сначала показывать

Поиск данных в инструментах Data Governance: вызовы и решения

Время на прочтение7 мин
Количество просмотров1.9K

Добрый день!

Меня зовут Никита, я работаю ведущим системным аналитиком в Департаменте управления данными компании Ростелеком.

В данной статье я опишу наш опыт использования Реестра отчетов и Бизнес-глоссария, подводные камни, с которыми мы столкнулись, а также планы по оптимизации рабочих процессов в инструментах Data Governance (далее – DG).

Три года назад ИТ-команда Ростелекома разработала Реестр отчетов и Бизнес-глоссарий на базе Open-Source технологий, и данные модули впоследствии получили широкое распространение в периметре компании. Также была создана Единая точка входа, позволяющая сотрудникам получать быстрый доступ ко всем отчетам и бизнес-терминам, существующим в компании. За два года количество постоянных пользователей Единой точки входа увеличилось с 200 до 2300 человек, при этом количество уникальных посетителей Единой точки входа составляет порядка 400 пользователей еженедельно, и данная цифра постоянно растет.

Инструментарий для работы с данными покрывает значительный объем запросов Ростелекома в разрезе таких сегментов как B2B, B2C, БТИ и т.д. Подробнее можно прочитать здесь и здесь.

Департамент по управлению данными заинтересован не только в оптимизации процессов работы с данными во всей компании, но и в улучшении показателей пользовательского опыта в разрезе DG продуктов. Для этого необходимо модернизировать функционал существующих систем путем поиска точек роста и выпуска обновлений по их устранению. Искать точки роста мы решили при помощи интервьюирования пользователей и сбора обратной связи от них. По результатам были отрисованы карты пользовательских путей (cjm – "customer journey map") в разрезе DG инструментов, а также сформирован бэклог, описывающий основные зоны роста в части систем по управлению данными. В связи с этим, в скором времени планируется ряд обновлений с целью внедрения доработок и увеличения эффективности продуктов.

Читать далее

Ускорение инференса модели BERT с помощью ONNX и ONNX Runtime на примере решения задачи классификации текста

Время на прочтение12 мин
Количество просмотров8.2K

В статье на примере определения интента по фразе клиента, полученной в текстовом виде показаны подходы для решения поставленной задачи, выбор метрик и моделей.

Сделан обзор на актуальные подходы для ускорения работы нейронных сетей, представлены библиотеки ONNX и ONNX Runtime.

Проведены тесты с использованием фреймоворков ONNX и ONNX Runtime, используемых для ускорения работы моделей перед выводом их в продуктовую среду.

Представлены графические зависимости и блоки кода.

Читать далее

Конструктор дашбордов своими руками – базовые идеи для реализации

Время на прочтение8 мин
Количество просмотров4.7K

Всем привет! На связи команда разработки модуля ESMP Metrica.

Зачем может понадобиться конструктор дашбордов?

Во-первых, дашборды – это современная неотъемлемая часть большинства бизнес-процессов, как инструмента, позволяющего наглядно, в виде инфографики и интерактивных информационных панелей, представлять ценную информацию.

Во-вторых, без конструктора дашбордов создавать новые дашборды и поддерживать существующие дорого, так как услуги программиста дороже услуг аналитика.

В-третьих, у конкурентов, скорей всего, конструктор дашбордов уже есть и, возможно, настала пора обзавестись своим.

Существует огромное количество решений (на пальцах уж точно не сосчитать) для работы с дашбордами, которые отличаются ценой, возможностями, способами взаимодействия с данными и сложностью для пользователя. Некоторые из них можно использовать только на личном ПК, другие реализованы как облачные сервисы, есть те, которые можно использовать без специальной подготовки, есть и такие, которые потребуют определённых навыков, но и предложат большую функциональность. В нашем же случае решалась задача, которая по совокупности параметров не могла быть решена существующими инструментами.

В этой статье приводится описание тех идей, которые мы реализовали у нас, с использованием концепций Low-code, предполагающей возможность модифицировать, адаптировать и развивать дашборд непосредственно в ходе «боевой» эксплуатации с минимумом программирования и максимумом визуальной разработки. Статья будет полезна начинающим разработчикам, любопытствующим и тем, кто приступает к созданию своего редактора дашбордов.

Читать далее

Пишу диаграммы последовательностей текстом (кодом). Вы тоже можете

Время на прочтение5 мин
Количество просмотров34K

Я работаю бизнес-аналитиком. Создание диаграмм последовательностей (sequence diagram) – часть регулярной рутины. Всё классно. Но процесс правок…

К счастью, я нашел для себя решение. Теперь я не рисую sequence diagram, а пишу "кодом". Это легко, быстро и удобно.

Читать далее

Чек-лист онбординга системного аналитика

Время на прочтение7 мин
Количество просмотров4.2K

На каждом проекте, рано или поздно, наступает момент, когда появляется необходимость ввести в команду аналитиков еще одного сотрудника. И раз появилась данная необходимость, значит команда аналитиков либо уже не справляется с объемом работы, либо не будет справляться с ним в ближайшее время.

Для того чтобы новый сотрудник начал как можно быстрее забирать на себя часть задач по анализу необходимо его ввести в проект. В этом поможет чек-лист онбординга системного аналитика — он позволит максимально быстро и без лишних вопросов провести онбординг нового системного аналитика.

Читать далее

Кря-кря на день программиста: вспоминаем универсальный метод решения проблемных задач

Время на прочтение4 мин
Количество просмотров6.6K

Привет, Хабр! Недавно мы проводили конкурс компьютерных историй на Пикабу, а также при поддержке Ростелекома дарили участникам мероприятия утят. В этом посте я хочу рассказать, как это было и поделиться историями участников, а также поговорить о том, насколько важен утенок в работе айтишника.

Любите кря-кря? Давайте под кат.

Читать далее

Учим автотесты API адаптироваться под требования

Время на прочтение8 мин
Количество просмотров6.8K

Привет! Меня зовут Тимур Шарафутдинов, я занимаюсь процессами автоматизации тестирования в «Ростелеком ИТ». Сегодня поделюсь своим опытом реализации model based-подхода в написании python API автотестов на проекте — приложении с микросервисной архитектурой для обработки, хранения, конфигурирации заказов.

Используя API интерфейс мы сделали удобный и адаптивный стек под частые изменения с лаконичным кодом и с проверками соответствия спецификации, без необходимости каждый раз актуализовать вручную все сопутствующие тесты. Как мы это сделали — читайте под катом.

Читать далее

Как собирать статистику по pytest-прогонам в Test IT

Время на прочтение6 мин
Количество просмотров4.4K


Как известно, основной проблемой в тестировании является отчетность по прогонам. Некоторые компании собирают данные в отдельном хранилище. Вместо того, чтобы вручную организовывать хранение, было решено сохранять их в Test IT. Такие данные как: исход, время выполнения и количество автоматизированных кейсов позволяют разделить тесты на выборки и дать оценку покрытия автотестами.

Читать дальше →

Тактовый механизм управления DWH: как разгрести бесконечную очередь и не умереть

Время на прочтение13 мин
Количество просмотров7.1K

Отдать управление загрузками в DWH на откуп ETL-инструменту или реализовать самим, что лучше? Если реализовать самим, то какой тип механизма выбрать? Как при этом снизить трудозатраты на разработку и сопровождение? Вопросы вечные и спорные, не хуже нетленной дискуссии «взлетит или не взлетит».

Под катом описание одного из вариантов – круглосуточно работающей автоматизированной системы управления DWH, не требующей постоянных ручных пинков (ну почти). Я расскажу о том, как в нашем хранилище решили выкрутить автоматизацию на максимум, к чему пришли и стоила ли игра свеч.

Читать далее

Сравниваем качество русскоязычных SaaS-систем в задаче распознавания интентов

Время на прочтение7 мин
Количество просмотров2.8K

Продуктовый офис B2O Ростелекома предлагает продукты операторам связи, которые помогают решать задачи бизнеса. Один из таких продуктов - чат-бот. Ключевая задача в развитии диалоговых систем связана с улучшением понимания намерений пользователей — увеличением точности распознавания интентов — intent recognition.

Эту задачу решают десятки движков для машинного обучения, но качество их работы меняется в зависимости от языка и размера датасета, на котором обучен алгоритм. Выбор далеко не очевиден, поэтому мы решили внести немного ясности в этот вопрос и провести исследование — сравнить семь русскоязычных SaaS-систем. Что из этого вышло — читайте под катом.

Читать далее

Сложные маневры: как выстроить передачу скрам-команды и ничего не упустить

Время на прочтение6 мин
Количество просмотров1.3K

Так бывает, что надо команду передать от одного скрам-мастеру другому (например, в ситуации с переводом, увольнением или уходом в декрет). Я в таких ситуациях была дважды, когда уходила и возвращалась из декрета, и выработала оптимальный порядок при передаче/приёмке скрам-команды из 6 шагов. О нем и пойдет речь в статье.

Читать далее

JupyterHub или как перестать бояться pip install

Время на прочтение10 мин
Количество просмотров6.5K

Всем привет! Сегодня я расскажу о том, как мы переехали на наш велосипед в виде JupyterHub, и он оказался удобным. У нас в компании работают ~20 дата саентистов и в своей работе они используют множество Open Source-инструментов: Airflow, Hadoop, Hive, Spark и т.д. Но в данной статье речь пойдет исключительно о JupyterHub, точнее говоря о боли, которая преследовала администраторов, и как мы успешно ее побороли.

Читать далее

Do It Yourself or die? Объясняем, что делать с Open Source для «импортонезависимости» на гифках из Футурамы

Время на прочтение11 мин
Количество просмотров5.5K

Религиозные противостояния GNU против Microsoft и Open Source против проприетарного ПО шли несколько десятков лет. Казалось, что тема Open Source уже раскрыта со всех сторон, каждый занял свою позицию, интерес к этому конфликту сошел на нет: Linux так и не убил Windows, а Билл Гейтс не завладел миром. 30 лет назад оптимисты предсказывали, что проприетарное ПО умрет и весь софт станет открытым — всего этого так и не произошло.

Но 2022-ой год для ИТ-отрасли России проходит под девизом «DIY or DIE», и в этой парадигме тема Open Source стала снова актуальной и дискуссионной. Мы в DataOffice Ростелекома используем ПО с открытым исходным кодом для решения задач по работе с данными с 2017 года, и с тех пор мы набили много шишек и накопили экспертизу в вопросах работы с Open Source. В этой статье мы делимся своими размышлениями, опытом и любимыми гифками из Футурамы.

Читать далее

Дизайн-система не равно UI-kit

Время на прочтение5 мин
Количество просмотров16K

Дизайн-системы и UI-киты сейчас воспринимаются как равнозначные или тождественные. Но это не так! Более того, смешивать их будет чистым дилетантством, что недопустимо для современных UI/UX-дизайнеров и фронтендеров. В этой заметке я — Денис Пушкарь, оунер дизайн-системы Ростелекома — объясню почему.

Читать

Выходим за пределы JVM. Объясняем на крестиках-ноликах чем хорош Kotlin Multiplatform

Время на прочтение31 мин
Количество просмотров14K

Какой есть общий недостаток у мобильной, front-end и back-end разработки и иногда распила микросервисов? Дублирование логики. Очень часто я видел статьи или новости, где одна команда мобильных разработчиков ждет другую, чтобы выкатить релиз. И если с мобильными версиями более-менее все понятно и есть решения, то что делать с браузером? Очень часто логику работы приложения нужно поддержать и там.

Что делать, если хочется писать нативный код и при этом не иметь дублей реализации — на этот вопрос я постараюсь ответить подробно в данной статье. В процессе чтения можно будет познакомиться с технологией Kotlin Multiplatform и создать полноценный проект всем известной игры «Крестики-нолики» на трех самых популярных платформах Browser (JS), iOS (Swift) и Android (Java) с общей логикой на Kotlin.

Читать далее

WireMock – швейцарский нож в арсенале тестировщика. Часть 2

Время на прочтение17 мин
Количество просмотров20K

Всем привет! В предыдущей части я рассказал, что такое WireMock, в каких случаях его необходимо использовать, как его разворачивать и настраивать, как правильно сопоставлять запросы с заглушками и как пользоваться журналированием. Настало время рассмотреть все что связано с HTTP ответом, который возвращает заглушка, а также затронем сценарии.

Читать далее

Сам себе data scientist или зачем нужен анализ данных менеджеру по продажам

Время на прочтение15 мин
Количество просмотров5.2K

Всем привет! Меня зовут Михаил Тимофеев, я работаю специалистом в отделе телемаркетинга в Ростелекоме. Когда начинал работать менеджером по продажам, меня постоянно мучали вопросы: почему клиент отказался, где моя зона роста, что делать, чтобы продавать больше? И тогда я решил все взять в свои руки.

В статье я расскажу о своём опыте создания DIY-системы учета и прогноза продаж в Excel (или его аналоге Cacl из пакета LibreOffice), Power BI и Python 3 с подключенной библиотеками Pandas, NunPy и MatPlotLib.

Читать далее

WireMock – швейцарский нож в арсенале тестировщика. Часть 1

Время на прочтение15 мин
Количество просмотров61K

Всем привет! Меня зовут Анатолий Калмыков, и я отвечаю за качество создаваемых решений в «Ростелеком ИТ». Сегодня я расскажу вам про WireMock – это одновременно и утилита, и библиотека на Java для создания HTTP заглушек над веб-сервисами. Он создает HTTP-сервер, к которому мы могли бы подключиться, как к реальному веб-сервису.

Статья получилась длинной, поэтому в первой части я расскажу, что такое WireMock и в каких случаях его необходимо использовать, как его разворачивать и настраивать, как правильно сопоставлять запросы с заглушками и как использовать журналирование. Сегодня речь пойдет исключительно о WireMock в амплуа утилиты и standalone http-сервер, который можно настроить как душе угодно, не зная языков программирования.

Читать далее

Что раздражает российских IT-специалистов в компаниях

Время на прочтение2 мин
Количество просмотров19K

Привет, меня зовут Марина, я отвечаю за IT-бренд и DevRel в Ростелекоме. Мы очень любим data driven-культуру, и в части бренда работодателя тоже стараемся проверять исследованиями большинство гипотез. Одной из главных тем остается перегрев рынка IT и проблемы с наймом и удержанием в компаниях компетентных специалистов. Эти кейсы мы и решили изучить поглубже. 

Читать далее

Контроль качества данных и точка. Как мы строили модуль DQM с нуля

Время на прочтение8 мин
Количество просмотров3.6K

Всем привет! Меня зовут Андрей, я занимаюсь процессами контроля качества данных в DataOffice Ростелекома. Мы используем данные для автоматизации бизнес-процессов, классической аналитики, машинного обучения и принятия решений на всех уровнях управления, поэтому для нас большое значение имеет качество данных. В статье поделюсь опытом создания модуля контроля качества данных, с какими трудностями мы сталкивались и как их преодолевали.

Читать далее

Информация

Сайт
www.company.rt.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия
Представитель
Vatuhaa