Okko, Санкт-Петербург / Статьи / Хабр

Как стать автором

ПрофильСтатьи29Посты2Новости3Вакансии1

IvanBlock вчера в 09:23

MDC в реактивном стеке: как не потерять контекст в Spring WebFlux и Kotlin Coroutines

Средний

8 мин

979

Блог компании Конференции Олега Бунина (Онтико)Блог компании Okko

Всё больше Java-разработчиков переходят от приложений, использующих синхронный стек, к реактивным решениям на базе Spring WebFlux и Kotlin Coroutines. Такой переход позволяет строить более масштабируемые и устойчивые к высокой нагрузке системы, эффективно используя пул потоков и асинхронное выполнение задач. Однако вместе с преимуществами реактивного подхода появляется и новая неочевидная проблема — потеря MDC-контекста (Mapped Diagnostic Context), который традиционно используется для сквозной трассировки запросов в логах.

Читать далее

+11

rav_2549 25 июн в 21:52

Релиз без сюрпризов: как мы уменьшили количество багов в проде

Простой

4 мин

1.9K

Блог компании Конференции Олега Бунина (Онтико)Блог компании Okko

Кейс

Привет! Меня зовут Андрей Романюк, я руковожу группой качества WEB в онлайн-кинотеатре Okko. В этой статье я расскажу о процессе, с помощью которого мы снизили количество багов, которые мы выкатываем в прод, когда мы о них уже знаем.(Естественно, мы всё равно их выкатываем, но таких багов в релизах стало намного меньше :)

О чём поговорим:

Читать далее

+13

KasperI 4 июн в 07:54

Как мы делаем ML на Java

Средний

7 мин

633

Блог компании Okko

Кейс

Привет, Хабр. Меня зовут Лёша Круглик, я занимаюсь коммерческой разработкой около 7 лет. Писал код для Epam, Альфа Банка и Яндекса, а последние года три занимаюсь разработкой в Okko.

Как-то солнечным питерским днём мы с коллегами запускали процесс стажировок и обсуждали перфоманс и код-ревью. Код — это источник правды для разработчика. Руководитель оценивает его и находит точки роста, подсказывает, что можно улучшить. Эта концепция неплохо работает в небольших командах, где тимлид может посвятить время оценке кода и поиску хороших ресурсов для обучения. Но чем больше команда, тем больше времени будет на это уходить.

В процессе обсуждения мы решили провести эксперимент и автоматизировать процесс код-ревью с помощью ML. В этой статье расскажем о том, какой подход использовали, какой результат получили и порассуждаем, где ещё можно применить эту модель.

Читать далее

+1

masikm 14 мая в 09:00

Terraform уже не тот? Как Pulumi меняет правила игры в Infrastructure as Code

6 мин

5.3K

Блог компании OkkoБлог компании Конференции Олега Бунина (Онтико)DevOps*

Привет, Хабр! Сегодня поговорим про инфраструктуру как код. Почему Terraform уже не единственный игрок в мире IaC, а Pulumi становится всё более актуальным. Я расскажу, как эти инструменты работают, чем отличаются, и почему стоит присмотреться к Pulumi, особенно, если вы хотите гибкости и мощи в управлении облаками.

Читать далее

+24

Anastas_solov 11 апр в 09:32

В стиле ретро: меньше слов — больше action items

Простой

8 мин

1.7K

Блог компании OkkoБлог компании Конференции Олега Бунина (Онтико)

Ретроспектива

✏️ Технотекст 7

Как сделать ретроспективу полезной и интересной

Привет! Меня зовут Настя, я работаю проектным менеджером и скрам-мастером в онлайн-кинотеатре Okko. За последний год я провела более 100 ретроспектив в разных командах. Не все из них были удачными.

Читать далее

+21

komissar_off_andrey 26 мар в 10:45

История эволюции веб-сервиса: от примера из доки до космолета

Средний

9 мин

1.2K

Блог компании OkkoБлог компании Конференции Олега Бунина (Онтико)Python*Высоконагруженные системы*

Ретроспектива

5k RPS, 5ms Latency и 100 экспериментов одновременно. История о том, как наша команда перестраивала веб-сервис для сплитования трафика в высокопроизводительную систему. С какими ограничениями Cpython и Gil столкнулись на пути, как обходили "узкие места" и оптимизировали сервис до микросекунд. В общем, всё о том, как мы построили "космолет" на Python и взлетели! Ну и, конечно же, ответ на вопрос: "Почему не Go? ".

Читать далее

+11

LionMuzzle 14 мар в 06:47

Playwright: игра в скриншотные тесты

Средний

14 мин

5.2K

Блог компании OkkoТестирование веб-сервисов*Веб-разработка*JavaScript*

Туториал

Работа с Playwright всегда доставляет мне удовольствие. «Наиграв» уже десятки, если не сотни часов в библиотеке, решая проблемы, копаясь в исходниках или на просторах сети, я практически всегда находил удачное решение. И это я списываю не столько на свой опыт, сколько на удобство самой библиотеки. Чаще всего удачные решения находились уже в коробке. А то, что приходилось допиливать руками, всегда сопровождалось ощущением игры и веселья – настолько приятно и легко работать с этим инструментом. Вот уже год, как наши тесты работают стабильно без каких-либо значимых изменений. Сегодня я расскажу вам о скриншотных тестах, реализованных на основе Playwright и Storybook.

Читать далее

+12

8Michelle 12 дек 2024 в 09:02

Как на самом деле работает Attention

Сложный

8 мин

3.6K

Блог компании Конференции Олега Бунина (Онтико)Блог компании OkkoМашинное обучение*Искусственный интеллект

Обзор

Как именно работают механизмы, которые позволяют LLM так эффективно взаимодействовать с контекстом? Принято рассматривать нейронные сети как black-box, не разбираясь, что на самом деле происходит во время их инференса. Однако можно немного заглянуть «в мозги» нейронным сетям и попытаться понять, за что отвечают те или иные группы параметров модели.

Меня зовут Михаил Коновалов, я работаю ML-инженером в Okko. В этой статье я хочу рассмотреть несколько публикаций, посвященных интерпретации механизма Attention в трансформерах.

Читать далее

+17

nastiagorodnicheva 16 ноя 2024 в 19:05

Как создать дашборд в Superset: гайд для новичков и полезные лайфхаки

Простой

16 мин

26K

Блог компании Конференции Олега Бунина (Онтико)Блог компании OkkoApache*Визуализация данных*

Туториал

Из песочницы

✏️ Технотекст 7

Superset не самый новый bi-инструмент, но его популярность продолжает расти. На мой взгляд, он достаточно прост в освоении, но все же требует некоторых усилий и времени, чтобы разобраться куда тыкать, чтобы загрузить данные и нарисовать красивый отчет. Лично я за свою карьеру в IT уже второй раз сталкиваюсь с необходимостью переезда на этот инструмент. Он снова новый для компании и многие сотрудники с ним раньше не работали. Поэтому я и решила написать статью-шпаргалку, которая поможет в несколько кликов создать работающий дашборд и всегда будет под рукой.

В дополнении к гайду напишу с какими подводными камнями мне приходилось сталкиваться, как их решить, а также покажу несколько полезных фичей Superset. Это поможет быстро разобраться в интерфейсе и знать, на что обратить внимание.

Читать далее

+36

tazubakhina 30 окт 2024 в 09:01

Как сократить время ответа в 2 раза, добавив одну строку кода

Средний

9 мин

39K

Блог компании OkkoБлог компании Конференции Олега Бунина (Онтико)Python*Высоконагруженные системы*

Кейс

✏️ Технотекст 7

Okko – один из крупнейших онлайн-кинотеатров в России c нагрузкой в несколько тысяч запросов в секунду, в котором персональные рекомендации занимают важное место. Для улучшения пользовательского опыта нужно не только предоставить качественные рекомендации, но и обеспечить быстрый доступ к ним.

В этой статье мы поделимся:

1. Описанием, как мы использовали инструменты Jaeger и Grafana для выявления узких мест в производительности, что привело к выявлению критических проблем со сборщиком мусора;

2. Анализом влияния различных настроек сборщика мусора на время ответа, что позволило сократить его вдвое для 99% запросов;

3. Когда и почему стоит рассматривать изменение стандартных настроек сборщика мусора (на примере нашего случая).

Читать далее

+83

a_shcherbakov 10 окт 2024 в 12:00

Selenoid на Android – от А до Я

Простой

16 мин

2.5K

Блог компании OkkoТестирование мобильных приложений*

Туториал

✏️ Технотекст 7

Планируете внедрить или уже используете Appium-тесты для Android и задумываетесь о многопоточности? У нас есть для вас полный гайд, как реализовать это с помощью Selenoid – предварительно немного взбодрив образы для поддержки последних версий Android, и при этом сделав тестовую инфраструктуру стабильной, как молоток.

Читать далее

+5

dim_ogu 17 сен 2024 в 11:17

Вместо тысячи слов: как картинки помогают в текстовом Поиске?

Средний

5 мин

1.5K

Блог компании OkkoБлог компании Конференции Олега Бунина (Онтико)Natural Language Processing*Искусственный интеллектМашинное обучение*

Кейс

Всем привет! Меня зовут Дима. Я работаю в Поиске Okko и в этой статье хочу рассказать, насколько картиночные модели полезны для задачи Поиска и для чего мы используем их в наших пайплайнах.

Данный материал может быть полезен тем, кто только начинает разрабатывать аналогичные системы, и, возможно, сомневается в полезности кроссмодальных факторов в текстовом поиске.

Читать далее

+14

pgonin 26 авг 2024 в 05:57

Как небольшой команде переехать на ClickHouse: на какие грабли мы наступили и о каких фишках не знали

Простой

21 мин

17K

Блог компании Конференции Олега Бунина (Онтико)Блог компании OkkoOpen source*SQL*Data Engineering*

Кейс

✏️ Технотекст 7

Привет, Хабр!

Меня зовут Петр. Я работаю инженером по данным в Okko и обожаю ClickHouse.

Примерно в середине прошлого года мы начали переезжать с PostgreSQL на ClickHouse. Одной из главных причин переезда была низкая производительность: среднее время аналитического запроса составляло около минуты. Сейчас, после переезда, среднее время запроса в аналитическом кластере — около 2 с. И это не предел.

Я расскажу, как мы пришли к текущему состоянию хранилища данных, какие ошибки совершили, какие шишки набили, и о каких фишках кликхауса предпочли бы знать заранее.

Статья в основном для тех, кто только начинает свой путь работы с кликхаусом: мы посмотрим, как делать не надо, и как можно сделать лучше.

В этой статье не будет объяснений почему для переезда мы выбрали именно этот инструмент. Не будет и глубокой теории о его внутреннем устройстве. Отметим лишь: в правильных руках ClickHouse — одна из самых быстрых колоночных СУБД для OLAP запросов.

Читать далее

+59

maks-sh 15 авг 2024 в 10:55

Как организовать процесс А/В тестирования на коленке

Простой

10 мин

5.6K

Блог компании Конференции Олега Бунина (Онтико)Блог компании Open Data ScienceБлог компании OkkoАнализ и проектирование систем*Управление продуктом*

Роадмэп

Привет, Хабр!

Меня зовут Максим Шевченко и последние два года я занимаюсь развитием платформы экспериментов в Okko, одном из ведущих онлайн-кинотеатров в России. Наша команда разрабатывает инструменты, которые позволяют продуктовым командам самостоятельно проводить А/В тесты и анализировать их результаты. Мы отвечаем за весь цикл экспериментов – от помощи в дизайне и выдаче пользователям разного опыта до предоставления рекомендаций по принятию решений.

Когда речь заходит об А/В-тестах, первыми в голову приходят статистические методы: различные параметрические или непараметрические критерии и многое другое. Но если взглянуть шире, становится понятно, что статистика – лишь часть экспериментов. Довольно важная часть, но не единственная. В контролируемых онлайн-экспериментах также важны сплитование трафика, удобное управление изменениями пользовательского опыта, обработка данных, дашборды, система мониторинга и многое другое.

В этой статье я поделюсь опытом и результатами организации процесса экспериментов в компании, где нет собственной платформы для экспериментов или она только начинает развиваться. Если в вашей компании есть собственная платформа экспериментов и вы собаку съели на A/B-тестах, я вряд ли смогу вас удивить. Всех остальных интересующихся темой милости прошу под кат.

Читать далее

+22

justLegend 2 авг 2024 в 13:14

История оптимизации Python сервиса: пара простых системных улучшений

Средний

9 мин

4.5K

Блог компании Конференции Олега Бунина (Онтико)Блог компании OkkoВеб-разработка*Python*

Ретроспектива

Привет, Хабр! В двух предыдущих статьях здесь и тут мы рассказывали историю создания одного из компонентов платформы экспериментов в компании Okko — сервиса сплитования трафика. В тех статьях говорилось о множестве изменений и улучшений, которые претерпел Python-код, чтобы работать достаточно быстро. Но как бы качественно не был написан код, все усилия могут сойти на нет, если он будет запущен в неправильной среде. В этой статье продолжим рассказ об оптимизациях и улучшениях, но сейчас речь будет идти не столько об особенностях предметной области и решаемой бизнес-задачи, сколько о том, как мы архитектурно организовали работу сервиса для получения минимального времени ответа.

Читать далее

+24

komissar_off_andrey 15 июл 2024 в 12:45

Как компилировать json или история оптимизации python сервиса

Средний

10 мин

9.3K

Блог компании Конференции Олега Бунина (Онтико)Блог компании OkkoВеб-разработка*Python*

Ретроспектива

В прошлой статье мы начали историю создания одного из компонентов платформы экспериментов в компании Okko — сервис сплитования трафика.

Там были описаны небольшие, но эффективные оптимизации Python-кода, которые могут быть полезны в практически любом сервисе на этом языке.

В статье мы продолжим рассказ об оптимизациях и улучшениях, однако здесь речь пойдет про детальные и последовательные изменения в самом узком месте сервиса. Приготовьтесь к более высокому уровню Python-магии.

Читать далее

+32

shereneshka 20 июн 2024 в 10:13

История оптимизации Python сервиса: Маленький шаг для человека, гигантский скачок для сервиса

Простой

10 мин

5.3K

Блог компании OkkoВеб-разработка*Python*

Привет, Хабр, на связи Okko! У нас одна из самых больших медиатек в России, поэтому мы постоянно работаем над развитием алгоритмов поиска и рекомендаций. Новые фичи тестируются с помощью А/Б тестов. Количество фичей неустанно растет, поэтому было решено создать специальную платформу для проведения экспериментов. Она позволила бы удобно их заводить и настраивать, сплитовать трафик в онлайн-режиме и формировать результаты экспериментов.
Мы — команда разработки платформы экспериментов — посвятим цикл рассказов самому важному и сложному компоненту сервиса — сплитовалке трафика. В этой статье расскажем о небольших по сложности, но больших по значению оптимизациях в коде, которые мы сделали, чтобы разогнать нашу платформу до скорости ракеты 🚀

Читать далее

+12

alekseyolg 15 июн 2023 в 07:00

Apache Airflow в связке с Kubernetes

Сложный

5 мин

11K

Блог компании OkkoPython*Apache*DevOps*Data Engineering*

Туториал

Привет! Меня зовут Алексей Карпов, я DevOps-инженер (MLOps) отдела ML разработки в OKKO. Хочу поделиться опытом в работе с Apache Airflow в связке с Kubernetes. Расскажу, как установить Airflow в Kubernetes, настроить автоматическую синхронизацию DAG'ов с удалённым репозиторием, а также как отладить его работу. Всё это — на примере запуска простейшего DAGа.

Читать далее

+4

a_shcherbakov 25 апр 2023 в 15:25

Backend Client как универсальный инструмент для UI-автотестов

Простой

6 мин

3.7K

Блог компании OkkoТестирование мобильных приложений*Тестирование веб-сервисов*Тестирование IT-систем*

Роадмэп

Всем привет!

В этой статье я бы хотел поделиться инструментом, который мы в Okko используем для UI-автотестов для клиентских приложений платформы Android.

Обычно, когда в компаниях начинают задумываться о UI-тестах, первой вехой такой автоматизации являются чистые e2e-тесты. Это уже хороший результат, но, к сожалению, как только наше покрытие начинает выходить за рамки того, что можно сделать только через клиент, начинаются большие проблемы.

Также по мере расширения покрытия мы начинаем сталкиваться с проблемой времени выполнения тестов, которое может легко составлять и несколько часов, поскольку для каждого кейса мы должны заново прокликивать на клиенте все предусловия для какой-либо из проверок.

И соответственно, чем больше мы этим занимаемся, тем выше вероятность падения UI-тестов, поскольку в идеальном мире взаимодействия с клиентом должно быть ровно столько, сколько необходимо для выполнения теста, а у нас же получается всё наоборот. Поэтому после того, как такие тесты уже написаны, все начинают задумываться, а не начать ли применять к фронтовым тестам что-нибудь из бэкенда. Мы столкнулись с этой же проблемой.

В статье я расскажу, как можно выйти из этого положения, причем данный опыт можно применить и превентивно, еще до того, как будут написаны ваши первые тесты.

Читать далее

+9

pfilaretov42 8 мар 2023 в 13:53

Динамические типы с GraphQL

Средний

4 мин

2.3K

Блог компании OkkoПроектирование API*

Кейс

Реализация динамических типов на GraphQL выглядит довольно естественно. Однако, есть определенные сложности.

Читать далее

+1

1