Хабр

Все потоки

СтатьиПостыНовостиАвторыКомпании

husky_it 20 часов назад

Как применяют LLM с RAG в экосистеме ML-моделей поддержки Лемана Тех? Кейс

12 мин

4.6K

Блог компании Конференции Олега Бунина (Онтико)Блог компании Лемана ТехPython * Искусственный интеллектData Engineering *

Кейс

С ростом числа обращений в Service Desk классические ML-решения перестали покрывать все сценарии. Что же с этим делать?

Привет, Хабр! Я — Дмитрий Терентьев, ведущий специалист по науке о данных в Центре компетенций сопровождения IT-продуктов. Работаю с данными больше восьми лет, последние четыре — в Лемана Тех. В этой статье по мотивам доклада с AiConf я расскажу об эволюции моделей машинного обучения в поддержке и как удалось дополнить экосистему поддержки LLM с RAG для человекообразных ответов по Wiki и интеллектуальной эскалации к живым специалистам.

Читать далее

+1

olegbunin 19 мар в 09:00

Черная магия unsafe в Go: практические примеры и ошибки использования. Часть 2

5 мин

4.3K

Блог компании Конференции Олега Бунина (Онтико)Go * C * C++ *

Обзор

Привет, Хабр! Я — Владимир Балун, и это — вторая часть материала о пакете с отпугивающим названием «unsafe» в Go и том, чем он может быть реально полезен. В первой части мы рассмотрели его содержимое, особенности и нюансы, оптимизации кода с использованием unsafe — все это вы можете освежить в памяти по ссылке.

Сегодня перейдем непосредственно к той самой «магии»: трюки, хаки, советы и лучшие практики с моей стороны.

Читать далее

0

x4mmm 16 мар в 09:00

Про избыточность WAL в Postgres

14 мин

11K

Блог компании Конференции Олега Бунина (Онтико)Блог компании Yandex Cloud & Yandex InfrastructureВысоконагруженные системы * Базы данных * IT-инфраструктура *

Обзор

WAL — один из ключевых компонентов внутреннего устройства Postgres. Файлы WAL для истории бэкапов ужимаются в несколько раз, что говорит об избыточности. Изменяя физические параметры кластера, можно существенно повысить и эффективность локальной записи, и пропускную способность репликации, а можно создать неприятные инциденты.

Привет, Хабр! Я — Андрей Бородин, работаю над Postgres и Apache Cloudberry для Yandex Cloud и вообще. Поддерживаю WAL-G, SPQR, Odyssey и всякое такое. В этой статье на основе доклада для конференции Saint HighLoad++ я расскажу о причинах избыточности, о действиях сообщества, а также о своей работе в рамках подсистемы WAL. Понимание работы WAL поможет вам проектировать ваши сервисы с учетом специфики этой подсистемы.

Читать далее

+43

olegbunin 12 мар в 09:00

Черная магия unsafe в Go: практические примеры и ошибки использования. Часть 1

13 мин

5.9K

Блог компании Конференции Олега Бунина (Онтико)Go * C * C++ *

Обзор

В стандартной библиотеке Go есть пакет с отпугивающим названием «unsafe». Но он может быть реально полезен! Сегодня поговорим о том, как использовать его надежно и эффективно.

Привет, Хабр! Я — Владимир Балун, основатель balun.courses и it-interview.io. Эта статья будет для удобства разделена на две части. Из них вы узнаете, как можно создавать срезы без дорогостоящей инициализации, научитесь избавляться от Bound Checks и конвертировать строки в срезы и обратно без лишних копирований и аллокаций памяти.

Черную магию мы оставим на десерт, чтобы с ее использованием посмотреть, как можно проехаться по памяти для анализа сложных структур данных, модифицировать иммутабельные строки в Go и получать доступ к приватным полям структур.

Читать далее

+6

torkve 10 мар в 11:30

Платформа для 50000 приложений: как собрать инфраструктуру и выжить

17 мин

7.1K

Блог компании Yandex Cloud & Yandex InfrastructureБлог компании Конференции Олега Бунина (Онтико)Высоконагруженные системы * Распределённые системы *

Привет, Хабр! Я — Сева, разработчик в Yandex Infrastructure. Уже больше десяти лет я занимаюсь разработкой внутреннего облака Яндекса, которое охватывает около 150 000 физических хостов и поддерживает все сервисы платформы.

Сегодня я представлю вам практический кейс по обеспечению очень высокой надёжности комплексной системы на примере собственного облака Яндекса. Принципы обеспечения надёжности будут продемонстрированы на всех уровнях архитектуры системы, чтобы в итоге сложилась картина, как достичь наивысшей отказоустойчивости. Статья написана по мотивам моего доклада для HighLoad++.

Читать далее

+11

olegbunin 4 мар в 12:22

DevOpsConf 2026: «Онтико» меняет рынок IT-конференций

5 мин

6K

Блог компании Конференции Олега Бунина (Онтико)DevOps * КонференцииСофтИскусственный интеллект

Обзор

Кажется, мы все немного устали. Устали от унаследованного кода без владельца. От инфраструктуры, которая «как-то работает». От ИИ, который внедряют быстрее, чем понимают. От регуляторики, написанной на инопланетном языке. От SLO, которым вроде бы можно верить — но лучше бы перепроверить.

И на фоне всего этого — привычный формат конференции: два дня докладов, блокнот заметок, лёгкая эйфория… а через неделю всё растворяется в задачах.

Команда DevOpsConf в этом году честно признала: формат «послушал — вдохновился — пошёл применять» больше не тянет. Индустрия изменилась. И мероприятия тоже должны. Поэтому DevOpsConf 2026 проходит в новом формате — «конференция развития».

Расписание уже готово — можно изучить программу и собрать свой маршрут по стримам на официальном сайте. Давайте посмотрим, что получилось!

Читать далее

+2

olegbunin 4 мар в 09:00

Edge AI: почти всё о видеокамерах с искусственным интеллектом. Часть 2

11 мин

4.8K

Блог компании Конференции Олега Бунина (Онтико)Искусственный интеллектРабота с видео * Видеотехника

Обзор

Привет, Хабр! Это вторая часть статьи по мотивам доклада реверс-инженера Дмитрия Ильина для прикладной конференции по Data Sience Ai Conf 2025. Дмитрий рассказал о своём проекте OpenIPC, где IPC — это аббревиатура от IP-камера. Изначально он задумывался как специализированный дистрибутив Linux для IP-камер, но со временем превратился в большое комьюнити любителей опенсорса, каждый из которых является носителем уникального кусочка знаний.

В предыдущем материале мы разбирали вопросы видеоаналитики, сравнивали Cloud AI протв Edge AI и изучали, что есть интересного кроме GPU. Освежить материал в памяти можно по ссылке. Сегодня поговорим о многокамерных массивах (Multi Camera Array), мультисенсоры и разберём конкретные кейсы.

Читать далее

+6

e_lysenko 2 мар в 09:00

Полгода на включение: как мы построили онбординг в команде не по инструкции. Часть 3: Self-Assessment, 1:1 и честная ОС

14 мин

6.2K

Блог компании Конференции Олега Бунина (Онтико)DevOps * Управление персоналом * КонференцииУправление сообществом *

Кейс

На связи — Катя Лысенко и третья часть статьи о системе онбординга. В первых двух (ч.1 и ч.2) мы разобрали основы: как подготовить почву, выстроить маршрут и создать понятный трек для новичка. Но структура — это только половина системы. Вторая половина — то, что делает её живой: регулярная рефлексия, честный разговор и поддерживающая среда, где человек не боится расти и пробовать.

Читать далее

+1

mad_ocean 27 фев в 09:00

L4-балансировка и защита от DDoS-атак

14 мин

7.8K

Блог компании Конференции Олега Бунина (Онтико)Блог компании Wildberries & RussИнформационная безопасность * Высоконагруженные системы *

Кейс

В высоконагруженных системах балансировка трафика быстро перестаёт быть просто задачей распределения запросов. Сегодня на реальном опыте разбираем путь от BGP Anycast к L4-балансировке и XDP: зачем она понадобилась, как помогла справиться с ограничениями Anycast, повысить отказоустойчивость и производительность, а также почему балансировщик стал точкой входа для защиты от L4-DDoS. Статья будет полезна инженерам, которые проектируют и развивают инфраструктуру под высокий трафик и пиковые нагрузки.

Читать далее

+8

olegbunin 26 фев в 09:00

Edge AI: почти всё о видеокамерах с искусственным интеллектом. Часть 1

8 мин

5.1K

Блог компании Конференции Олега Бунина (Онтико)Искусственный интеллектВидеотехникаРабота с видео *

Обзор

Привет, Хабр! Эта статья написана по мотивам доклада реверс-инженера Дмитрия Ильина для прикладной конференции по Data Sience Ai Conf 2025. В нём Дмитрий рассказывает о своём многолетнем хобби, которое родилось на стыке реверс-инжиниринга, софта и железа. Это проект OpenIPC, где IPC — это аббревиатура от IP-камера. Изначально он задумывался как специализированный дистрибутив Linux для IP-камер, но со временем превратился в большое комьюнити любителей опенсорса, каждый из которых является носителем уникального кусочка знаний.

Это будет материал из двух частей. В первой Дмитрий объясняет, как работать с видеоаналитикой, какие есть проблемы в области Computer Vision и какие нестандартные решения можно найти сегодня.

Читать далее

+5

andyray 25 фев в 09:00

Оптимизация стоимости владения K8s-кластерами в AWS и YC

Средний

17 мин

4.5K

Блог компании Конференции Олега Бунина (Онтико)DevOps * Облачные сервисы * Поисковые технологии *

Кейс

Облака обещают магическую экономию и бесконечное масштабирование. На практике Kubernetes‑кластеры в AWS и Яндекс.Облаке легко превращаются в бездонную чёрную дыру для бюджета. Мы в «Антиплагиате» научились готовить споты, научили шедулер и дешедулер работать правильно и выжали из кубов максимум надежности и производительности при минимуме затрат. В этой статье — конкретные шаги, которые позволили сэкономить миллионы рублей.

Казалось бы, задай вопрос любой популярной LLM, она выдаст набор рецептов на любой вкус. То, что будет в этой статье, LLM не расскажут. Я проверял. В этой статье, только реализованные и действительно работающие рецепты с плюсами, минусами и подводными камнями.

Без галлюцинаций и смс, погнали!

+6

samoxbal 24 фев в 09:00

Погружение в eBPF и XDP вместе с Go

12 мин

9.3K

Блог компании Конференции Олега Бунина (Онтико)Блог компании К2ТехGo * Управление разработкой *

Обзор

Технология eBPF у всех на слуху, но написать свой инструмент и получить все выгоды от eBPF не так просто из-за недостатка информации.

Привет, Хабр! Я — Дмитрий Самохвалов, архитектор в компании К2Тех. Помимо этого пишу на GO и на Rust, и стараюсь делать жизнь наших инженеров и разработчиков интереснее и проще. В этой статье по мотивам доклада с Golang Conf я расскажу, как мы пришли к работе с eBPF и покажу на примере написания своего XDP-фильтра, как начать работу с eBPF, используя Go.

Читать далее

+37

e_lysenko 19 фев в 09:00

Полгода на включение: как мы построили онбординг в команде не по инструкции. Часть 2: геймификация, бадди и адаптация

12 мин

5K

Блог компании Конференции Олега Бунина (Онтико)DevOps * Управление персоналом * Конференции

Кейс

На связи — Катя Лысенко и вторая часть статьи о системе онбординга новых людей в команду. Здесь поговорим о маршруте, ролях и последовательности в управлении адаптацией. Освежить в памяти материал вы можете по ссылке на первую часть.

В структуре онбординга, которую мы внедрили, получилось три ключевых части:

Геймификация — всё, что происходит до выхода, плюс квесты первых дней и встречи.

План онбординга — подробный маршрут, направляющий новичка через обучение, знакомства и задачи.

Self-Assessment — регулярная точка саморефлексии, через которую новичок понимает, куда движется и что с ним происходит.

Как это было?

Читать далее

0

L1meJkeee 16 фев в 09:00

1000 серверов и один RedFish: управляем собственным ЦОД, используя современный протокол от DMTF

7 мин

7.7K

Блог компании Конференции Олега Бунина (Онтико)Серверное администрирование * IT-инфраструктура *

Сегодня публикуем материал для тех, кого интересуют современные инструменты и протоколы управления ИТ-инфраструктурой. В своей статье по мотивам доклада с HighLoad++ 2025 технический руководитель компании «Прегель» Никита Австрийский рассказывает о том, как построить систему для управления тысячей серверов на базе протокола DMTF RedFish, как понять, чем неудобен его предшественник IPMI и как справиться с несовершенствами RedFish.

Читать далее

+14

bznk 12 фев в 09:00

10 000 RPS и доступность 99,99%: как устроено шардирование PG в процессинге Яндекс Такси

Средний

13 мин

40K

Блог компании Конференции Олега Бунина (Онтико)Блог компании ЯндексВысоконагруженные системы * Базы данных * PostgreSQL *

Когда система растёт, нагрузка на базу становится критичной, а готовых решений для шардирования PostgreSQL не хватает. Стандартные подходы не подошли — поэтому команда сделала свое решение для шардирования в ядре процессинга заказов. Оно позволяет решардировать данные без простоев и деградации метрик.

Привет, Хабр! Меня зовут Игорь Березняк, я руковожу группой процессинга в Техплатформе Городских сервисов Яндекса. В этой статье по мотивам моего доклада на Highload++ расскажу, как мы проектировали шардирование PostgreSQL, чтобы выдерживать нагрузку, сохранить доступность и уложиться в строгие требования по latency.

Читать далее

+55

e_lysenko 9 фев в 09:00

Полгода на включение: как мы построили онбординг в команде не по инструкции. Часть 1: от хаоса до осмысленной системы

11 мин

5.3K

Блог компании Конференции Олега Бунина (Онтико)DevOps * Управление персоналом * Конференции

Кейс

Возможно, я проклята. Иначе как объяснить, что снова и снова мне приходится собирать команды? Интервью — привычная часть моей работы, даже если прямо сейчас своей команды нет. Такая уж роль — «Technical Product». В какой-то момент я неизбежно становлюсь нанимающим менеджером, а значит, снова нужно тратить время на поиск, воронку, собеседования и онбординг.

В некоторых компаниях с этим проще: есть сильная HR-функция, и HR действительно помогают — продумывают онбординг, соединяют корпоративную часть и командную, следят, чтобы ничего не упало по пути. Но бывает и по-другому: есть рекрутеры, но нет HR-департамента, потому что компания ещё просто не доросла. И тогда весь онбординг — ваша личная головная боль. Если хотите, чтобы новые ребята не просто вышли на работу, а вросли в команду — придётся делать всё самостоятельно. У меня как раз такой кейс.

Читать далее

+1

Aleksey999 5 фев в 07:00

Экономика выбора: Python, Java, Go при разных RPS. Деньги или скорость?

Простой

13 мин

8.1K

Блог компании Конференции Олега Бунина (Онтико)Блог компании МТСGo * Java * Управление разработкой *

Аналитика

Сегодня проведём полный экономический анализ для каждого языка программирования, основанный на реальных данных и кейсах и покажем, как количественно оценить trade-off между скоростью разработки и производительностью, учесть долгосрочные затраты на поддержку кода.

В меню — исследования скорости разработки, стоимость изменений, скорость обновления кода для разных отраслей, стоимость инфры. Учитывая эти факторы, посчитаю для скольких RPS экономически оправдано использовать тот или иной язык разработки.

В конце вы получите ссылку на экономическую модель, которую сможете забрать и использовать у себя, подкрутив разные параметры для своего кейса.

Читать далее

+19

euko 4 фев в 09:00

Эволюция PostgreSQL-хранилища размещений в Авито

14 мин

6.8K

Блог компании Конференции Олега Бунина (Онтико)Блог компании AvitoTechБазы данных * Высоконагруженные системы *

Ретроспектива

Что делать, если сервис, который вырос из транзакции в монолите, за несколько лет стал входной точкой во все размещения на Авито? Когда через PostgreSQL проходят миллионы объявлений в день, привычные приёмы вроде «подождём, пока освободится блокировка» перестают помогать справляться с нагрузкой. А DELETE FROM больше не удерживает рост таблицы на диске.

Эта статья — ретроспектива развития продукта Listing Fee. В ней Евгений Константинов, backend-инженер Авито, рассказывает, как вместе с командой справлялся с ростом нагрузки и объёма данных без шардирования, а ещё про инциденты, дедлоки и «аварии первого числа», из-за которых критичные бизнес-сценарии оказывались недоступны. Материал подготовлен по мотивам выступления на Saint HighLoad++ 2025 — с разбором проектных ошибок, технических решений и приёмов, которые иногда спасали буквально одним запросом.

Читать далее

+21

Tianno 2 фев в 09:00

GraphRAG: 8 способов укротить расширенный контекст у LLM

Сложный

24 мин

5.6K

Блог компании Конференции Олега Бунина (Онтико)Блог компании RaftИскусственный интеллектБазы данных * Хранение данных *

Кейс

В 22% случаев онкологи не могут назначить лечение из-за рисков, связанных с хроническими заболеваниями. Сегодня разбираем кейс, в котором ИИ помогает врачам решать сложнейшие когнитивные задачи, связанные с лечением различных видов рака. Рассказываем про методологию GraphRAG, разбираем, как устроены и работают решения из кейса и проводим сравнительный анализ всех способов решить эту сложнейшую задачу.

Привет, Хабр! Это Андрей Носов, AI-архитектор из Raft. Я проектирую и создаю системы, которые должны стоять годами — сегодня речь пойдёт именно о них. В этой статье по мотивам моего доклада на AI Сonf 2025 я расскажу, как превратить стандартные RAG-системы из простых источников знаний в управляемый инструмент, способный справиться со сложным контекстом. Вас ждёт не просто технический обзор, а практическое руководство, где мы пойдём от прода к проду.

Читать далее

+8

ivagulin 28 янв в 09:00

Ускорение вычислений в алгоритме DRS-виртуализации через векторизацию

9 мин

5.3K

Блог компании Конференции Олега Бунина (Онтико)Блог компании Cloud.ruGo * Python * Управление разработкой *

Переписать решение с Python на Go и получить ускорение в 35 раз — звучит приятно. Но можно ведь пойти дальше, вспомнить о возможностях современных процессоров и увеличить отрыв Go до 200 раз! Статья написана по мотивам доклада для Golang Conf.

Привет, Хабр! Я — Игорь Вагулин, работаю тимлидом департамента IaaS в Cloud.ru, крупнейшем в России облачном провайдере IaaS- и PaaS-сервисов. Прогресс в производительности процессоров и видеокарт привел к тому, что мы можем использовать полный перебор там, где мы раньше обходились приближениями. Сегодня на примере алгоритма DRS-платформы Cloud.ru Evolution рассмотрим, как он может быть решен на разных версиях операций с плавающей точкой процессоров x86 и Arm, в чем сложности задействования SIMD-операций, почему это сложнее на Go и как это обойти.

Читать далее

+6

1

2 3 ...