Обновить

Моя лента

Тип публикации
Порог рейтинга
Уровень сложности
Предупреждение
Войдите или зарегистрируйтесь, чтобы настроить фильтры
Статья

Линейные скрипты мертвы: что их заменит в саппорте и как это собрать

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели4.2K

Когда в продуктовой компании растёт база клиентов, первая линия поддержки всё чаще решает не «где найти кнопку», а «почему сломалась интеграция с CRM» или «как правильно вызвать API, чтобы не уронить биллинг». В этот момент становится очевидно, что старый добрый «скрипт для колл-центра» из двух страниц в Word не работает: оператору нужно держать в голове архитектуру сервиса, бизнес-правила и десятки edge‑кейсов. 

Читать далее
Новость

ИИ-министра Албании «задержали» после получения взяток в криптовалюте

Время на прочтение2 мин
Охват и читатели6.5K

Специальная прокуратура по борьбе с коррупцией и организованной преступностью Албании (SPAK) распорядилась (по данным хорватского новостного портала, которому можно, но не обязательно, доверять) срочно «заморозить» и перевести в автономный режим работу ИИ-министра Диеллы, отвечающей за госзакупки и прозрачность. Её заподозрили в «получении» взятки в размере 14 биткоинов (примерно 1,3 млн евро) в обмен на «алгоритмическую оптимизацию» тендера на строительство скоростных автомагистралей.

Читать далее
Статья

Баланс между хаосом и структурой и ни одной скучной минуты за рабочий день: что включает в себя роль CPO в MWS

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели3.9K

Привет, Хабр! Меня зовут Денис Улизко, я CPO CRM-системы Automation of Sales (AoS) в B2B-блоке МТС. Это тот самый продукт, вокруг которого крутится большая часть моего дня. Я уже не первый год в этой роли, но каждый раз убеждаюсь: она про баланс между хаосом и структурой, а не про красивые концепции. В один день — архитектура, в другой — инцидент на проде, вечером — охота за фокусом. Сегодня расскажу, как эта роль выглядит изнутри на примере AoS, как проходит мой рабочий день, какие решения приходится принимать и как удерживать баланс между операционкой и фокусом на ценность для бизнеса и пользователей. Погнали! 

Читать далее
Статья

Анимация загрузки: как скорость влияет на восприятие времени и конверсии

Время на прочтение8 мин
Охват и читатели4.4K

Мы терпеть не можем ждать, особенно в цифровых средах. И всё же задержки встречаются, то перегружена сеть, то сложное приложение, то серверные лаги и даже география.

Длинное ожидание портит пользовательский опыт. Так почему же современные технологии сами создают эти задержки и как с этим бороться? Разберёмся дальше.

Читать далее
Пост

📊 Multi‑LLM Orchestrator v0.6.0: метрики провайдеров и умный роутинг

На этой неделе на Хабре вышла статья про Multi-LLM Orchestrator — библиотеку для работы с российскими LLM через единый интерфейс. Сегодня релиз v0.6.0 добавляет метрики провайдеров и стратегию роутинга на основе health status.

Автоматический сбор метрик

Роутер отслеживает каждый запрос и собирает статистику по провайдерам. Latency, success rate, количество ошибок — всё фиксируется без дополнительной настройки.

from orchestrator import Router
from orchestrator.providers import GigaChatProvider, ProviderConfig

router = Router(strategy="best-available")
router.add_provider(GigaChatProvider(
    ProviderConfig(name="gigachat", api_key="...", model="GigaChat")
))

# После нескольких запросов
metrics = router.get_metrics()
print(f"{metrics['gigachat'].avg_latency_ms:.0f}ms")
print(f"Health: {metrics['gigachat'].health_status}")

Система отслеживает среднюю задержку и rolling average по последним 100 запросам. Если провайдер начинает деградировать, это видно сразу.

Health status провайдеров

Роутер классифицирует каждого провайдера автоматически:

  • healthy — error rate меньше 30%, стабильная latency

  • degraded — error rate 30-60% или задержки растут

  • unhealthy — error rate выше 60%

Классификация происходит на лету, без пороговых значений в конфигах.

Стратегия best-available

Новая стратегия роутинга выбирает провайдера на основе метрик. Приоритет отдаётся healthy-провайдерам, среди них — с минимальной задержкой.

router = Router(strategy="best-available")
router.add_provider(gigachat_provider)
router.add_provider(yandexgpt_provider)

# Роутер выбирает самого здорового и быстрого
response = await router.route("Вопрос")

Если GigaChat деградирует до 3 секунд, а YandexGPT стабильно отвечает за 500ms — роутер переключится на YandexGPT.

Тестирование на боевых API

Запущена серия тестов с реальными запросами к GigaChat и YandexGPT. Результаты подтверждают стабильность системы метрик.

Метрики провайдеров: GigaChat vs YandexGPT (fallback-тест)
Метрики провайдеров: GigaChat vs YandexGPT (fallback-тест)

Первый тест показал базовую работу: GigaChat отвечает за ~1.7 секунды со 100% success rate. Второй тест проверил fallback при ошибке авторизации — роутер переключился на YandexGPT без потери запроса. Третий тест подтвердил корректность метрик при streaming-запросах.

YandexGPT показал стабильные 500-700ms на серии из шести запросов. GigaChat медленнее (~1.7s), но это ожидаемо для более тяжёлой модели. Success rate обоих провайдеров — 100%.

Structured logging

Каждый запрос логируется в структурированном формате с полями provider, model, latency_ms, streaming, success. Интеграция с Prometheus или Grafana требует только парсинг JSON

# При успехе
logger.info("llm_request_completed", extra={
    "provider": "gigachat",
    "latency_ms": 1723
})

# При ошибке
logger.warning("llm_request_failed", extra={
    "provider": "yandexgpt",
    "error_type": "RateLimitError"
})

Ссылки

Следующий релиз (v0.7.0) добавит token-aware метрики: подсчёт токенов, расчёт tokens/s, cost estimation и экспорт в Prometheus.

Если используете российские LLM в production — буду рад обратной связи в комментариях.

Теги:
0
Комментарии0
Пост

Запуски 2025: программирование

В 2025 году мы запустили 25+ курсов и тарифов для ИТ-специалистов. В этой подборке собрали новые программы по разработке и архитектуре.

«Rust для действующих разработчиков» — 4 месяца
После курса сможете использовать Rust как основной стек и создавать отказоустойчивые системы с высоким уровнем безопасности.

«SRE — обеспечение надёжности систем» — 4 месяца
Освоите практики и подходы SRE, наладите мониторинг инфраструктуры и приложений, чтобы повышать стабильность и улучшать бизнес-процессы.

«DevSecOps: безопасная разработка и эксплуатация» — 3 месяца
Разберём, как выявлять и устранять уязвимости на ранних этапах и снижать риски на всём жизненном цикле приложения — от планирования до эксплуатации.

«MLOps для разработки и мониторинга» — 5 месяцев
Освоите принципы MLOps, чтобы ускорять и безопасно выводить ML-модели в продакшн, настраивать стабильную инфраструктуру и улучшать взаимодействие команд.

«Микросервисная архитектура» — 3 месяца
Научитесь проектировать и реализовывать масштабируемые и отказоустойчивые микросервисные системы. Разберёте паттерны SAGA и Transactional Outbox, подход DDD и другие инструменты.

«Мидл разработчик C++» — 4,5 месяца
Прокачаете владение современным C++: лучшие практики и идиомы языка, работа с диапазонами, библиотечными возможностями, асинхронностью и многопоточностью.

«Продвинутая разработка на C# и .NET» — 5 месяцев
Научитесь писать безопасный высокопроизводительный код, разбирать сложные продакшн-задачи, внедрять observability (логи, метрики, трейсы) и использовать современные возможности .NET.

Теги:
0
Комментарии0
Новость

В «Яндекс Браузере» оптимизировано потребление оперативной памяти с помощью ML-модели

Время на прочтение2 мин
Охват и читатели3.2K

«Яндекс» внедрил в версию «Яндекс Браузера» для ПК ML‑модель для определения неактивных вкладок, которые не понадобятся пользователям в ближайшее время. Как пояснили Хабру в компании, новая опция позволяет освобождать от ненужных вкладок оперативную память компьютера.

Читать далее
Новость

Регулятор США выявил десятки случаев незаконного обгона робомобилями Waymo школьных автобусов

Время на прочтение2 мин
Охват и читатели3.6K

Национальное управление безопасности дорожного движения США (NHTSA) потребовало от Waymo разъяснений после того, как власти Техаса сообщили о 19 случаях незаконного обгона школьных автобусов со стороны беспилотных автомобилей. Инциденты фиксировали даже после того, как компания заявила об установке программного обеспечения для исправления ошибки. 

Читать далее
Статья

Не читал, но одобряю: пишем софт для быстрого анализа пользовательских соглашений

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели4.3K

Недавно посмотрел видео про скандал вокруг известного сервиса по торговле ключами для игр Kupikod. Для тех кто не в курсе: ребята из данной конторы решили подзаработать деньжат довольно интересным способом - объявили у себя на сайте нулевые комиссии за пополнение кошелька, но почему-то после пополнения у клиентов дополнительно списывалось 300 рублей. Оказывается, пополняя кошелей, пользователь дополнительно оформлял помесячную подписку стоимостью 300 рублей, которая как раз и обеспечивала эти нулевые комиссии. И разумеется, если эту подписку не отменить, то с тебя так каждый месяц и будет списываться по 300 рублей. Информации об этом на сайте просто не было, она была указана в публичной оферте, том самом документе, который никто никогда не читает. Собственно вот этот пункт:

Читать далее
Новость

Известный ML-исследователь разобрал DeepSeek V3.2 и рассказал, как открытая модель догнала GPT-5

Время на прочтение2 мин
Охват и читатели3.5K

Себастьян Рашка — автор бестселлера Python Machine Learning и рассылки Ahead of AI — опубликовал детальный технический разбор новой флагманской модели DeepSeek V3.2. Модель вышла 1 декабря и показывает результаты на уровне GPT-5 и Gemini 3.0 Pro: на математическом бенчмарке AIME 2025 версия V3.2-Speciale набрала 96%. В отличие от конкурентов, веса модели доступны для скачивания.

Читать далее
Статья

Двухфакторная аутентификация (2FA) в Zabbix 7.0

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели3.8K

Всем привет! Мы делаем проекты по Zabbix, накопили большую экспертизу и решили сделать переводы нескольких статей, которые нам показались интересными и полезными. Наверняка, будут полезны и вам. Также своим опытом делимся в телеграм-канале zabbix_ru, где вы можете найти полезные материалы и записи наших вебинаров, опубликованных на нашем ютуб-канале (прим. переводчика). Ниже ссылки на предыдущие статьи из цикла.

Миграция с MySQL на PostgreSQL

SELinux: интеграция с Zabbix и другими инструментами

Защита от ложных срабатываний триггеров в Zabbix с использованием функций min/max/avg

Zabbix – автоматизация управления пользователями (JIT)

В этой статье мы покажем, как легко принудительно включить двухфакторную аутентификацию для группы пользователей в Zabbix и как сбросить токен для генерации TOTP (одноразового пароля с ограниченным сроком действия). Подробности под катом.

Читать далее
Новость

В Великобритании легкий самолёт разбился из-за плавления 3D-запчасти

Время на прочтение1 мин
Охват и читатели6.1K

Легкий самолёт Cozy Mk IV разбился в Глостершире после того, как распечатанный на 3D-принтере пластиковый коленчатый патрубок воздухозаборника размягчился от тепла двигателя. Это привело к отключению двигателя при заходе на посадку.

Читать далее
Статья

Спасаем ARGB: Как я заменил сгоревший китайский хаб на ESP32 с веб-интерфейсом

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели5.4K

Год назад я собрал систему с пятью бюджетными ARGB вентиляторами Aigo AR12 с 6-pin разъёмами. В комплекте шёл хаб AR12-2012 это типичная китайская плата с 10 портами для вентилей, SATA питанием и выходом на материнку для синхронизации подсветки.

Всё работало. Красиво светилось. Но ровно год.

Однажды утром вентиляторы крутились, а подсветка увы нет. Хаб умер. Покупать новый за $15-20 не хотелось, тем более что я знал: внутри этих вертушек сидят обычные адресные светодиоды (WS2812/SM16703-совместимые).

А раз адресные, значит можно управлять с ESP32.

Читать далее

Ближайшие события

Статья

Как я попал в СберМобайл в 18 лет: мой путь, ошибки, 300 откликов и один шанс

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели4.8K

История о том, почему упорство, нетворкинг и любовь к делу могут заменить опыт и возраст.

Мне 18 лет, я стажёр-дизайнер в СберМобайле. Но если оглянуться назад на последние два года, путь к этой точке кажется одновременно хаотичным, тяжёлым и абсолютно закономерным.

Первые шаги: от интерьера к графическому дизайну

В 15 лет, учась в 9 классе, я впервые понял, что хочу стать дизайнером. Начал я… с дизайна интерьеров. Просто потому что это было первое, что попалось, и казалось «настоящим дизайном».

В 16 лет я принял одно из самых серьёзных решений в своей жизни — уехать из Краснодара в Москву. Поступил на первый курс колледжа по направлению «графический дизайн» и начал жить один. Это было сложно, но именно самостоятельность и ответственность стали для меня драйвером роста. Огромную роль сыграл мой дядя — мой наставник, ментор и человек, который верил в меня, когда я сам ещё не до конца понимал, куда иду.

Читать далее
Новость

Глава Google DeepMind: AGI на горизонте, риск для человечества — «значительный»

Время на прочтение1 мин
Охват и читатели4.7K

Генеральный директор Google DeepMind Демис Хассабис заявил, что создание искусственного общего интеллекта (AGI) уже близко и это будет "вероятно, самый трансформативный момент в истории человечества". Об этом он сказал в интервью на саммите Axios AI+ в Сан-Франциско 4 декабря. В Axios напоминают, что ранее Хассабис не раз озвучивал, что AGI может появиться до 2030 года.

Читать далее
Статья

Неопределённость как часть модели

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели4.6K

Привет, Хабр!

Сегодня рассмотрим тему неопределённости в моделях. Классические ML-модели детерминированы: на вход получили – на выход выдали одно число или метку. Но жизнь полна неопределённости, и игнорировать её плохая идея. Представьте, у вас мало данных, модель предсказывает конверсию 15%. Но насколько она уверена? Может, разброс от 5% до 30%. Обычная модель этого не скажет, а вот вероятностная модель скажет.

В этой статье в коротком формате разберём, как с помощью байесовского подхода и фреймворка Pyro моделировать такую неопределённость на примере A/B-теста конверсии и заставить модель честно признавать свою неуверенность.

Читать далее
Статья

Разговорные клубы для изучения английского: есть ли от них польза, кому не подойдут и как выбрать подходящий

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели4.7K

Разговорные клубы часто окружены завышенными ожиданиями. Многие отзывы в интернете создают впечатление, что это универсальное решение всех языковых проблем: достаточно походить на встречи — и вы уже свободно говорите по-английски.

На практике всё сложнее. Разговорные клубы не научат вас грамматике, не поставят произношение и не подготовят к экзамену. Они не заменят системных занятий с преподавателем. Более того, для многих людей этот формат может оказаться неподходящим. Так стоит ли вообще тратить на них время?

Привет! Меня зовут Елизавета Рослякова, я методист курсов английского в Практикуме. В этой статье я расскажу о разговорных клубах без розовых очков, но и без лишнего пессимизма. Разберём, для кого они точно не подходят, чем они реально полезны и как выбрать клуб, который не разочарует.

Читать далее
Новость

Anthropic объяснила, почему не устраивает авралы из за релизов конкурентов

Время на прочтение1 мин
Охват и читатели3.6K

На саммите NYT Dealbook глава Anthropic Дарио Амодей выступил с заявлением, которое явно контрастирует с поведением других игроков индустрии. Пока OpenAI включает режим code red после свежих релизов Google, в Anthropic считают такую реакцию лишней. Амодей сказал, что компания не собирается бежать за конкурентами и менять курс в попытке ответить на каждое громкое обновление.

Читать далее
Статья

Чтение на выходные: «Культурный код. Как мы живём, что покупаем и почему» Клотера Рапая

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели4.5K

Bonjour! Hello! Сегодня в рубрике — американо-французский флёр.

Мы часто пишем для айтишников и любителей видеоигр. Однако сегодня мы приглашаем к чтению всех: ценителей авто, домохозяек, маркетологов, культурологов, сотрудников сферы гостеприимства, предпринимателей. Иначе говоря, людей с самым разным родом занятий, которые хотя бы раз были в магазине. Шутка, речь в книге идёт не совсем про потребление.

Сразу подскажем, что эта книга легка для восприятия и вместе с этим крайне содержательна, а значит вы можете использовать её как полезное чтение на досуге. Ключевое в ней — культурные коды разных стран и сообществ. Упор Клотер Рапай делает на американскую и французскую культуры. Это связано с тем, что он одновременно и американец, и француз. Ставьте ударение в его имени на последний слог.

Клотер Рапай — консультант по маркетингу, генеральный директор и основатель Archetype Discoveries Worldwide, выпускник Института политических наук в Париже и доктор психологии Сорбонны. Он специализируется на декодировании бессознательных механизмов принятия решений, благодаря чему консультирует ведущие мировые бренды и политические команды. В своём нон-фикшне он предлагает читателю глубокое культурологическое и психологическое исследование, которое отвечает на главный вопрос: почему мы, принадлежащие к разным культурам, по-разному смотрим на одни и те же вещи? И вот что имеется в виду.

Читать далее
Пост

Хабр бенч LLM

Здесь в комментах завязалась дискуссия про возможности тупых LLM. И вроде как тупыми оказались не LLM. Gemini распознала тавтограмму, распознала белиберду и написала рассказ из ровно 20 слов.

В этой связи хочу предложить сеанс разоблачения иинтелектуальной магии.

Скептики: накидывайте шарад уровня "дебил или нет". И делайте ставку.
Трудяжки: скармливайте задачу вашему инструменту и результат сюда. Первый, кто принес правильный ответ, получает банк.


Теги:
+1
Комментарии0