Разработка

Техрепорт Alice AI: как мы создавали новое поколение моделей для самого популярного ИИ-ассистента в России

46 мин

9.2K

Блог компании ЯндексМашинное обучение * Natural Language Processing * Алгоритмы * Поисковые технологии *

Сегодня мы делимся техрепортом, в котором разобран полный цикл создания нового семейства моделей Alice AI: базовая текстовая Alice AI LLM и специализированная LLM Search, мультимодальная Alice AI VLM и картиночная Alice AI ART.

В части про Alice AI LLM расскажем, как сделали упор в Alignment на RL и Reward Modeling: мы минимизируем число разрозненных RL-стадий, собирая «общий RL». Вместо хрупкого «суперсигнала» используем аспектную формулировку качества и агрегируем её в целевую функцию, чтобы изменения критериев не требовали пересборки всей разметки. В главе про Alice AI LLM Search расскажем про многократные последовательные походы в Поиск с последующей фильтрацией/ранжированием источников. А также о том, как готовим ответы с использованием документов разной модальности (веб-документы, картинки, видео, гео).

Чтобы «вывезти» MoE-модель на сотни миллиардов параметров, мы целенаправленно сняли инфраструктурные ограничения обучения и инференса: в обучении используется YaFSDP (которую мы выложили в опенсорс) и собственная библиотека коллективных коммуникаций YCCL. В прод-инференсе мы работаем под SLA (avg TPOT ≤ 70 ms, p95 TTFT ≤ 2 s) и достигаем их комбинацией TP Attention/EP FFN, KV cache reuse, FP8 w8a8kv8 (в т. ч. сжатие KV cache ~3,05→~1,52 GB) и спекулятивного декодинга EAGLE‑3, что в сумме даёт 5.8× ускорение относительно BF16 (и 1,32× относительно лучшего open-source). Параллельно для Alice AI VLM нарастили в 1,5 раза объем претрейна, контекст до 32k и обновили OCR-датасет; VLM-генератор работает «из коробки», а для математики/геометрии выделен специализированный VLM‑решатель. В пайплайне Alice AI ART повышение релевантности к промпту начинается с диагностики смещений в датасете с помощью VLM и последующей адресной коррекции обнаруженных проблем.

Недавно все эти модели и решения легли в основу нашего нового ИИ-ассистента, и уже к ноябрю, согласно исследованию Mediascope, Алиса AI вышла на первое место по используемости среди россиян (14,3%), обойдя ранее доминировавший DeepSeek (9,4%). Кроме того, модель Alice AI LLM теперь доступна и для разработки собственных AI-решений на платформе Yandex AI Studio.

Читать техрепорт

+45

m039 21 час назад

Разработка USB-клавиатуры без поиска легкого пути

Средний

17 мин

7.9K

Блог компании Timeweb CloudПрограммирование микроконтроллеров * DIY или Сделай самПроизводство и разработка электроники * Схемотехника *

Кейс

Помимо полноценных клавиатур, есть клавиатуры с несколькими кнопками, клавиши которых можно запрограммировать. Их называют еще макропадами. Макропад не сложно купить, хоть часто он стоит дороже обычной клавиатуры, но можно и сделать. Статей как его смастерить много, самый простой способ — использовать каждый вывод микроконтроллера, пока они не закончатся. Но у меня не было никакого желания делать все как у всех. Хотелось чего-то по-настоящему DIY.

Поэтому в статье пойдет подробный рассказ о разработке USB-клавиатуры на микроконтроллере CH32V003, в котором по умолчанию нет поддержки USB. Но чтобы проект был более интересным, клавиатура состоит из 9 кнопок, 3-х энкодеров и 2-х светодиодов. При этом корпус и кейкапы тоже сделаны самостоятельно (почти).

Но стоит еще добавить, что эта статья могла бы и не появится на свет, потому что когда сделал клавиатуру, то она работала с ошибками. Какое-то время я пытался их поправить, но сдался и забросил проект на месяц. Но вернулся с новыми знаниями, исправил ошибку в коде и оно заработало! Поэтому надеюсь, этот проект теперь может заслуживать вашего внимания.

+31

LUS_85 22 часа назад

Интеграция 1С в личный кабинет и ERP-систему

6 мин

8.1K

Блог компании CDEK1С * ERP-системы *

Ретроспектива

Привет, Хабр! Меня зовут Александр Любин, я архитектор 1С в CDEK. В этой статье расскажу про наш опыт интеграции 1С в ERP‑систему и личный кабинет. Расскажу, с какими проблемами мы сталкивались, как их решали, какие инструменты использовали.

Мой опыт в разработке — 15 лет. Последние три с половиной года — в CDEK.За это время мы с командой смогли в корне изменить позиционирование 1C в компании от «что‑то там для бухгалтерии» до фундамента финансового, регламентированного и оперативного учёта. Смогли доказать, что 1C может быть средой быстрой разработки и инструментом, который позволяет обеспечить потребности как фронт, так и бэк контуров. Я расскажу, как у нас всё проходило.

+31

Viktoria_Arturovna 20 часов назад

Как функциональное программирование изменило фронтенд и почему отрасль возвращается к платформе

Средний

5 мин

11K

Блог компании Альфа-БанкJavaScript *

Мнение

Недавно я наткнулась на статью «How Functional Programming Shaped Modern Frontend» и неожиданно поймала себя на мысли: мы уже настолько привыкли к функциональному программированию (ФП) в JavaScript, что забыли, как всё начиналось и почему многие идеи казались почти спасением. Чтобы лучше понять эволюцию, я решила посмотреть, что писали разработчики о ФП во фронтенде 10 лет назад, примерно в 2013-2016 годах.

Контраст получился довольно яркий: от искреннего восторга до постепенного прозрения.

Я решила поделиться своим анализом, основанным на современных наблюдениях и на тех статьях прошлого, где ФП воспринималось как путь к «правильному» фронтенду.

+27

oldadmin 20 часов назад

Как установить почтовый сервер под Debian

Средний

6 мин

8.6K

Блог компании RUVDS.comСерверное администрирование * Open source * СофтEmail-маркетинг *

Обзор

Postal — это современный, безопасный и удобный почтовый сервис с акцентом на конфиденциальность, гибкость и интеграцию с другими инструментами. Исходники открыты, подходит для установки на VPS.

+24

kmoseenk 15 часов назад

Как сделать реверс-инжиниринг аналоговой микросхемы: FM-радиоприёмник TDA7000

Сложный

30 мин

5.4K

Блог компании OTUSРеверс-инжиниринг * Электроника для начинающихКомпьютерное железо

Ретроспектива

Перевод

Что на самом деле происходит под чёрной каплей компаунда, когда вы крутите ручку FM-приёмника? В статье автор берёт старую, но очень показательную микросхему Philips TDA7000, снимает с неё «маску анонимности» и по фотографии кристалла восстанавливает внутреннюю схемотехнику.

По пути разбираются реальные NPN и PNP транзисторы на кристалле, резисторы «змейкой», p–n-конденсаторы, токовые зеркала, диффпары, смесители на ячейке Гилберта, квадратурный детектор и генератор шума. Параллельно показываются приёмы реверс-инжиниринга: как сопоставлять даташит с топологией, как выделять функциональные блоки, что можно «прочитать» по форме и окружению транзистора и почему TDA7000 — удобный учебный объект для тех, кто хочет заглянуть на уровень кремния, а не только принципиальных схем.

Смотреть анализ

+21

PatientZero 21 час назад

Формат файлов, который не удаётся взломать уже 20 лет

Средний

30 мин

5.8K

Разработка игр * Реверс-инжиниринг * Отладка * Программирование *

Перевод

Splinter Cell (2002) была одной из первых игр, купленных мной для Xbox, и она по-прежнему остаётся одной из самых любимых моих игр. Эта игра была разработана Ubisoft на движке Unreal Engine 2, лицензированном у небольшой инди-студии Epic Games, которая и сегодня продолжает использовать и лицензировать этот движок в современных малобюджетных инди-играх наподобие Fortnite и Halo: Campaign Evolved.

Я начал заниматься программированием/хакингом благодаря видеоиграм, и до сих пор получаю удовольствие от дата-майнинга/исследования контента, вырезанного из тех немногих игр, в которые играю сегодня. Недавно я решил поискать онлайн вырезанный контент Splinter Cell, и был удивлён отсутствием раскопанной информации. За исключением прототипа игры для Xbox, в котором содержались два уровня, вырезанные из розничной версии для Xbox и некоторые другие мелкие отличия, информации об игре практически нет.

Естественно, я решил законным образом создать резервную копию своего личного диска с игрой и приступил к ковырянию в файлах.

Изначально я планировал изучить формат игровых данных и разведать любые признаки вырезанного контента: текстуры, модели, любопытные строки... Интересными находками стали бы отладочные меню, голосовые файлы, концепции оружия или уровни, недоступные при обычном прохождении игры.

+20

AnastasiiaSevostianova 21 час назад

Как системному аналитику перейти в дата-аналитику: советы из личного опыта

13 мин

5.6K

Блог компании VK TechБлог компании VKКарьера в IT-индустрииМашинное обучение * Big Data *

Рынок вакансий для системных аналитиков меняется. Растет спрос на работу с данными, облачные технологии и инструменты ETL/ELT. Бизнесу нужны специалисты, которые понимают архитектуру хранения данных, знают процессы их преобразования и принципы управления. Но требования в таких вакансиях часто пугают — со стороны это выглядит как другой мир, требующий совершенно новых знаний.

На своем примере перехода из финтеха в data-платформу VK Tech покажу, что все не так страшно. Расскажу, что в профессии системного аналитика остается неизменным, какие есть ключевые концепции и инструменты Data-направления и что на самом деле нужно знать для перехода.

+19

sazonovfm 21 час назад

OpenIDE Pro: ответ на запросы бизнеса и разработчиков одновременно

Простой

8 мин

5.6K

Блог компании Axiom JDKПрограммирование * Java * Текстовые редакторы и IDE * Open source *

Обзор

Привет! Я Фёдор, CEO OpenIDE. За год с момента анонса OpenIDE выросла в стабильную, привычную и активно используемую IDE, которую всё чаще выбирают разработчики и компании. Мы создали её быстрой, предсказуемой и полностью доступной — и теперь готовы к следующему шагу.

В этой статье — что мы сделали, зачем мы это делаем и куда дальше движется OpenIDE.

+17

NickM_IT 22 часа назад

Из мёртвой зоны — в зелёную: как мы запускали техподдержку для системы утилизации токсичных отходов

9 мин

4.4K

Блог компании ГринатомУправление персоналом * Алгоритмы * Управление проектами *

С 1 марта 2022 года тысячи российских компаний — от промышленных гигантов до сельских школ — в один день перешли на новую систему по обращению с отходами I и II классов опасности, которая стала частью управляемого процесса обращения с отходами в стране.

Простыми словами, это самые вредные отходы: отслужившие ртутные лампы, батарейки, аккумуляторы, промышленные химикаты. Для многих это стало шоком: привычные процессы рушились, вызывая панику и раздражение. Весь этот шквал эмоций и вопросов обрушился на нас — команду техподдержки.

Раньше оборот таких отходов был серой зоной: кто-то пытался соблюдать правила, а кто-то просто сливал их в овраг. Новая система была создана по заказу Минприроды и призвана сделать этот процесс прозрачным и контролируемым.

Создатель и владелец системы — ФГУП «ФЭО» (структура «Росатома»), он же стал единым федеральным оператором обращения с такими отходами. Его задача — управлять процессом. А мы должны были создать и запустить техподдержку.

Задачу мы выполнили.

Дальше расскажу, как мы создали эффективную поддержку, когда и команда, и пользователи не понимали, что делать и куда бежать.

+17

cognitronn 22 часа назад

ИИ: как триллионы долларов, спрятанные в офшорах, стали топливом для самого опасного пузыря в истории

Простой

5 мин

7.8K

Блог компании BotHubБудущее здесьИскусственный интеллектМашинное обучение * Научно-популярное

Мнение

Перевод

В искусственный интеллект влито столько денег, что мы, по сути, поставили на его успех всю экономику. И это огромная проблема. Не только потому, что ИИ - это технология с фундаментальным изъяном, которая никогда не станет прибыльной, никогда не оправдает спекуляций и создаёт долговую бомбу невиданных ранее масштабов. Нет, видите ли, даже если я ошибаюсь, а инвесторы в ИИ правы, мы все равно в проигрыше, поскольку ИИ отнимет огромное количество рабочих мест и обрушит экономику снизу вверх. Это идиотская, проигрышная со всех сторон ситуация.

Но так быть не должно было. Чёрт возьми, так никогда не должно было быть. Если бы компании взяли на себя часть ответственности, тикающей экономической бомбы под названием «пузырь ИИ» никогда бы не случилось, и вы жили бы экспоненциально лучше. Позвольте мне объяснить.

Почему существует пузырь ИИ? Не поверхностные спекуляции, а реальные структурные силы, стоящие за ним. Что ж, есть четыре простые, но весомые причины.

+16

Read-IT-Club 19 часов назад

Факапы Google, эволюционная архитектура и API без лишних сложностей: три проверенных книги об инженерном мышлении

7 мин

Блог компании КРОКЧитальный залИнженерные системы * Микросервисы *

Обзор

Привет! На связи Read IT Club — сообщество рецензентов и переводчиков ИТ-литературы. Мы делимся проверенными книгами, которые помогают не просто читать про ИТ, а по-настоящему понимать, как все устроено внутри. На этот раз — три издания о том, как проектировать надежные системы, создавать архитектуры, способные к изменениям, и выстраивать понятные API без избыточной сложности.

Эти книги объединяет одно — инженерное мышление. В них нет громких лозунгов и чудесных рецептов, зато есть проверенные практики, помогающие строить системы, которые работают стабильно, развиваются без паники и взаимодействуют без хаоса.

+15

Stanislav9801 16 часов назад

ИИ агент на n8n: создаём Telegram бота с доступом к своим данным без иностранной карты за 30 минут

Простой

10 мин

6.4K

Блог компании Data Feeling School | ИИ агенты и автоматизация на n8nИскусственный интеллектМашинное обучение * Программирование *

Туториал

В свободное время я часто "грешу" тем, что пилю очередной "стартап на коленке". Каждый раз когда мне приходила идея по типу "а не создать ли мне прикольного бота, который будет изменять прическу или одежду по фото, я шел по самому долгому пути - лез в код, и порой, это отнимало недели.

Как итог - разработка прототипа затягивались. Идеи опережали возможности, а мысль о том, что надо снова пилить фичу, тестировать ее, и паралельно еще править кучу багов (при этом без какой-либо гарантии, что продукт когда-либо принесет деньги), отбивало желание возвращаться к нему вовсе.

В этой статье я бы хотел поделиться с вами преимуществами no-code, которые я для себя открыл, а в качестве примера продемонстрировать, как можно легко и быстро, буквально за один вечер собрать телеграм бота с ИИ под капотом. Да еще и с возможностью подключения к собственным данным

Поехали! 🚀

+14

22 часа назад

Кому на заводе работать хорошо: результаты опроса хабравчан о карьере в Heavy Digital

10 мин

5.9K

Блог компании Цифровой СИБУРПромышленное программирование * Исследования и прогнозы в IT * Карьера в IT-индустрииIT-компании

Недавно команда Цифрового СИБУРа и ЭКОПСИ провела большое исследование. Мы сравнили портреты IT-специалистов из BigTech (таких как Яндекс или VK) с теми, кто работает на заводах и предприятиях. В результате получилось описание двух типов людей: одни ценят стабильность и реальные, осязаемые результаты на производстве, другие предпочитают скорость и свободу в IT.

Это исследование наглядно показало разницу между ценностями специалиста из Heavy Digital и BigTech, очень рекомендуем его почитать. Но в нём не хватало одного важного элемента — момента выбора. Почему человек, который всегда работал в классической IT-среде, вдруг серьёзно задумывается о переходе на завод? Что он при этом чувствует, чего боится и на что надеется?

Чтобы найти ответы на эти вопросы, мы провели собственный опрос, разделив респондентов на две группы:

1. Те, кто уже работает в IT на производстве (ветка опроса «Я эксперт в Heavy Digital»).

2. Те, кто пока не работает, но думает о карьере в IT-проме (ветка «Я пока не в Heavy Digital»).

Итоги опроса в целом подтверждают выводы ЭКОПСИ, а местами их отлично дополняют. Мы смогли заглянуть в тот самый переломный момент, когда человек стоит на распутье и размышляет: «А не попробовать ли мне свои силы в промышленном IT?»

+14

TantorLabs 14 часов назад

Ускорение планирования JOIN’ов — до 16 раз быстрее

Средний

4 мин

5.8K

Блог компании Тантор ЛабсPostgreSQL * SQL * Базы данных *

Обзор

Перевод

Привет, Хабр! Делимся переводом статьи о патче, сделанном разработчиком «Тантор Лабс» для 19 версии PostgreSQL — по сути, частичкой вклада нашей компании. Благодаря коммиту Ильи Евдокимова, в PostgreSQL 19 планирование JOIN’ов станет до 16 раз быстрее. Если раньше алгоритм сравнения частых значений (MCV) работал за O(N²), и при target=10k само планирование запроса могло занимать десятки миллисекунд, то теперь вместо квадратичного перебора будет использоваться хеш-таблица, а это снижает сложность до O(N). Изменение особенно оценят те, кто работает с неравномерными данными и поднимает default_statistics_target выше 1000.

Подробный разбор с тестами и графиками — в переводе статьи о нашем патче.

+12

Wonderlove 15 часов назад

Нейро-дайджест: ключевые события мира AI за 2-ю неделю декабря 2025

Простой

7 мин

4.9K

Блог компании Timeweb CloudИскусственный интеллектБудущее здесьМашинное обучение * IT-компании

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной: Mistral выкатили Devstral 2, Photoshop, Express и Acrobat встроили прямо в ChatGPT, а исследования показывают, что более 80% вайб-кода могут содержать уязвимости. Криштиану Роналду инвестирует в Perplexity, а Сэм Альтман считает, что сейчас невозможно воспитывать детей без ИИ.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

+11

cuprumtan 21 час назад

Как мы научились строить деревья блокировок PostgreSQL в фоне и без влияния на производительность

Средний

29 мин

5.6K

Блог компании СберPostgreSQL * Базы данных * Программирование *

Кейс

Блокировки в СУБД — основа механизма параллельного доступа к данным, но также и частый симптом проблем в архитектуре или ошибок в логике работы с БД. Когда из-за них запросы зависают, нам требуется разбираться, кто кого и когда заблокировал, то есть поднимать и смотреть историю возникновения блокировок.

Чтобы понять цепочку блокировок, обычно строят их дерево рекурсивными запросами. Но частое выполнение таких запросов может существенно замедлить работу СУБД. В худшем случае можно усугубить проблему, которую мы пытаемся диагностировать.

Меня зовут Александра Кузнецова, я бэкенд-разработчик в СберТехе, в команде Platform V Kintsugi — это графический инструмент для сопровождения, разработки и диагностики СУБД на основе PostgreSQL. Расскажу о том, как мы с коллегами интегрировали сбор данных о блокировках в наш мониторинг сессий. Решение работает в фоне и не нагружает БД. И дерево блокировок можно построить для любого момента в прошлом, даже через несколько дней после инцидента. Начнём.

+11

srzybnev 22 часа назад

OWASP Top 10 for Agentic Applications for 2026: Разбор главных угроз завтрашнего дня

Средний

12 мин

3.6K

Блог компании OWASPИнформационная безопасность * Искусственный интеллект

Обзор

Привет, Хабр! С вами снова Сергей Зыбнев, автор теле... а об этом позже. После нашего глубокого погружения в OWASP AI Testing Guide, пришло время заглянуть в будущее, которое наступит менее чем через месяц. Сегодня мы разберем еще один важнейший документ от OWASP, который смотрит на шаг вперед — OWASP Top 10 for Agentic Applications for 2026.

Если LLM — это мозг, то агентные системы — это полноценный организм с руками и ногами. Это ИИ, которые не просто отвечают на вопросы, а могут самостоятельно ставить цели, планировать и выполнять многошаговые задачи, используя различные инструменты (API, shell, браузер). Они могут управлять вашим календарем, писать код, заказывать товары и многое другое. И, конечно, такая автономия порождает совершенно новый класс угроз.

Этот Top 10 — попытка осмыслить и классифицировать риски, которые несут в себе эти мощные системы. Мы пройдемся по каждому из 10 пунктов, разберем их на реальных примерах и поговорим о том, как от них защищаться.

+10

xtraroman 17 часов назад

Эффективное применение NuGet

Средний

5 мин

Блог компании ЭРЕМЕКС.NET *

Туториал

В этой статье мы рассмотрим централизованное управление версиями пакетов, а также разберем настройку приватного NuGet-сервера BaGet для эффективной работы в изолированных средах. Мы уверены, что статья будет полезна многим российским разработчикам, поскольку NET разработка в изолированных средах в нашей стране действительно широко распространена.

SergeyStrukov 19 часов назад

Как упростить сборку на С++: мой open source-проект LightForge

Простой

12 мин

4.7K

Блог компании YADROC++ * Системы сборки * Open source *

Обзор

Когда много лет пишешь на C++ и регулярно работаешь с множеством небольших проектов, рано или поздно устаешь от рутины. Каждый раз — новый make-файл, новые зависимости и ошибки в длинных строках компилятора. В какой-то момент я поймал себя на мысли: «А почему бы не сделать сборку проще?».

2 3

Разработка

Техрепорт Alice AI: как мы создавали новое поколение моделей для самого популярного ИИ-ассистента в России

Новости

Разработка USB-клавиатуры без поиска легкого пути

Интеграция 1С в личный кабинет и ERP-систему

Как функциональное программирование изменило фронтенд и почему отрасль возвращается к платформе

Как установить почтовый сервер под Debian

Как сделать реверс-инжиниринг аналоговой микросхемы: FM-радиоприёмник TDA7000

Формат файлов, который не удаётся взломать уже 20 лет

Как системному аналитику перейти в дата-аналитику: советы из личного опыта

OpenIDE Pro: ответ на запросы бизнеса и разработчиков одновременно

Из мёртвой зоны — в зелёную: как мы запускали техподдержку для системы утилизации токсичных отходов

ИИ: как триллионы долларов, спрятанные в офшорах, стали топливом для самого опасного пузыря в истории

Факапы Google, эволюционная архитектура и API без лишних сложностей: три проверенных книги об инженерном мышлении

ИИ агент на n8n: создаём Telegram бота с доступом к своим данным без иностранной карты за 30 минут

Ближайшие события

Кому на заводе работать хорошо: результаты опроса хабравчан о карьере в Heavy Digital

Ускорение планирования JOIN’ов — до 16 раз быстрее

Нейро-дайджест: ключевые события мира AI за 2-ю неделю декабря 2025

Как мы научились строить деревья блокировок PostgreSQL в фоне и без влияния на производительность

OWASP Top 10 for Agentic Applications for 2026: Разбор главных угроз завтрашнего дня

Эффективное применение NuGet

Как упростить сборку на С++: мой open source-проект LightForge

Хабы

Вклад авторов