Обновить

Разработка

Сначала показывать
Период
Уровень сложности

Техрепорт Alice AI: как мы создавали новое поколение моделей для самого популярного ИИ-ассистента в России

Время на прочтение46 мин
Охват и читатели9.2K

Сегодня мы делимся техрепортом, в котором разобран полный цикл создания нового семейства моделей Alice AI: базовая текстовая Alice AI LLM и специализированная LLM Search, мультимодальная Alice AI VLM и картиночная Alice AI ART. 

В части про Alice AI LLM расскажем, как сделали упор в Alignment на RL и Reward Modeling: мы минимизируем число разрозненных RL-стадий, собирая «общий RL». Вместо хрупкого «суперсигнала» используем аспектную формулировку качества и агрегируем её в целевую функцию, чтобы изменения критериев не требовали пересборки всей разметки. В главе про Alice AI LLM Search расскажем про многократные последовательные походы в Поиск с последующей фильтрацией/ранжированием источников. А также о том, как готовим ответы с использованием документов разной модальности (веб-документы, картинки, видео, гео).

Чтобы «вывезти» MoE-модель на сотни миллиардов параметров, мы целенаправленно сняли инфраструктурные ограничения обучения и инференса: в обучении используется YaFSDP (которую мы выложили в опенсорс) и собственная библиотека коллективных коммуникаций YCCL. В прод-инференсе мы работаем под SLA (avg TPOT ≤ 70 ms, p95 TTFT ≤ 2 s) и достигаем их комбинацией TP Attention/EP FFN, KV cache reuse, FP8 w8a8kv8 (в т. ч. сжатие KV cache ~3,05→~1,52 GB) и спекулятивного декодинга EAGLE‑3, что в сумме даёт 5.8× ускорение относительно BF16 (и 1,32× относительно лучшего open-source). Параллельно для Alice AI VLM нарастили в 1,5 раза объем претрейна, контекст до 32k и обновили OCR-датасет; VLM-генератор работает «из коробки», а для математики/геометрии выделен специализированный VLM‑решатель. В пайплайне Alice AI ART повышение релевантности к промпту начинается с диагностики смещений в датасете с помощью VLM и последующей адресной коррекции обнаруженных проблем.

Недавно все эти модели и решения легли в основу нашего нового ИИ-ассистента, и уже к ноябрю, согласно исследованию Mediascope, Алиса AI вышла на первое место по используемости среди россиян (14,3%), обойдя ранее доминировавший DeepSeek (9,4%). Кроме того, модель Alice AI LLM теперь доступна и для разработки собственных AI-решений на платформе Yandex AI Studio.

Читать техрепорт

Новости

Разработка USB-клавиатуры без поиска легкого пути

Уровень сложностиСредний
Время на прочтение17 мин
Охват и читатели7.9K

Помимо полноценных клавиатур, есть клавиатуры с несколькими кнопками, клавиши которых можно запрограммировать. Их называют еще макропадами. Макропад не сложно купить, хоть часто он стоит дороже обычной клавиатуры, но можно и сделать. Статей как его смастерить много, самый простой способ — использовать каждый вывод микроконтроллера, пока они не закончатся. Но у меня не было никакого желания делать все как у всех. Хотелось чего-то по-настоящему DIY.

Поэтому в статье пойдет подробный рассказ о разработке USB-клавиатуры на микроконтроллере CH32V003, в котором по умолчанию нет поддержки USB. Но чтобы проект был более интересным, клавиатура состоит из 9 кнопок, 3-х энкодеров и 2-х светодиодов. При этом корпус и кейкапы тоже сделаны самостоятельно (почти).

Но стоит еще добавить, что эта статья могла бы и не появится на свет, потому что когда сделал клавиатуру, то она работала с ошибками. Какое-то время я пытался их поправить, но сдался и забросил проект на месяц. Но вернулся с новыми знаниями, исправил ошибку в коде и оно заработало! Поэтому надеюсь, этот проект теперь может заслуживать вашего внимания.

Читать далее

Интеграция 1С в личный кабинет и ERP-систему

Время на прочтение6 мин
Охват и читатели8.1K

Привет, Хабр! Меня зовут Александр Любин, я архитектор 1С в CDEK. В этой статье расскажу про наш опыт интеграции 1С в ERP‑систему и личный кабинет. Расскажу, с какими проблемами мы сталкивались, как их решали, какие инструменты использовали. 

Мой опыт в разработке — 15 лет. Последние три с половиной года — в CDEK.За это время мы с командой смогли в корне изменить позиционирование 1C в компании от «что‑то там для бухгалтерии» до фундамента финансового, регламентированного и оперативного учёта. Смогли доказать, что 1C может быть средой быстрой разработки и инструментом, который позволяет обеспечить потребности как фронт, так и бэк контуров. Я расскажу, как у нас всё проходило.

Читать далее

Как функциональное программирование изменило фронтенд и почему отрасль возвращается к платформе

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели11K

Недавно я наткнулась на статью «How Functional Programming Shaped Modern Frontend» и неожиданно поймала себя на мысли: мы уже настолько привыкли к функциональному программированию (ФП) в JavaScript, что забыли, как всё начиналось и почему многие идеи казались почти спасением. Чтобы лучше понять эволюцию, я решила посмотреть, что писали разработчики о ФП во фронтенде 10 лет назад, примерно в 2013-2016 годах.

Контраст получился довольно яркий: от искреннего восторга до постепенного прозрения.

Я решила поделиться своим анализом, основанным на современных наблюдениях и на тех статьях прошлого, где ФП воспринималось как путь к «правильному» фронтенду.

Читать далее

Как установить почтовый сервер под Debian

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели8.6K

Postal — это современный, безопасный и удобный почтовый сервис с акцентом на конфиденциальность, гибкость и интеграцию с другими инструментами. Исходники открыты, подходит для установки на VPS.

Читать далее

Как сделать реверс-инжиниринг аналоговой микросхемы: FM-радиоприёмник TDA7000

Уровень сложностиСложный
Время на прочтение30 мин
Охват и читатели5.4K

Что на самом деле происходит под чёрной каплей компаунда, когда вы крутите ручку FM-приёмника? В статье автор берёт старую, но очень показательную микросхему Philips TDA7000, снимает с неё «маску анонимности» и по фотографии кристалла восстанавливает внутреннюю схемотехнику.

По пути разбираются реальные NPN и PNP транзисторы на кристалле, резисторы «змейкой», p–n-конденсаторы, токовые зеркала, диффпары, смесители на ячейке Гилберта, квадратурный детектор и генератор шума. Параллельно показываются приёмы реверс-инжиниринга: как сопоставлять даташит с топологией, как выделять функциональные блоки, что можно «прочитать» по форме и окружению транзистора и почему TDA7000 — удобный учебный объект для тех, кто хочет заглянуть на уровень кремния, а не только принципиальных схем.

Смотреть анализ

Формат файлов, который не удаётся взломать уже 20 лет

Уровень сложностиСредний
Время на прочтение30 мин
Охват и читатели5.8K

Splinter Cell (2002) была одной из первых игр, купленных мной для Xbox, и она по-прежнему остаётся одной из самых любимых моих игр. Эта игра была разработана Ubisoft на движке Unreal Engine 2, лицензированном у небольшой инди-студии Epic Games, которая и сегодня продолжает использовать и лицензировать этот движок в современных малобюджетных инди-играх наподобие Fortnite и Halo: Campaign Evolved.

Я начал заниматься программированием/хакингом благодаря видеоиграм, и до сих пор получаю удовольствие от дата-майнинга/исследования контента, вырезанного из тех немногих игр, в которые играю сегодня. Недавно я решил поискать онлайн вырезанный контент Splinter Cell, и был удивлён отсутствием раскопанной информации. За исключением прототипа игры для Xbox, в котором содержались два уровня, вырезанные из розничной версии для Xbox и некоторые другие мелкие отличия, информации об игре практически нет.

Естественно, я решил законным образом создать резервную копию своего личного диска с игрой и приступил к ковырянию в файлах.

Изначально я планировал изучить формат игровых данных и разведать любые признаки вырезанного контента: текстуры, модели, любопытные строки... Интересными находками стали бы отладочные меню, голосовые файлы, концепции оружия или уровни, недоступные при обычном прохождении игры.

Читать далее

Как системному аналитику перейти в дата-аналитику: советы из личного опыта

Время на прочтение13 мин
Охват и читатели5.6K

Рынок вакансий для системных аналитиков меняется. Растет спрос на работу с данными, облачные технологии и инструменты ETL/ELT. Бизнесу нужны специалисты, которые понимают архитектуру хранения данных, знают процессы их преобразования и принципы управления. Но требования в таких вакансиях часто пугают — со стороны это выглядит как другой мир, требующий совершенно новых знаний.

На своем примере перехода из финтеха в data-платформу VK Tech покажу, что все не так страшно. Расскажу, что в профессии системного аналитика остается неизменным, какие есть ключевые концепции и инструменты Data-направления и что на самом деле нужно знать для перехода.

Читать далее

OpenIDE Pro: ответ на запросы бизнеса и разработчиков одновременно

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели5.6K

Привет! Я Фёдор, CEO OpenIDE. За год с момента анонса OpenIDE выросла в стабильную, привычную и активно используемую IDE, которую всё чаще выбирают разработчики и компании. Мы создали её быстрой, предсказуемой и полностью доступной — и теперь готовы к следующему шагу.

В этой статье — что мы сделали, зачем мы это делаем и куда дальше движется OpenIDE.

Читать далее

Из мёртвой зоны — в зелёную: как мы запускали техподдержку для системы утилизации токсичных отходов

Время на прочтение9 мин
Охват и читатели4.4K

С 1 марта 2022 года тысячи российских компаний — от промышленных гигантов до сельских школ — в один день перешли на новую систему по обращению с отходами I и II классов опасности, которая стала частью управляемого процесса обращения с отходами в стране.

Простыми словами, это самые вредные отходы: отслужившие ртутные лампы, батарейки, аккумуляторы, промышленные химикаты. Для многих это стало шоком: привычные процессы рушились, вызывая панику и раздражение. Весь этот шквал эмоций и вопросов обрушился на нас — команду техподдержки.

Раньше оборот таких отходов был серой зоной: кто-то пытался соблюдать правила, а кто-то просто сливал их в овраг. Новая система была создана по заказу Минприроды и призвана сделать этот процесс прозрачным и контролируемым.

Создатель и владелец системы — ФГУП «ФЭО» (структура «Росатома»), он же стал единым федеральным оператором обращения с такими отходами. Его задача — управлять процессом. А мы должны были создать и запустить техподдержку.

Задачу мы выполнили.

Дальше расскажу, как мы создали эффективную поддержку, когда и команда, и пользователи не понимали, что делать и куда бежать.

Читать далее

ИИ: как триллионы долларов, спрятанные в офшорах, стали топливом для самого опасного пузыря в истории

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели7.8K

В искусственный интеллект влито столько денег, что мы, по сути, поставили на его успех всю экономику. И это огромная проблема. Не только потому, что ИИ - это технология с фундаментальным изъяном, которая никогда не станет прибыльной, никогда не оправдает спекуляций и создаёт долговую бомбу невиданных ранее масштабов. Нет, видите ли, даже если я ошибаюсь, а инвесторы в ИИ правы, мы все равно в проигрыше, поскольку ИИ отнимет огромное количество рабочих мест и обрушит экономику снизу вверх. Это идиотская, проигрышная со всех сторон ситуация.

Но так быть не должно было. Чёрт возьми, так никогда не должно было быть. Если бы компании взяли на себя часть ответственности, тикающей экономической бомбы под названием «пузырь ИИ» никогда бы не случилось, и вы жили бы экспоненциально лучше. Позвольте мне объяснить.

Почему существует пузырь ИИ? Не поверхностные спекуляции, а реальные структурные силы, стоящие за ним. Что ж, есть четыре простые, но весомые причины.

Читать далее

Факапы Google, эволюционная архитектура и API без лишних сложностей: три проверенных книги об инженерном мышлении

Время на прочтение7 мин
Охват и читатели5K

Привет! На связи Read IT Club — сообщество рецензентов и переводчиков ИТ-литературы. Мы делимся проверенными книгами, которые помогают не просто читать про ИТ, а по-настоящему понимать, как все устроено внутри. На этот раз — три издания о том, как проектировать надежные системы, создавать архитектуры, способные к изменениям, и выстраивать понятные API без избыточной сложности.

Эти книги объединяет одно — инженерное мышление. В них нет громких лозунгов и чудесных рецептов, зато есть проверенные практики, помогающие строить системы, которые работают стабильно, развиваются без паники и взаимодействуют без хаоса.

Читать далее

ИИ агент на n8n: создаём Telegram бота с доступом к своим данным без иностранной карты за 30 минут

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели6.4K

В свободное время я часто "грешу" тем, что пилю очередной "стартап на коленке". Каждый раз когда мне приходила идея по типу "а не создать ли мне прикольного бота, который будет изменять прическу или одежду по фото, я шел по самому долгому пути - лез в код, и порой, это отнимало недели.

Как итог - разработка прототипа затягивались. Идеи опережали возможности, а мысль о том, что надо снова пилить фичу, тестировать ее, и паралельно еще править кучу багов (при этом без какой-либо гарантии, что продукт когда-либо принесет деньги), отбивало желание возвращаться к нему вовсе.

В этой статье я бы хотел поделиться с вами преимуществами no-code, которые я для себя открыл, а в качестве примера продемонстрировать, как можно легко и быстро, буквально за один вечер собрать телеграм бота с ИИ под капотом. Да еще и с возможностью подключения к собственным данным

Поехали! 🚀

Ближайшие события

Кому на заводе работать хорошо: результаты опроса хабравчан о карьере в Heavy Digital

Время на прочтение10 мин
Охват и читатели5.9K

Недавно команда Цифрового СИБУРа и ЭКОПСИ провела большое исследование. Мы сравнили портреты IT-специалистов из BigTech (таких как Яндекс или VK) с теми, кто работает на заводах и предприятиях. В результате получилось описание двух типов людей: одни ценят стабильность и реальные, осязаемые результаты на производстве, другие предпочитают скорость и свободу в IT. 

Это исследование наглядно показало разницу между ценностями специалиста из Heavy Digital и BigTech, очень рекомендуем его почитать. Но в нём не хватало одного важного элемента — момента выбора. Почему человек, который всегда работал в классической IT-среде, вдруг серьёзно задумывается о переходе на завод? Что он при этом чувствует, чего боится и на что надеется?

Чтобы найти ответы на эти вопросы, мы провели собственный опрос, разделив респондентов на две группы:

1. Те, кто уже работает в IT на производстве (ветка опроса «Я эксперт в Heavy Digital»).

2. Те, кто пока не работает, но думает о карьере в IT-проме (ветка «Я пока не в Heavy Digital»).

Итоги опроса в целом подтверждают выводы ЭКОПСИ, а местами их отлично дополняют. Мы смогли заглянуть в тот самый переломный момент, когда человек стоит на распутье и размышляет: «А не попробовать ли мне свои силы в промышленном IT?»

Читать далее

Ускорение планирования JOIN’ов — до 16 раз быстрее

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели5.8K

Привет, Хабр! Делимся переводом статьи о патче, сделанном разработчиком «Тантор Лабс» для 19 версии PostgreSQL — по сути, частичкой вклада нашей компании. Благодаря коммиту Ильи Евдокимова, в PostgreSQL 19 планирование JOIN’ов станет до 16 раз быстрее. Если раньше алгоритм сравнения частых значений (MCV) работал за O(N²), и при target=10k само планирование запроса могло занимать десятки миллисекунд, то теперь вместо квадратичного перебора будет использоваться хеш-таблица, а это снижает сложность до O(N). Изменение особенно оценят те, кто работает с неравномерными данными и поднимает default_statistics_target выше 1000.

Подробный разбор с тестами и графиками — в переводе статьи о нашем патче.

Читать далее

Нейро-дайджест: ключевые события мира AI за 2-ю неделю декабря 2025

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели4.9K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной: Mistral выкатили Devstral 2, Photoshop, Express и Acrobat встроили прямо в ChatGPT, а исследования показывают, что более 80% вайб-кода могут содержать уязвимости. Криштиану Роналду инвестирует в Perplexity, а Сэм Альтман считает, что сейчас невозможно воспитывать детей без ИИ.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

Как мы научились строить деревья блокировок PostgreSQL в фоне и без влияния на производительность

Уровень сложностиСредний
Время на прочтение29 мин
Охват и читатели5.6K

Блокировки в СУБД — основа механизма параллельного доступа к данным, но также и частый симптом проблем в архитектуре или ошибок в логике работы с БД. Когда из-за них запросы зависают, нам требуется разбираться, кто кого и когда заблокировал, то есть поднимать и смотреть историю возникновения блокировок.

Чтобы понять цепочку блокировок, обычно строят их дерево рекурсивными запросами. Но частое выполнение таких запросов может существенно замедлить работу СУБД. В худшем случае можно усугубить проблему, которую мы пытаемся диагностировать.

Меня зовут Александра Кузнецова, я бэкенд-разработчик в СберТехе, в команде Platform V Kintsugi — это графический инструмент для сопровождения, разработки и диагностики СУБД на основе PostgreSQL. Расскажу о том, как мы с коллегами интегрировали сбор данных о блокировках в наш мониторинг сессий. Решение работает в фоне и не нагружает БД. И дерево блокировок можно построить для любого момента в прошлом, даже через несколько дней после инцидента. Начнём.

Читать далее

OWASP Top 10 for Agentic Applications for 2026: Разбор главных угроз завтрашнего дня

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели3.6K

Привет, Хабр! С вами снова Сергей Зыбнев, автор теле... а об этом позже. После нашего глубокого погружения в OWASP AI Testing Guide, пришло время заглянуть в будущее, которое наступит менее чем через месяц. Сегодня мы разберем еще один важнейший документ от OWASP, который смотрит на шаг вперед — OWASP Top 10 for Agentic Applications for 2026.

Если LLM — это мозг, то агентные системы — это полноценный организм с руками и ногами. Это ИИ, которые не просто отвечают на вопросы, а могут самостоятельно ставить цели, планировать и выполнять многошаговые задачи, используя различные инструменты (API, shell, браузер). Они могут управлять вашим календарем, писать код, заказывать товары и многое другое. И, конечно, такая автономия порождает совершенно новый класс угроз.

Этот Top 10 — попытка осмыслить и классифицировать риски, которые несут в себе эти мощные системы. Мы пройдемся по каждому из 10 пунктов, разберем их на реальных примерах и поговорим о том, как от них защищаться.

Читать далее

Эффективное применение NuGet

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели5K

В этой статье мы рассмотрим централизованное управление версиями пакетов, а также разберем настройку приватного NuGet-сервера BaGet для эффективной работы в изолированных средах. Мы уверены, что статья будет полезна многим российским разработчикам, поскольку NET разработка в изолированных средах в нашей стране действительно широко распространена.

Читать далее

Как упростить сборку на С++: мой open source-проект LightForge

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели4.7K

Когда много лет пишешь на C++ и регулярно работаешь с множеством небольших проектов, рано или поздно устаешь от рутины. Каждый раз — новый make-файл, новые зависимости и ошибки в длинных строках компилятора. В какой-то момент я поймал себя на мысли: «А почему бы не сделать сборку проще?». 

Читать далее