Обновить

Все потоки

Сначала показывать
Порог рейтинга
Уровень сложности

Вам продают ИИ. Покупать нужно не его

Уровень сложностиПростой
Время на прочтение15 мин
Охват и читатели15K

Звонил мне на днях один знакомый CIO. Питерский, ритейл, средний бизнес, ничего особенного. Слушай, говорит, надо нам с ИИ что-то делать: все вокруг внедряют, конкуренты вон что-то запустили, на отраслевом Data Summit уши прожужжали, а у меня даже плана нет. И денег, кстати, особо на это не выделили, но не суть.

Это был, кажется, пятый такой звонок за месяц.

И знаете, что меня в них всех поражает? Спрашивают они одно и то же, и спрашивают неправильно. Не «нужен ли нам ИИ», а «куда бежать, чтобы не опоздать», - разница на самом деле огромная, потому что первый вопрос предполагает разбор задачи, а второй уже подразумевает, что бежать в любом случае надо, осталось только направление выбрать.

Так вот, если коротко - не надо бежать.

Сам я не специалист по нейросетям. Много лет вожусь с базами данных в банках, в ритейле, в системной интеграции, и работа моя: смотреть, как данные живут в настоящих, не презентационных компаниях, и решать, что из задуманного взлетит, а что разобьётся об реальность. Через этот фильтр я и предлагаю взглянуть на нынешний шум вокруг локальных LLM, RAG и «корпоративных помощников».

Читать далее

Матрица компетенций тимлида: как снизить Bus Factor на проекте

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели9.5K

Представьте: у вас упал прод, и никто не знает, как поднять. Проблема в коде, который писал один человек. А он – недоступен. Или вообще уволился. И вот за вашим плечом вырастает фигура начальника. Затем – начальника начальника. Вы выдергиваете на созвон всех: разрабов, девопсов, тестеров и устраиваете мозговой штурм . Кто-то смотрит код, кто-то логи. А решения все нет. Брр….

Меня зовут Иван, я тимлид. Мне важно, чтобы на проекте не было таких «факапов». Я работаю над устойчивостью команды к рискам. 

Потеря знаний – серьезный риск. Печально, если никто не знает, как работает фича или как устранить инцидент. Для снижения риска я использую матрицу компетенций конкретного проекта. В матрице нет места сферическим знаниям типа «Асинхронности», «SQL», «Паттернов». Только конкретика: «Делал релиз», «Разработал отчеты».

Меня этот инструмент как-то раз серьезно спас, когда ротировалась половина команды. Bus Factor ≥ 2 позволил не потерять критичные знания на проекте. И хотя мой опыт несёт флёр Капитана Очевидности, я рискну им поделиться. Потому что хочу помочь командам, у которых до сих пор Bus Factor = 1.

Читать далее

Production начинается там, где заканчивается вайбкодинг

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели17K

Сначала всё выглядело как типичная AI-история успеха.

За пару вечеров LLM помогла превратить Google Sheets для учёта финансов в настоящее приложение. Потом появился backend, sync между устройствами, mobile-first UX, AI-рекомендации, rollback, conflict resolution, миграции, Docker images, golden tests и React-компонент на 10 537 строк.

Оказалось, что AI действительно радикально ускоряет старт разработки. Но production начинается сильно позже демки.

Читать далее

От фич и каскадов к генеративной модели: как мы переосмыслили рекомендации с помощью ARGUS

Время на прочтение14 мин
Охват и читатели14K

Классические рекомендательные системы в крупных компаниях — это десятки микросервисов, каскадная фильтрация и тысячи ручных признаков. Такой стек может надёжно работать годами, но неизбежно упирается в фундаментальную проблему: он перестаёт масштабироваться. Качество выходит на плато — всё меньше отдачи от новых фич, усложнения моделей и наращивания данных.

Генеративная постановка, когда модель восстанавливает целые последовательности пользовательских действий, обещает принести в рекомендации законы масштабирования, снизить операционную сложность и открыть путь к единой кросс‑сервисной модели. Но между обещанием и продакшеном — огромная дистанция. Нужно понять, какая токенизация работает, как устроить претрейн, что делать с контекстом, негативами и задержками в реальных распределённых системах.

Последний год мы адаптировали нашу генеративную модель персонализации ARGUS под разные домены внутри Яндекса, меняли архитектуру, пересобирали обучение и пробовали новые способы интеграции в продакшене. В этой статье я расскажу, какие решения сработали, какие — нет и что нам дала генеративная постановка в реальных рекомендательных системах.

Читать далее

Отвечай, как топовый специалист: как службе поддержки решать настоящие, а не озвученные проблемы клиентов

Время на прочтение7 мин
Охват и читатели12K

За типичной заявкой «не работает, посмотрите» может скрываться необходимость пересмотра архитектуры системы. В то же время, «добавьте мне новый процесс» нередко решается простой настройкой фильтров или прав доступа.

Где здесь проходит грань, за которую лучше не заходить без допаналитики? Почему ИИ-помощь в одних задачах повышает риск провала, а в других становится настоящим спасением? Покажем, как распаковывать запросы в поддержку, чтобы добраться до сути проблемы и не потратить лишние ресурсы — свои и клиента.

Читать далее

Новые IT-специалисты эпохи AI: как зарубежные и российские компании относятся к vibe-coders, low-coders и zerocoders

Время на прочтение6 мин
Охват и читатели16K

Мир меняется стремительно. ИИ занимает все более заметную роль. Все мировые гиганты, от Google до Microsoft, инвестируют миллиарды в развитие собственных AI-инструментов. Многие работодатели открыто признают силу ИИ и ищут сотрудников, которые уверенно им владеют.

Однако на российском IT-рынке складывается парадоксальная ситуация. С одной стороны, компании все чаще требуют от специалистов навыки работы с ИИ-инструментами, особенно это актуально для разработчиков и тестировщиков. С другой, стоит произнести ChatGPT на интервью, как в воздухе повисает напряженная тишина...

К кандидатам, которые открыто заявляют, что профессионально используют нейросети для решения задач (а понимание границ моделей и умение качественно создавать промты — важные умения в наше время), часто относятся с предвзятостью. Примерно так же, как если бы в дипломной работе в списке источников указать «Википедию». Пользоваться ИИ можно, но лучше не афишировать и уж точно не называть это «настоящим» навыком.

В этой статье мы коснемся таких альтернатив классической разработке как zero-code (no-code), low-code и vibe coding. А также сравним, как к AI-инструментам, no-code/low-code-платформам относятся на зарубежных job-площадках и в российских компаниях.

Читать далее

Разрабатывали решение для автоматизации, а получили универсальный продукт «Мультиплексор для Лабораторных измерений»

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели12K

Добрый день, коллеги!

Разрабатывали очередной аутсорсный заказ и в процессе разработки поняли с командой, что это может быть довольно интересным универсальным продуктом. В статье (без подробностей) расскажу, что изначально делали и что получили в итоге.

Совместно с заказчиком продумывали идею автоматизации производства. Они занимаются разработкой и изготовлением отечественных электронных компонентов, но процесс измерения основных параметров делался оператором вручную, с использованием 2-ух отдельных средств измерений, поочередно и по одному фильтру за раз.

Мы предложили автоматизировать этот процесс, разработать систему измерения, к которой можно будет подключить оба измерителя, до 10 тестовых образцов с механическим креплением на контактирующих устройствах, персональный компьютер с программным обеспечением, которое будет управлять всей системой, автоматически генерировать протокол измерений, собирать статистику и максимально упростит задачу оператора.

Разрабатывая решение под конкретную задачу конкретного заказчика, мы получили довольно универсальный мультиплексор, который могут использовать любые лаборатории для автоматизации своих измерительных процессов.

Читать далее

Подготовка и сдача экзамена PMP в мае 2026 года

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели7.9K

Это статья - еще один рассказ о подготовке и сдаче экзамена PMP. Материалов в этом жанре в интернете (и на Хабре в том числе) достаточно, но вдруг мой опыт подготовки вам окажется полезным.
Учитывая, что с приходом PMBoK 8 экзамен меняется и с июля вопросы существенно обновятся, вероятно, будут полезны скорее принципы и подходы.

Читать далее

Время закрывать доски. Ваш SaaS таск-трекер — это просто слой лака над базой данных

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели10K

Как ИИ-агенты, «вайб-кодинг» и $285 миллиардов испаряющейся капитализации ставят крест на Monday, Asana, Trello и всех, кто продаёт красивые доски за 10 долларов в месяц

Я помню 2018 год. Мы подключились к Asana всей командой. Это было красиво: разноцветные колонки, порхающие между ними карточки, анимация единорога, пролетающего через экран, когда ты закрываешь задачу. Серьёзно, у них там был единорог. Мы чувствовали себя продуктивными. Мы были продуктивны ровно до того момента, пока не поняли, что половина команды продолжает обсуждать задачи в Телеграме, треть ведёт свой личный Trello, а PM тихо матерится и всё равно собирает статус в Excel по пятницам.

Сейчас мне даже немного стыдно за тот восторг. Потому что весь этот рынок, разноцветные досочки, канбан-борды и автоматизации «если задача просрочена, дёрни ответственного», катится в тартарары. И его убьёт не конкурент с более красивым интерфейсом. Его убьёт команда из трёх человек, которая за выходные соберёт себе инструмент под свои процессы с помощью Claude Code, даже не открыв браузер с Monday.com.

Цифры, от которых у вашего инвестора дёргается глаз

Начнём с главного. 2 февраля 2026 года Anthropic выпустила, казалось бы, рутинное обновление Claude Cowork (плагин для автоматизации юридических задач). Через 24 часа с технологических акций было стёрто $285 миллиардов рыночной стоимости. Именно стёрто, не «скорректировалось», не «немного просело». SaaS-акции пережили худший квартал со времён финансового кризиса 2008 года. Термин «SaaSpocalypse» перестал быть шуткой криптоскептиков и вошёл в словарь CFO из Fortune 500.

Читать далее

Как мы проектировали multi-agent feedback для обучения рисованию

Время на прочтение8 мин
Охват и читатели7.7K

Написал инженерный разбор про multi-agent feedback для обучения рисованию.

Что происходит, когда рисунок оценивает не один AI-критик, а «совет»: три LLM-персоны на разных моделях + четвёртый вызов-судья, который собирает их отзывы в общий вердикт.

Без хайпа: технические параметры, компромиссы и грабли из реальной реализации.

— почему это 4 логических вызова, а в two-stage режиме физически до 7; — как судья работает text-only и НЕ видит рисунок: он проверяет согласованность трёх разборов, а не пересматривает изображение; — честная latency: wall-clock = max(самая медленная персона с retry) + судья, а не сумма трёх персон; — почему council получается в 3–4 раза дороже single-critic; — где «больше моделей» оказалось хуже: слабый судья ронял качество, пришлось вводить quality gate и математический fallback; — где обычный single-critic объективно выигрывает: быстрая итерация, latency, стоимость.

Если строите multi-agent / ensemble / judge-паттерны, внутри есть конкретные грабли: галлюцинации персон, эхо плейсхолдера из промпта в ответ судьи, consensus-фильтр поверх финального вердикта.

Читать далее

Что такое Gemma 4: обзор новой LLM от Google

Уровень сложностиСредний
Время на прочтение25 мин
Охват и читатели13K

2 апреля 2026 года Google DeepMind выпустила Gemma 4. В отличие от GPT, Claude и Gemini, GigaChat и других облачных API, это открытая модель: ее можно бесплатно скачать и запустить на собственном сервере, ноутбуке и даже смартфоне, используя в коммерческих целях без ограничений и лицензионных отчислений. 

Впервые открытая LLM практически сравнялась по качеству с лидерами облачного рынка, сохранив при этом «любительские» требования к оборудованию: с одной стороны, флагманская Gemma 4 31B, которая входит в тройку сильнейших открытых моделей (по версии Arena AI), помещаясь на GPU уровня RTX 4090. С другой — младшая Gemma 4 E2B, занимающая около 1,5 ГБ и способная эффективно работать без интернета, прямо на смартфоне. 

Именно этот диапазон — от локального AI на мобильном устройстве до корпоративных RAG-систем и серверной аналитики — делает Gemma 4 одной из самых интересных open-source-моделей 2026 года. Интересных настолько, что в ряде клиентских проектов, которые требуют внедрения локальной LLM, мы уже используем Gemma 4, заменив ею Ollama. 

Вот на этой ноте, предлагаем свой взгляд на то, как устроено семейство Gemma 4, чем новые модели отличаются от предыдущих версий, насколько конкурентоспособны на фоне GPT, Claude, Qwen, DeepSeek и GigaChat и сколько стоит их локальное развертывание. 

Читать далее

CyBOK. Глава 3. Законы и регуляторные нормы. Часть 8

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели9.7K

Мы продолжаем серию публикаций, посвященную своду знаний по кибербезопасности — Cybersecurity Body of Knowledge (CyBOK). В Главе 3 данного свода знаний описываются основные регуляторные нормы и принципы международного права, которые имеют отношение к кибербезопасности и могут применяться при оценке киберрисков, управлении ИБ, расследовании киберинцидентов. Сегодня — восьмая часть обзора Главы 3 CyBOK, в которой обсуждаются вопросы юридической значимости электронных подписей и ответственности издателей сертификатов, некоторые отраслевые требования по ИБ и экспортные ограничения для технологий кибербезопасности.

Читать далее

LLM-инференс на фотонах? Препарируем передовые технологии, представленные в апреле

Время на прочтение9 мин
Охват и читатели14K

Majestic Labs Prometheus, Kingston DC3000ME на 30,72 ТБ, TPU восьмого поколения от Google и не только... Как всегда, вендоры не дремлют и участвует в AI-гонке. И должен признать, иногда это приводит к появлению крайне неординарных решений на рынке.

Привет, Хабр! Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В новом дайджесте собрал самые актуальные и передовые новинки в мире железа. Читайте, делитесь своим мнением — в общем, добро пожаловать под кат!

Читать далее

Ближайшие события

Агенты выходят на работу (часть 3)

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели9K

В первой части мы говорили про оргмодель — зачем она вообще нужна и какая от нее польза.

Во второй части говорили о процессах — чего не хватает в типовых BPM и как можно ситуацию улучшить.

И вот настало время поговорить об агентах.

Читать далее

Нехватка CUDA-памяти при обучении с GRPO: как перестать гадать и начать считать

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели8.8K

Ошибка CUDA out of memory при обучении LLM обычно превращается в бесконечный цикл случайных правок: уменьшили batch size, урезали sequence length, снизили LoRA rank — и всё равно где-то снова падает. Особенно весело становится в RL-сценариях с GRPO, vLLM и генерацией нескольких ответов на один промпт.

Поговорим о том, как перестать гадать и начать считать потребление GPU-памяти: от чтения самого текста ошибки до оценки вклада vLLM, активаций и параметров обучения. С формулами, реальными конфигами и объяснением, какие настройки действительно дают эффект, а какие только создают иллюзию оптимизации.

Оптимизировать LLM

Окей, Lamoda, что надеть на вечеринку? Как обучить LLM навыкам ИИ-стилиста

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели8K

Как объяснить алгоритму, что кожаная куртка и очки героя мемов Джейсона Стетхема — это не просто одежда, а часть стиля? Классические поисковые системы хорошо работают с запросами, в которых указаны категории и атрибуты товаров, но не «чувствуют» дополнительный fashion-контекст. А это ключевая способность эксперта по моде — понять каждого своего клиента и собрать ему подходящий лук даже для самого оригинального кейса. 

Меня зовут Артем Нигоян, я дата-сайентист в Lamoda Tech и занимаюсь разработкой ИИ-стилиста. Этот продукт помогает подбирать товары и образы для наших пользователей. В его основе наша собственная LLM с навыками стилиста — предельно гибкая и контролируемая, покрывающая максимум разных запросов от пользователей.

В августе 2025 года ИИ-стилист появился в формате Telegram-бота, а в конце декабря был интегрирован в приложение Lamoda. 

Расскажу, как мы обучали и внедряли нашу LLM, как она помогает подбирать образы на разные случаи жизни, в чем преимущество по сравнению с готовыми решениями, и как мы планируем развивать данный продукт дальше.

Читать далее

ArchiMate 4: Отказ от слоёв и унификация метамодели

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели9.1K

The Open Group представила четвёртую версию языка ArchiMate. Обновление носит структурный характер: изменена философия языка, переработана метамодель и унифицированы основные элементы. В заметке — разбор наиболее значимых нововведений.

Читать далее

Дальнейшая судьба SFP-Master

Время на прочтение2 мин
Охват и читатели11K

По следам моей публикации "Программируем SFP-модули на программаторе CH341A". Программа SFP-master была портирована c Qt5 на Qt6. Модуль "общения" с интерфейсом I2C был полностью переписан, стал значительно проще, короче и надежней. Сейчас доступна версия v1.1.1. Русскоязычное описание программы я выложил здесь. Поэтому повторять его здесь смысла нет.

Читать далее

Игровой ПК или PlayStation 5: что выгоднее в 2026 году

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели9.6K

Последние лет 15 все было максимально просто. Собрать игровой ПК стоило дороже консоли, и никого это особенно не смущало. Просто тот, кто хотел получить доступ к модам, эмуляторам, апгрейдам по частям и стим-распродажам со скидками 80%, брал ПК. А тот, кому было важнее сэкономить или не хотелось лишних заморочек, выбирали PS. Ну или на худой конец Xbox. Главное, что доплата в целом была оправдана. В 2026 году концепт не изменился. ПК стоит по-прежнему дороже PS5. Но, как говорится, теперь есть серьезный нюанс.

Читать далее

Flipper One — нам нужна ваша помощь

Время на прочтение15 мин
Охват и читатели63K

Мы наконец готовы рассказать про Flipper One — проект, над которым корпим уже много лет и который несколько раз полностью переделывали с нуля. Это очень сложный проект как экономически, так и технически. Поэтому сегодня мы выходим в паблик не с триумфальным анонсом, а чтобы рассказать все как есть. Скажем честно — нам тупо страшно и нам нужна ваша помощь.

TL;DR Flipper One — это наша попытка переосмыслить, чем может быть Linux кибердек. Это огромный проект, поэтому мы открываем процесс разработки и просим сообщество о помощи.

В Flipper One мы поставили перед собой амбициозные задачи:

— Создать самый открытый и хорошо документированный ARM-компьютер в мире с полной поддержкой в мейнлайн-ядре Linux — чтобы можно было скачать ядро c kernel.org и оно сразу работало на Flipper One.

— Убедить вендоров открыть их существующий закрытый код и полностью избавиться от бинарных блобов и костылей.

— Слепить нестандартную аппаратную платформу из микроконтроллера и CPU и портировать кучу кода на уровень MCU.

— Переосмыслить как люди используют Linux и разработать свой GUI-фреймворк с обертками существующих CLI-утилит.

Многие из этих задач имеют кучу неопределенностей и это пугает. Но мы верим, что только так, мы можем сделать по-настоящему важный вклад в общество и образование, и это стоит дороже денег.

Читать далее