Pull to refresh
16K+
10
Гусев Николай@Aule

Инженер, внедряю всякое

24,7
Rating
5
Subscribers
Send message

Три вещи прошли мимо всех я смотрю :)

Time-мультиплексируемое MatVec-ядро. Один вычислитель на все матрично-векторные умножения трансформера. Экономия площади FPGA в 3-5 раз. Эта техника переносится на любую ПЛИС - она не зависит от размера модели.

Фиксированная точка Q4.12. Отказ от float - предсказуемый тайминг, радикальная экономия LUT и DSP. Метод квантования универсален - применить можно к модели любого размера, вопрос только в подборе разрядности.

Верификационный конвейер: ModelSim testbench, Python-референс, unit-тест на эквивалентность RTL-Пайтон. Методология переносима на любой toolchain.

Talos V2 - лучший открытый учебник по теме «как трансформер выглядит в RTL». Не в софте, не в блок-схемах - в регистрах и вентилях. Разработка учебной платы с методичкой - вопрос нескольких миллионов рублей. Для ВУЗов - норм.

Плюс это можно реализовать на российских ПЛИС, а областей типа телеметрии, SmartNIC по типу AMD Pensando\Nvidia BlueField, космос - радиационнстойкие ПЛИС от Миландр и т.л. и т.п.

Я бы мог написать очень много слов на тему того почему самописные решения это плохо, просто спрошу, вы готовы что у вас все просто перестанет работать после какого нибудь обновления? Как вы решаете басфактор уникальных знаний? Все задокументировано? А обновляется? А есть четкий процесс "ни строчки кода без документирования?" Используйте подход premortem напишите прям себе или в ИИ "все умерло через полгода, пайплайны рассыпались, коммуникации не работают, бизнес встал" и начните выписывать прямо по порядку что в голову приходит, если через ИИ то опишите прямо весь пайплайн как устроена система.

Приложения очень крутые, без дураков, правда можно с клодом или loveable накодить красивое за неделю, но упрутся в бэк, ну ок вот твоя супераппка, а с чем она будет работать? А там бд\доступы, всякие скучные настройки вот эти вот девопеские, скейлин\хуейлинг резервное копирование, разобраться там с тем что под капотом, Чудес то не бывает, это или очередной "сфоткай тарелку - клод за охулиард токенов распознает и посчитает кбжу" или за разработкой стоит нормальная команда которая просто пишет код испольуя агентов и настраивает инфру с ними (это пока задача со звездочкой)

Да, один человек все еще нужен, но вместо команды. Все, что остается, — это стать этим самым одним человеком.

и нет, вопрос то простой "можно, а зачем?" 1 человек - это басфактор, команда с культурой и планом -нет. Лично я не хочу в солодев браться за что-то сложнее домашней бугалтерии формата вебапп+супабэйс, взваливать на себя все потому что можешь? ну сомнительный тейк

а зачем у тебя можно сделать overprovisioning, точнее почему? у тебя OpenNebula какая то? Чет в голову ниче не приходит с такими проблемами больше

Причем у меня есть подозрение, что если поставить задачу то и эникея сможет нанять :)

Все что может сделать админ не считая патчкорд обжать и принтер заправить, а по сети настроить сможет и эта шайтан-машина, надо только объяснить что нужно

Нашей самой амбициозной целью стал переход к AI-агентам, которые смогут не просто искать текст, но и самостоятельно выполнять рутинные задачи в наших системах

Тут важное различие: RAG-бот отвечает на вопросы, а агент ещё и делает (дергает API, создаёт тикеты, запускает скрипты, помнит контекст между сессиями). Я рекомендую посмотреть на Hermes Agent там это решается через профили несколько конфигов под разные роли с разным набором инструментов. Для прода на несколько десятков пользователей нужно будет немного допилить

С консультантом ты платишь за ответ, не зависимо от того правильный или нет. Ты не можешь оценить его работу. Тебе продали то что продали и ты молча купил. Нет возможности вернуть деньги если ответ не подошел... Да еще много нюансов.

Hermes Worker не заменит инженера, который придумывает архитектуру. Но он заменит инженера, который в 3 ночи заходит по SSH и чинит конфиг.

литералли об этом и написано что если ты чинишь прод в три ночи по алерту, у тебя говно а не архитектура и тебя заменят

никто в своем уме не будет работать с "кровавым ынтерпрайзом" через подписку на openrouter, естьтакое понятие как комплаенс и прочие неприятные ИБешные слова, на своих модельках пожалста, умный qwen 3.6 27b манагер, IBM: Granite 4.1 8B заточеный под tool call в агентов

я так разьебал в ответе, но потом видео открылось :)))

ну если у тебя изначально кривая архитектура то причем тут ИИ вобще? Красивый педикюр на сломанных ногах не улучшает беговые качества спортсмена, а вот эта связка позволит тебе просто накинуть скилов типа как тут я описал и провести аудит инфры, потому что вечная боль это не задеплоить стенд а разобраться что тут нахуеверчено, это я тебе как страшный инженер отдела архитектыры и внедрения говорю :))) Менеджер тебе как раз и не даст тупо накидывать ресурсов, если надо я могу подробно расписать как это устроено, что такое профили, скилы, роли, почему такая связка, почему это не просто в чатик написал и скопипастил

я специально проанализировал паттерны топ постов за неделю, сделал скилл рейджбайт, ты думаешь я не старался штоле?

Да и человек а рамках УК и ТК :))

"Я написал длинное письмо, потому что у меня не было времени написать короткое" (с) Паскаль, лень, занятость, у меня есть тезисы пусть llm развернет мысль, длинно значит умно и т.д. бороться глупо, это уже считай стандарт в соцсетях, мне тут показывали https://zerogpt.cc расширение для детекта иислопа, вобщем "лучше бы я не смотрел"

я бы с 90-х считал+- как первый BOFH написали :)

[05.05.2026 21:23] Hermes: Привет! 🙌

Вы абсолютно справедливо подметили про Premortem — да, методологии работают только когда адаптированы под бизнес-контекст, а не просто скопированы из учебника. Это именно то, о чём я старался сказать. 👍

Насчёт Prism — спасибо за тёплые слова! 🤝 Когда мы говорим про архитектуру AI-агентов, структурный анализ выходит на первый план. Именно такие инструменты позволяют не просто констатировать проблемы, а докопаться до их глубинных причин. И связка Premortem + Prism здесь действительно раскрывается по-новому. 🚀

SeptumCore — обязательно присмотрюсь! 🔥 Легковесные WAF-решения без лишней магии — это то, чего сейчас не хватает рынку. Спасибо, что поделились ссылкой!

Буду рад, если заглянете и на другие мои статьи — там тоже есть о чём поговорить. Конструктивная критика всегда помогает двигаться вперёд! 💪✨

Ну ладно меньше чем я живу, но считать что девопс это с 2009 года, не знать истории вопроса :)

1

Information

Rating
349-th
Location
Екатеринбург, Свердловская обл., Россия
Date of birth
Registered
Activity

Specialization

Системный администратор, DevOps-инженер
Старший