Articles / Bookmarks / Profile of Biornclaw / Habr

@Biornclaw^{read⁠-⁠only}

User

Subscribers

ProfileBookmarks28

rAnto yesterday at 09:30

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака

Medium

4 min

10K

Artificial IntelligenceMachine learning * Open source *

Tutorial

From sandbox

Я давно слежу за развитием локальных LLM, но всегда упирался в одно и то же — либо модель маленькая и качество не устраивает, либо большая и не влезает в видеопамять. Всё изменилось когда я наткнулся на статью про MoE-модели и параметр -cmoe в llama.cpp.

Расскажу как я запустил Qwen3.6 35B-A3B на RTX 4070 12GB с 32GB RAM, настроил его как AI-ассистент для реального проекта в opencode, и почему теперь эта модель у меня работает постоянно.

+17

kardanShurup Apr 20 at 07:18

Собираем AI-агента нового поколения: Python, RAG и внешние инструменты через MCP (Model Context Protocol)

Medium

13 min

13K

Machine learning * Artificial IntelligencePython * Programming * GitHub *

Tutorial

Ещё пару лет назад типичное LLM-приложение выглядело как последовательная цепочка вызовов: взяли промпт, добавили контекст из векторной базы, отправили в модель, получили ответ. LangChain популяризировал эту парадигму — chains, retrievers, memory — и это работало для простых сценариев вроде «ответь на вопрос по документации».
Но бизнес-задачи редко укладываются в линейный пайплайн. Пользователь хочет не просто получить ответ, а чтобы система совершила действие: создала тикет в Jira, отправила письмо, запросила данные из CRM, проверила погоду и только потом сформулировала ответ. Именно здесь на сцену выходят AI-агенты — системы, которые не просто генерируют текст, а автономно принимают решение, какой инструмент вызвать, в каком порядке, и интерпретируют результат. Проблема в том, что до недавнего времени подключение каждого нового инструмента требовало написания «клея» — кастомных функций, обёрнутых в @tool декоратор LangChain, с ручным управлением аутентификацией, обработкой ошибок и сериализацией данных. Для продакшена это быстро превращалось в зоопарк нестандартных интеграций, который сложно поддерживать и масштабировать.
Model Context Protocol (MCP) от Anthropic решает эту проблему, предлагая единый стандарт для подключения инструментов и источников данных к LLM-приложениям. Вместо того чтобы для каждого API писать свой адаптер, мы просто запускаем MCP-сервер, который предоставляет инструменты по стандартизированному протоколу. Агент подключается к этому серверу через MCP-клиент и получает доступ ко всем инструментам без лишнего кода.
В этой статье мы соберём полноценного агента, который:
1. Умеет работать с внешним миром через MCP (узнавать погоду и создавать GitHub Issues);
2. Имеет доступ к внутренней базе знаний через RAG;
3. Принимает решения по ReAct-подходу с использованием LangGraph.

Разбираем код и архитектуру

+15

bormee Apr 20 at 11:35

Vibe++ очень простой язык для промпт-программистов. А почему бы и не да?

Easy

6 min

13K

Programming * Artificial IntelligencePrototyping *

Opinion

Дисклеймер: не претендую ни на что, просто делюсь результатами размышлений с коллегами и приглашаю к диалогу. Примеры сгенерированы на 100% в ChatGPT в режиме Plus — Thinking.

Мне хочется помочь новичкам структурированно думать и для этого я предлагаю Vibe++ — язык намерений, язык промпт программирования, слабо структурированное описание задач в виде промпта на человеческом языке, обеспечивающих более хороший результат.

Vibe++, так Vibe++, ну, давай посмотрим...

+27

romkamario Apr 19 at 06:15

Как техлид без навыка кодинга руками собрал Telegram-систему закупок с OCR, модерацией и безопасным деплоем

Medium

9 min

12K

Development Management * System Analysis and Design * Python * DevOps * System administration *

Case

From sandbox

Я технический лидер. Обычно моя работа не в том, чтобы писать код руками, а в том, чтобы запускать сложные hardware/software-проекты с нуля, собирать архитектуру, принимать ключевые технические решения, выстраивать команду и доводить систему до MVP в условиях неопределённости.

Я работаю на стыке механики, электроники, разработки и AI, связывая это в единый контур.

При этом я не владею языками программирования как разработчик.

Именно поэтому этот проект оказался для меня особенно интересным. Это был не просто внутренний бот, а практический эксперимент: можно ли, оставаясь в роли техлида и архитектора, собрать рабочий software-продукт через агентную разработку, не теряя в качестве решений, управляемости и инженерном здравом смысле.

Короткий ответ: да, можно.

Но очень быстро становится понятно, что агентные системы не избавляют от архитектуры. Они просто дают тебе другой интерфейс к реализации.

-20

kirillbrsnkv Apr 15 at 13:16

Как я сделал Claude мультимодальным, подключив к нему Qwen Omni

Easy

4 min

11K

Artificial IntelligenceOpen source *

Case

From sandbox

Claude слепой. К сожалению ни одна модель Антропиков не работает напрямую с видео.
Да, можно нарезать хоть на каждый кадр и скормить ему, но это не то. Контекст движения теряется, а без него это просто разбор кучи кадров на составляющие и попытка собрать контекст воедино.

Для меня как для визуального артиста это большая боль, потому что часто хочется отправить видео-рефы и попросить разобрать движение камеры, персонажа, дизайн в конце концов.

И вот конкретная задача - 29 сгенерированных видео-референсов анимации персонажа лежат в папке проекта, надо их разобрать по категориям и описать каждое движение.
Вручную мне заниматься этим, конечно же, лень. Час-полтора времени на нудную задачу.

Тогда я вспомнил про Qwen Omni, которым уже пользуюсь для создания Цифрового риалтайм персонажа-ассистента. И подумал, а почему бы не подружить их.

+13

x4team_only Apr 18 at 13:26

Как я тестировал локально новый Qwen 3.6 и Gemma 4

Medium

8 min

19K

JavaScript * Text editors and IDEs * Programming * ReactJS * Open source *

Tutorial

Всем привет
! Текст полностью написан человеком !

На днях вышла модель Qwen 3.6, весь реддит забит этой темой. И я рискнул проверить что она может

Оборудование на котором тестировал (Ноутбук Asus TUF AMD Ryzen + дискретная Nvidia rtx 4070 8GB):

+25

ph_piter Apr 14 at 09:22

Книга: «GitHub Copilot. Программирование в паре с ИИ»

2 min

9.8K

Издательский дом «Питер» corporate blogProfessional literature * GitHub * Artificial Intelligence

Привет, Хаброжители! Освойте навыки программирования в тесном сотрудничестве с генеративным ИИ, используя GitHub Copilot — пожалуй, самый популярный ИИ-инструмент разработчика. Брент Ластер, опытный девелопер и преподаватель, описал реальные сценарии из ежедневной практики и тем самым показал, что GitHub Copilot — это не просто подсказки в редакторе, а полноценный партнер по программированию, который может в разы ускорить вашу работу, если знать, как с ним взаимодействовать.

solo12zw74 Apr 11 at 08:55

Nano NAS из смартфона

Easy

3 min

12K

Smart House

Tutorial

Нано-микро-NAS из телефона. Как мне надоело скачивать кино и потом вспоминать куда я его скачал и что нужно подключить чтобы его посмотреть.

+14

Apokalepsis Apr 12 at 22:03

NAS, который стал сервером: почему я отказался от DIY и купил Minisforum

Easy

4 min

21K

GadgetsData storage * Computer hardware

Case

Я долго хотел собрать NAS сам, но в итоге выбрал готовое решение. Рассказываю, где ломается идея «сделаю дешевле», почему роутер с Docker — это не сервер, и как я пришёл к устройству, которое закрывает сразу всё: хранение, сервисы и эксперименты.

+10

GrekNirvana Apr 17 at 08:17

Как шпионить за Wi-Fi сетями для пользы дела — полный гайд (легально!)

Medium

6 min

11K

Wireless technologies * System administration * Information Security * Network technologies *

Tutorial

Привет, Хабр! Меня зовут Алексей, и я продолжаю копаться в беспроводных технологиях. В прошлый раз мы настраивали Wi-Fi в OpenWrt для максимальной стабильности и покрытия. Сегодня я хочу поговорить о другой, не менее увлекательной теме - мониторинге беспроводного эфира с помощью легедарного роутера TP-Link MR3020.Многие скажут: «Зачем мне это? У меня и так всё работает». А я отвечу: возможности, которые открываются, могут удивить. Давайте сразу к делу.

python_leader Apr 16 at 08:20

Когда, зачем и как правильно начинать новую сессию в Claude Code?

Easy

5 min

13K

Artificial IntelligenceProgramming * Text editors and IDEs *

Tutorial

Translation

В последних разговорах с пользователями Claude Code постоянно всплывает одна тема: контекстное окно в 1М токенов — палка о двух концах.

С одной стороны, Claude Code дольше работает автономно и надёжнее справляется со сложными задачами. С другой — если не следить за сессиями, контекст быстро засоряется.

Управление сессиями сейчас важнее, чем когда-либо, и вопросов вокруг него много. Держать одну или две долгосрочные сессии в терминале? Начинать новую с каждым промптом? Когда использовать compact, rewind или subagents? Что приводит к плохой компактизации или плохой сессии?

Всё это неожиданно сильно влияет на опыт работы с Claude Code, и почти всё сводится к управлению контекстным окном.

nlaik Apr 7 at 17:02

Бесплатная нейросеть для генерации музыки локально: ACE-Step 1.5 обходит Suno на бенчмарках

Medium

4 min

14K

Artificial IntelligenceSoundMachine learning *

Review

Open source модель для генерации музыки, которая на бенчмарке SongEval обходит Suno v5. Работает локально от 4 ГБ VRAM, генерирует полный трек за 2 секунды на A100. Разбираю архитектуру LM + DiT: почему разделение планирования и синтеза даёт такой результат, что реально работает, а что авторы сами называют проблемами.

+14

antipov_dmitry Apr 9 at 07:18

Как кодинг-агенты используют инструменты, память и контекст репозитория, чтобы писать код лучше

13 min

8.1K

Artificial IntelligenceMachine learning * System Analysis and Design *

Translation

Это перевод хорошей статьи про базу того, как устроены кодинг-ассистенты и что для них важно: что такое харнесс и харнесс-инжиниринг, в чем разница просто агентной обвязки и кодинговой, что такое компактизация и почему та же самая модель в консольке ощущается мощнее, чем просто в веб-чате.

Сильного хардкора и больших откровений в ней нет, но это отличный материал для старта изучения архитектуры кодинг-ассистентов и лучшего понимания, как оно работает внутри.

+14

nlaik Apr 11 at 22:18

Промпты для Suno AI: как писать запросы, чтобы нейросеть генерировала нормальную музыку, а не кашу

Easy

4 min

15K

Artificial IntelligenceSound

Tutorial

Suno генерирует музыку по текстовому описанию, но без правильной разметки результат — каша. Разобрал систему промптов: метатеги [Verse], [Chorus], [Drop], музыкальные термины для поля Style, рабочие комбинации жанров и то, чего Suno не умеет и не стоит ждать. Готовые шаблоны для копипасты внутри.

+11

Andrey_Popov30 Apr 11 at 13:40

Как писать промпты для разработки: опыт, который экономит часы

Easy

4 min

17K

Programming *

Tutorial

Recovery Mode

Система промптов — это фундамент всей работы с ИИ при разработке. Через промпты вы не просто общаетесь с моделью, а фактически управляете процессом создания продукта.

При этом важно сразу убрать лишнее ожидание. Вам не нужно искать идеальную формулировку или пытаться писать «правильные» запросы. В реальной работе это почти не играет роли.

Результат появляется не из одного точного запроса, а из процесса. Вы ставите задачу, получаете ответ, смотрите, что получилось, и корректируете. Именно этот цикл и есть основа вайбкодинга.

hack_less Apr 10 at 19:11

OSINT для ленивых. Часть 7: Вспоминаем забытые пароли от zip архива за 2 минуты

Easy

2 min

16K

Information Security * IT Infrastructure *

Case

Recovery Mode

Что такое хлам? Хлам это то, что хранится годами и ты его выкидываешь, как раз перед тем, как он тебе понадобится.

Так иногда получается, что мы храним какие-то данные в zip архиве, а пароль от него забыли напрочь. Как люди грамотные, мы не ставим в качестве пароля свой день варенья или имя своего котика.

Но пароль забыть, вспомнить шансов — ноль. Как быть?

FirstJohn Jun 13 2023 at 07:58

Zabbix-мониторинг российского микрокомпьютера Repka Pi

12 min

8.1K

FirstVDS corporate blogComputer hardwareDevelopment for Raspberry Pi * Programming microcontrollers * System administration *

В этой статье я расскажу о настройке Zabbix-мониторинга российского одноплатного микрокомпьютера Repka Pi 3, разработанного НПО Рэйнбовсофт (Rainbowsoft) из Саратова. Помимо параметров, доступных для мониторинга с помощью стандартного агента Zabbix, с помощью шаблона zabbix-agent-on-repka-pi, рассмотренного в этой статье, вы сможете поставить на контроль температуру CPU и GPU, а также тактовую частоту ядер процессора.

+14

mvideo Jun 14 2023 at 15:51

Лучшие VR-шлемы: от самых бюджетных к премиальным

Easy

5 min

85K

М.Видео-Эльдорадо corporate blogReading roomGadgetsAR and VRThe future is here

Review

В интернет-магазинах РФ и на классифайдах появилась возможность оформить предзаказ на гарнитуру Apple Vision Pro по цене до 500 тыс. рублей. При этом устройство стоимостью $3,5 тыс. выйдет в США только в 2024 году. Собрали несколько отличных и реальных вариантов для тех, кто хочет опробовать VR-экспириенс уже сейчас.

+24

AlyaCheers Jun 16 2023 at 10:45

10 шаблонов запросов для ChatGPT, которые выдадут качественные ответы в помощь продакт-менеджеру

24 min

54K

Selectel corporate blogIT Infrastructure * IT-companiesArtificial IntelligenceProduct Management *

Привет! Я Аля — продакт-менеджер выделенных серверов Selectel. Люблю быстрое тестирование гипотез (и да, верю, что в B2B это возможно), общаться с целевой аудиторией и чистить бэклог.

Хочу поделиться, как продакт-менеджеры могут превратить ChatGPT из магии и забавной болталки, вокруг которой уже существует целая куча мемов, в полезный инструмент для решения повседневных задач. В этом тексте дам шаблоны запросов для разных целей — от составления структуры презентаций до валидации идей. Задачу ChatGPT не облегчала и проверяла его на боевых задачах, связанных с развитием моего непростого продукта.

Дисклеймер: Сразу отмечу, что рассматриваю AI-инструменты в качестве мощного ускорителя работы и источника вдохновения, а не как полную замену продакт-менеджера. Да, с помощью ChatGPT или Notion AI можно генерировать идеи и вопросы для интервью, но принятие решения о дальнейших шагах и выбор путей реализации все равно остаются в компетенции специалиста.

Читать дальше →

+44

abykova27 Jun 17 2023 at 00:29

Unihiker: одноплатник с экраном за $75. Что это за девайс и какие у него возможности

3 min

18K

Selectel corporate blogGadgetsComputer hardwareManufacture and development of electronics *

Одноплатные ПК крайне редко поставляются с экранами. Обычно дисплей приходится докупать. Но теперь появился необычный девайс, который представляет собой нечто вроде карманного компьютера уже из коробки. Самый его дорогой компонент — дисплей, поэтому разработчики стремились удешевить систему, чтобы удержать стоимость на отметке в $79. Соответственно, каких-то рекордов производительности от него ждать не приходится. Но все же это неплохой девайс, который может пригодиться многим из нас. Давайте посмотрим, что он из себя представляет.

Читать дальше →

+49