Pull to refresh
3
@Biornclawread⁠-⁠only

User

1
Subscribers
Send message

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака

Level of difficultyMedium
Reading time4 min
Reach and readers10K

Я давно слежу за развитием локальных LLM, но всегда упирался в одно и то же — либо модель маленькая и качество не устраивает, либо большая и не влезает в видеопамять. Всё изменилось когда я наткнулся на статью про MoE-модели и параметр -cmoe в llama.cpp.

Расскажу как я запустил Qwen3.6 35B-A3B на RTX 4070 12GB с 32GB RAM, настроил его как AI-ассистент для реального проекта в opencode, и почему теперь эта модель у меня работает постоянно.

Читать далее

Собираем AI-агента нового поколения: Python, RAG и внешние инструменты через MCP (Model Context Protocol)

Level of difficultyMedium
Reading time13 min
Reach and readers13K

Ещё пару лет назад типичное LLM-приложение выглядело как последовательная цепочка вызовов: взяли промпт, добавили контекст из векторной базы, отправили в модель, получили ответ. LangChain популяризировал эту парадигму — chains, retrievers, memory — и это работало для простых сценариев вроде «ответь на вопрос по документации».
Но бизнес-задачи редко укладываются в линейный пайплайн. Пользователь хочет не просто получить ответ, а чтобы система совершила действие: создала тикет в Jira, отправила письмо, запросила данные из CRM, проверила погоду и только потом сформулировала ответ. Именно здесь на сцену выходят AI-агенты — системы, которые не просто генерируют текст, а автономно принимают решение, какой инструмент вызвать, в каком порядке, и интерпретируют результат. Проблема в том, что до недавнего времени подключение каждого нового инструмента требовало написания «клея» — кастомных функций, обёрнутых в @tool декоратор LangChain, с ручным управлением аутентификацией, обработкой ошибок и сериализацией данных. Для продакшена это быстро превращалось в зоопарк нестандартных интеграций, который сложно поддерживать и масштабировать.
Model Context Protocol (MCP) от Anthropic решает эту проблему, предлагая единый стандарт для подключения инструментов и источников данных к LLM-приложениям. Вместо того чтобы для каждого API писать свой адаптер, мы просто запускаем MCP-сервер, который предоставляет инструменты по стандартизированному протоколу. Агент подключается к этому серверу через MCP-клиент и получает доступ ко всем инструментам без лишнего кода.
В этой статье мы соберём полноценного агента, который:
1. Умеет работать с внешним миром через MCP (узнавать погоду и создавать GitHub Issues);
2. Имеет доступ к внутренней базе знаний через RAG;
3. Принимает решения по ReAct-подходу с использованием LangGraph.

Разбираем код и архитектуру

Vibe++ очень простой язык для промпт-программистов. А почему бы и не да?

Level of difficultyEasy
Reading time6 min
Reach and readers13K

Дисклеймер: не претендую ни на что, просто делюсь результатами размышлений с коллегами и приглашаю к диалогу. Примеры сгенерированы на 100% в ChatGPT в режиме Plus — Thinking.

Мне хочется помочь новичкам структурированно думать и для этого я предлагаю Vibe++ — язык намерений, язык промпт программирования, слабо структурированное описание задач в виде промпта на человеческом языке, обеспечивающих более хороший результат.

Vibe++, так Vibe++, ну, давай посмотрим...

Как техлид без навыка кодинга руками собрал Telegram-систему закупок с OCR, модерацией и безопасным деплоем

Level of difficultyMedium
Reading time9 min
Reach and readers12K

Я технический лидер. Обычно моя работа не в том, чтобы писать код руками, а в том, чтобы запускать сложные hardware/software-проекты с нуля, собирать архитектуру, принимать ключевые технические решения, выстраивать команду и доводить систему до MVP в условиях неопределённости.

Я работаю на стыке механики, электроники, разработки и AI, связывая это в единый контур.

При этом я не владею языками программирования как разработчик.

Именно поэтому этот проект оказался для меня особенно интересным. Это был не просто внутренний бот, а практический эксперимент: можно ли, оставаясь в роли техлида и архитектора, собрать рабочий software-продукт через агентную разработку, не теряя в качестве решений, управляемости и инженерном здравом смысле.

Короткий ответ: да, можно.

Но очень быстро становится понятно, что агентные системы не избавляют от архитектуры. Они просто дают тебе другой интерфейс к реализации.

Читать далее

Как я сделал Claude мультимодальным, подключив к нему Qwen Omni

Level of difficultyEasy
Reading time4 min
Reach and readers11K

Claude слепой. К сожалению ни одна модель Антропиков не работает напрямую с видео.
Да, можно нарезать хоть на каждый кадр и скормить ему, но это не то. Контекст движения теряется, а без него это просто разбор кучи кадров на составляющие и попытка собрать контекст воедино.

Для меня как для визуального артиста это большая боль, потому что часто хочется отправить видео-рефы и попросить разобрать движение камеры, персонажа, дизайн в конце концов.

И вот конкретная задача - 29 сгенерированных видео-референсов анимации персонажа лежат в папке проекта, надо их разобрать по категориям и описать каждое движение.
Вручную мне заниматься этим, конечно же, лень. Час-полтора времени на нудную задачу.

Тогда я вспомнил про Qwen Omni, которым уже пользуюсь для создания Цифрового риалтайм персонажа-ассистента. И подумал, а почему бы не подружить их.

Читать далее

Как я тестировал локально новый Qwen 3.6 и Gemma 4

Level of difficultyMedium
Reading time8 min
Reach and readers19K

Всем привет
! Текст полностью написан человеком !

На днях вышла модель Qwen 3.6, весь реддит забит этой темой. И я рискнул проверить что она может

Оборудование на котором тестировал (Ноутбук Asus TUF AMD Ryzen + дискретная Nvidia rtx 4070 8GB):

Читать далее

Книга: «GitHub Copilot. Программирование в паре с ИИ»

Reading time2 min
Reach and readers9.8K

Привет, Хаброжители! Освойте навыки программирования в тесном сотрудничестве с генеративным ИИ, используя GitHub Copilot — пожалуй, самый популярный ИИ-инструмент разработчика. Брент Ластер, опытный девелопер и преподаватель, описал реальные сценарии из ежедневной практики и тем самым показал, что GitHub Copilot — это не просто подсказки в редакторе, а полноценный партнер по программированию, который может в разы ускорить вашу работу, если знать, как с ним взаимодействовать.

Читать далее

NAS, который стал сервером: почему я отказался от DIY и купил Minisforum

Level of difficultyEasy
Reading time4 min
Reach and readers21K

Я долго хотел собрать NAS сам, но в итоге выбрал готовое решение. Рассказываю, где ломается идея «сделаю дешевле», почему роутер с Docker — это не сервер, и как я пришёл к устройству, которое закрывает сразу всё: хранение, сервисы и эксперименты.

Читать далее

Как шпионить за Wi-Fi сетями для пользы дела — полный гайд (легально!)

Level of difficultyMedium
Reading time6 min
Reach and readers11K

Привет, Хабр! Меня зовут Алексей, и я продолжаю копаться в беспроводных технологиях. В прошлый раз мы настраивали Wi-Fi в OpenWrt для максимальной стабильности и покрытия. Сегодня я хочу поговорить о другой, не менее увлекательной теме - мониторинге беспроводного эфира с помощью легедарного роутера TP-Link MR3020.Многие скажут: «Зачем мне это? У меня и так всё работает». А я отвечу: возможности, которые открываются, могут удивить. Давайте сразу к делу.

Читать далее

Когда, зачем и как правильно начинать новую сессию в Claude Code?

Level of difficultyEasy
Reading time5 min
Reach and readers13K

В последних разговорах с пользователями Claude Code постоянно всплывает одна тема: контекстное окно в 1М токенов — палка о двух концах.

С одной стороны, Claude Code дольше работает автономно и надёжнее справляется со сложными задачами. С другой — если не следить за сессиями, контекст быстро засоряется.

Управление сессиями сейчас важнее, чем когда-либо, и вопросов вокруг него много. Держать одну или две долгосрочные сессии в терминале? Начинать новую с каждым промптом? Когда использовать compact, rewind или subagents? Что приводит к плохой компактизации или плохой сессии?

Всё это неожиданно сильно влияет на опыт работы с Claude Code, и почти всё сводится к управлению контекстным окном.

Читать далее

Бесплатная нейросеть для генерации музыки локально: ACE-Step 1.5 обходит Suno на бенчмарках

Level of difficultyMedium
Reading time4 min
Reach and readers14K

Open source модель для генерации музыки, которая на бенчмарке SongEval обходит Suno v5. Работает локально от 4 ГБ VRAM, генерирует полный трек за 2 секунды на A100. Разбираю архитектуру LM + DiT: почему разделение планирования и синтеза даёт такой результат, что реально работает, а что авторы сами называют проблемами.

Читать далее

Как кодинг-агенты используют инструменты, память и контекст репозитория, чтобы писать код лучше

Reading time13 min
Reach and readers8.1K

Это перевод хорошей статьи про базу того, как устроены кодинг-ассистенты и что для них важно: что такое харнесс и харнесс-инжиниринг, в чем разница просто агентной обвязки и кодинговой, что такое компактизация и почему та же самая модель в консольке ощущается мощнее, чем просто в веб-чате.

Сильного хардкора и больших откровений в ней нет, но это отличный материал для старта изучения архитектуры кодинг-ассистентов и лучшего понимания, как оно работает внутри.

Читать далее

Промпты для Suno AI: как писать запросы, чтобы нейросеть генерировала нормальную музыку, а не кашу

Level of difficultyEasy
Reading time4 min
Reach and readers15K

Suno генерирует музыку по текстовому описанию, но без правильной разметки результат — каша. Разобрал систему промптов: метатеги [Verse], [Chorus], [Drop], музыкальные термины для поля Style, рабочие комбинации жанров и то, чего Suno не умеет и не стоит ждать. Готовые шаблоны для копипасты внутри.

Читать далее

Как писать промпты для разработки: опыт, который экономит часы

Level of difficultyEasy
Reading time4 min
Reach and readers17K

Система промптов — это фундамент всей работы с ИИ при разработке. Через промпты вы не просто общаетесь с моделью, а фактически управляете процессом создания продукта.

При этом важно сразу убрать лишнее ожидание. Вам не нужно искать идеальную формулировку или пытаться писать «правильные» запросы. В реальной работе это почти не играет роли.

Результат появляется не из одного точного запроса, а из процесса. Вы ставите задачу, получаете ответ, смотрите, что получилось, и корректируете. Именно этот цикл и есть основа вайбкодинга.

Читать далее

OSINT для ленивых. Часть 7: Вспоминаем забытые пароли от zip архива за 2 минуты

Level of difficultyEasy
Reading time2 min
Reach and readers16K

Что такое хлам? Хлам это то, что хранится годами и ты его выкидываешь, как раз перед тем, как он тебе понадобится.

Так иногда получается, что мы храним какие-то данные в zip архиве, а пароль от него забыли напрочь. Как люди грамотные, мы не ставим в качестве пароля свой день варенья или имя своего котика.

Но пароль забыть, вспомнить шансов — ноль. Как быть?

Читать далее

Zabbix-мониторинг российского микрокомпьютера Repka Pi

Reading time12 min
Reach and readers8.1K

В этой статье я расскажу о настройке Zabbix-мониторинга российского одноплатного микрокомпьютера Repka Pi 3, разработанного НПО Рэйнбовсофт (Rainbowsoft) из Саратова. Помимо параметров, доступных для мониторинга с помощью стандартного агента Zabbix, с помощью шаблона  zabbix-agent-on-repka-pi, рассмотренного в этой статье, вы сможете поставить на контроль температуру CPU и GPU, а также тактовую частоту ядер процессора.

Читать далее

Лучшие VR-шлемы: от самых бюджетных к премиальным

Level of difficultyEasy
Reading time5 min
Reach and readers85K

В интернет-магазинах РФ и на классифайдах появилась возможность оформить предзаказ на гарнитуру Apple Vision Pro по цене до 500 тыс. рублей. При этом устройство стоимостью $3,5 тыс. выйдет в США только в 2024 году. Собрали несколько отличных и реальных вариантов для тех, кто хочет опробовать VR-экспириенс уже сейчас.

Читать далее

10 шаблонов запросов для ChatGPT, которые выдадут качественные ответы в помощь продакт-менеджеру

Reading time24 min
Reach and readers54K

Привет! Я Аля — продакт-менеджер выделенных серверов Selectel. Люблю быстрое тестирование гипотез (и да, верю, что в B2B это возможно), общаться с целевой аудиторией и чистить бэклог.

Хочу поделиться, как продакт-менеджеры могут превратить ChatGPT из магии и забавной болталки, вокруг которой уже существует целая куча мемов, в полезный инструмент для решения повседневных задач. В этом тексте дам шаблоны запросов для разных целей — от составления структуры презентаций до валидации идей. Задачу ChatGPT не облегчала и проверяла его на боевых задачах, связанных с развитием моего непростого продукта.

Дисклеймер: Сразу отмечу, что рассматриваю AI-инструменты в качестве мощного ускорителя работы и источника вдохновения, а не как полную замену продакт-менеджера. Да, с помощью ChatGPT или Notion AI можно генерировать идеи и вопросы для интервью, но принятие решения о дальнейших шагах и выбор путей реализации все равно остаются в компетенции специалиста.

Читать дальше →

Unihiker: одноплатник с экраном за $75. Что это за девайс и какие у него возможности

Reading time3 min
Reach and readers18K
image

Одноплатные ПК крайне редко поставляются с экранами. Обычно дисплей приходится докупать. Но теперь появился необычный девайс, который представляет собой нечто вроде карманного компьютера уже из коробки. Самый его дорогой компонент — дисплей, поэтому разработчики стремились удешевить систему, чтобы удержать стоимость на отметке в $79. Соответственно, каких-то рекордов производительности от него ждать не приходится. Но все же это неплохой девайс, который может пригодиться многим из нас. Давайте посмотрим, что он из себя представляет.
Читать дальше →
1

Information

Rating
Does not participate
Registered
Activity