Комментарии / Профиль rodial / Хабр

@rodial^{read⁠-⁠only}

Пользователь

Рейтинг

Подписчики

ПрофильСтатьи1ПостыНовостиКомментарии152

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

rodial 10 июн в 18:29

Лучше в чём?

Она будет быстрее - да, она будет без цензуры, но на этом всё. Код писать эта модель будет хуже чем оригинальная.

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

rodial 10 июн в 18:07

Тем более на 96gb vram проще несколько моделей сразу загрузить

Не уверен что на windows версии есть такие параметры, но на linux я добавляю в llama.cpp сервер ещё –no-mmap --fit off

Компьютерное зрение на коленке: распознаем дорожные знаки и управляем роботом на ESP32 и Arduino

rodial 9 июн в 18:34

Есть ещё Seeed Studio XIAO ESP32-S3 Sense, все преимущества S3, кроме количества пинов, + встроенный контроллер заряда (самый простейший) может работать напрямую от аккумулятора и сверхмалый размер.

Десять лет в индустрии я писал код руками. Три месяца назад перестал

rodial 7 июн в 20:23

Если модель поддерживает контекст 1М то это не означает что она может эффективно работать со всем этим контекстом. Для моделей заявляющих 256к деградацию наблюдают уже от 32к-100к, для 1М уже от 100к-200к. Так что если брать окно эффективности, то 20к это 10-20%.

Вышел локальный ИИ-агент для смартфонов: LFM2.5-8B-A1B обходит модели вчетверо больше

rodial 31 мая в 18:01

Жду того момента когда уже сделают модель которая вообще не будет иметь энциклопедических знаний сама по себе (только общие поверхностные знания) но будет рассуждать максимально хорошо и уметь запрашивать знания из внешних подключаемых источников.

...а если не знает и не может получить по запросу будет говорить "не имею соответствующих баз знаний" а не придумывать дичь

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству

rodial 28 мая в 21:36

Gemini затачивается в том числе под поиск и в этом 3.5 вполне хороша, если предоставить ей возможность гуглить то и результат скорее всего будет иной.

Cerebras ускорила 1 трлн модель kimi K2.6 до тысяча т/sec

rodial 28 мая в 19:49

На openrouter в данный момент показывает 32tps

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

rodial 28 мая в 11:46

Обрезку словаря пробовали? В теории если оставить только пятерку основных языков и потом дообучать на русском то должно получиться лучше для ру бенча. Но это из тыканья пальцем в небо, в этих условиях наверное больше навредит, просто смотрю эту тему сейчас.

Возможно сработает подмешивание исходных данных на которых модель обучалась(или схожих) к вашим чтобы уменьшить размытие.

Как я строил ИИ-стартап, или Новые архитектурные риски 2026

rodial 25 мая в 12:27

Я конечно понимаю что это MVP, но в текущее время для хоть какой-то гарантии стабильной работы серверов "вне" должно быть несколько, туннелей к этим серверам должно быть несколько с разными протоколами, хотя бы один из этих серверов должен быть в "дружественной" стране ... настроить маршрутизацию между этим всем и не сойти с ума.

NVIDIA ускорила языковую модель в 4 раза: вышла Nemotron-Labs Diffusion

rodial 24 мая в 16:17

Я так понимаю новшество не в моделях(не совсем в моделях), а в алгоритме. Интересно когда добавят в llama.cpp. Хотя это чем-то похоже на MTP

Мессенджер Ласточка. Нас не пустили в Rustore

rodial 23 мая в 13:35

Два ключевых документа, которые нам требовались:

Это можно сказать было самое простое. Что на счёт СОРМ-3?

Спустя 5 лет и $5 миллионов: почему создание нового языка для веб-разработки оказалось ошибкой

rodial 23 мая в 08:30

создан чтобы умирать

Японские военные начали использовать картонные дроны самолётного типа

rodial 4 мая в 19:45

Почему картон, а не ячеистый поликарбонат?

Структура похожа, жесткость сравнимая.

Обработанный влагозащитой картон весить будет примерно также.

Доступность меньше, но сравнимая, в случае полного коллапса - можно разобрать теплицы.

Также режется канцелярским ножом.

Зато шанс размокнуть у поликарбоната нулевой, а картон будет набирать вес и терять прочность просто находясь во влажном воздухе. Можно взять даже прозрачный для визуальной маскировки.

...но вообще конечно пеноплекс и скотч

Второй мозг строят все. Но большинство — не для себя

rodial 4 мая в 14:07

Я пытаюсь сделать что-то похожее, сейчас дорабатываю ( и перерабатываю и переписываю ...) базу на которой будет построено. И до сих пор не до конца представляю во что это выльется в итоге, комбайн из всего.

Ответы на вопросы:

И для себя и для агента, если получится, на последнем этапе предполагается хранение информации в максимально раздробленном виде и отдельные представления (сборка в читаемый вид) для агента и для себя.
-
Если монетизация когда-нибудь и будет то точно не в том виде в котором продукт создаётся, или только отдельные части или доработка для бизнеса.

Я думал, что просто не могу найти себя — пока не разобрался, как на самом деле работает СДВГ

rodial 1 мая в 16:08

Попробовал лития оротат 5мг через день, чисто субъективно - получше стало. Номинально это бад, по действию - должен просто слегка приглушать нейронный шум. Естественно лучше сначала проконсультируйтесь с врачом.

Голосовой ввод на русско-английском в 2026: WisprFlow, Handy, OpenWhispr, GigaAM v3 — для диктовки нейросетям и кода

rodial 1 мая в 15:55

Попробовал сейчас VibeVoice-ASR и он показался мне отличным даже с Q4, пунктуация есть, разпознал даже моё аудио на котором whisper был не точен.

Голосовой ввод на русско-английском в 2026: WisprFlow, Handy, OpenWhispr, GigaAM v3 — для диктовки нейросетям и кода

rodial 25 апр в 06:32

https://github.com/voicekit-team/T-one

https://huggingface.co/t-tech/T-one

https://habr.com/ru/companies/tbank/articles/929850/

Голосовой ввод на русско-английском в 2026: WisprFlow, Handy, OpenWhispr, GigaAM v3 — для диктовки нейросетям и кода

rodial 24 апр в 15:26

А чего T-one не включили в сравнение?

Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

rodial 14 апр в 17:19

CJK-символы в русском тексте

Я заметил такое чаще случается из-за использования квантизации (которая часто используется в моделях на openrouter для экономии). Квантизация распространяется и на все слои и из-за этого появляются артефакты. Есть довольно простые способы уменьшить/избежать этого эффекта если использовать выборочную квантизацию без затрагивания важных слоев, такое используется в unsloth

NAS, который стал сервером: почему я отказался от DIY и купил Minisforum

rodial 14 апр в 16:44

Есть внешние устройства для этого, хотя возможностей и поменьше, KVM over IP вроде общее обозначение

2 3 ...

7 8