Комментарии / Профиль dmiche / Хабр

Дмитрий Черняк@dmiche

IT-архитектор, владелец компании, философ

ПрофильСтатьи3ПостыНовостиКомментарии150

$20 в месяц на Cursor. Куда уходят токены и что с этим можно сделать

Авто стала чудо как хороша. С летом вообще не сравнить. Хотя ровно сегодня попал под какую-то более кондовую. Возможно тестят чего-то новое.

А вообще doc-first рулит. Начинать с документации. Поддерживать ее, чтобы не разъезжалась стало необременительно, а архитектурный документ нынче ценнее кода.

Цивилизация на основе контейнеров: как выйти в следующий техноуклад с помощью морских контейнеров и Майнкрафта

dmiche 9 фев в 08:28

Мысль не нова. Более того, давно есть прототипы, в т.ч., стыковка с убиранием стенок и и.п. модульные гостиницы для строителей и вахтовиков, опять же. Но, очевидно, существуют объективные тормозящие факторы для бытового внедрения. Вот их анализ был бы интересен.

Ну и ещё есть такая больная тема, как модульная унификация коммунальной инфраструктуры, без которой сантехника не заменить на ИИ.

Ну и третий момент: может оказаться, что именно контейнер при ИИ и роботах вообще не сдался, так же как уже сейчас стремительно устаревает идея фреймворков в программировании и практически загнулись бизнес модель tailwind.

Moltbot: 83 сценария использования open-source AI-агента

dmiche 4 фев в 10:03

А что за ассистент такой за полтинник, на которого Вы все время киваете?

Подскажите, как устроено подключение к тому же Вайлдберриз? Они засабмттили какого-то провайдера к Клауд скиллу?

Почему Andrej Karpathy использует SVM в 2026 году (и вам тоже стоит)

dmiche 2 фев в 10:25

Ну, там не на много подороже. В общем, идей в статье как бы две:
1) Что TF-IDF на текстах с высокой степенью формализма всё ещё рулит.
2) Что SVM позволяет мега быстро определять границу предпочтений и учится на ходе без расходов (и это не зависит от того, берём мы TF-IDF или llm embeddings - там мат. представление идентичное).

За статью спасибо - познавательно!

Почему Andrej Karpathy использует SVM в 2026 году (и вам тоже стоит)

dmiche 2 фев в 01:02

А что мешает тот же SVM напустить на эмбеддинги вместо TF-IDF? Структура та же, но вместо слов уже - смыслы.

Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

dmiche 23 янв в 10:01

Статья интересная, спасибо!

В то же время, попытку высадить эмбеддер специальным датасетом можно сравнить с попыткой высадить grep сжатым архивом: grep ищет слова (подстроки), а в архиве только буквы вперемежку.

Так и в их исследовании: эмбеддер ищет смыслы и способен справляться даже тогда, когда пересекающихся слов вообще нет, а bm25 ищет именно на комбинациях слов. Это два разных уровня. Если посмотреть на их тестовый датасет в таком ракурсе, то мы обнаружим, что там вообще всего примерно один смысл: что кому-то что-то нравится. Неудивительно, что для эмбеддера строки по смыслу слабо отличаются. И никакие мультивекторы тут не помогут.

В то же время, этот пример очень хорошо иллюстрирует, что в практике RAG - это не серебряная пуля и что нужно оценивать состав данных, а затем комбинировать инструменты.

Есть смысл избегать применения RAG практически везде, где легко справляются алгоритмы. Лёгкость алгоритмической обработки материала - прямое свидетельство конечности и относительной узости смыслового корпуса входных данных.

Выходцы из MIT создали рассуждающий ИИ для смартфонов — он занимает всего 720 МБ

dmiche 21 янв в 11:56

Прошу прощения, комментарий с телефона набирал - "собрать" - это "собрат" :)

В общем, если про Instruct-версию, то для 1.2B она, на удивление неплохо, понимает, что от неё хотят, ей не срывает крышу от повторяющихся блоков (типа вагона ссылок на страничке), при этом работает с высокой скоростью.

В итоге получается скоростной и довольно интеллектуальный саммаризатор для чтения интернет-страничек, ленты чата и прочего мусора - сильно лучше и стабильнее, чем Qwen3B по всем параметрам, кроме русского. Русский понимает хорошо, а выдаёт на четвёрочку. Но если вывод идёт потом обратно в LLM, то это как-то вообще без разницы. Зато 320-380 ток/с на 3090.

Плюс, при таком размере легче дообучать, в т.ч. на тот же русский.

А про оркестр - LFM сделала несколько мелких моделей, там и аудио и видео и всякое. Они их позиционируют для мобильных приложений, но в сегодняшней реальности их можно напихать в 3060 все одновременно. И получится туповатый, но деятельный локальный комбайн с низкой задержкой. А это уже уровень обычного игрового ноута.

Fine-tuning Qwen-8B под проприетарный синтаксис (CADINP) на одной RTX 3090: опыт инженера-конструктора

dmiche 21 янв в 06:22

Хорошая работа, хорошая статья! Плюсовать не дают, но спасибо скажу.

Есть вопрос: вот пример рассуждения про проверку оси - чем он обеспечен в датасете?

Есть образцы рассуждений прямо по данному вопросу?

Есть образцы общих/отвлеченных рассуждений плюс эта логика акцентирована в решениях?

Или как?

Сколько образцов нужно на такой кейс?

Как их готовили? Синтетика старшей моделью на комментировании образцов кода?

И ещё аналогичный вопрос по обучению синтаксису: что ей нужно показать, чтобы она его начала понимать строго?

К сожалению в сети полно хороших объяснялок, как учить, но про подготовку датасета все рассказывают как художники про рисование совы: рисуем овал, ещё овал... И что дальше здесь пёрышки докрашиваем :)

Если бы Вы немного рассказали по этой теме, был бы благодарен.

Выходцы из MIT создали рассуждающий ИИ для смартфонов — он занимает всего 720 МБ

dmiche 20 янв в 21:10

Думающую не пробовал, а вот её Instruct собрать - прямо агонь! Там у них очень хороший оркестр выходит.

Embedder для ИТ-крестьянина

dmiche 14 янв в 18:31

Интриги, месье

Embedder для ИТ-крестьянина

dmiche 13 янв в 15:30

Перед этим стоит попробовать просто увеличить число чанков в выдаче для прода. Этот тест проводился на 5 чанков выдачи. Хороший объём для теста. Если сделать 10-25, то охват будет больше. Но и мусора больше, и токенов тоже и там уже реранкинг в помощь.

А ансамблить есть смысл с bm25. Он сам по себе, тупее, но быстрый и "альтернативно мыслящий" и вот он даст несколько процентиков к охвату.

Embedder для ИТ-крестьянина

dmiche 13 янв в 13:48

У квенов - один общий. Не такой, как у других

Embedder для ИТ-крестьянина

dmiche 13 янв в 13:20

Тестировались три модели серии Qwen3-Embedding: 8B, 4B и 0.6B. По идее, чем меньше параметров, тем менее точным должен быть поиск. Но технически выгодее брать более слабую модель, потому что гораздо быстрее работает.
И вот на том тестсете, что я гонял, разницы, можно сказать, что нет.

Embedder для ИТ-крестьянина

dmiche 13 янв в 08:51

Да, всё так.

Upgrade: OpenSpec и Beads в Cursor

dmiche 7 янв в 16:02

Ну, это весьма внятный обзор. Не знаю, как другие. Спасибо автору. Но к вопросу присоединяюсь.

Кто настоящий герой наших книг? Спросим у ИИ

dmiche 3 янв в 15:46

Ну... Винни-Пух поглубже, чем ностальгическая утопия. Все игрушки Кристофера Робина - это частички его внутреннего мира, его характера. Довольно занятная декомпозиция.

Иерархия vs Массовые изобретатели

dmiche 7 дек 2025 в 11:19

Тезис о жестокой конкуренции ошибочен. При высоком уровне случайности никогда неизвестно, кто найдёт ответ - возможно, что самый слабый. Поэтому если при каждой победе сжирать другого, что шансы популяции будут таять, а они должны расти. Более того, при высокой случайности, у агентов и так повышенный риск убиться - не о людей, а о среду. Поэтому, наоборот - милосердие, помощь даже без запроса, как при дружбе.

Иерархия vs Массовые изобретатели

dmiche 7 дек 2025 в 08:59

Каковы параметры мира, в которых распределённая сеть изобретателей выигрывает у иерархии?

В рамках Теории социальной специализации была предложена деятельностная формулировка Теории игр. Суть там сводится к тому, что существуют параметры среды, которые диктуют выигрышную деятельность, а выигрышная деятельность диктует структуру отношений и там не шибко богатое и вполне однозначное соответствие:

Когда условия среды непредсказуемы и в каждом другом месте может оказаться всё по другому, приоритет получают агенты с высокой степенью свободы, адаптивностью, изобретательностью. Основной деятельностью является поиск. Тем не менее, на фоне личной свободы, требованием для выживания популяции является наличие совести (т.е., приоритетной заботы о ресурсах других) и взаимовыручке в ситуациях, создающих риск для жизни другого агента (как он живёт - его дело, но выжить и коптить дальше - должен). Если будете моделировать, то ровно к этому и придёте. Многие инженерные среды склонны к этой структуре.
Когда условия среды частично предсказуемы, приоритет получают сообщества, которые больше знают универсальных законов - те, кто сможет освоить сбор, накопление, обработку и передачу знаний. Монастыри, университеты, секты, тайные общества. Ценность знания, оберегание знания, передача знания. Причём, основной социальный метод оберегания - не столько "не скажу" (хотя значение посвящения в члены сообщества тоже не стоит игнорировать), сколько максимальное усложнение и запутывание подачи, чтобы со средним умом и без знания "ключей" было попросту не разобраться. Примечательно, что, не смотря на инженерную тематику, Хабр является площадкой второго типа, а не первого... точнее являлся, когда его сделали, сейчас инструменты остались второго типа, а сообщество, всё больше, третьего, что, в целом, следует за эволюцией российской айтихи.
Когда большинство, или все условия среды предсказуемы, приоритет получают сообщества, где лучше всего фигачат по правилам. Трудолюбие, организационные таланы, понимание цикического характера процессов. Естественный критерий оценки: кто больше наработал, тот и лучше работал, потому что тяжело работать и нифига не заработать в среде, где все правила известны - это какая-то ерунда. Такова протестантская этика, капитализм и либеральные ценности.
Когда возможно менять условия (например, характер среды, или общественные законы), приоритет получают общества, которые способны собраться большей шоблой, чтобы их поменять в свою пользу. Это иерархии, потому что они лучше всего масштабируются. Здесь рулит устав и делегирование (воспринимайте это как механики агентов). Основной принцип - разделение свой-чужой, что чётенько выведет вас на физику плазмы (а то, что Вы хотите промоделировать - это физика воды с диполями и слабыми водородными связями).

Если же говорить о популяции в целом, то она всегда специализируется по этим четырём нишам (агенты одного типа практически не воспринимают правила ниши другого типа) и Природа постоянно поддерживает это разнообразие, потому что условия в любой момент могут поменяться. И всегда кто-то имеет в моменте приоритет, а кто-то должен понимать, как ему найти свою хлебную нишу в мире, основные правила которого легли не очень удачно.

В общем, первый тип получает приоритет на переднем крае и во всяких непригодных для жизни неудобьях, в которые не добираются те, кто имеет более организованные модели. Цена свободы.

Анализ возможности применения модели OpenThinker2-32B в автоматизированных системах прогнозируемого обслуживания

dmiche 25 ноя 2025 в 21:40

Почему именно эта модель в ряду других опенсорсных?

Выглядит как отдельное описание некого концепта применения ИИ в интегрированных системах анализа и принятия решений и отдельное нахлабучивание на неё конкретной модели, без обоснования ключевых метрик по сравненияю с qwen2.5-coder, qwen3, а также моделей 70B+. Всё-таки говорим о применении в крупном, дорогом производстве, есть ли смысл гнаться за модельками, квантовка которых должна умещаться в 24Gb?

Хотя для массового потребления, да, удачный формат.

Пользовательский опыт остается заложником предубеждений. MAX и Telegram

dmiche 16 ноя 2025 в 08:00

Ничёсе вас тут потрепали. Да и меня за одно.

Вопрос по теме: а МАКСовцы собираются юридически значимое голосование делать?

Ну, т.е., чтобы голоса как подписи можно было засчитывать. В идеале, оформлять просто как вставляемую голосовалку, как везде.

2 3 ...

7 8