Comments / Profile of Amareis / Habr

Иван Плесских@Amareis

Пользователь

0,8

Rating

Subscribers

ProfileArticles7PostsNews1Comments283

Целая прорва связных списков, чтобы выучить Rust

Amareis Jun 19 at 02:52

Я бы кстати рекомендовал в статьи сами это оглавление докинуть, потому что сейчас это оглавление все равно придется искать в профиле автора.

Moonshot AI выпустили Kimi-K2.7-Code

Amareis Jun 13 at 13:56

Да, дает.

Moonshot AI выпустили Kimi-K2.7-Code

Amareis Jun 12 at 15:48

У них большое преимущество - это куча всяких сервисов и приложение десктопное, то есть экосистема (а не просто инференс как у того же дипсика). Есть даже опенклоу из коробки, ну и всякие deep research и прочее. С русским вполне дружит. С минимаксом не сравнивал.

Moonshot AI выпустили Kimi-K2.7-Code

Amareis Jun 12 at 13:49

О, спасибо - перезапустил kimi code и сразу же подцепилось, видно что действительно меньше стал думать по кругу.

Магия чепухи: как «бессмысленные» инструкции заставляют нейросети работать лучше

Amareis Jun 8 at 10:08

Может куча абстрактных токенов просто дает больше пространства для аттеншена и компьюта?)

Самый старый кирпич трансформера наконец переизобрели. DeepSeek взял матрицу из 1967 года

Amareis Jun 6 at 08:45

Все же AttnRes от кими выглядит как-то поэлегантней, да и результаты заяляются посильнее.

Производитель экшен-камер GoPro оказался на грани прекращения деятельности

Amareis Jun 3 at 08:56

Для хранения нескольких (а то и многих) часов видео в высоком качестве же.

-1

Экономия токенов на grep: индекс кода для AI-агентов на Rust + tree-sitter + SQLite + MCP

Amareis Jun 2 at 13:50

Может хоть приведете пример что там в бд то хранится и что агенты запрашивают/получают?..

Как я запускал Qwen 3.5 на Mac: бенчмарк 8 локальных LLM-серверов. Кто быстрее?

Amareis Jun 1 at 12:16

Спасибо за статью, очень пригодилась! По поводу higgs - не знаю когда добавили, может и после написания статьи уже, но загрузка qwen 3.5 и dense и moe там уже есть, единственное что без вижена, так что пришлось самому довайбкодить основываясь на mlx-vlm.

Claude Code научился запускать сотни ИИ-агентов — и за дни закрывать задачи, на которые раньше уходил квартал

Amareis May 29 at 07:51

Это они получается просто сделали agent swarm из того же kimi code?

Тебя уволят, и ничего не сломается. Возможно, станет даже лучше

Amareis May 21 at 08:06

Вот последние абзацы интересней всего - я еще в прошлом году, как следует распробовав наконец агентскую разработку, начал прикидывать вероятность того что еще через 3-5 лет вся индустрия разработки необратимо поменяется.

Если есть, условно, 30% вероятность того что программистов на зарплате нужно будет в 2 раза меньше - это уже мощный риск который хеджировать надо прямо сейчас. И если не хочется менять сферу и участвовать в крысиных гонках на выживание тоже желания нет - действительно стоит смотреть в сторону запуска своих продуктов, благо ИИ тут как раз сильно помогает.

Прекрасно понимаю что далеко не у всех (и, вполне вероятно, у меня - тоже) есть необходимые для этого продуктово-маркетинговые скиллы, но что еще тут поделаешь?

Почему время замедляется при ускорении? Объяснение, которое вы нигде не найдёте

Amareis Apr 22 at 18:38

Но кстати вопрос про тангенциальный импульс остается открытым - получается все же скорость (пере)излучающего тела действительно меняет направление полета фотона, иначе никак не получится сохранить работу световых часов на скоростях в условно 99.99C - когда метровой длины часы успеют "улететь" из под фотона за один тик.

И это вот как раз открывает интересный вопрос про скорость движения света в одну сторону.

В том же сетапе когда свет в часах летает по оси движения ракеты - для внешнего наблюдателя (которому гипотетически ничего не мешает наблюдать всю эту картину со стороны) свет по направлению движения ракеты до одного зеркала часов летит в сотню раз быстрее чем в другую сторону. При этом в перпендикулярных часах он в обе стороны летит одинаковое количество времени, в терминах внешнего наблюдателя.

То есть если мы снаружи отслеживаем каждый пинг-понг фотона в обеих часах - мы четко видим что "вдоль" часы тикают гораздо неравномерней чем часы "поперек" и можем спокойно вычислить скорость движения ракеты на основе этой неравномерности и даже отправить эту информацию обратно на ракету.

Собственно, вопрос такой - а каким вообще образом инвариантность между этими двумя часами сохранится для наблюдателя на ракете? Я подозреваю конечно что здесь должны выскочить преобразования Лоренца, но чисто физически - какие должны работать силы/законы чтобы нельзя было заметить что одни часы тикают равномерно (тик-----так-----тик), а другие - как (тик-так---------тик)?

Скорость передачи информации по разным направлениям искажается так, чтобы ты не мог заметить эту неравномерность? Но ведь внутренний наблюдатель может стоять в такой точке что информация от часов приходит к нему с одного направления...

В общем теория говорит что в таком сетапе для тебя разницы не будет стоят ли часы поперек или вдоль, но вот практически представить как это работать должно - не получается совсем.

Как я экономлю 80% контекста нейросетей при работе с логами

Amareis Apr 22 at 14:05

ВАЖНО - я говорю именно про обучение модели с нуля, не про скармливание бинарных данных в обычную текстовую модель.

А так, надо понимать что текст - точно такие же бинарные данные для модели, просто набор абстрактных чисел (токенов) между которыми есть какие-то взаимосязи. И вот ллм в процессе обучения пытается найти взаимосвязи между этими числами и успешно находит, после чего может предсказывать какое число должно быть следующим.

У текста есть некоторое преимущество перед бинарными данными только в том что это неструктурированные данные и соответственно можно совершать небольшие ошибки и потом их корректировать через "ой, в смысле другое имел в виду", при этом ошибка в следующем байте компрессии может быть куда более серьезной проблемой.

Но учитывая насколько хорошо модели умеют соблюдать локальную структуру токенов (они по сути не совершают ошибок в структуре предложений/текстов, а это воообще будто бы более сложная задача чем соблюдать well defined структуру архивов) - скорее всего этому они прекрасно научились бы тоже.

Тут правда возникает вопрос - насколько этот дополнительный слой обфускации помешает моделям корректно понимать собственно смысл текста, ведь получается модели надо сначала перевести архив в текст на определенном языке, а потом текст - в его "смысл", общий между разными языками (то что все нейронки в итоге приходят к некоторому универсальному языку для внутреннего мышления - факт вроде бы даже доказанный).

Но тут как раз и получается что компрессия должна быть сразу в этот внутренний язык моделей, по факту - это будет внешняя алгоритмическая замена огромному количеству слоев модели, которые отвечают не за абстрактные операции, а конкретно за перевод текста в абстрактные понятия, которые там потом между собой как-то перемножаются и потом через кучу слоев снова превращаются в одно число на выходе.

Но если так не упарываться, то ничего не мешает модель и на выводе zlib с каким-то разумным размером блока и хорошим словарем - модели то все равно какие взаимосвязи предсказывать.

Как я экономлю 80% контекста нейросетей при работе с логами

Amareis Apr 22 at 08:41

Вот кстати неиронично кажется мне что нейросетки можно обучить на выходе любого потокового архиватора с относительно небольшим окном (чтобы аттеншен сильно не страдал)

Как я экономлю 80% контекста нейросетей при работе с логами

Amareis Apr 21 at 13:11

Индустрия понемногу переизобретает компрессию данных для более дешевой их обработки...)

Claude от Anthropic взлетает среди платящих пользователей

Amareis Mar 29 at 13:35

Glm 5.1 вышел который заявляется на уровне клода вполне.

Дикий мир литературы в 2026 году

Amareis Mar 29 at 09:50

С точки зрения интеллекта худлит должен предоставлять не только сюжет, а еще и разные возможные жизненные (и не очень) ситуации, то как в них можно действовать и какие возможны последствия. Для этого конечно автор должен быть сам с жизненным опытом.

Забыть про Backprop: Как я собрал «Термодинамический Мозг» с фазой сна и митозом, который влезет в Arduino

Amareis Feb 25 at 13:15

Лучше тогда на расте и писать, он в wasm замечательно компилируется и в браузере запускается. Десктопная версия с максимальной оптимизацией в таком случае прилагается в подарок.

Как я написал ASR-движок на Rust: от разочарования в одной модели до мульти-модельной архитектуры

Amareis Feb 12 at 12:08

Silero модели не пробовали? У них и STT и TTS есть, ну и русский один из целевых языков.

О том как подключить Open WebUI и Cline к Telegram Cocoon

Amareis Feb 2 at 08:51

Кстати, а насчет gonka.ai - их протокол в основе кокона лежит - не смотрели? Там гораздо больше карт и моделей вроде должно быть? @raiym

2 3 ...

14 15