Обновить
4

Пользователь

0,4
Рейтинг
2
Подписчики
Отправить сообщение

Переходите на Cursor с подходящей геолокацией, там пока работает.

В целом согласен, только с некоторыми плясками с бубном потолок на м3 ультра расширяется до 4 х 512Гб в rdma через thunderbolt 5. Такой сетап позволяет гонять все актуальные sota llm модели в mxfp8 квантизации на текущий день. Префилл слегка тормознутый, генерация в районе 20-40 токенов в секунду, параллельный батчинг тоже возможен со своими ограничениями.

Из минусов - 512гб модель снята с производства, софт чтобы это запустить в кластере имеет свои приколы, но в целом решение рабочее.

Это новая дисциплина, сродни запуску doom на калькуляторах и кофеварках, только результат несколько, ммм... иной =)

Для истинных гурманов не хватает нескольких иллюстраций с отшакаленными современными сайтами.
Креатив огонь =)

Есть документ по деталям интерфейса и программирования похожей серии, возможно другого поколения - https://www.smh-tech.com/wp-content/uploads/2021/05/DC10958.pdf
В целом, это специализированный чип для бесключевого доступа, спеки под NDA, теоретически можно попытаться считать прошивку, однако учитывая что это крупный производитель - я бы не питал иллюзий насчет простых путей его взлома или исследования.

Дать ии возможность заруинить прод при отражении атаки это конечно идея покруче вайбкодинга без верификации и код ревью.

Но в целом, котятки, 6-12 месяцев пока к распиаренному mythos подтянутся китайские модели, потом еще какое-то время железячники догонят, - и тем, кто не шевелился заранее будет надежной защитой выключить питание, ну или хотябы внешнюю сеть.

Потыкав палкой в операционную структуру компании и открытые финансовые данные за 2025 год получаем, что проект на 200млн. руб. финансирования, убыточный, без понятной декларируемой модели монетизации. Имеет множество признаков аффилированности с ВК.
Подозреваю, что от реакции AppStore и остальных по навешиванию ярлыков spyware, у руководства проекта знатно припекает и возможна постановка вопроса о закрытии этой богадельни.

У антропиков вероятно пошла какая-то внутренняя движуха по усилению комплаенса - на этой неделе использование их моделей впервые начало ограничиваться в Cursor с РФ айпи. Может расчищают нагрузку для mythos?

ощущаю себя лишним элементом в этом разговоре двух llm между собой

Отличное описание того, как я начинал в это вкатываться в момент выхода дипсика с год назад - четкие краткие указания, небольшой скоуп и радиус изменений. А потом завертелось все дальше и глубже, по мере выхода новых моделей:

  • изучи этот и связанные модули, добавь аналогичную обработку для случая ***

  • напиши тесты для модуля

  • изучи описание архитектуры микросервиса, дай анализ сильных и слабых сторон

  • по списку задач разработай и согласуй со мной архитектуру, затем приступай к пошаговой реализации, включая модульные и интеграционные тесты, пайплайны ci/cd согласно документированных подходов

  • посмотри ошибки в логах деплоя ci/cd проекта ххх на gitlab сервере, логи на серверах деплоя и выясни причины проблем, предложи их архитектурно грамотное решение

  • вот тебе несколько mcp серверов к api бектестирования и хранения кода, документация движка, проанализируй и дай варианты улучшения этого пучка торговых стратегий

Тоже в непонятках, пришлось привлечь клода в качестве пояснительной бригады:

Что такое anti-distill

Это Skill для AI-ассистентов (Claude Code, OpenClaw), который решает конкретную проблему: когда компания просит сотрудника задокументировать свой опыт в виде AI Skill-файла, по сути происходит «дистилляция» (蒸馏) — извлечение экспертных знаний из человека и перевод их в форму, которая делает этого человека заменяемым.

anti-distill — инструмент «анти-дистилляции», который «очищает» такой Skill-файл: на выходе получается документ, который выглядит полноценно и профессионально, но из которого вырезана вся реально ценная суть.

Идея и реализация огонь. Однако количество боли и костылей для решения проблем производительности java намекает, что это был архитектурно спорный выбор.

Концепция в целом хороша, но полностью упущен раздел верификации результатов и защиты от ошибок разного рода - например, когда агент из-за пробелов в условии задачи или нарушения инструкции "творит немного дичи". Недавний пример - публикация агентом исходников claude code.

Совет полезный, но видел две его крайности:

1) мейнтейнеры игнорируют серьезные баги или PR с решениями;

2) мейнтейнеров заваливают мелкими проблемами или псевдобагами-нейрослопом, и они пытаются уточнить у автора wtf, а автор - молчок.

Так что опыт и знания тех, кто у руля ии выходит на первый план.

Glm-5 в 8bit квантовании неплохо работает на кластере из mac studio под управлением exo. Жду публикацию весов 5.1 чтобы сравнить скорость и качество.

Зачастую анализ прошивки от устройства, если удается ее найти, дает еще массу векторов для атаки и закрепления - например, hardcoded пароли которые "чисто случайно" оказываются еще и паролями от встроенного root аккаунта.
А весь доступный веб-интерфейс и api у устройства при тщательном тестировании на типовые уязвимости добавляет еще тележку дыр.
Вообще у меня порой возникает ощущение, что "дырявость" китайских устройств это не столько недостаток квалификации разработчиков, сколько осознанная политика - чем больше дырявых устройств по миру, тем проще через них получать доступ, собирать информацию.

А почему кроме DeepSeek не оценивались другие актуальные китайские модели - GLM-4.7 (который сейчас уже 5), MiniMax ?

То, что вы описываете - уже рабочая система. По сути те же принципы: контекст персистентный, структурированный и рядом с чатом. Разница только в масштабе.

Для одного проекта ваш подход вполне достаточен. Пара мыслей, что можно добавить без усложнения:

  1. Фиксировать отвергнутые решения - буквально пара строк в контексте: "рассматривали X, не подошло потому что Y". Это те же ADR, но в минимальной форме. Экономит повторные обсуждения.

  2. Хранить доки в репозитории (хоть в docs/), а не отдельно — тогда git сохраняет историю, и ничего не потеряется.

Workbench из статьи - это то, во что такой подход естественно вырастает, когда проектов становится несколько и контекст перестаёт помещаться в три документа. Но начинать с трёх документов - абсолютно правильно.

Спасибо! ADR - штука, которая кажется избыточной пока не попробуешь, а потом не понимаешь как без них жил.

Если начнёте внедрять - необязательно документировать всё с нуля. Ретроспективные ADR по 3-5 ключевым развилкам проекта уже дают заметный эффект.

Правильное решение описанной проблемы лежит в смещении фокуса с "передать в контексте как можно больше в меньшем объеме" к "организовать и структурировать связанную документацию". У себя решил дополнительным кросс-проектным репозиторием с документацией, правилами, планами. Подключается к кодовому репо через cursor workspace файл. В ходе реализации ии модель видит и код, и связанные структурированные артефакты разработки, читает только нужные и не переполняет окно контекста лишней информацией, не изучает каждый раз кодовую базу детально, а находит большинство ответов в документации.

1

Информация

В рейтинге
2 713-й
Зарегистрирован
Активность

Специализация

Фулстек разработчик