есть подозрение, что из-за ограничения в compute они не стали делать 3.6 122B A10B, сделали только часть моделей, и пошли клепать версию 3.7. Так что получается что связан. Но 3.7 27b обещали, будем ждать
вот только он не является дообученным deepseek, даже близко не находится. был бы просто дообученный deepseek - в стиле GLM5.1 это было бы величайшее достижение для ИИ в РФ.
надо удалить содержание папки localapp/antigravity и поставить именно antigravity 2 ide заново, мне помогло. Путь может быть не верен, делайте бэкапы проверяйте информацию.
или вот так
Paste this directory path exactly and hit Enter: %LOCALAPPDATA%\Programs\Antigravity\
Open the resources folder.
Find the file named app.asar (this is the new 2.0 Agent runtime). Right-click it, rename it, and change it to: app.asar.bak
Go back up one directory level to the main folder and look for Antigravity IDE.exe. Right-click it and choose Run as administrator.
Хотя на сегодня все модели обучались на одних и тех же данных
Но вы же не сможете подтвердить данное утверждение. И к чему тогда мне апеллировать? Вы даже не смогли разобраться в посыле моего совета - а он очень простой, если человек не умеет работать с LLM, то лучше всего кинуть первые 1000 промптов на дешевой, но достаточно качественной модели. И моя быстрая оценка текущих моделей, с которыми человек может столкнуться. Вы ещё мои комментарии с двача вытащите или оверлокерс 2005 года, наверняка сделают вашу позицию - "срочно надо обучить узкую модель под каждую отдельную задачу" - намного сильнее. Хотя все это звучит как обида, ведь проклятые капиталисты не хотят обучать модель под ваш конкретный кейс.
Надо объяснять что обучать модель под каждую конкретную задачу (или язык, как вы обобщаете) - неверный подход?
Я то думал поговорим об сложностях фильтрации мусорного контекста, и какая модель лучше с этим справляется здесь и сейчас, а тут вот оно как.
Но проблемы с данными при обучении языкам программирования сейчас как раз нет
с точностью до наоборот. Вы исходите из неверных посылок, пытаетесь предложить решения для проблем которых нет, создавая новые. Дело ваше, но читать одни и те же аргументы по кругу 5 раз - утомительно :/
Я просто не вижу как уменьшение количества датасетов улучшит качество модели. MoE не дает такую специализацию как хочется конкретно вам, но тут ничего удивительного. Ошибки близко вероятных токенов решаются внимание - коррекцией позиции или перерасчета этих токенов на уровне активации.
Интересно ваше мнение по поводу A2A (agent to agent) протокола, ведь по сути вопрос заключается именно в реализации подобной штуке на каждом слое бизнес адаптации?
У меня есть личная потребность в сервисе, идея и понимание о том как он должен работать. Хочу начать с того, что нарисую в Фигме пользовательские экраны.
Это уже отличный промпт, вот с него и начните. Только не с чатгпт, лучше опус или (бесплатный)дипсик на этапе планирования. Дипсик хорош в планировщике, но скриншоты ваши пока не примет, опус съест все, но дорого, квен съест бесплатно, но предложит ерунды, гпт в целом специфичен для фронта.
Как правильно оформить свою идею и мысли в ТЗ для ИИ, чтобы получить максимальной рабочий результат?
Вот прям так, можно прямой цитатой, можно добавить ещё с десяток слов, они обычно появляются при переписывании промптов.
Как проще всегда закрыть базовые дыры в знании разработки - я понятия не имею ничего про терминал, среду разработки, да и весь процесс «под капотом» для меня это темный лес.
Аналогично, но вместо как я предпочитаю использовать фразу " мне нужны...знания в разработке...".
Какие сервисы сейчас актуальны для самостоятельной разработки, с учетом того что бекграунда в этом у меня нет вообще?
Я бы рекомендовал VScode + Codex, либо Cline, там с DeepSeek V4lite бесплатный, V4pro тоже стоит копейки, прям вот 10 баксов от силы на месяц хватит, но с бесплатным вам вообще только кнопки нажимать надо. VScode - графический интерфейс проще для восприятия, видео на ютубе где что куда нажимать и погнали. А дальше уже качество вашего продукта зависит от уровня вашей экспертизы, LLM - только инструмент
Насколько сейчас реально из России пользоваться сервисами из п.2?
Реально все, но забанить могут с любой стороны. Официальные российские гугл-аккаунты в зоне риска. Минималка сейчас xboxdns + kvn access.
если это вопрос не автору, то самые интересные сейчас - qwen 3.6 27b, легенда этой весны. если допилят, то в mtp. Если поместиться, то Qwen 3.5 122B (10B active), особенно когда выйдет обновленная 3.6 версия. Если нет - reap версии, типа Nemotron-3-Super-64B-A12B-Math-REAP или Qwen3.5-REAP-97B-A10B, из вполне может хватить для агентских задач, но кодить с ними может быть опасно, мало ли где произойдет затуп в ответственный момент.
очень бы хотелось все таки обсудить проблему, но вы зачем то обсуждаете свое видение невозможности декомпозиции исходя из вам только известных критериев. И предлагаете воскресную угадайку. Угадайка не интересна, проблема у вас типичная, но если вам просто хочется отстаивать позицию нейроскептиков - можете считать что вам это удалось.
Но вы же могли просто написать: проблема в реализации ERP решения одним запросом в sql, а не строить абракадабру. Но тогда бы оказалось, что в самой проблеме и кроется решение.
Задачка то стандартная, хоть и сложная, но вся её сложность кроется в валидации промежуточных данных
"надо все требования прописать один раз в правилах проекта". Какая же это декомпозиция, когда все требования прописаны в одном месте?
Но ведь я не писал что правила должны быть прописаны в одном месте.
Вы сами, лично, хоть раз в жизни решали вопрос расчета многопередельной себестоимости производства?
Только сдавал штук 5 экзаменов по этой теме, но сам не ногой, все уже порешено до нас.
Это не та задача, которую можно собрать по частям.
C точки зрения разработчика ПО эта фраза не имеет смысла, но все пробелы я вам не заполню.
разбить все на блоки, потом на функции и скармливать ИИ для написания отдельные функции, лучше всего чистые, это я могу.
Ну так да. И модель это может, можете ей назначить сперва этот этап декомпозиции.
А что бы ИИ их не забыл и не потерял, их нужно повторять из раза в раз
Пропишите один раз в правилах проекта, и лучше сразу накройте бескомпромиссными тестами на предварительных данных
Правда потом, все это придется самому собирать в общий модуль.
Не вижу о какой общем модуле идет речь. Экономика отдельно, логистика отдельно, производство отдельно, по любому запросу собирается в результирующую таблицу по текущим данным, все что вам нужно - валидировать коэффиценты исходя из внешних данных меняющегося законодательства.
Мы все ещё про разработку ПО или про то что волшебный агент по волшебному промпту должен рассчитать все и сходу? У топ менеджера, который всех выгнал все эти задачи были уже декомпозированы, поэтому переназначение этих этапов на модель не является сложностью. А у вас первая реакция на декомпозцию - "зачем?" Я тут не знаю как ответить. Ну не декомпозируйте, подождите пару лет, там новые модели справятся и с вашей задачей сходу. Хотя и сейчас опус справится, тут скорее вопрос валидации встанет.
есть подозрение, что из-за ограничения в compute они не стали делать 3.6 122B A10B, сделали только часть моделей, и пошли клепать версию 3.7. Так что получается что связан. Но 3.7 27b обещали, будем ждать
так уже, все CEO говорят о (мощностях) compute как о главном показателе
вы не отличаете модель и архитектуру?
https://habr.com/ru/companies/sberbank/articles/1014146/#comment_29720506
вот только он не является дообученным deepseek, даже близко не находится.
был бы просто дообученный deepseek - в стиле GLM5.1 это было бы величайшее достижение для ИИ в РФ.
надо удалить содержание папки localapp/antigravity и поставить именно antigravity 2 ide заново, мне помогло. Путь может быть не верен, делайте бэкапы проверяйте информацию.
или вот так
Paste this directory path exactly and hit Enter:
%LOCALAPPDATA%\Programs\Antigravity\Open the
resourcesfolder.Find the file named
app.asar(this is the new 2.0 Agent runtime). Right-click it, rename it, and change it to:app.asar.bakGo back up one directory level to the main folder and look for
Antigravity IDE.exe. Right-click it and choose Run as administrator.Но вы же не сможете подтвердить данное утверждение.
И к чему тогда мне апеллировать?
Вы даже не смогли разобраться в посыле моего совета - а он очень простой, если человек не умеет работать с LLM, то лучше всего кинуть первые 1000 промптов на дешевой, но достаточно качественной модели. И моя быстрая оценка текущих моделей, с которыми человек может столкнуться.
Вы ещё мои комментарии с двача вытащите или оверлокерс 2005 года, наверняка сделают вашу позицию - "срочно надо обучить узкую модель под каждую отдельную задачу" - намного сильнее. Хотя все это звучит как обида, ведь проклятые капиталисты не хотят обучать модель под ваш конкретный кейс.
Надо объяснять что обучать модель под каждую конкретную задачу (или язык, как вы обобщаете) - неверный подход?
Я то думал поговорим об сложностях фильтрации мусорного контекста, и какая модель лучше с этим справляется здесь и сейчас, а тут вот оно как.
с точностью до наоборот. Вы исходите из неверных посылок, пытаетесь предложить решения для проблем которых нет, создавая новые. Дело ваше, но читать одни и те же аргументы по кругу 5 раз - утомительно :/
Я просто не вижу как уменьшение количества датасетов улучшит качество модели. MoE не дает такую специализацию как хочется конкретно вам, но тут ничего удивительного. Ошибки близко вероятных токенов решаются внимание - коррекцией позиции или перерасчета этих токенов на уровне активации.
в мире без RL ваше утверждение было бы почти верным
уровень дискуссии на хабре
поставьте автосчетчик на такты и байты и доверьте все это на автотестах.
сколько пафоса то. При том что и codex и claude code и все что угодно есть в ide VScode.
Монетизировать тяжело. Все остальное лишнее.
Интересно ваше мнение по поводу A2A (agent to agent) протокола, ведь по сути вопрос заключается именно в реализации подобной штуке на каждом слое бизнес адаптации?
вы про оригинальный квен или чьи-то урезанные кванты? Там любят русский язык вырезать, да и другие тоже.
псп чуть выше 5060ti, сомнительная штука
Это уже отличный промпт, вот с него и начните. Только не с чатгпт, лучше опус или (бесплатный)дипсик на этапе планирования. Дипсик хорош в планировщике, но скриншоты ваши пока не примет, опус съест все, но дорого, квен съест бесплатно, но предложит ерунды, гпт в целом специфичен для фронта.
Вот прям так, можно прямой цитатой, можно добавить ещё с десяток слов, они обычно появляются при переписывании промптов.
Аналогично, но вместо как я предпочитаю использовать фразу " мне нужны...знания в разработке...".
Я бы рекомендовал VScode + Codex, либо Cline, там с DeepSeek V4lite бесплатный, V4pro тоже стоит копейки, прям вот 10 баксов от силы на месяц хватит, но с бесплатным вам вообще только кнопки нажимать надо. VScode - графический интерфейс проще для восприятия, видео на ютубе где что куда нажимать и погнали. А дальше уже качество вашего продукта зависит от уровня вашей экспертизы, LLM - только инструмент
Реально все, но забанить могут с любой стороны. Официальные российские гугл-аккаунты в зоне риска. Минималка сейчас xboxdns + kvn access.
если это вопрос не автору, то самые интересные сейчас - qwen 3.6 27b, легенда этой весны. если допилят, то в mtp. Если поместиться, то Qwen 3.5 122B (10B active), особенно когда выйдет обновленная 3.6 версия. Если нет - reap версии, типа Nemotron-3-Super-64B-A12B-Math-REAP или Qwen3.5-REAP-97B-A10B, из вполне может хватить для агентских задач, но кодить с ними может быть опасно, мало ли где произойдет затуп в ответственный момент.
очень бы хотелось все таки обсудить проблему, но вы зачем то обсуждаете свое видение невозможности декомпозиции исходя из вам только известных критериев. И предлагаете воскресную угадайку.
Угадайка не интересна, проблема у вас типичная, но если вам просто хочется отстаивать позицию нейроскептиков - можете считать что вам это удалось.
Но вы же могли просто написать: проблема в реализации ERP решения одним запросом в sql, а не строить абракадабру. Но тогда бы оказалось, что в самой проблеме и кроется решение.
Задачка то стандартная, хоть и сложная, но вся её сложность кроется в валидации промежуточных данных
Но ведь я не писал что правила должны быть прописаны в одном месте.
Только сдавал штук 5 экзаменов по этой теме, но сам не ногой, все уже порешено до нас.
C точки зрения разработчика ПО эта фраза не имеет смысла, но все пробелы я вам не заполню.
Ну так да. И модель это может, можете ей назначить сперва этот этап декомпозиции.
Пропишите один раз в правилах проекта, и лучше сразу накройте бескомпромиссными тестами на предварительных данных
Не вижу о какой общем модуле идет речь. Экономика отдельно, логистика отдельно, производство отдельно, по любому запросу собирается в результирующую таблицу по текущим данным, все что вам нужно - валидировать коэффиценты исходя из внешних данных меняющегося законодательства.
Мы все ещё про разработку ПО или про то что волшебный агент по волшебному промпту должен рассчитать все и сходу? У топ менеджера, который всех выгнал все эти задачи были уже декомпозированы, поэтому переназначение этих этапов на модель не является сложностью. А у вас первая реакция на декомпозцию - "зачем?" Я тут не знаю как ответить. Ну не декомпозируйте, подождите пару лет, там новые модели справятся и с вашей задачей сходу. Хотя и сейчас опус справится, тут скорее вопрос валидации встанет.