Самый лучший тест это на своём проекте:) так вот, Qwen3.6, по моим ощущениям, писала код и находила проблемы не хуже, чем Соннет (или это Соннет стал не такой уж и крутой?). Не так, как он, по-другому и за за заметно большее число итераций, но в целом нормально выруливала, крайне положительное впечатление. Ели бы не этот дебильный маркетинг Алибабы с единственным кодинг-планом за $50, а было бы поменьше лимитов но за $10, это была бы лучшая покупка, ИМХО:)
Всё в схеме понравилось, кроме расчёта по токенам. Разбить задачи на идеальные мелкие куски без учёта контекста ИМХО не получится. А дешёвые модели по 0.1-0.2 доллара за млн токенов ваш контент кэшировать просто не будут. Поэтому вам нужно будет хорошо подмешивать контент в запрос, то есть количество токенов будет больше минимум на порядок, и это ещё очень оптимистично. С оплатой вызовов через api ваш проект вылетит в финансовую трубу. Поэтому только подписка, и лучше на несколько разных моделей, а то слабые модели могут легко накидать чуши и легко её же и верифицировать.
Оптимально мне видится связка из подписок minimax + Qwen + claude. Простые задачи кидать в minimax + написание кода и верификация Qwen + финальные погоны на Sonnet , в случае мёртвого затыка - Opus, если и это не помогло, то лезть руками разбираться:)
Последняя версия NetBSD всё ещё поддерживает 486 процессоры. А в промышленных изделиях на потомках 486-х используются ОС реального времени ( RTOS ) типа FreeRTOS, LynxOS или DOS или ещё что-то специальное.
В том то и дело, что совершенно не пытается, цель - реклама своего бизнеса. Она, "Основатель Рерайт-Завода", как написано в профайле, обосновывает свои руководящие решения, с помощью текста, сгенерированного нейронкой, а котором она выступает против бездумного использования нейронок, легко палится по тем же самым признакам, которые перечислены в статье. Ачотакова(с)
"Текст грамотный, структурированный. Три аргумента в каждом блоке. " "Модель интернализировала структуру «заголовок + три буллета» и транслирует её в прозу. " и тут же "GitHub, Stack Overflow, техническая документация. " "Почерки моделей
"У каждой модели свой стилистический отпечаток. ChatGPT Claude DeepSeek "
Не хамоватый, нормальный. Что вас оскорбило в моём вопросе? Как нужно было спрашивать?
Про то, что ЛЛМ пишут так, как научили, это очевидно. Они пишут универсально и предсказуемо, и это даже хорошо.
Вы пытаетесь утверждать, что сделали декомпозицию "настоящего" человеческого текста:) «Не так, а вот так »(с) На самом деле, у людей, которые пишут тексты профессионально и своими руками, на выходе можно ожидать в принципе любой текст. Абсолютно любой и в любом стиле. Профессионального писателя текстов вообще можно попросить написать в стиле бабы Мани с рынка, и он это вам легко выдаст. А исследования на тему «не так, а вот так» обычно анализируют комментарии юзеров, написанных одной рукой в телефоне. Отличаются ли они от текстов нейросетей? Ну, конечно же, отличаются. В худшую сторону — почти все.
Когда я спросил про «читаете ли вы», я не имел в виду информацию по работе, а литературу — фикшен, нон-фикшен, и тому подобное等等 . Мне кажется, что нет, иначе бы вы видели, насколько может быть разнообразным авторский текст.
В статье вы много раз упомянули про «Три аргумента в каждом блоке». Три свойства предмета, три описания, три прилагательных — именно так, по три штуки, советует писать некий Стивен Кинг, и вероятно, он знает толк в таких вещах.
Кроме того, стоит учитывать (с) что сейчас люди перенимают у нейросетей характерные речевые обороты (калька с иностранного, структура и так далее等等), вы это не отразили в статье. Остальные спорные моменты разбирать лень, простите.
В принципе ваша статья - это тоже нейрослоп по вашим же маркерам и по смыслу, имеющий плохую корреляцию к с лингвистической реальностью. Так нельзя — в академическом смысле, хотя, если вам это принесёт сколько-то денег, то пускай:)
P.S. Текст комментария написан своими личными руками, в отличие от. Длинные тире, иероглифы и угловые кавычки я специально вставил:)
То есть, она для интенсивного вайб кодинга слишком дорогая по входящим - в три раза дороже, чем не менее прекрасная qwen 3.6 (при вайб- кодинге главное это цена входящих, так как пихать побольше в контекст запроса это на самом деле разумно), а если не интенсивный вайб, то лучше что-то из топовой тройки.
Но какие-то неоднозначные чувства от прочтения. Гемма 4 лучше Квен3.5? 48тыс токенов окно для работы, вы это серьёзно? Уменьшить количество потоков, чтобы больше тормозило? Гемма 4 как замена Клауде?
В смысле, "код ничего не стоит"?! Вы видели цены на OpenAI: o1-pro ? :)
Самый лучший тест это на своём проекте:) так вот, Qwen3.6, по моим ощущениям, писала код и находила проблемы не хуже, чем Соннет (или это Соннет стал не такой уж и крутой?). Не так, как он, по-другому и за за заметно большее число итераций, но в целом нормально выруливала, крайне положительное впечатление.
Ели бы не этот дебильный маркетинг Алибабы с единственным кодинг-планом за $50, а было бы поменьше лимитов но за $10, это была бы лучшая покупка, ИМХО:)
Ну так у средних и мелких компаний тоже будет Мифос по подписке. И куча айтишников на зарплате.
Всё в схеме понравилось, кроме расчёта по токенам. Разбить задачи на идеальные мелкие куски без учёта контекста ИМХО не получится. А дешёвые модели по 0.1-0.2 доллара за млн токенов ваш контент кэшировать просто не будут. Поэтому вам нужно будет хорошо подмешивать контент в запрос, то есть количество токенов будет больше минимум на порядок, и это ещё очень оптимистично. С оплатой вызовов через api ваш проект вылетит в финансовую трубу. Поэтому только подписка, и лучше на несколько разных моделей, а то слабые модели могут легко накидать чуши и легко её же и верифицировать.
Оптимально мне видится связка из подписок minimax + Qwen + claude. Простые задачи кидать в minimax + написание кода и верификация Qwen + финальные погоны на Sonnet , в случае мёртвого затыка - Opus, если и это не помогло, то лезть руками разбираться:)
Побуду Капитаном Очевидность:)
Последняя версия NetBSD всё ещё поддерживает 486 процессоры.
А в промышленных изделиях на потомках 486-х используются ОС реального времени ( RTOS ) типа FreeRTOS, LynxOS или DOS или ещё что-то специальное.
Директора разве когда-то говорят по-другому?:)
владеющих компетенциями в разработке софта, инфраструктуры и информационной безопасностиЭникейщик :)
Что там с правами доступа? Из статьи непонятно.
P.S. Лирическое отступление:)
Первая 50% статей на Хабре: Рекламный нейрослоп.
Вторая 50% статей на Хабре: Я запустил Клауд и он мне всё написал, восторг!
а, нашёл
https://github.com/QwenLM/qwen-code
https://www.alibabacloud.com/help/en/model-studio/qwen-code
вот здесь написано что 1000 в день
В том то и дело, что совершенно не пытается, цель - реклама своего бизнеса. Она, "Основатель Рерайт-Завода", как написано в профайле, обосновывает свои руководящие решения, с помощью текста, сгенерированного нейронкой, а котором она выступает против бездумного использования нейронок, легко палится по тем же самым признакам, которые перечислены в статье. Ачотакова(с)
"Текст грамотный, структурированный. Три аргумента в каждом блоке. "
"Модель интернализировала структуру «заголовок + три буллета» и транслирует её в прозу. "
и тут же
"GitHub, Stack Overflow, техническая документация. "
"Почерки моделей
"У каждой модели свой стилистический отпечаток.
ChatGPT
Claude
DeepSeek "
И так везде.
Ваш текст воняет GPT. (с)
Не хамоватый, нормальный. Что вас оскорбило в моём вопросе? Как нужно было спрашивать?
Про то, что ЛЛМ пишут так, как научили, это очевидно. Они пишут универсально и предсказуемо, и это даже хорошо.
Вы пытаетесь утверждать, что сделали декомпозицию "настоящего" человеческого текста:) «Не так, а вот так »(с) На самом деле, у людей, которые пишут тексты профессионально и своими руками, на выходе можно ожидать в принципе любой текст. Абсолютно любой и в любом стиле. Профессионального писателя текстов вообще можно попросить написать в стиле бабы Мани с рынка, и он это вам легко выдаст.
А исследования на тему «не так, а вот так» обычно анализируют комментарии юзеров, написанных одной рукой в телефоне. Отличаются ли они от текстов нейросетей? Ну, конечно же, отличаются. В худшую сторону — почти все.
Когда я спросил про «читаете ли вы», я не имел в виду информацию по работе, а литературу — фикшен, нон-фикшен, и тому подобное等等 . Мне кажется, что нет, иначе бы вы видели, насколько может быть разнообразным авторский текст.
В статье вы много раз упомянули про «Три аргумента в каждом блоке». Три свойства предмета, три описания, три прилагательных — именно так, по три штуки, советует писать некий Стивен Кинг, и вероятно, он знает толк в таких вещах.
Кроме того, стоит учитывать (с) что сейчас люди перенимают у нейросетей характерные речевые обороты (калька с иностранного, структура и так далее等等), вы это не отразили в статье. Остальные спорные моменты разбирать лень, простите.
В принципе ваша статья - это тоже нейрослоп по вашим же маркерам и по смыслу, имеющий плохую корреляцию к с лингвистической реальностью. Так нельзя — в академическом смысле, хотя, если вам это принесёт сколько-то денег, то пускай:)
P.S. Текст комментария написан своими личными руками, в отличие от.
Длинные тире, иероглифы и угловые кавычки я специально вставил:)
Как будто есть некий образцовый "человеческий" текст:)
Девушка, а вы книжки читаете?:)
Ещё один Макс:)
У этой замечательной модели один минус, это цена.
$1/M input tokens
$3/M output tokens
То есть, она для интенсивного вайб кодинга слишком дорогая по входящим - в три раза дороже, чем не менее прекрасная qwen 3.6 (при вайб- кодинге главное это цена входящих, так как пихать побольше в контекст запроса это на самом деле разумно), а если не интенсивный вайб, то лучше что-то из топовой тройки.
Предлагаю не мелочится, а сразу строить сферу Дайсона.
За перевод статьи спасибо.
Но какие-то неоднозначные чувства от прочтения. Гемма 4 лучше Квен3.5? 48тыс токенов окно для работы, вы это серьёзно? Уменьшить количество потоков, чтобы больше тормозило? Гемма 4 как замена Клауде?
В общем, материал типа "я запустил и радуюсь".
А за что минус-то? Ведь реально обман клиентов.
В чате ещё очень хорош Qwen. DeepSeek в начале года улучшили и он тоже неплох. Кстати, новый DeepSeek обещают к концу апреля.
Сами себе яму роют.