Search
Write a publication
Pull to refresh
3
0
Send message

Не знаю зачем оно, мне квин 3 кодера хватает за глаза.

Сейчас делают ллм-ки, которые будут рассуждать в абстрактных понятиях, возможно даже не на английском языке. Вот в этом направлении будет небольшой прорыв, который улучшит генерацию кода на 5-7%. И это затем назовут AGI.

Господи, ну был дикий спрос во время ковида на ит - сейчас нет. Это было временное явление. Сейчас все приходит в норму. Ллм практически никакого влияния на рынок труда не оказывает. Харэ постить эту чипегузню.

Я попробовал этот хуанан: код пишет ужасно. Инструкций слушается очень нехотя. Не знаю где и как они что там тестировали и каким чудом они сравнились с квином. Это все выглядит как чистое фуфло. Официальные статические кванты gguf у меня вообще не заработали. Заработали только динамические кванты от unsloth. Я бы сказал, что llama 4 намного лучше, чем хуанань a13b. Опять же если сравнивать лицензии, то llama 4 на удивление лучше. Хуанан по идее вообще нельзя использовать в странах ЕС и США. Вывод - такой хуанан и даром не надо.

очередного приступа параноидального психоза

Не "параноидального", а параноидного. Не "психоза", а "шизофрении" т.к. очевиден распад личности.

А если быть точным, то у парня была "приступообразно-прогредиентная параноидная шизофрения". И принимать ему надо было ксаномелин-троспиум.

Команды тратят до 30 % рабочего времени на верификацию промптов

А оставшиеся 70 % времени тратят на валидацию результатов. Выгодная позиция, надо занимать.

Я провожу собес очень просто и эффективно: подхожу к доске и начинаю решать какую-то задачу. Но я не называю саму задачу и прошу испытуемого продолжить решение и назвать саму задачу. Таким образом удалось нанять самых лучших джунов.

Лично я вкатунов отсеивал и набрал 3 отличных джунов, но не только я веду собесы. У нас как минимум 5 человек кроме меня их ведут. Кроме этого у нас были интерны, которые вкатились без собесов. Мои джуны работают отлично и никаких претензий к ним нет.

Ой да успокойтесь вы. С 26 года наша компания к примеру будет нанимать джунов. Вкатунов мы потихоньку увольняет и набираем толковых.

Когда не разбираешься в теме: ни в ллм ни в сантехнике и разбираться не желаешь. А желаешь... погонять софистику.

Мой подход кода с поддержкой ИИ заключается в аккуратных, постепенных правках: я обрабатываю небольшие, вполне конкретные участки работы. Думаю, большинство из вас разрабатывают схожие методики.

Мягко стелит.

Всё прошло идеально: за всю поездку не понадобилось ни одного вмешательства в процесс вождения.

Входит в доверие и просит расслабиться.

Раньше нужно было тратить годы на изучение основ программирования, чтобы хоть немного преуспеть, а теперь этого не требуется.

Просит дать ручку погадать на успешный успех.

Вайбкодинг идеален, если вы хотите создать что‑то абсолютно уникальное, чего ещё не существует, — и вам просто хочется «пофантазировать», особенно в какой‑нибудь субботний день.

Врет в открытую прямо в глаза и одновременно делает массаж.

Вы приходите в ресторан, читаете меню — и абсолютно не понимаете, что означают названия блюд. Вам просто нужно увидеть картинки.

Реальные фото блюд в едином стиле ресторана не нужны, достаточно втюхать клиенту левые сгенерированные картинки. Но вы это не говорите вслух т.к. хотите чтобы массаж продолжался.

Честно говоря, было поразительно, что MenuGen в виде прототипа работал столь быстро, а превращение в реальный продукт заняло столько сил лишь из‑за невероятной муторности процесса.

Вы уже в открытую подымаете голос и говорите, что это такой же реальный продукт как симулятор огурца. А втюхать его получается т.к. вместе с ним в комплекте идет массаж. Пытаетесь отказаться от дальнейшего массажа.

Итак, финальная часть моего выступления сосредоточена на вопросе: а можем ли мы создавать непосредственно для агентов?

Для того, чтобы агенты генерировали подобные симуляторы огурца автоматически. Вы с чувством горечи пытаетесь прогнать цыгана.

Андрюха на своем тепловозе опять даванул тапку в пол. При этом он уже и не замечает, что тепловоз-то у него 2ТЭ10 и скоро он пойдет вместе с ним на списание.

Он обнаружил в коде на гитхабе промпты. Люди просто экспериментируют с ллм и это нормально. Но никакого нового языка программирования не создано и никакого прорыва не произошло. Его слова звучат уже как "ай дигиди дидидай".

Это произошло в 2023 году статья MeMOTR: Long-Term Memory-Augmented Transformer for Multi-Object Tracking https://arxiv.org/abs/2307.15700. Сейчас идет адаптация этих наработок.

Несмотря на это, она не может конкурировать с более крупными моделями, такими как Qwen-3-235B или GPT-4o.

Qwen3-235b это неплотная модель с экспертами по 22b. А есть еще плотная на 32b, тягаться с которой наверное совсем туго.

ЗЫ вчера выложили рассуждающую модель magistral, начал также использовать ее. Получил очень положительные результаты. Модель немного умнее, чем devstral. Но с этой моделью надо быть аккуратным т.к. у нее есть системный промпт, если нужно кастомизировать системный промпт, то надо сначала скопировать оригинальный.

А почему по-быстрому не навайбкодили? Почему еще не уволили всех своих программистов? Что-то не так в королевстве.

Да, обычный qwen3:32b без наворотов.

Для квин 3 все зависит от языка. Тайпскрипт она у меня пишет очень хорошо. А вот баш скрипт лучше пишет квин 2.5 кодер. Еще у квин 3 более высокая температура. Но в целом иногда квин 3 дает очень интересный результат и я его использую.

Information

Rating
2,455-th
Registered
Activity