All streams
Search
Write a publication
Pull to refresh
74
0
Александр Щепановский @Suor

User

Send message

И получает десятки новых багов :)

Сначала пишешь промпт, чтобы сгенерировать тот промпт. Но всё равно долго получается

Автопополнение, которое нужно ждать 15 секунд? Звучит как ерунда или я что-то не понимаю

И при этом китайцы, если и отстают, то ненамного. Т.е. они эффективнее используют имеющиеся мощности.

Куча текста, ничего нормально не объяснено.

На вход токены стоят намного дешевле и кешируются, а на вывод не так много. Ну и плюс если модель хороша, то она справится за меньше количество итераций и в итоге её $3/15 могут оказаться дешевле $1.5/10 за гпт5 или гемини про.

И большинство людей, кажется, используют всякие подписки

Вот только это работает наоборот. До всяких девопс код деплоили башскриптом за 3 секунды, сейчас нужно собрать докер контейнер и потом его выкатить в кубернетесы. Полчаса-час, куча xml/yaml и связующего говнокода.

С разработкой ПО аналогично. Были, конечно, конторы, которые фичу по три месяца пилили (и сейчас есть). Но многие до скрама имели более гибкие процессы в стиле просто пиши код.

Непонятно почему свет сошёлся на Open code. Есть десятки клишных агентов. Большинство из них умеют опенроутер, т.е. де факто могут использовать любую модель. Да и с другими провайдерами, как правило, могут работать. Мультиагентность многие умеют (хотя так пока и не придумал зачем она нужна, кроме параллельного мозгового штурма, разве что), например, Aider desk, droid, Agent Zero.

Пока вижу единственную более менее уникальную фишку Open code - поддержка LSP. Но и у других агентов есть свои фишки, например, aider использует repo map.

P.S. Claude Code можно использовать с GLM 4.5 - авторы модели сделали специальный совместимый API

Просто нужно добавить инструкции по использованию этих инструментов с описанием ситуаций когда их применять и примерами в системный промт. Это то, как работают все тулзы у всех агентов и MCP. Ничего из этого не встраивается на этапе обучения.

Ну да, сам параметр назвали модно молодежно, а значения - скукота

Так эта не галера. Обычно, когда у компании уже есть деньги, то она может себе позволить заниматься ерундой вроде этой или например колесики к столам приделывать.

Нужно уточнять только когда оно тебя неправильно поняло, в зависимости от задачи таких моментов может вообще не быть. Ну и есть задачи с которыми ИИ просто не справляется.

Анализировать нужно только новый код и то, с чем он связан. Зачем всё то?

Вот только прототипирование - крайне маленький процент работу программиста.

Тест уже откалиброван, если после этого все люди будут решать все задачи, то у них будет не 100, а столько сколько максимально тест позволяет

Иногда отдельные сети могут перемудривать в отдельных задачах. Поэтому примеры дело такое. Может с вашей задачей и гпт4 бы справился, а у соннета просто в данном случае затуп.

По мне релиз провальный, не потому что он теперь не дружелюбно говорит, а потому что умнее не стал. Они даже это не рекламируют, они рекламируют, что стало меньше галлюцинаций и ещё что-то второстепенное. А в гпт-6 собираются сосредоточиться на какой-то третичной фича вообще. Т.е. всё развитие ллм у опенэйай прекратилось и идёт шлифовка околорюшечек.

Причём тут сигмы, если люди просто запомнили уже все эти задания?

Люди задрочившие IQ-тест выбивают до 220 попугаев. Кажется более правильной базой для сравнения, чем 100

Приложение за миллиард сделает один выпускник, а все остальные будут лапу сосать?

На выходе словоблудие, которое потом читателям нужно обратно в ИИ засовывать, чтобы с 58% вероятностью получить исходную информацию.

1
23 ...

Information

Rating
5,462-nd
Location
Красноярск, Красноярский край, Россия
Date of birth
Registered
Activity