Search
Write a publication
Pull to refresh

Comments 21

Начинается киберпанк, людей лишают способности думать забирая доступ к GenAI...

Я пробовал Gemini и Kimi, но сейчас нет ничего, что могло бы сравниться с возможностями Claude Code

Что если попробовать... мозг?

Полагаю, вы задаете этот вопрос себе каждый раз, когда использует LLM?

Читая этот фрагмент текста также ужаснулся, что чат бот стал этому человеку не помощником, а "рабочим" (хотя вернее сказать рабом. Ну или пользователь стал рабом чат боту и сам ничего не может писать). Или пользователь и вовсе не программист 😐

UFO landed and left these words here

Сейчас определённо не понедельник, ни по какому часовом поясу.

UFO landed and left these words here

Вы хоть читайте что авто переводчик вам на переводил. Какие звонки там люди совершают с помощью LLM? Даже не глядя в оригинал догадываюсь что речь шла о запросах (calls).

Claude звонит Natasha, она ему ответ надиктовывает

Не будь так строг, перевод делает чат GPT.

«Это просто лишило меня возможности двигаться вперёд, — сказал пользователь в интервью TechCrunch. — Я пробовал Gemini и Kimi, но сейчас нет ничего, что могло бы сравниться с возможностями Claude Code».

А самому написать слабо? (Как верно было написано @Wrench_IT выше "А что если использовать... мозг?")

Именно поэтому вно самому уметь программировать, а ещё важнее продумывать и корректировать реализацию о дей архитектуры проекта. Иначе всё превращается в редактирование "каких-то кусков непонятного кода", который, к слову, обычно и получается при использовании LLM.

Если код уже был написан LLM, в выделенной ему песочнице, то нет даже смысла разбираться, что он там пишет - уйдет гораздо больше времени, чем использовать конкурента или продолжать.
Каждый раз, когда я пытался исправлять, что-то там написанное как prototype-SPA, понимал, что с 0 написать было бы быстрее.

Полностью согласен. Нередко на первый взгляд понятный и простой код, написанный ИИ, при ближайшем рассмотрении оказывается нечитаемым.

Так там про то, что чел хочет Opus, и не хочет Sonnet.
Потому что Sonnet сегодня работал безупречно. Накодил мне 2000 строк кода и еще 1000 строк доки. Все летает.
Странно , но особого ума у Opus по сравнению с Sonnet не заметил.
Хотя один запрос Opus стоит как 10 запросов Sonnet в GitHub Copilot.
Самая дорогая штука из всех в GitHub Copilot.
Надо однако присмотреться.

Так Sonnet 4 обходит в SWE-bench Opus 4

  • Opus дополнительно себя перепроверяет и создает себе задачи при необходимости.

  • Sonnet же "видит цель, не замечает препятствий" (до каких-то пределов конечно же).

Если нужно сделать линейную, понятную, контролируемую задачу - то лучше sonnet. Если нужен анализ или исследование (например поиск сложного бага), то лучше Opus ultrathink.

Вот как раз разницы в этом и не почувствовал.
Самые сложные задачи - это когда надо исследовать реальный физический отклик.
Скажем что-то сбоит в железе. Например сбоит чтение из NOR Flash.
Так и Opus и Sonnet несли одинаковую ахинею про некую нестабильность периферии из-за чего видишь ли DMA может попортить стек.
Оба в упор не замечали явно неправильного базового адреса при обращении к Flash.
И оба одинаково пичкали код диагностическими логами чтобы попытаться найти проблему.
Отличий в их подходе не увидел. Даже время реакции похожее.
В результате баг пришлось найти самому. Хотя логи ихние помогают здорово. Без них было бы искать гораздо тяжелее.

Вероятно очень специфичная задача для них. Или не было вначале корректно собранной "базы" про суть выполняемого в коде. Нужно вначале чтобы они собрали полный анализ по тому что код делает и какой flow должен быть. И уже по нему они смогут ориентироваться.

В целом, на моих задачах - sonnet бывает тупит, повторяет то что уже делал но другим способом, начинает "лепить горбатого" (виноваты задержки, конфигурации, таймауты, внешние силы). А вот opus всегда в этом молодец: когда встречает на пути стенку - начинает иные идеи прорабатывать и размышлять.

Логи они лепят слишком хаотично. Нужно какую-то memory им про подход к логам делать. И на временные логи какие-то пометки ставить чтобы потом одним движением убрать.

У меня они логи как раз уместно ставят. Они ставят лог и просят потом показать результат, так как сами к железу доступ не имеют. Потом эти логи анализируют и если чего не поняли ставят ещё более подробные логи. У меня они имеют доступ к абсолютно всей кодовой базе. И файл инструкций на пару страниц все время имеют в контексте. Но и инструкции не всегда смотрят, и кодовую базу не всю смотрят. И вот тут я и не почувствовал разницу между Opus и Sonnet.

Sign up to leave a comment.