Мне кажется этот пример показывает слабость не LLM, а другой нейронки, что у нас в голове. Вот если вы хотели показать, что не надо включать последнее число, то зачем нам показывали числа до 31 два раза, чтобы мы внимательно перечитали весь ряд?
Я умею самостоятельно программировать. Вот только касательно этого проекта - я этого не делаю в 99% случаев. Что я делаю - это внимательно проектирую вместе фичи и прописываю детали, затем проверяю что получилось по факту и придумываю, что можно исправить. И так - постоянно, плюс надо учитывать, что параллельно работают от 3 до 5 агентов, и я постоянно обсуждаю, проверяю Если честно, весьма утомительно.
Я решил сделать челлендж - сто дней вайбкожу проект. По аналогии с моими прошлыми вызовами, 100км ультра и прочая. Прошло дней 15 с начала, а очень многое уже сделано. Думаю, мне нужен ещё месяц, чтобы добить проект и выложить первую версию официально. Я обязательно напишу статью на Хабре, как это было, какие сложности и прочее. И тогда и поговорим на основании фактов, забава ли это или все же годится для реальных проектов
А вы как обезопасили себя если при обновлении IDE (и не только его) оно сворует ваши данные и отошлет их куда надо, потому что было взломано(потому что так захотел разработчик ПО)?
Очень много советов, спасибо. Лично мне не хватило подробных кейсов и примеров. Например, я впервые услышал про хуки. Хотелось бы в статье увидеть и реальные примеры. И так далее.
Не вижу чем это отличается от того же Клауд кода, которым пользуюсь, с обилием агентов, промтов, правил и главное планом работы. Без плана любая долгая работа приходит в хаос. С планом и правилами я отходил на полтора часа и возвращался к почти готовому проекту, который сам бы пилил неделю точно.
Но да, в целом конечно построение плана визуально - это хорошая тема.
Вовсе не на две категории. Мы вместе с "архитектором" в Клауд код придумываем архитектору, предлагаем идеи и ищем лучшее решение. Порой косячит он, порой я. Когда он - я рад, что я это вижу и могу контролировать. Когда я - я рад, что у меня теперь коллега, что страхует. Но разумеется, чем умнее tool, тем более вероятен ее хитрый сбой
Не из вредности, но часто из-за того, что не знают, насколько важны промты и использование думающей модели. Тот же Клауд код, который я активно использую - без правил и промта даже думающая лучшая модель часто косячит. И да, после написания того же промта архитектора и написания множества общих правил ситуации кардинально меняется. Аналогично с gpt - спросите его просто так что-то или добавьте пару фраз - будь скептичен, не спеши, проверь по солидным источникам. И все, ответы различаются примерно также, как информация от просто популярного блогера и ученого
Ничего удивительного! (с) Подумаешь, работает автономно сутки. А пусть он попробует автономно годами, как человек! А сутки - это ерунда! Нечему тут удивляться!
Реакция IT сообщества на этот пост с одной стороны расстраивает, с другой очень показательна. Хоть сам я из IT и вырос в тимлида из программиста, но чувствовал себя в их среде не совсем своим. Какое-то занудство, снобизм, я бы даже сказал аутизм, вот это вот "я указал в резюме" и неумение общаться, что ли.
Однако для меня программист, что делает по тикету, а не по бизнес потребностям, это не Ред флаг, а просто такой инструмент, не гибкий, да, надо это учитывать. Я ведь не хочу, чтобы калькулятор обладал свободной волей и гибкостью, так и некоторые даже сеньоры - дай точные реквайременты и они блистают
“Адкок вложил $100 млн личных средств — при состоянии в $19 млрд это осознанная ставка, а не эксперимент.”
ИИ, ты уверен что 100 млн при 19 млрд - это осознанная ставка?
спасибо что заметил! …
Мне кажется этот пример показывает слабость не LLM, а другой нейронки, что у нас в голове. Вот если вы хотели показать, что не надо включать последнее число, то зачем нам показывали числа до 31 два раза, чтобы мы внимательно перечитали весь ряд?
Вы все врете, не может быть никаких сокращений, потому что в комментариях на Хабре программисты доказали, что ИИ ни о чем!
Из статьи:
"Углубляйте экспертизу. «Я знаю Python» - уязвимо. «Я проектирую системы на 100K RPS» - нет"
Прям душком LLM запахло. Или если это человек, то он стал брать за основу тексты LLM?...
Идея нового эксперимента - дать Адаму (ой, простите, Арии) "Еву". Пусть они общаются друг с другом и обсуждают мир :)
Такое ощущение, что писал пришелец-аутист, если честно.
Гугл ищет деньги на ИИ. Наивный народ этот Гугл, явно не читает комментарии на Хабре - иначе они бы знали, что пузырь вот-вот лопнет!
Я умею самостоятельно программировать. Вот только касательно этого проекта - я этого не делаю в 99% случаев. Что я делаю - это внимательно проектирую вместе фичи и прописываю детали, затем проверяю что получилось по факту и придумываю, что можно исправить. И так - постоянно, плюс надо учитывать, что параллельно работают от 3 до 5 агентов, и я постоянно обсуждаю, проверяю Если честно, весьма утомительно.
Я решил сделать челлендж - сто дней вайбкожу проект. По аналогии с моими прошлыми вызовами, 100км ультра и прочая. Прошло дней 15 с начала, а очень многое уже сделано. Думаю, мне нужен ещё месяц, чтобы добить проект и выложить первую версию официально. Я обязательно напишу статью на Хабре, как это было, какие сложности и прочее. И тогда и поговорим на основании фактов, забава ли это или все же годится для реальных проектов
А вы как обезопасили себя если при обновлении IDE (и не только его) оно сворует ваши данные и отошлет их куда надо, потому что было взломано(потому что так захотел разработчик ПО)?
Очень много советов, спасибо. Лично мне не хватило подробных кейсов и примеров. Например, я впервые услышал про хуки. Хотелось бы в статье увидеть и реальные примеры. И так далее.
Абсолютная правда
Не вижу чем это отличается от того же Клауд кода, которым пользуюсь, с обилием агентов, промтов, правил и главное планом работы. Без плана любая долгая работа приходит в хаос. С планом и правилами я отходил на полтора часа и возвращался к почти готовому проекту, который сам бы пилил неделю точно.
Но да, в целом конечно построение плана визуально - это хорошая тема.
Вовсе не на две категории. Мы вместе с "архитектором" в Клауд код придумываем архитектору, предлагаем идеи и ищем лучшее решение. Порой косячит он, порой я. Когда он - я рад, что я это вижу и могу контролировать. Когда я - я рад, что у меня теперь коллега, что страхует. Но разумеется, чем умнее tool, тем более вероятен ее хитрый сбой
Не из вредности, но часто из-за того, что не знают, насколько важны промты и использование думающей модели. Тот же Клауд код, который я активно использую - без правил и промта даже думающая лучшая модель часто косячит. И да, после написания того же промта архитектора и написания множества общих правил ситуации кардинально меняется. Аналогично с gpt - спросите его просто так что-то или добавьте пару фраз - будь скептичен, не спеши, проверь по солидным источникам. И все, ответы различаются примерно также, как информация от просто популярного блогера и ученого
Ничего удивительного! (с) Подумаешь, работает автономно сутки. А пусть он попробует автономно годами, как человек! А сутки - это ерунда! Нечему тут удивляться!
(Пост написан из недалёкого будущего)
А когда мошенник звонит и по телефону уговаривает что-то сделать, то решает что сделать принимающий звонок. Понимаете, на что я намекаю?
Если в задаче есть красное яблоко, зелёное яблоко, красный мяч, то нельзя будет ответить, что тут лишнее. Тут явно не хватает данных.
И насколько же бросается стиль чата жпт в этой статье...
Я был в Тинькофф 5 лет. Но это не весь мой опыт, я в айти с 2008 года
Реакция IT сообщества на этот пост с одной стороны расстраивает, с другой очень показательна. Хоть сам я из IT и вырос в тимлида из программиста, но чувствовал себя в их среде не совсем своим. Какое-то занудство, снобизм, я бы даже сказал аутизм, вот это вот "я указал в резюме" и неумение общаться, что ли.
Однако для меня программист, что делает по тикету, а не по бизнес потребностям, это не Ред флаг, а просто такой инструмент, не гибкий, да, надо это учитывать. Я ведь не хочу, чтобы калькулятор обладал свободной волей и гибкостью, так и некоторые даже сеньоры - дай точные реквайременты и они блистают