мы увидели, что LLM – не думает так, как человек. Модель не может отделять ключевое от второстепенного, держать мысль по ходу разговора, она галлюцинирует, придумывает факты как раз потому, что у нее нет реального опыта, контекста в котором происходит общение.
А по моему, очень даже по человечески. Многие люди отделяют ключевое от второстепенного не правильно не так как я. Придумываю факты, страдают ложными воспоминаниями и рассуждают неадекватно в вопросах, которых не разбираются. В отличии от ллм, человеки еще и в нос могут дать на фразу "Ой ты не прав".
Я это все к тому, что утверждение что люди думают иначе требует некоторого доказательства.
Мне просто любопытно, может я слепой. А какую политоту вы увидели например вот в этом посте?
PS А вообще можно ли говорить о космосе без политики, особенно в государстве где весь космос государственный? Исходя из этого, любое обсуждение роскосмоса - политота ?
Я пользуюсь cursor, по этому буду говорить про него. У меня как раз активен context7(гуглит доки) и brave search(гуглит интернет).
В целом у курсора есть два режима для выполнения команд: - Делай все что хочешь - Спрашивай вызов каждого MCP и обращения к терминалу
У меня есть отдельная ОС, где я занимаюсь своими проектами и там я как тру вайбкодер конечно же сказал "Делай все что хочешь" и по этому, если там будет качественная инъекция, он скорее всего выполнит все ее инструкции и отправит все что можно куда нужно. Есть пара моментов, которыми я себя утешаю: - Каких-то секретных секретов у меня нет на устройстве с курсором. По этому, чтобы он там не слил, не беда - Встретить инъекцию в доках по популярным библиотекам кажется маловероятным.
Для работы, где есть ПД, мишн критикал системы и т.д. курсор работает в режиме "Спрашивай меня обо всем", но это не удобно :)
PS Да я осознаю риски, но на моих проектах мне это не критично и даже если злые хакеры зашифруют мне весь диск, я не очень расстроюсь.
У меня есть альтернатива, которая позволяет мне много лет держаться более менее. Я называю ее "Фитнес перекусы". От 1го до 3х раз в день я отхожу от компа на 5-10 минут и делаю по одному подходу на 50% от максимума(разминка около минуты): - Прыжки на скакалке (около минуты) - Приседания - Подтягивания - Отжимания
И 1-3 раза в неделю я делаю максимум на одно из тех же упражнений: - Приседания - Подтягивания - Отжимания
По сути, я просто поддерживаю баланс и силовые показатели за последний год не приросли вообще. Но это просто, много времени не требует, из снарядов скакалка и шведская стенка.
Часто я пропускаю какие-то дни, иногда до недели, но потом возвращаюсь.
PS Для тех, кто даже 1го раза не может подтянуться или отжаться, можно делать сильно упрощенные упражнения. За пример можно взять "Тренировки по методу Пола Уэйда"
Я несколько раз делал подох к Перплексити как к поисковику, и все разы ответ был какой-то скудный. В то же время, ChatGPT справляется на несколько порядков лучше со всеми вопросами.
Например, недавно у меня героически погибла посудомойка и я решил выбрать новую. Я попробовал перплексити с промтом вида: "У меня сломалась посудомойка <модель>, найди мне альтернативы в разных ценовых сегментах с возможность заказать онлайн с беслатной доставкой до дома. Приложи ссылки на карточки для заказа онлайн" и эта задача закончилась полным провалом, т.к. он не смог посмотреть карточки магазинов.
В то же время ChatGPT справился на ура и прислал мне вполне годный результат
Как менеджер выросший из разработчика хочу сказать, что тут есть одно заблуждение. Вы предположили, что задача разработчика только писать код и ничего больше. Это не всегда так. В компаниях с большой кодовой базой зачастую надо еще понимать, когда код писать надо, а когда вообще не надо. Например, опытный разработчик на совещании зачастую может сэкономить сотни часов на разработку, объяснив почему это вообще делать не надо или как адаптировать прошлое решение. А без этих знаний разработку нормально даже не запланировать.
Или надо продумать решение с учетом различной архитектуры. И это тоже важная и сложная глубокая работа, в которой будет несколько участников. То есть это тоже совещание.
PS Я в целом то согласен, что после того, задача проработана надо не мешать ее решать. Но зачастую, чтобы ее проработать и запланировать, без созвонов никак.
Лично для меня терминал не вопрос удобства, а вопрос настроения. Вот пишешь в него что-то, он что-то делает в ответ. Кайф и магия. Сразу чувствую себя лучше, чем эти скучные GUI
У меня от СБЕРа остались вполне позитивные впечатления. Премиальный менеджер есть, но это не мешает ходить в отделение около дома к обычному, а премиальному звонить из когда надо много чего сделать и приходить только документы забрать (например при закрытии ИИС и переводе бумаг была такая петрушка).
Из бесючего только постоянные попытки впарить страхование жизни
Так все так и есть. С ИИ стало легче делать MVP и тестировать гипотезы. Для привлечения денег и раньше мало было показать прототип. Надо показать работающий, продающийся прототип :)
Просто теперь тестировать гипотезы можно быстрее. Что позволит одиночкам проверять свои гипотезы на прочность быстро. А раньше надо было сначала команду разработчиков найти, чтобы узнать, что идея то не очень ;)
Ничего не знаю про JetBrains, их агентом еще не пользовался. Я ранее пробовал PyCharm + Copilot, но это был совсем другой уровень использования.
Весь cursor - это форкнутый VSCode настроенный на работу с LLM. Если вы еще не знакомы, лучше статью какую почитать или видео посмотреть. По сравнению с копилотом это был другой уровень.
+ из коробки работают MCP, это фактически очень простое расширение функционала LLM внутри IDE. Можно прям просить ходить в интернет и гуглить, или перед написанием кода ознакомиться с документацией по библиотеке.
PS Волшебства конечно не будет, но я рекомендую взглянуть и изучить
Курсор стоит 20$ в месяц. Это IDE + доступ к разным нейронкам. За эти деньги получается 500 дорогих обращений в LLM и бесконечно дешевые. За пару месяцев использования пока ни разу не вышел за лимиты.
Когда я говорил пара сотен итераций - это вызовы API LLM для генерации. В Курсоре есть ограничение, что после 25 вызовов нейронка ждет подтверждения, что стоит продолжать. Чтобы кожаный мешок взглянул, все ли в порядке. А то можно весь лимит обращения к LLM выесть потому, что агент фигню какую-то делал.
Делал похожую задачу для бэкэнда на Python + FastApi. Около 20 методов в API.
Я использовал Cursor + Claude 3.7 Sonnet Thinking; Добавил несколько MCP: - readonly sql в Postgress - Возможность искать в интернете
Разрешил запускать любые MCP без спроса, в том числе любые команды в консоли.
Поставил задачу сначала как : Составь план тестов в файле test_plan.md Потом немного отредактировал сценарии поставил новую задачу: "Реализуй все тесты из test_plan.md, используй pytest; Пишем только e2e тесты. Бэкэнд не правь, если с ним что-то не так фиксируй это как техдолг в readme.md. Используй любые MCP по необходимости"
За пару сотен итераций он написал покрытие вполне приемлимо, только пара сценариев были не супер. Зафиксировал десяток замечаний и только в конце решил, что бэкэнд совсем говно и пошел пофиксить там ошибку. Для этого нашел процесс бэкэнда, кильнул и перезапустил.
В одном месте сжульничал, и изменив логику сценария так, что она маскировала багу бэкэнда.
В целом получилось сносно, но много лапшекода, который возможно дольше перепроверять, чем изначально было бы тесты написать :)
Добавлю еще, что у меня в силу дальтонизма и в кожанном обвесе есть большие проблемы с краснотой красного и зеленотой зеленого :)
А по моему, очень даже по человечески. Многие люди отделяют ключевое от второстепенного
не правильноне так как я. Придумываю факты, страдают ложными воспоминаниями и рассуждают неадекватно в вопросах, которых не разбираются. В отличии от ллм, человеки еще и в нос могут дать на фразу "Ой ты не прав".Я это все к тому, что утверждение что люди думают иначе требует некоторого доказательства.
Три конкретных шага
Без воды!
Сразу понимаешь
Текст писал ИИ!
Я зашел сказать сюда спасибо! У меня вроде нет СДВГ, но работать под такое мне нравится :)
Мне просто любопытно, может я слепой. А какую политоту вы увидели например вот в этом посте?
PS
А вообще можно ли говорить о космосе без политики, особенно в государстве где весь космос государственный? Исходя из этого, любое обсуждение роскосмоса - политота ?
Я пользуюсь cursor, по этому буду говорить про него. У меня как раз активен context7(гуглит доки) и brave search(гуглит интернет).
В целом у курсора есть два режима для выполнения команд:
- Делай все что хочешь
- Спрашивай вызов каждого MCP и обращения к терминалу
У меня есть отдельная ОС, где я занимаюсь своими проектами и там я как тру вайбкодер конечно же сказал "Делай все что хочешь" и по этому, если там будет качественная инъекция, он скорее всего выполнит все ее инструкции и отправит все что можно куда нужно.
Есть пара моментов, которыми я себя утешаю:
- Каких-то секретных секретов у меня нет на устройстве с курсором. По этому, чтобы он там не слил, не беда
- Встретить инъекцию в доках по популярным библиотекам кажется маловероятным.
Для работы, где есть ПД, мишн критикал системы и т.д. курсор работает в режиме "Спрашивай меня обо всем", но это не удобно :)
PS
Да я осознаю риски, но на моих проектах мне это не критично и даже если злые хакеры зашифруют мне весь диск, я не очень расстроюсь.
У меня есть альтернатива, которая позволяет мне много лет держаться более менее. Я называю ее "Фитнес перекусы".
От 1го до 3х раз в день я отхожу от компа на 5-10 минут и делаю по одному подходу на 50% от максимума(разминка около минуты):
- Прыжки на скакалке (около минуты)
- Приседания
- Подтягивания
- Отжимания
И 1-3 раза в неделю я делаю максимум на одно из тех же упражнений:
- Приседания
- Подтягивания
- Отжимания
По сути, я просто поддерживаю баланс и силовые показатели за последний год не приросли вообще. Но это просто, много времени не требует, из снарядов скакалка и шведская стенка.
Часто я пропускаю какие-то дни, иногда до недели, но потом возвращаюсь.
PS
Для тех, кто даже 1го раза не может подтянуться или отжаться, можно делать сильно упрощенные упражнения. За пример можно взять "Тренировки по методу Пола Уэйда"
Я несколько раз делал подох к Перплексити как к поисковику, и все разы ответ был какой-то скудный. В то же время, ChatGPT справляется на несколько порядков лучше со всеми вопросами.
Например, недавно у меня героически погибла посудомойка и я решил выбрать новую. Я попробовал перплексити с промтом вида: "У меня сломалась посудомойка <модель>, найди мне альтернативы в разных ценовых сегментах с возможность заказать онлайн с беслатной доставкой до дома. Приложи ссылки на карточки для заказа онлайн" и эта задача закончилась полным провалом, т.к. он не смог посмотреть карточки магазинов.
В то же время ChatGPT справился на ура и прислал мне вполне годный результат
Как менеджер выросший из разработчика хочу сказать, что тут есть одно заблуждение.
Вы предположили, что задача разработчика только писать код и ничего больше. Это не всегда так.
В компаниях с большой кодовой базой зачастую надо еще понимать, когда код писать надо, а когда вообще не надо.
Например, опытный разработчик на совещании зачастую может сэкономить сотни часов на разработку, объяснив почему это вообще делать не надо или как адаптировать прошлое решение. А без этих знаний разработку нормально даже не запланировать.
Или надо продумать решение с учетом различной архитектуры. И это тоже важная и сложная глубокая работа, в которой будет несколько участников. То есть это тоже совещание.
PS
Я в целом то согласен, что после того, задача проработана надо не мешать ее решать. Но зачастую, чтобы ее проработать и запланировать, без созвонов никак.
Лично для меня терминал не вопрос удобства, а вопрос настроения. Вот пишешь в него что-то, он что-то делает в ответ. Кайф и магия. Сразу чувствую себя лучше, чем эти скучные GUI
Было бы интересно почитать сравнение с cursor
У меня от СБЕРа остались вполне позитивные впечатления.
Премиальный менеджер есть, но это не мешает ходить в отделение около дома к обычному, а премиальному звонить из когда надо много чего сделать и приходить только документы забрать (например при закрытии ИИС и переводе бумаг была такая петрушка).
Из бесючего только постоянные попытки впарить страхование жизни
Собственно, а почему вы решили, что ИИ не обладает сознанием? Ну и перед этим вообще придется договориться о том, что такое сознание
Так все так и есть. С ИИ стало легче делать MVP и тестировать гипотезы. Для привлечения денег и раньше мало было показать прототип. Надо показать работающий, продающийся прототип :)
Просто теперь тестировать гипотезы можно быстрее. Что позволит одиночкам проверять свои гипотезы на прочность быстро. А раньше надо было сначала команду разработчиков найти, чтобы узнать, что идея то не очень ;)
Вообще говоря я не понял, чем это лучше Miro. Мне вообще не очевидно, зачем мне на доске рабочий терминал или рабочий vscode.
Было бы в 100 раз интереснее, с пятком примеров исопльзования
Ничего не знаю про JetBrains, их агентом еще не пользовался. Я ранее пробовал PyCharm + Copilot, но это был совсем другой уровень использования.
Весь cursor - это форкнутый VSCode настроенный на работу с LLM. Если вы еще не знакомы, лучше статью какую почитать или видео посмотреть. По сравнению с копилотом это был другой уровень.
+ из коробки работают MCP, это фактически очень простое расширение функционала LLM внутри IDE. Можно прям просить ходить в интернет и гуглить, или перед написанием кода ознакомиться с документацией по библиотеке.
PS
Волшебства конечно не будет, но я рекомендую взглянуть и изучить
Курсор стоит 20$ в месяц. Это IDE + доступ к разным нейронкам. За эти деньги получается 500 дорогих обращений в LLM и бесконечно дешевые. За пару месяцев использования пока ни разу не вышел за лимиты.
Т.к. я не в РФ, то за vpn платить не приходится.
Когда я говорил пара сотен итераций - это вызовы API LLM для генерации. В Курсоре есть ограничение, что после 25 вызовов нейронка ждет подтверждения, что стоит продолжать. Чтобы кожаный мешок взглянул, все ли в порядке. А то можно весь лимит обращения к LLM выесть потому, что агент фигню какую-то делал.
Промпт был стартовый, я не вмешивался в процесс
Делал похожую задачу для бэкэнда на Python + FastApi. Около 20 методов в API.
Я использовал Cursor + Claude 3.7 Sonnet Thinking; Добавил несколько MCP:
- readonly sql в Postgress
- Возможность искать в интернете
Разрешил запускать любые MCP без спроса, в том числе любые команды в консоли.
Поставил задачу сначала как : Составь план тестов в файле test_plan.md
Потом немного отредактировал сценарии поставил новую задачу:
"Реализуй все тесты из test_plan.md, используй pytest; Пишем только e2e тесты. Бэкэнд не правь, если с ним что-то не так фиксируй это как техдолг в readme.md. Используй любые MCP по необходимости"
За пару сотен итераций он написал покрытие вполне приемлимо, только пара сценариев были не супер. Зафиксировал десяток замечаний и только в конце решил, что бэкэнд совсем говно и пошел пофиксить там ошибку. Для этого нашел процесс бэкэнда, кильнул и перезапустил.
В одном месте сжульничал, и изменив логику сценария так, что она маскировала багу бэкэнда.
В целом получилось сносно, но много лапшекода, который возможно дольше перепроверять, чем изначально было бы тесты написать :)
А объясните, это решение чем-то отличается от cursor ?
Было бы интересно как-то в сранвении смотреть