Comments 330
Через полгода CEO Anthropic перестанет адекватно мыслить на 90%. Через год — на 100%
Либо - в первом слоге его фамилии пропущена буква "с".
А через полтора года - на 110%! тэг: мое хобби - экстраполировать
Тоже поржал с этих заявлений, было уже такое:
Через 3 года беспилотные такси заменят таксистов
Через 5 лет мы полетим на Марс
и прочее
Через 2 спрос на программистов экспоненциально вырастет, ведь кому-то же надо разгребать всю эту кучу... кода.
Арендуют другой алгоритм, который будет разгребать. Так снежный ком проблем докатится до состояния: "вроде, как-то работает, но никто уже давно не понимает, что там внутри" и, скорее всего, в итоге всё придёт к "проще всё удалить и написать заново" (впрочем, такое и с людьми происходит постоянно).
Будет как с картинками. Один ИИ будет генерить код, а другой будет говорить "фу, фигня", пока тот нормальный код не напишет )) Хотя если посмотреть на сгенерённые картинки, в общем это не панацея, конечно.
Один ИИ будет генерить код, а другой будет говорить "фу, фигня", пока тот нормальный код не напишет
я, кстати, сейчас при разработке так и делаю. буквально TDD, даже исследование на эту тему было, я на Хабр про него писал: https://habr.com/ru/news/879826/
то есть, я буквально агенту даю задачу - напиши автотесты, покрывающие будущую функциональность. а потом говорю - пиши функциональность, гоняй тесты, пока всё не заработает идеально. и он именно так и делает - сам итерирует, сам смотрит на ошибки, решает проблемы. очень удобно.
сколько итераций обычно проходит и как много денег уходит на оплату api и при каком размере кодовой базы?
Ну тут всё упирается в то, сможет ли он сочинить все нужные тесты.
Ха, хуже если он сгенерирует противоречивые тесты, и будет подгонять под них код до скончания времён.
Тут, кстати, можно вспомнить про проблему "переобучения" в "машинном обучении". Он может сначала сочинить тесты, не совсем адекватные требованиям, а потом подогнать под них код. В результате получится переусложнённый код с встроенными трудноуловимыми багами. Но зато проходящий все тесты. )
Опять упираемся в проблему "кто контролирует контролёров?" )
Ну или же все придет к культу механикусов: Программисты натянут красные рясы и начнут поклоняться машинным духам
так вот как будет выглядеть технологическая сингулярность...
есть мнение, что со временем нейросети станут чем-то вроде компилятора в высокоуровневые языки. Ну и есть причины предполагать, что это будет не очень хорошо, т.к. компилятор мы пока еще худо-бедно можем отследить почему он выдал такой бинарник, а вот с нейросетями сложнее.
Раньше были ремесленники, делали все вручную, постепенно их труд автоматизировался, изобретались инструменты которые улучшали и ускоряли работу. Почему здесь не может быть такого?
Инструменты делают ровно то, что в них заложил ремесленник ими управляющий. Результат работы инструментов предсказуем и повторяем. Задача "как сделать" всегда решалась человеком.
Довольно сильная разница если сравнивать с LLM.
Вот кстати да. Промтехнология - это все-таки в первую очередь про предсказуемость и повторяемость (в том числе процента брака, ошибок и т.д.). Как раз это дает эффективность и возможность работать при низкой маржинальности - поскольку расходы можно довольно точно посчитать заранее. А недетерминированные алгоритмы, по-моему, немного возвращают нас в ремесленную эпоху. Когда "великий мастер" мог выдать "шедевр" через месяц, испортив 20 заготовок. Или три месяца и 50 - как повезет. А еще через 1-3 месяца - новый, но уже другой. С "удивительными достижениями" нейросетей после долгого тюнинга, подбора контекста и черрипикинга - мне кажется, очень похоже. Применительно к теме - интересно, наверное, иметь в проекте в разных местах 5 разных реализаций функции (класса / метода / etc.). И трудо(электро)затраты +-50-100% в зависимости от расположения планет. Нет, кожаные тоже так умеют, но помогает организация труда. Почему-то это редко обсуждают апологеты.
Зато скоро с помощью ИИ-агентов можно будет разработать все приложения, нарисовать все картинки, написать все тексты и.... может кто случайно купит за 1$?
Какая-то доля "мастеров" останется, но ии значительно повышает порог входа для новичков. В компаниях останутся работать специалисты уровня "сеньер" с опытом 7-10 лет и конкурировать они будут между собой. Очень сильно вырастут требования к "мастеру".
Кто "над ИИ" должен будет постоянно доказывать, что он лучше
Кто "под ИИ" вообще в нишу не зайдет
Я говорю про "инфляцию мастерства" и может пока вы молоды ещё можете быстро адаптироваться. А что будет когда станет 50 лет? Ресурс мозга уже не тот, скорость не та, энергии мало. А ИИ не останавливается и конкуренция на рынке труда тоже.
Я про то, что пока вы говорите "ИИ глуп" вы пропустите момент, когда глупыми уже станете вы
В компаниях останутся работать специалисты уровня "сеньер" с опытом 7-10 лет
И размножаться они будут почкованием, появляясь на свет сразу с нужным опытом.
Ну это понятная и известная мысль - и контрдовод тоже уже здесь (предыдущий ответ). Я о другом. Любое современное производство - это про предсказуемость. Промышленная разработка приложений - тоже. Типовые кейсы решаются за более или менее понятное время и в понятном бюджете (RD не берем - это априори высокорисковая сфера). Предсказуемость сроков и затрат - конкурентное свойство. Любой вменяемый заказчик скорее выберет даже при не совсем равных более предсказуемого подрядчика, чем риск сильно выйти за ожидаемые сроки и бюджет. Поэтому и инженер - уверенный середнячок для нанимателя лучше, чем "безумный гений". Я понимаю, что могу тут получить минусов - но так работает современная массовая экономика. "Мастера" остались только в узких нишах - венчурных, исследовательских и тому подобных. "Криэйтором, Вава, криэйтором"с - простите за цитату.
Поэтому мне и интересно - ИИ в качестве "уверенного джуна" - дает такой же стабильный по качеству и затраченному времени результат, как хорошо отобранный мясной джун? Или результат сильно плавает? Во втором случае, по-моему, очевидно, сокращение затрат на мясных может не компенсировать риски. Ну примерно по аналогии - лучше гарантировано доехать куда-то за час, потратив 200 условных пиастров с небольшой погрешностью, чем за 150 - иметь разброс от получаса до трех часов. Это взгляд на "искусственного инженера" немного с другой стороны - не мясного конкурента, а заказчика. Мне пока не очевидно, что электрический исполнитель лучше по соотношению результата / рисков. Каких-то попыток объективно это оценить в цифрах пока не видел.
Сейчас вместо ремесленников всё делается на заводах и фабриках, но вы удивитесь, если узнаете, сколько на этих заводах ручного труда. Полностью автоматизированы только всякие гвозди, карандаши, микросхемы, но всё крупное собирается руками. Например любая машина: швейная, стиральная, посудомоечная, автомобиль - всё собирается руками. Да, с помощью инструментов, порой очень сложных, но при непосредственном участии человека. Есть конечно и более автоматизированные автозаводы, но их единицы. Опять же, если даже машину соберут роботы, потом всё обслуживание делается руками.
Это всего лишь вопрос денег - часто работа человека сильно дешевле автоматизации.
На деле "всего лишь вопрос денег" означает, что задача неразрешима. Ведь вылечить всех тяжелобольных, накормить всех голодных, дать жильё всем нуждающимся, колонизировать другие планеты, починить все дороги - это тоже всего лишь вопрос денег.
На деле "всего лишь вопрос денег" означает, что задача неразрешима.
Не совсем. Просто замещение будет происходить не по щелчку пальцев, а постепенно, с развитием технологий. Как успехи в медицине позволяют излечивать все больше тяжелобольных, а успехи в АПК позволяют производить больше еды, тут все точно также.
Первые роботизированные цеха на автозаводах появились ещё в 80-е года прошлого века. Но сейчас, спустя почти 40 лет, на каждом автозаводе всё равно почему-то работают тысячи людей. Ясное дело, что сейчас тысяча рабочих, благодаря роботам может произвести больше автомобилей, чем 100 лет назад. Но это никакое не скачкообразное развитие, а очень даже плавное.
Просто замещение будет происходить не по щелчку пальцев, а постепенно, с развитием технологий.
(С замиранием:) Может, Вы ещё и знаете, когда наконец дороги починят?
Ведь вылечить всех тяжелобольных
Это не вопрос денег, даже имея сверхбезлимитные деньги, это неосуществимо в обозримой перспективе и боюсь что в необозримой тоже
но вот конкретно с автоматизацией - это реально решаемая задача, но стоимость робота который автоматически соберет жгуты, проложит в автомобиле, и прикрутит все шурупы и гайки, да при этом еще будет просто и легко перенастраиваться под разные модели авто, будет такова что автомобили которые он будет выпускать будут нерентабельны на рынке автомобилей
но вы удивитесь, если узнаете, сколько на этих заводах ручного труда.
Я прекрасно знаю сколько на заводе ручного труда, поскольку работаю в промышленности.
автомобиль - всё собирается руками
Вроде же Changan в городе Chongqing запустила полностью автоматизированный завод по сборке автомобилей?
И что, от этого все остальные заводы тоже стали автоматизированными? Это один завод из многих и многих тысяч автозаводов по всему миру. Очевидно, этот чел из Антропик тоже так рассуждал - увидел, что кто-то сгенерировал 10 строк качественного кода и сразу экстраполировал это на всё на свете.
Нет, не стали. Но это прецедент. Если смог Вася, то сможет и Петя. А если это ещё и финансово выгодно - Петя сделает это в самое ближайшее время. Программисты никуда не исчезнут, но низко - и средне квалифицированное большинство может потерять работу, пусть не одним махом, но плавно.
Первый прецедент был ещё в 80-е. Если брать весь этот временной отрезок, то это просто мизерные изменения. Думаю, ещё через 40 лет рабочие по всему миру будут крутить гайки, как и 100 лет назад. А вообще, сравнивая автоматизацию заводов и автоматизацию труда программиста, надо понимать, что на заводе роботы выполняют повторяющиеся операции. В программировании все повторяющиеся задачи давно решены всякими библиотеками, фреймворками и т.д. А то, что делает программист - это уже как раз штучная работа. А в штучном производстве то самое ремесленничество процветает и поныне.
Если смог Вася, то сможет и Петя.
Ну вот Петя посмотрел на Васю и сказал — «данунах, китайцы дешевле».
так и произошло, а потом Вася посмотрел что все у него закупаются, и сказал, да ну нах, хотите покупать у нас, вот вам список условий - девственниц ежедневно дракона кормить, ходить исключительно с голым торсом, на голове ведро, и да, там Света не согласная и пытается что то сама делать, убедите ее нас слушаться, а то отлучу от кормушки.
Что вы имеете в виду под "полностью автоматизированный"?
Без участия людей - операторов. Такие заводы уже есть у Xiaomi
Для таких есть термин автоматический. Автоматизированные требуют участия человека по определению.
Ну и такие заводы слишком затратны в производстве. Они имеют смысл только если производимая продукция сможет окупить эти затраты. И перенастраивать их на новые модели, подозреваю, тоже не просто. Возможно, в Китае такое ещё можно сделать за счёт дешёвой рабочей силы. Но в повсеместно такое вряд ли будет доступно.
Так ручной труд дешевле. Даже кроссовки какие-то взять: дешман шьют вручную где-то в Азии, дорогие - производят механизированным путём. Машины то гораздо точнее. То же и с автопромом - немецкая большая тройка производится практически полностью роботами, а что попроще - вручную в странах 3го мира. Исключение - короткоживущая техника вроде смартфонов. Т.к модельный ряд обновляют каждый год, автоматизировать производство нет смысла, собирают только руками.
У вас похоже, как автор выразился "защитный механизм" 😁
Точно будут нужны аналитики, чтобы осмыслить весь масштаб бедствия, с учетом того, что ии обладает навыком генерить правдоподобные, но принципиально ошибочные решения.
Мы будем пользоваться аи инструментами. Уменьшить ли это потребность в разработчика - нет, ведь количество кода из-за кодогенерации вырастет кратно и те задачи, которые раньше решались по несколько спринтов начнут укладываться в 1 спринт или даже меньше. Просто производительность вырастет и вероятно умение пользоваться инструментами этими станет требованием к многим вакансиям. Но количество мест в it индустрии продолжит расти, хотя бы потому что мир все больше и больше цифровизируется и такое чувство, будто этот процесс бесконечен.
Впринципе я сам пользуюсь аи ассистентами, они реально удобные и код генерят за частую достойный. Тебе остаётся лишь направлять ассистента в нужное русло и проверять за ним. Чем более подробно ты описываешь что ты хочешь от сервис-класса, функции или какой-нибудь фабрики, указываешь на применение конкретных патернов, например, посредника, для тех или иных случаев, указываешь на использование конкретных библиотек и фреймворков с конкретным версия и, тем с более высокой долей вероятности ты получишь рабочий код на выходе. А ещё использование аи ассистентом полезно для разработчика тем, что он из кодера превращается в проектировщик, в такого технического архитектора. Так что думаю ии ещё могут и уровень разрабов поднять.
Ага, а соседний CEO другой ИИ-компании утверждает, что они сильный ИИ в этом году выпустят. Чего только не скажешь ради инвестиций.
Один плюс от их заявлений - они отпугивают людей, который в IT идут исключительно ради денег и думая, что это легко, авось охладят мировой рынок.
Не совсем так. Такие заявления
помогают людям, которые ни фига не шарят и даже не собираются, решиться пойти-в-АйТи. Потому что можно потерпеть пол годика, попасть в штат, а там "90% кода будет писать ИИ", а зарплату получать человек на карточку
дают повод менеджерам заявлять, что "через два года будем экомить 70% на ФОТ программистов. Код за них будет писать ИИ"
А ещё
Пройдет еще десяток лет, и отставные программисты станут попадаться среди охранников на автостоянках. Едва ли с этим можно что-то поделать.
Шикарная цитата из журнала Хакер, 2006 года.
https://xakep.ru/2006/05/31/31901/
Впрочем с учетом появления значительного числа выгоревших, а также с учетом случаев яркого снижения когнитивных способностей после короновируса...возможно, что статья в Хакере 2006 года оказалась права
Ух ты какая статья то классная
Там есть и другие клёвые заходы
Да что там, теперь в объявлениях о знакомстве девушки просят программистов не беспокоиться – вот интегральная оценка ситуации, в которой оказались рядовые труженики клавиатуры.
...
Программист – это тот, кто пишет программы. Из-за потасканности термина программисты вынуждены называть себя разработчиками. Крайним случаем терминологической путаницы, которой подвержен невежа-обыватель, надо считать утверждение «программист=хакер»
Сейчас те, кто оставался в школе на второй год по несколько раз из-за неуспеваемости по математике, учась в классе коррекции, могут учиться при помощи ChatGPT программированию и разработке, и верить, что смогут устроиться на работу, даже в 45+ с образованием 9 классов без опыта работы, без английского. А ИИ их ещё и поддержит, в роли психотерапевта выступит, скажет, что IT можно и без образования залететь. А некоторые просто промпты будут учиться писать так, даже не вникая в сам код особо. И при помощи тех же инструментов проходить собеседования и по инструкциям с Ютуба как это делать.
Поэтому Каналы ютуба и телеги, линкедин, вк, фейсбук полны "свитками священных заклинаний" - универсальными сборниками промтов от супер-экспертов с неполным средним образованием.
А перспективные вкатуны читают это, радуются и представляют как будут работать на пляжике с телефончика.
Как говорится "мы лежим, а денежки (з/п) идут)".
В ит большинство идет исключительно ради денег и плюшек, которые дает ит. Уверен и вы туда ради денег пришли, ведь если бы зп в ит была, скажем, как у кладовщиков и нужно было бы столько вкалывать, вы бы на ит даже не посмотрели
Ну, например, я пришел в IT не ради денег. Зарплата была как раз примерно как у кладовщиком и точно ниже чем у продавцов. Что дальше?
Пришел в айти 25+ лет назад когда мне родители говорили "зачем ты туда идешь, поступай на юриста или экономиста", и действительно тогда зарплаты в том месте, где я жил, у кладовщика были схожие, у юристов и экономистов сильно выше, а вкалывать приходилось дико, но меня это как-то особо не смущало. Ну и плюшек тоже особо не было кроме "свободного" графика - "хочешь пришел пораньше, хочешь ушел попозже".
Мне бабушка все 90-е говорила "что ты сидишь перед компуктером, иди лучше в сапожники, работа всегда будет, и деньги будут".
Ха-ха! Мне родители то же самое говорили. А девочка соседка, которая за 2 месяца научилась делать маникюр зарабатывала в 4 раза больше меня. С тех пор многое поменялось 😄
Теперь она зарабатывает только в два раза больше?)
Простите, но шутка напрашивалась :D
Сам когда начинал работать программист на пол ставки после учёбы - продавец в магазине больше зарабатывал.
ведь если бы зп в ит была, скажем, как у кладовщиков и нужно было бы столько вкалывать, вы бы на ит даже не посмотрели
Если бы за чистку нужников платили больше всех, то все бы чистили сортиры, а не программировали. Но, к сожалению или к счастью, чтобы получать много в айти нужно знать немного больше, чем при чистке туалетов.И компании по (не)понятной причине готовы платить за это больше, чем за что-то ещё.
В ит большинство идет исключительно ради денег и плюшек, которые дает ит.
Я надеюсь вы приведёте данные опроса абсолютно всех айтишников РФ(а это где-то 3-4% населения), где подавляющее большинство проголосовало за деньги,так?(картинка с Падме). Поэтому не стоит говорить за толпу, особенно стереотипами.И не надо всех под одно лепить, особенно незнакомых вам людей,таких как я. У всех свои причины прийти в какую-то профессию и далеко не у каждого это сводится к деньгам и плюшкам. Мой случай это любовь к компьютерным играм из детства и к ПК в целом, которая переросла в профессию. А ещё вы не поверите, но на своей первой работе я получал меньше, чем кладовщик в той же компании(да, не у всех со старта зарплата в 300к/наносек), но тем не менее я дальше кодил, а не таскал ящики и считал компоненты.
Абсолютно нормально, что в профессию тянутся из-за её финансовой привлекательности - значит она востребована. Да, перегревает рынок адово, но те, кто полюбил прогу не за деньги - так и останутся, кто полюбил в процессе погони за деньгами - тоже, а остальные сами уйдут. Все так же, как и раньше с юристами/бухгалтерами/банкирами, история знает много примеров, как какая-то профессия на "хайпе" привлекала людей, а потом её сменяла другая.
У вас вообще какой-то пункт на осуждение зарплат айтишников, судя по вашим комментариям в профиле. Не могу вас за это осуждать, заблуждение ныне расхожее. Но программисты не виноваты, что им так много платят. Сколько дают - столько и берут.
Я нисколько не принижаю труд других профессий и глубоко уважаю наших клининг-менеджеров, разнорабочих, доставщиков и других людей, которые не прогают, но приносят пользу в меру своих сил и желания. Любой человек, работающий на совесть - молодец. Другое дело, что для компании важно только то, сколько денег ты приносишь или экономишь им, и тут есть достаточная большая разница в том, что один Java-Васян за 150к может заменить 10 Васянов за 30к на линии производства или в техподдержке, если напишет программу для оптимизации их работы. Поэтому можете винить в этом капитализм, компании, несправедливость или что-то ещё, но никак уж не самих прогеров.
людей, которые не прогают, но приносят пользу в меру своих сил и желания.
Вот в этом и состоит различие между прогерами и прочими человеками: если прогеру что-то до чёртиков надоедает — он пишет маленький скрипт: пусть теперь компьютер этим занимается, он железный.
Клининг-менеджеров
Деливери-партнеров и мастеров на все руки)
Ну я на днях попробовал aider с Claude 3.7, дороговато, но действительно может с нуля проект написать на питоне, пусть и приходится им рулить пока что, описать примерную архитектуру, тз, ошибки скидывать ему чтобы исправил и т.п.
Хотя дороговато - смотря с чем сравнивать. Дешевле человека, и при этом быстрее. Про результаты работы я бы сказал что уровень хорошего джуна получается. Ну и большие проекты не осилит (ну на это нам и дана многомодульность/микросервисы)
У подобного подхода есть пара существенных минусов:
1) Код нейросети, особенно большой, становится слабочитаемым для человека. И чтобы потом его доработать, нужно... тоже использовать нейросеть. Иными словами, вы просто увязнете в ней и не сможете от неё отказаться, даже если захотите. Я сам пробовал дорабатывать нейрокод и чаще всего проще с нуля свой написать, чем лезть в те дебри.
2) Нейросети учатся на коде людей, поэтому в будущем если кодить начнут только они, то и обучаться начнут они тоже только на своей коде. Как это будет понимать человек - мне лично не представить. Как она будет осваивать те языки или библиотеки, где не так много исходного материала(т.е те, которые люди недавно придумали) - тоже.
Исходя из этого, я слабо себе представляю, чтобы они вообще заменили программистов - человечество просто потеряет контроль над кодом как таковым и будет сюжет игры Crying suns.
Имхо, нишевое применение(то, зачем слабый ИИ и придумали), особенно не-кодерами это более чем нормально. Использовать как помощника - тоже. Но заменять им всех - а как тогда будете специалистов выше уровнем получать, почкованием от сеньоров? Да и человек, который будет учится не обычным путем, а через бота, будет писать код такого же качества.
Я пользовался Codeium-ом и их редактором, после смены их ценовой политики он отупел(на reddit-е каждая вторая тема об этом). Курсор да, хорошо справляется с простыми задачами, но когда у нас бывает простая задача, у которой срок не закончился вчера? И они часто подвержены галлюцинациям(даже по их же заявления, gpt 4.5 галлюцинирует в 40% случаев, если не знает ответ, т.е почти в половине). Можно поискать статью, где нейроботов просили посчитать количество пальцев на шестирукой руке и никто из них не справился. Так что помимо галюнов ИИ, нужно ещё отсутствие галюнов у обучающих(надеюсь, что кто-нибудь ради прикола протащит теорию плоской земли в GPT, во умора будет).
Так что надо ИИ воспринимать как инструмент, которым можно неправильно воспользоваться и отстрелить себе всё что можно, но с правильным использованием можно ощутимо улучшить продуктивность, если ты уже в чем-то шаришь. Или если не шаришь вовсе, но тебе и не нужен уровень Enterprise
Использовать как помощника
Мне не нужен такой помощник, за которым глаз да глаз нужен, причём не так, что «три раза сказал — он научился и больше не ошибается», а такой, который может ошибиться всегда.
Так что надо ИИ воспринимать как инструмент, которым можно неправильно воспользоваться и отстрелить себе всё что можно, но с правильным использованием можно ощутимо улучшить продуктивность, если ты уже в чем-то шаришь.
Ну так об этом вроде и речь, не? Да, нужно контролировать его работу, бить по рукам за косяки, ошибки и стиль. Но производительность труда он повышает вполне серьезно (а еще куда проще начать писать с ИИ на том стеке который плохо знаешь, если в целом кругозор имеешь и опыт). Пощупал тут сегодня вечером roo code с claude 3.7, будто слабый джун/сильный стажер работает. Но при этом закончивший топовую вышку (так что знания имеет глубокие, просто применять не умеет). Если ему дать архитектуру и план работы (ну или разработать совместно с ним) + контролировать результаты, давать уточнения и т.п. - получается вполне себе мидлово-сеньерный код. И куда быстрее. Gонравилось больше чем с aider, хотя бы по той причине что умеет в тулы (mcp + лучше терминалом пользуется), а так же редактирует пофайлово, не нужно смотреть огромный дифф как у aider, у которого либо целиком одобряешь, либо целиком переписываешь (хотя не удивлюсь если это настраивается, но я вроде не нашел). Всяко удобнее когда можешь исправить в процессе редактирования любого файла, и токенов меньше ест, и меньше самому в голове держать.
З.Ы. Но пока серьезным ограничением еще и размер проектов является. Хороший результат показывает только на небольших проектах. Чем больше проект - тем больше ручной работы, больше приходится его исправлять и направлять. Так что микросервисы/модульность выход разве что, и то с нюансами.
З.З.Ы. Хотелось бы конечно локальную модель уровня sonnet 3.7, надеюсь в течении пары-тройки лет появятся, доступные для запуска на железе домашнем за адекватный ценник (тысяч 5$), qwq:32b надежду дает, для своего размера прям хороша, хотя именно по коду deepseek проигрывает, как и по глубине/ширине знаний, в целом еще год назад я и представить не мог что подобную модель смогу локально запускать, которая gpt-3.5, кмк, неплохо так уделывает.
Если ему дать архитектуру и план работы (ну или разработать совместно с ним) + контролировать результаты
Ну да

В новости речь, что ИИ будет все 100% кода писать, что можно считать равноценным "Прогеры не нужны, осваивайте швабру". Ваш комментарий я воспринял тоже в таком ключе, что вы пишите код исключительно через ИИ, без доработок и исходил из этого. Извиняюсь, если был не прав и понял вас не так, как вы задумывали.
Но производительность труда он повышает вполне серьезно (а еще куда проще начать писать с ИИ на том стеке который плохо знаешь, если в целом кругозор имеешь и опыт). Пощупал тут сегодня вечером roo code с claude 3.7, будто слабый джун/сильный стажер работает. Но при этом закончивший топовую вышку (так что знания имеет глубокие, просто применять не умеет). Если ему дать архитектуру и план работы (ну или разработать совместно с ним) + контролировать результаты, давать уточнения и т.п. - получается вполне себе мидлово-сеньерный код
Не сочтите за претензию, но я считаю, что нужно разделять понятие "ИИ пишет код" и "ИИ помогает вам писать код". Ваш случай - второй, и если тут убрать кожаного мешка(т.е вас), то ии станет бесполезен и скатится на уровень стажёра. Я именно так и призываю его юзать - как помощника, когда у вас уже есть опыт, компетенция и знания( и считаю, что за этих их будущее на ближайшие лет 10). Без ИИ вы бы так же дали этот план условному джуну и он бы так же работал. Может с меньшей отдачей, но зато учился бы ощутимо быстрее и без вложения 800млн долларов в его развитие.
Новости, хайповые заголовки и СЕО двух закрытых ИИ компаний(я думаю все поняли, о ком я) активно вбрасывают именно первый вариант и многие люди, не сильно погруженные в ML воспринимают это на веру. Такие вещи надо развеивать, потому что на данный момент они очевидно лживы, если только они взакрытую не делают аналог Скайнета, который в 27 нас всех уничтожит(но думаю у них не хватит на это видеокарт, даже если они заставят заводы Nvidia работать день за два).
Но пока серьезным ограничением еще и размер проектов является.
Я косвенно это и имел ввиду, когда говорил про доработки нейрокода. ИИ сейчас очень плохо(по меркам человека) воспринимает контекст и особенности предметной области. На хабре есть статья, как люди попытались применить его для создания планировок квартир и зданий в городе, вышло не очень по причине того, что ИИ не сильно улавливает регламенты очень сильно регламентированной области в виде строительства. По этому он и хорош в изоляции, когда нужно написать конечный код с точкой входа и выходом(функция и микросервис под это подходят идеально), но плохо связывает несколько таких частей вместе или когда нужно учесть особенности предметной области . А т.к больше размер - больше связей, то логично, что он сыпется с увеличением проекта.
Имхо, согласен с вами, что ИИ станет частью нашей жизни и полезен, я просто против преувеличения его влияния( как минимум текущего).
Ну фактически именно код пишет он, я код не писал в этих экспериментах с aider/roo code. Выступал архитектором/ревьювером/ментором. Т.е. реально выходит что 100% кода написано LLM (ну ладно, может в промптах была пара примеров или названий функций которые лучше использвовать, так что пусть будет 99%), пусть под контролем и руководством человека. Пробовал так же отдавать ему написание без моего котроля, тогда да, он быстро скатывается в дичь (в общем то почти сразу начинает дичь писать, но она какое то время работает, пока проект не разрастается).
Я также могу использовать плагин к IDE, который перебирает буквы, и я говорю ему, какую букву фиксировать. Плюс автодополение. Тут тоже 100% кода будет написано IDE, но IDE не заменит меня. Ваш случай чуть хитрее, но суть остается той же:
без моего котроля, тогда да, он быстро скатывается в дичь
Не сказал бы что чуть. Да, по прежнему надо понимать как написанный код работает, уметь в архитектуру и алгоритмы, знать sdk (но уже не так обязательно кстати, если пишешь что то не критичное) и предметную область. Но по сути из написания кода работа смещается в сторону архитектора. Уровень абстракции серьезно довольно вырастает (хоть и течет эта абстракция куда сильнее чем нижележащие уровни).
Про замену программистов никто не говорил, только про то кто будет код писать (впрочем часть программистов либо отвалится, действительно, либо количество проектов сильно вырастет, ибо за счет повышения эффективности за те же деньги куда больше можно будет делать).
я думаю, через три-шесть месяцев мы будем там, где ИИ будет писать 90% кода. А затем через 12 месяцев мы можем оказаться в мире, где ИИ будет писать по сути весь код.
ОК, давайте вспомним эту фразу через год. Март 2026 - какой ты там? ;) #Нострадамус
Через полгода ИИ заменит исполнительного директора Anthropic на 90%. Через год — на 100%.
P.S. Ах, да, реферальную ссылку на телеграм не забыть бы...
что характерно, то зарплаты вместе с золотыми парашютами для этих людей явно ставят их позиции как лидирующие на замещение. Или мне так только кажется.
Тут конфликт интересов. Эти люди и есть те, кто принимают решения. Заменять себя они, естественно, не будут.
У кого-то был опыт, чтобы сравнить Claude Code, Cursor Agent и Windsurf с плагинами для IDE, такими как cline.bot , Roo-Code, continue.dev?
Я тыкал все эти редакторы, Cursor юзаю ежедневно. Из плагинов - тестил только continue.dev. Я не очень понял, зачем пользоваться им, а не полноценным редактором. Я довольно глубоко изучаю как работают эти IDE на базе ИИ, у того же Cursor очень интересные технические статьи в блоге, и мне совершенно непонятно, как плагин может конкурировать с IDE. С кажем, те же lint errors Cursor исправляет при помощи очень хитрой механики клона IDE в бекграунде, в которой агент работает незаметно для юзера. Плагином или экстеншеном ничего такого сделать нельзя.
Как минимум потому, что все эти IDE требует нести им деньги, ты не можешь придти к ним со своим API и ключом, как это можно сделать в перечисленных выше плагинах. Есть очень неплохая для написания кода и дешевая Google: Gemini Flash 2.0, а есть и открытые модели, которые можно запустить локально. Это и экономия, и гарантия, что интеллектуальная собственность (код), не покинет периметра компании.
а, понял. ну, с локальными моделями я Cursor гонял - он умеет в custom api URL, а LM Studio в свою очередь умеет в OpenAI-compatible API. главная беда в том, что LLM для генерации кода в агенте - это, безусловно, супер-важная вещь и 50% результата, но ещё 50% - это Tab LLM, та самая, которая делает очень быстрый автокомплит. и вот там кастомные модели, локально которые не особо разворачиваются :(
в любом случае, может быть вам стоит глянуть в сторону Void - это попытка сделать open-source версию Cursor, очень свежий проект: https://github.com/voideditor/void
Странное утверждение. Конечно ты можешь прийти к курсору со своим ключом, это хорошо работает. Хотя их штатные механизмы ещё лучше.
ты не можешь придти к ним со своим API и ключом
Можешь. Но насколько я понял, вдумчиво прочитав обсуждения на Reddit (сам не экспериментировал) платить за API того же Claude получается дороже, чем платить за Cursor (20 баксов за 500 запросов). А локальные LLM, которые могут хотя бы приблизиться к уровню лучших API, увы, требуют железа за миллионы рублей. И всё равно получится хуже.
Cline умеет linting ошибки фиксить. Не знаю что там за незаметность в Cursor, в cline просто все ошибки передаются в промпте агенту и он может решить пофиксить их
continue.dev
Это не агентский плагин. А вот агенты Cline/RooCode закрывают большую часть функционала Cursor, тот же MCP, например, там реализован давно (но закрывают не весь функционал, не спорю). Механику клона IDE с помощью расширения может сделать и нельзя, но концептуально аналогичного результата можно добиться и иным способом, пусть решение в основе своей и будет отличаться.
Пишу не как хейтер курсора. Я и сам в последние две недели перешёл на курсор со своей кастомной солянки из VSCode+RooCode+Continue. Ибо он стал куда лучше последние месяцы (4 месяца назад уже пробовал его и он на моих тасках выдавал результаты хуже, чем кастомная сборка).
Но и сейчас у него есть проблемы. И их не мало. И кое-где он проигрывает обычному агентскому расширению RooCode. Просто именно на данный момент инструмент на моих задачах оказался лучшим из опробованного. Однако в любой момент это может поменяться и вперёд выйдет другое решение.
Я делал сравнительный анализ трёх инструментов (cursor, github copilot, tabnine) для своей компании при работе на наших тасках и с нашей кодовой базой, и если интересно, могу привести результаты.
Если коротко, то курсор с небольшим отрывом победил github copilot (и RooCode, который для меня стоит на одной с ним ступеньке).
спасибо, очень дельный коммент. на выходных потыкаю RooCode. от github copilot я отказался в своё время как раз потому, что они очень сильно отстали от Cursor. потом они наверстали - но я не увидел причин возвращаться назад.
Там, у github copilot, вроде буквально сегодня должна была выйти версия 0.25, где обещали улучшить поиск по файлам и обогащение контекста (одна из двух основных причин превосходства курсора над ним). Но вообще, у него есть всякие интеграции из-под экосистемы гитхаб для интерпрайзов. Именно этим он привлекателен для команд. Но если нет большой команды, то, на мой взгляд, курсор в однозначных фаваритах.
Мне тут пришлось всё бросить и возвращаться на PyCharm, потому что коллеги, которые были в проекте до меня и всю жизнь на PyCharm, наплодили кучу конструкций которые другая IDE распарсить не может и не предлагает разумные дополнения, считая что всё везде типа Any | None.
Вот поэтому и нужен плагин.
Подписки за $20 хватает или свои ключи используете? И насколько медленные запросы медленные?
Насколько я вижу, курсор используют, потому что у него подписка со всеми sota дешевле, чем брать подписку на них по отдельности. Посмотрел их доки, не понял, зачем мне он, когда можно юзать continue в своей IDE.
Режим агента, так то тоже continue использую (тем более что он есть для jetbrains ide). Мне курсор не нравится, ибо с ollama неудобно использовать. Пробовал aider - уже лучше, но работает из терминала (так что настраивать интеграцию надо руками с тем же линтером/запуском тестов/билда), и тоже заточен больше на облачные модели, по крайней мере как их указывать в конфиг файле я нашел, а как указать эндпоинт для ollama в конфиге - не увидел, только через переменные окружения.
Все шляпа, полная!
"Что всё это значит?" == "Дайте денег"
Деньги набранные у инвесторов заканчиваются, ничего похожего на самоокупаемость (не говоря уже о прибыли) на горизонте не просматривается, вот и приходится кормить деньгодателей сказками про 90 и 100%. Горизонт сказок правда сокращается на глазах, еще осенью было "два-три года", а теперь уже полгода-года.
Умри ты сегодня, а я завтра (с)
>может погуглить неизвестные вещи|
Искать в интернете уже очень сложно, так как, по ощущениям, больше половины сайтов к настоящему моменту написаны бредогенерилками различного качества генерации. Приходится держать не чёрный список, а уже белый список: то есть ходить на сайты, про которые точно помнишь, что там, вроде, люди и полезные советы. Пока поисковики не начнут гарантировать поиск осмысленной полезной информации, хотя бы за деньги, толку от такого поиска будет не очень много. Возможно, их основной доход скоро будут составлять не рекламные объявления, а подписки на N поисковых запросов, а за фильтрацию осмысленных данных будут брать дополнительно.
очень верно. Непонятно зачем они все это оформляют в качестве статических страниц правда, в принципе могли публиковать просто точку входа которая сгенерит любую информацию по поисковому запросу, хотя вроде и это тоже есть.
Там проблема курицы и яйца: чтобы поисковик привёл кого-то на страницу по некоторому запросу, она должна быть проиндексирована и содержать релевантный контент. А значит уже быть создана, возможно по другому запросу. Создавать отдельные страницы под каждый запрос в реальном времени это долго и дорого - LLM хочет денег за каждый токен. Получается некая задача на оптимизацию.
ну, честно говоря, мне кажется вы очень хардкорные вещи имеете в виду. там поиск уровня "встретил в коде неизвестную либу -> загуглил документацию этой либы -> получил ссылку на документацию на официальном сайте, и нашел ответ в доках". ну то есть в 90% случаев - это просто запрос дополнительной информации по какому-то компоненту системы, очень редко, когда ИИ идёт в интернет именно за поиском готового решения (все таки мы от него обычно ждём, что он это готовое решение напишет сам).
вот пример, как это обычно выглядит:

Возможно, их основной доход скоро будут составлять не рекламные объявления, а подписки на N поисковых запросов, а за фильтрацию осмысленных данных будут брать дополнительно
наивные, их основной доход будет состоять с арендной платы за право остаться в списке осмысленных источников контента.
Логика в нашем мире давно вышла 'из чата'
Возможно, их основной доход скоро будут составлять не рекламные объявления, а подписки на N поисковых запросов, а за фильтрацию осмысленных данных будут брать дополнительно.
Kagi - рекламы нет. Подписка есть, всякие способы настройки поиска тоже есть, ИИ (упрощенно - выглядит как Нейро от Яндекса но есть и полноценный чат с топовыми моделями) - на макс подписке. Но вот насколько знаю полноценного полностью своего индекса - у них нет.
Наше время, наши дни:
Программист: AI, напиши хороший код, да так, чтобы мне за него хорошо заплатили.
AI: На.
Программист: Господин, я написал код.
Господин: AI, посмотри что это за код.
AI: Хороший код, я бы рекомендовал хорошо за него заплатить.
Недалёкое счастливое будущее:
Всё то же самое, но AI универсален, антропоморфен, и получает откат.
Пытаюсь использовать ИИ для разработки и администрирования. Первый момент ИИ не всегда прав и если не знать как решается задача, он может упорно игнорировать корректное решение предлагая кривые и часто рискованные решения которые никуда не ведут. Второе, когда надо копнуть глубже, мне ни разу не удалось сделать это с помощью ИИ, во всяком случае в devops, все его рекомендации относительно сложных случаев носят общих характер и применимы только в руках квалифицированного специалиста. Хотя надо признать, он изрядно экономит время в задачах небольшой сложности, успешно заменяя google.
В разработке, из того, что может в контекст проекта пытался использовать курсор. Первое, итерационный промт часто занимает больше времени чем собственно написать код. Второе, детализация промта должна быть очень высокой,чтобы решение можно было использовать на практике, банально он постоянно путает типы данных внешних моделей и внутренних моделей. Третье, у него нет никакой архитектуру, за рамками одной задачи, т.е. три задачи будут написанны так как будто их писали в рамках трех разных проектов, три разных программиста. Что дальше будет с оптимизацией вообще сложно представить.
Если так подумать, то идеальный промт, это код, он однозначный и короткий. Получается, что написать код быстрее, чем полностью эквивалентный промт. Но быстро накидать прототип опустив кучу важных деталей, или попробовать несколько вариантов решений, тут да, ии позволяет сильно экономить время.
простите, а вы именно агента используете, или просто режим "запрос-ответ"? просто проблемы, с которыми вы столкнулись выглядят именно как использование обычного режима, не агентского. и отсутствие архитектуры/проектирования решается тем, что в начале процесса надо попросить его запроектировать решение, согласовать с вами, после чего уже переходить к написанию кода.
плюс, задокументированное и запроектированное решение можно держать в контексте ко всем будущим запросам - это кратко улучшает качество решений.
для DevOps задач я его юзаю не очень часто, мне непривычно использовать терминал в Cursor, пока не переучился, но в кейсах, когда надо было что-то несложное сделать - зайти на сервер по ssh, прочитать конфиг-файлы postgres, поправить лимиты памяти и кол-ва коннектов - справлялся вообще без проблем, полностью автономно.
т.е. три задачи будут написанны так как будто их писали в рамках трех разных проектов, три разных программиста
поэтому не забывайте в конце промта писать "here is the reference how similar task has been solved")
Или можно кратко

Что ж так сложно людям воспринимать новую реальность? Если у нас есть команда профессиональных программистов с огромным опытом именно в нашей задаче, нужно нам будет им в ТЗ всё описывать до мелочей или они сами нам предложат рабочие решения, поняв, что мы хотим видеть? Ну, вот эту всю команду и заменит ИИ.
Ну вот как приблизитесь к созданию такого понимающего опытного ИИ, тогда и приходите.
Что ж так сложно людям воспринимать новую реальность?
Ну и где она, эта реальность? Не в которой ИИ очередной хелловорлд пишет, а где берёт проектик на полмиллиона строк и за минуту добавляет новую функциональность, причём без переспрашиваний и ошибок уровня «датычо, совсем долбанулся???»
Сколько раз уже повторял
Все программисты в мире делятся на две категории:
— Те, кто считает, что ChatGPT кодит на порядок лучше их;
— Те, кто считает, что ChatGPT кодит на порядок хуже их.
И те, и другие абсолютно правы.
(терпеливо ждёт, пока дойдёт)
Буквально на днях я попросил DeepSeek написать код для вычисления ядра матрицы через QR-разложение (довольная банальная задача). Код не работает, сообщаю ему об этом, а он "всё норм, не для всех матриц есть решение". А решение точно есть, проверил в Вольфраме. Это теперь что, с нейросетью ругаться надо, доказывая, что прав я, а не он?
Реальность хорошо видна, если хоть немножко следить за темой. Агентские системы за один промпт уже пишут себе 3d игры, пусть пока неидеально. Мой тест на написание Xonix уже пройден и это даже не агентская система, а Claude 3.7. Ещё несколько месяцев назад никто не мог справиться. Аппетиты растут, конечно, уже оговорки в полмиллиона строк и одну минуту без переспрашиваний. Много людей знаете, способных на такое? Ну, будет вам и полмиллиона и минута, может и уже есть такое для задач уровня джуниоров. Никаких принципиальных ограничений не видно. Но люди упорно придумывают всё более сложные условия и говорят "Аааа, вот видите, они ничего не умеют". Очень будет забавно понаблюдать что придумают через пару лет. Очень узкие кейсы останутся, где люди ещё может будут превосходить ИИ.
Очень узкие кейсы останутся, где люди ещё может будут превосходить ИИ.
Какие?
Работа программиста это ж не только кодинг, как на соревновательных задачах, часто кодинг вообще занимает малую часть времени. Много усилий уходит на поиск, согласование подходов, библиотек, архитектуры, требований, визуальный анализ мокапов, док каких-то. Это частично уже тоже мультимодальные модели берут на себя, но иногда и текст с картинки распознать не могут. Вот это всё будет, но попозже.
Мой тест на написание Xonix уже пройден
О, интересно! Дадите ссылку почитать об эксперименте?
Могу ссылку на код дать. Сильно до ума не доводил, 4-5 запросов было, чтобы исправить основные косяки и добавить несколько функций. Но вполне играбельно уже даже. Оценивал прогресс по сравнению с прошлыми моделями. https://jsbin.com/zitituquta
Код - это прямо очень хорошо, спасибо! Но гораздо интересно именно в разрезе "какой был запрос, что получалось в ответ, как доводили до ума" :) Вот буквально недавно статья такого формата выходила, вдруг решитесь написать подобное - будет очень круто)
Мой тест на написание Xonix уже пройден
Осталась самая мелочь: найти желающих играть в XONIX в 2025 году.
Очень будет забавно понаблюдать что придумают через пару лет.
«Асимптота — воображаемая прямая, к которой график функции бесконечно приближается по мере удалении параметра в бесконечность, но никогда её не достигает.» ©
Что ж так сложно людям воспринимать новую реальность?
Ну да, ни одна статья с пиаром ИИ не может обойтись без комментариев о том, что программисты уже скоро, вот-вот уже сейчас станут не нужны :)
Ну, ближайшие несколько лет нужны будут еще. Следить за тем что там AI наворотил, вмешиваться в сложных случаях, ставить ему тз, архитектуру описывать, менеджить и т.п. Плюс те случаи когда компаниям не хочется в облака свой код отдавать. Плюс штуки типа 1с, для которых AI не заточен и всякие редкие языки, свежие библиотеки и наработки.
Еще недавно я в этом сильно сомневался, думалось что может и доберутся модели до мидловского уровня (за которым приглядывать все равно надо) лет за 5-10, но стоить будут дороже человеков, ибо будут ну очень тяжеловесные, доступные для запуска только на серверах и т.п. А вот после того как qwq:32b пощупал - склоняюсь к тому что работа программистов действительно сильно поменяется на горизонте лет 5. Да, эта модель далеко не идеальна, тому же claude 3.7 уступает значительно в задачах написания кода, но это блин крошечная модель, которая, как по мне, выдает результаты которые еще недавно chatgpt 3.5 и не снились.
Кмк, по моему опыту работы с джунами (не сказать что богатому, правда) - AI реально может их уже сейчас вполне заменить в большинстве своем. По крайней мере для массовых простых приложений и сайтов. С одной стороны пригляда за ним нужно чуть побольше, и побольше разжевывать + по рукам бить иногда. С другой это компенсируется скоростью работы.
нужно нам будет им в ТЗ всё описывать до мелочей или они сами нам предложат рабочие решения, поняв, что мы хотим видеть? Ну, вот эту всю команду и заменит ИИ.
Да-да...
Те слова, которые, применительно к ситуации, что я описывал как пример в позапрошлую пятницу, и которые, как выяснилось, не все правильно поняли, в иных ситуациях, о которых я доложу ниже, необходимо понимать с учетом тех поправок, которые будут ясны из следующих примеров…
В принципе, даже верю. Но нужна оговорка "кода на привычных языках программирования"
По сути, наблюдаем +1 уровень абстракции. Команды процессора -> ассемблер -> опционально (JIT/интерпретатор) -> исходный код привычного ЯП -> исходный код промптового ЯП
Возможно, будут даже промпты на промпты. Условно, модель, работающая на уровне архитектора, пишет промпты для модели, пишущей код отдельных модулей.
Не совсем так. В случае ассемблера его можно годами не видеть, так как ваш код однозначно в него компилируется. С промтом так не получится.
А вот хз. Даже сейчас уже практикуются быдлоподходы, вроде "если выход предыдущего агента не дает валидный json, то просто надо его еще раз скормить LLM с промптом вот схема, вот данные, впихни как-то одно в другое".
А дальше то невежество будет только расти. Ну выкинуло приложение рантайм эррор. Так чего-бы не скормить текст эррора вместе со стек трейсом и исходниками ИИ, и пусть сам фиксит?
Самое страшное, что именно так и будет.
Почему страшное? Потому как потеряется оптимальность и консистентность (хотя о какой консистентности можно говорить в контексте ИИ?))
Как будто, оптимальность и консистентность есть сейчас, в мире, где сраные текстовые мессенджеры запускаются по 10 секунд, едят по 2ГБ памяти, и падают с многозначительным сообщением oops. Something went wrong
Потому как потеряется оптимальность
Ничего страшного, поставим камень помощнее и памяти побольше!
И это даже не /s, этот горький катаклизм мы наблюдаем лет уже не знаю сколько.
Это называется vibe coding и я бы не назвал Андрея Карпатого (Карпаты) быдлокодером.
Самое веселое произойдет когда останется только два слоя абстракции: команды процессора -> исходный код промптового ЯП. Своего рода ИИ компилятор. Но до этого еще далеко
Хм. А мысль интересная. На этот счёт, помню, читал где-то, что генетическими алгоритмами выходило в лабораторных условиях создать суперэффективную схему для FPGA для анализа сигнала, которая эксплуатировала побочные эффекты, которые человек воспринимает исключительно, как зло, и только избавляется от них.
Но и недостатком было то, что гарантировать корректность работы на другой FPGA, или на той же, но при другой температуре, было невозможно
исходный код промптового ЯП
В чём его особенность в сравнении с обычными ЯП?
Неоднозначность, нечеткость и непредсказуемость поведения.
Звучит как достаточно большой код на C или JS
Ну нет. Большой C код может быть сложно понять, но там все четко и однозначно. Если в коде нету UB и прочих ошибок, то там еще и будет полная предсказуемость поведения. Если у вас написано a = b+c
, то у вас однозначно и всегда будет сложение двух чисел. Если вы в промпте напишите "сложи два параметра"
, то на выходе может быть что угодно. Может, он их в пирамидку сложит, или сложит их в базу данных. Даже с нулевой температурой, хоть и практически невозможно для такого простого примера. А уж в более сложных случаях возможность "галлюцинаций" быстро растет.
Угу, только где его нет, этого UB, кроме тривиальных программ, либо анально огороженных какими-нибудь MISRA? Даже ваш пример со сложением -- UB, если операнды знаковые и случится переполнение (до C23, по крайней мере). Не говоря уже про типичные сишные проблемы вроде выхода за границы с непредсказуемыми последствиями.
Ну случится и случится, это уже влияние внешних условий в рантайме. Но сложение всегда будет сложением. Исходный код будет компилироваться в один и тот же машинный код.
В C – да. А вот в JS сложение может внезапно стать конкатенацией, если вместо числа прилетела строка или массив.
Тем не менее, это все еще будет сложение в сторого описанной и четкой, хоть и извращенной, js логике.
Внезапно - не может. В стандарте описаны варианты, когда и как производится приведение типов при операциях.
А вот нейросетка на один и тот же запрос легко может выдать несколько кардинально отличающихся по смыслу и содержанию ответов.
Ну вообще можно seed задать, и тогда будет один и тот же ответ выдавать всегда на одинаковый запрос. Только смысла в этом не много)
А вот нейросетка на один и тот же запрос легко может выдать несколько кардинально отличающихся по смыслу и содержанию ответов.
Сложно ожидать чего‑то ещё от штуковины, которая прямо‑таки основана на генераторе случайных чисел (см.: «температура»).
ваше (физическое) существование тоже основанно на вероятностях (см. квантовая механика), но из-за больших чисел появляются новые эмерджентные не вероятностные свойства
Так то на микроуровне. При переходе к макроуровню неопределённости усредняются и испаряются.
Так я и написал, что это уже зависит от внешних условий в рантайме. Главное, что это будет абсолютно предсказуемое, задокументированное поведение. Внезапно было бы, если бы два инта так соединились.
В непредсказуемых внешних условиях поведение тоже иногда становится непредсказуемым, а некоторые баги — трудноуловимыми.
Какие непредсказуемые внешние условия могут вызвать непредсказуемое поведение компилятора? Мы же про компиляцию говорим. В частности, о сравнении компиляции из высокоуровневого ЯП и из естественного языка посредством LLM. А непредсказуемое поведение готовой программы это уже следствие проблемы в алгоритме, а не в компиляторе.
Я сравнивала не компилятор с LLM, а программу, написанную человеком (с непредсказуемыми багами, усугублёнными нестрогостью языка) и программу, написанную LLM (с непредсказуемым всем).
В принципе не сложно представить себе компилятор, который например использует HashMap, при этом ключи - объекты в куче, с в общем-то случайными адресами (GC и что-то ещё повлияет). И будет итерировать по этим ключам. Код получится правильный (иначе это баг), но другой чем прошлый раз.
В чём другой? Адресами значений? Но алгоритмически он ведь будет такой же. Если вы в исходном коде переименуете переменные и функции, или вообще обфусцируете его, он ведь всё-равно будет выполнять те же действия.
Но это уже нюансы, не относящиеся к теме.
Мой поинт состоит в том, что компилятор не обязательно полностью предсказуем. Значения, которые мы получим на выходе будут разумееется те же самые. А вот алгоритмически могут быть и разные (например разные оптимизации или кодогенерация). Совершенно запросто для разных компиляторов, вполне может быть для разных версий одного и того же компилятора, и редко но возможно для разных запусков того же компилятора. На каком-то уровне от этого конечно можно абстрагироваться. А где-то, если отключится оптимизация в tight loop, то это очень плохо.
Таким образом, абсолютной предсказуемости, я считаю, вы не правы. Да и документировать такие подробности мало кто будет.
Я понимаю, что вы хотите сказать. Но к обсуждаемой теме это не имеет отношения.
Таким образом, абсолютной предсказуемости, я считаю, вы не правы.
А что я писал про абсолютную предсказуемость?
Да и документировать такие подробности мало кто будет.
Какие подробности? Такие мелочи, что вы описываете, которые не влияют на результат?
А обсуждаемое поведение документировано.
Если у вас написано a = b+c
и в каком порядке будут запрашиваться b и c (если это функции), ведь бывает что это критично, а + как математическая операция должна одинаково работать в любом порядке, а значит с точки зрения компилятора это можно использовать для оптимизации (пример утрированный, кажется в стандарте именно этот момент указан, но есть куча других менее очевидных)
Ну там всё же его называют ЯП. Я то подумал, что уже какой-то особый язык для промптов придумали.
Ну нет, как только придумают однозначный и четкий язык для промптов, это будет лишь еще один язык программирования, для которого нужны будут программисты. Правда, там уже и не нужны будут нейронки, достаточно будет и простого компилятора.
Я уж не помню, где я это видел, но вроде как реальный коммит для "программы на промтовом языке" с просторов интернета:
- You must absolutely sanitize the user input.
- You must ABSOLUTELY sanitize the user input.
Вот такой вот он vibe-coding.
Да, AI частенько тупит
Да, иногда придумывает методы или берет методы не из этой версии библиотеки
Да, придумывает плохую архитектуру
Но!
С AI раскуривать какую-то документацию с ИИ кратно быстрее
С AI писать scaffold намного быстрее
С AI писать тесты, находить неиспользуемый код намного быстрее
AI расширяет T-модель знаний.
Я backend разработчик, но с AI я верстаю намного лучше
Я backend разработчик, с AI я намного лучший devops
И лично для меня самое главное: AI экономит кучу мыслетоплива
Например:
Я умею писать nginx.conf, но с условным ChatGPT я получаю результат в 10-15 раз быстрее, а главное не тратя мыслительной энергии
Да и кучу бойлерплейта AI пишет намного быстрее чем я, а я в это время могу пить чай и смотреть что он там делает
И это уже очень сильно изменило то как я пишу код.
Но, по правде говоря: я никогда не даю задачу напиши игру, или напиши фичу
Я говорю: напиши миграцию, напиши метод, напиши сервис, добавь в начало 4 проверки, оберни в транзакцию и т.д.
Когда-то мы перестали управлять памятью (с приходом Python, Ruby).
Я думаю уже пришло время перестать управлять стилями, проверкой синтаксиса и написанием тестов. Дальше больше.
Изменит ли AI то как мы пишем код? Уверен, что да. Думаю, что сильнее, чем появление интерпретируемых языков программирования и сильнее, чем появление фреймворков вроде React, Vue, Django или Rails
Полностью согласен. Использую точно такой же поход к использованию агентов и делю время работы надвое.
Да и кучу бойлерплейта AI пишет намного быстрее чем я, а я в это время могу пить чай и смотреть что он там делает
Макросы пишут кучу бойлерплейта ещё быстрее, чем AI.
А хорошая архитектура позволяет вообще не писать и не генерить болйлерплейт.
Даже самая идеальная архитектура всё ещё будет упираться в выразительные возможности языка.
Язык стоит выбирать подходящий для вашей задачи. Сейчас их достаточно для всего типового.
Если выбирать языки, наиболее подходящие под задачу с минимумом бойлерплейта, это будут предметно-ориентированные (DSL). Языки общего назначения в этом плане неизбежно будут хуже. Тут начинают играть роль другие факторы -- наличие библиотек и документации, размер сообщества, поддержка в IDE. Но конкретно выразительным возможностям они ортогональны.
Я backend разработчик, но с AI я верстаю намного лучше
Можете пару примеров привести пару примеров.
Я backend разработчик, с AI я намного лучший devops
Аналогично. Я вот поверхностные вопросы задавал про линукс (пересел недавно на него), тоже был впечатлён. Но чуть глубже: беда-печаль. Пришёл в выводу, что лучше перепроверить решение ещё на нескольких статьях и форумах, чем себе систему не поломать.
Раньше я умел верстать собирать элементы только из шаблонов (bootstrap, разные html шаблоны типа creative-tim и т.д.)
И я сталкивался с двумя проблемами:
- Шаблоны перегружены и все равно в них чего-то нет
- Если мне надо что-то сделать в текущем, а не шаблонном дизайне - я не могу этого сделать. У меня есть только один путь: доработка дизайна дизайнером, верстка и потом я запрогаю на vue или еще как-то. Это очень долго.
Теперь я могу просто выражать словами то, что я хочу сделать и получать верстку на tailwind
Например недавно верстал сложную форму и мне надо было выравнивать label по левому краю, поля по правому краю, кнопочки +/-, какие-то поля пошире, какие-то поуже и т.д. Это была форма в админке. И я получил ровно тот эффект, который я хотел
На новый год и на 8 марта - сверстал странички акций для бизнеса
Картинка, плюс форма с несколькими кнопками, плюс правила
Но всё это сверстано так, как мне нравится
В этой верстке нет ничего сложного, но раньше мне не хватало терпения ей заниматься, а теперь с удовольствием творю)
через полгода 90% кода будет писать ИИ. Через год — 100%
А через 2 года — 146%
Ключевых примера таких систем сейчас 3: Cursor Agent, Windsurf, Claude Code.
Всё же их больше. Github copilot, OpenHands, AIDE с sidecar'ом (который много где юзаетсся, кстати). И Claude code хоть и хайповый, но ключевым бы его не назвал.
Агенты развиваются быстро, очень быстро. Но всё равно в такие сроки я не верю. Скорее только через 3-5 лет агенты смогут решать задачи полостью самостоятельно. И то, скорее только в новых проектах, ибо разобраться в аде зависимостей множества легаси модулей любого бизнесового интерпрайза под силу только после принятия изрядной доли алкоголя (ИИ же ещё не научился бухать?). Да и то, это должны быть хорошо поставленные и описанные таски, созданные тем, кто полностью понимает кодовую базу и точно знает, какой результат хочет получить.
По сути, даже тогда ИИ не заменит программистов. Но вот облегчить работу и приблизить четырех дневную рабочую неделю (оптимист, ха-ха) будет вполне способен.
Хорошо, давайте пофантазируем. Допустим, AI сможет писать 100% кода, тогда получается, что:
Можно будет скопировать любую программу или сервис. Что будет с конкуренцией, как это отразится на рынке разработки в целом, если не будет барьера в виде каких-то технических знаний и навыков? Кроме этого ещё не нужно забывать об увеличении скорости разработки.
Программистов можно будет заменить AI. Но тогда и огромное количество т.н. "белых воротничков" можно будет заменить, если получилось заменить программистов. Как это отразится на рынке, вакансиях, ЗП?
Можно будет скопировать любую программу или сервис
Это давно уже так. Куча ит единорогов вообще не имеет ничего сложного в ядре бизнеса. Часто даже имеют уже готовые open-source аналоги. И что? Slack (предмет моего личного отвращения, и пример быдлософта) если и чувствует конкуренцию, то лишь от не лучшего технически Teams (ибо за ним стоит сейлз-команда MS с портфелем контактов, а это сила), и вообще не видит проблемы в бесплатном element, например.
Это действительно похоже на агонию, как и 20000-долларовые доктора наук альтмана, которых у него выкупает его же инвестор
Я еще застал время, когда маленькие .com программы писали на ассемблере (masm, tasm) и плевались на монстров, сгенерированных компиляторами со всяких паскалей и плюсов. Посмотрите на этот код, говорили они. Да я напишу на асме - будет в пять раз меньше.
А теперь программы будут писаться ИИ просто по описанию. Проекты будут выглядеть, как набор промптов, ссылающихся друг на друга. Наподобие Obsidian. Но кто-то должен будет их составлять и поддерживать. Ничего, привыкнем.
А агенты точно не смогут составлять и поддерживать? Ведь не смогут?...
Проблема LLM фундаментальная в том, что они на уровне архитектуры не умеют в новые понятия. То есть вот пока моделька учится она изучает всю текущую терминологию и может что-то с ней сделать. Но попробуйте сказать модели которую предположим обучили бы в 2019 году - а сделай-ка мне приложение мобильное для обнаружения того кто кому передал ковид и все. Она же не знает что это за ковид такой и как его передают. И даже если описать подробно она скорее всего не поймет что ко и вид подряд это не вид кудахтающей курицы. Так что какой-то мейнтенанс всего этого добра людьми ИМХО будет нужен постоянно.
Попробовал на 4о
You said:
Make an application that allows users to identify dhdbfkenv around them with mobile phone.
ChatGPT said:
It looks like "dhdbfkenv" might be a placeholder or a mistyped word. Could you clarify what users should be identifying with their mobile phones? Are you referring to objects, sounds, plants, animals, signals, or something else? Let me know the details so I can propose the best approach for the application.
You said:
I don't know. I heard in news about dhdbfken epidemic and want to protect myself.
ChatGPT said:
It seems like "dhdbfkenv" might be a misheard or mistyped word. I couldn't find any epidemic-related term that matches it. Could you provide more details on where you heard it or what the news was about? Was it related to a virus, bacteria, air pollution, radiation, or something else? I can help you understand the risk and suggest ways to stay safe.
Нет проблемы в начале запроса скормить ему определение ковида, ведь чтобы разговаривать о ковиде с человеком из 2019 году вы должны будете сделать то же самое.
А потом ИИ сколлапсирует и начнет писать на tasm, и его снова никто не сможет понимать)
Хм. У меня опыт вайб-кодинга довольно ограниченный, до сих пор приходилось пользоваться только Grok’ом, но впечатление сложилось такое, что ИИ позволяет перейти на уровень выше непосредственно кода и больше работать с архитектурой приложения. Главное, правильно описывать контекст, ограничения, вход-выход и тогда ИИ начинает показывать хорошие результаты. Ревью всё равно делать приходится и как-то всё собирать воедино, но времени уходит раз в пять меньше, чем самостоятельно сидеть и придумывать решение.
Не хочу экстраполировать, но часть разработки этот подход явно покроет. «Настоящая» разработка, вероятно, сконцентрируется на встроенных, системных, реалтаймовых штуках. Ну, мне так кажется.
вайб-кодинга
Благодаря вам открыл для себя новое словосочетание. Плюс вайбик. Уже вижу как серьёзный дядя говорит подчинённому "Ты что тут навайбокодил, это вообще не комфортик, переделывай"
Вы шутите, а между прочим, вайб-кодингу посвящён целый сабреддит ChatGPTCoding. Что интересно, если почитать некоторые тамошние истории, люди пытаются влететь в разработку с ноги, но спотыкаются на косяках генерации и в итоге сами начинают учиться программированию. Что, в принципе, естественно. ИИ всё-таки ассистент, а не волшебный горшочек.
Удивительно, как я мог это пропустить, при том что периодически почитываю истории оттуда.
Ну вот, нашёлся один пример. Не совсем с ноги, но ожидания у автора были изначально немного завышены.
Ну, во-первых, 100%, конечно же, не будет никогда. Застрянем как с беспилотными автомобилями, на которые нас обещают пересадить уже сколько лет, но вот беда - в 99% случаев автопилот, может, и справляется идеально, но из-за оставшегося 1% его нельзя оставлять без присмотра человека, и вот этот 1% пройти оказывается сложнее, чем предыдущие 99%.
Во-вторых, когда-то все документы писались от руки; потом появились пишущие машинки и машинистки; потом работа по составлению документов перешла на компьютеры. И что удивительно - людей, основной работой которых является это самое составление документов, на каждом из этих этапов становилось кратно больше. Парадокс Джевонса, однако.
"Ничего не будет: ни кино, ни театра, ни книг, ни газет - одно сплошное телевидение." (с) "Москва слезам не верит"
В этот ИИ-кодинг уперлись с таким остервенением, как будто это последний бастион, отделяющий планету от Прекрасного Будущего.
В мире столько проблем, а корпорации рвут жопы, чтобы дать подзатыльник какому-то жалкому проценту белых воротничков. Решается "проблема", которой просто не существовало, пока не придумали "решение". И эта воронка засасывает олимпиарды средств. Это ли не безумие?
Вот да! Лучше б начали с идей по замене бесполезных политиков и чиновников. А мы в ИТ уж как-нибудь разберемся
Решается проблема удешевления стоимости разработки.
А у вас есть пруфы того, что это реально проблема в мировом масштабе?
Спросите у тех же чатиков гопоты, какие проблемы в мире видят экономисты, политики, военные, ученые, инженеры и т.д. "Стоимость разработки ПО" там будет вторая с конца, условно говоря.
А еще хорошо бы разбор того, из чего эта стоимость складывается. Не забываем про реально заоблачные зарплаты топ-менеджмента, аренду нежно любимых офисов и прочую ерунду.
А вы сравните расходы на фот в общих затратах у завода или ещё какой-нибудь компании реального сектора и у айти компании, а потом прикиньте, какая экономия будет у первых и у вторых, если сократить его в 10-30 раз.
А вы сравните расходы на фот
Сравню, как только вы поделитесь ссылкой на публичные данные по фот с разбивкой по должностям. Давайте, например, сравним Яндекс как "ИТ-компанию" и СИБУР как "завод".
если сократить его в 10-30 раз
Это тоже цифра с потока. Каков реальный путь к этому "10-30 раз"? Я пока только абстрактные обещания вижу.
Сравню, как только вы поделитесь ссылкой на публичные данные по фот с разбивкой по должностям. Давайте, например, сравним Яндекс как "ИТ-компанию" и СИБУР как "завод".
СИБУР нет, но письмо про оптимизацию совета директоров ГАЗПРОМа недавно вывалили в паблик. И теперь можно уверенно говорить, что там зарплата выше, а эффективность (с т.з. возможности замены на ИИ) ниже, чем в условном Яндексе (пример очень стрёмной ИТ-компании).
CEO Anthropic: через полгода 90% кода будет писать ИИ. Через год — 100%
Где-то я его видел...

P. S. Вопрос, который всегда хочется задать продаванам курсов «как заработать миллион»: «А сам‑то как, заработал уже миллион?»
В конце видео последовал анонс увольнения 90% сотрудников Anthropic?
Главный минус Claude Code - он работает внутри терминала. Уровень интерактивности очень низкий, интерфейс очень упрощенный, это именно ИИ-агент, на звание "редактора кода" или "среды для разработки" он не претендует, и выполняет свою узкую (хотя можно ли весь цикл разработки назвать "узким") функцию.
Почему ИИ не написал гуи, интеграции с иде и вообще, чтобы все было классно?
Не забывайте кстати, все эти ИИ кодописатели не на ваших машинах крутятся. Им только с вашей машины исходники для обработки уходят. Если вы опенсорс пишете это не страшно, а вот если что-то закрытое и еще с какими ноухау - не удивляйтесь, что потом вашему конкуренту обучившееся на в том числе на ваших исходниках оно это ноухау и подскажет. Ну или проще - просто ваши исходники окажутся у кого не надо. Хотя нормальные безопасники компаний должны эту вакханалию с ИИ кодопомощниками закрывать в зародыше.
Локально работающих моделей уже достаточно. Пусть не локально на ноуте, но на своем сервере внутри периметра. Мимо.
Ну если компания достаточно богата и ей эту модель продадут. А это не всегда справедливо.
Можно и локально на ноуте. M4 max со 128 гигами оперативки может гонять тот же qwq:32b, и не сказать что сильно медленно (даже мой m1 max с 32 гигами q4 версию запускает). Правда система охлаждения при этом гудит как самолёт.
А теперь будет — «вот сайт конкурента, накрокодь мне такой же»:)
А если у вас энтерпрайз подписка на GitHub то нужно волноваться или нет?
Время показало, что корпорации хозяева своего слова. Захотели - дали, захотели - забрали. ОпенИИ качали себе пиратские библиотеки, как будто так и надо, была история что в подсказках копилота выдавался код с приватного репозитория, так что я бы рассчитывал на худшее.
Любопытно, какие могут быть мотивы доверять исходники GitHub, VSCode и не доверять Copilot - это одна и та же организация Microsoft.
была история что в подсказках копилота выдавался код с приватного репозитория
не ведитесь на ложь журналистов, там речь была о репозитариях которые были открытыми а потом стали приватными, там больше сетовали за невозможность удалить информацию по требованию из памяти ИИ
Там можно включить галку, чтобы он не показывал в ответах код из открытых источников. Судя по тому, что при обнаружении такого кода ответ прерывается в процессе генерации, это реализовано не как настройка при обучении модели, а как пост-процессинг. В теории, они могут фильтровать фрагменты кода как угодно.
Директор покровского хлебокомбината утверждает, что уже через пол года все будут есть только хлеб.
CEO Anthropic: через полгода 90% кода будет писать ИИ. Через год — 100%
На основе чего они будут дообучать свой ИИ, если 100% кода будет написано ИИ?
ИИ будет обучаться сам на собственном сгенерированном коде?
Где-то видел оценку, что написание кода - это примерно 10% работы программиста. При этом эта часть самая простая и приносящая наибольшее удовольствие. По факту они пытаются автоматизировать то, что не является проблемой или bottleneck.
Илон Маск в 2017-м: Через год Тесла проедет сама с парковки в Лос Анжелесе до парковки в Нью Йорке
Он же в 2016-м: В 2024 мы отправим 4 космических корабля на Марс, два грузовых и два с экипажем
Заявления того же рода. Балаболить не мешки ворочать, как говорится
Он говорит и делает, в отличии от других, что просто говорят.
Его машины перевернули в головах отношение к электромобилям и заставили по всей планете пилить инфраструктуру и зарядные станции, а его корабли топовые на планете во всех смыслах и нет никаких причин не полететь в ближайшие годы, а то что со сроками немножко ошибается, так это обычное дело.
Со сроками немного ошибся
Термоядерные реакторы "в ближайшие 15-20 лет" обещают с 60-70х годов. Со сроками немного ошиблись, но работа то идёт) Но это же мелочи? Особенно если вы на основании этих прогнозов строите вашу жизнь. 2 года или 20, в масштабах человеческой жизни это же фигня, да...)
основная причина существования таких мнений - либо недостаточная осведомленность о том, что умеют новые инструменты, и как ими пользоваться, либо какая-то защитная реакция психики.
Лихо же вы ставите диагнозы
С одной стороны, утверждение про "100% кода через год" - рискованное: кто-то из выживших человеков может же из принципа продолжать кодить без ИИ - либо чтобы не было 100%, либо по причине отсутствия доступа к интернетам. С другой стороны, сделать вот 99.9% ИИ-кода - не так уж и сложно: пусть этот ИИ генерит больше и больше кода, тогда доля будет расти. Вот, скажем, в "параллельной ветке" этого интеллектуального развлечения прямо утверждается, что искусственный суперинтеллект "будет писать триллионы строк кода", который код "человек не сможет понять, даже если ИИ будет годами его объяснять". Что там нагенерировано - не понятно, но зато непонятно на 100% (почти).
А вполне может и правдивое заявление. ИИ может и будет писать 90% кода или даже ближе к 100%. Ведь такой код в мире генерируется явно быстрее, чем мы пишем руками. Только из этих 90-100% большая часть будет идти в утиль, а по факту использоваться 5-10%.
Он же говорит про написание, а не использование. Так что, может, и не соврал.
Разве что в антропик, тетрис на html будут создавать
Просил в Cursor написать проект под Stream Deck (пишется на Node.js), но увы и ах, ничего работающего не выдал. Пришлось лезть в доки.
Этот ИИ сейчас с нами в одной комнате? claude 3.7 think не может docker compose на 5 сервисов написать, а уж кода он наклепает...
Еще 1 инструмент, как и языки высокого порядка / IDE. Где-то как-то возможно упростит работу.
Ну контента ИИ уже генерит процентов 80, чоб и кода 90 не нагенерить.
основная причина существования таких мнений - либо недостаточная осведомленность о том, что умеют новые инструменты, и как ими пользоваться, либо какая-то защитная реакция психики
Думаю, вы на 100% правы (причем не «либо-либо», а «и»). Но только никто не поверит с такой фразы (в том числе вот и я пока не верю, как раз по этим причинам). Реквестую конкретные примеры и/или конкретное видео, где показывается, как вы работаете и как это все выглядит на практике.
беда в том, что примеры на простых проектах - не впечатляют, т.к. кажется, что ИИ справился с простой задачей. а на сложные проектах - они во многом непонятны, т.к. я даю какую-то непонятную задачу в огромной неизвестной никому кодовой базе, из-за чего понять - а это сейчас было сложно или нет - тоже не удается.
в целом, мне сегодня уже пару раз написали с просьбой показать именно как я в агентском режиме работаю, так что думаю скоро бахну видос.
примеры простых проектов в неагентском режиме я в канале когда-то выкладывал, на 14 февраля к примеру были видео: https://t.me/elkornacio/149
Все кто пишет код, покупаем желтые сумки, и идем курьерить, нас заменит ИИ....
Я себе уже уже прикупил.
P.S. В своём телеграм-канале я как раз...
Через полгода 90% контента телеграм каналов будет писать ИИ.
А что ещё он может сказать? Их бизнес глубоко убыточен как и бизнес OpenAI и всех остальных "AI" строителей. Все они просто сжигают миллиарды долларов венчурных инвестиций, гиганты вроде Google, Amazon и MS сжигают свои, но суть не меняется. Это просто огромная топка, которая сжигает деньги, а на выходе получается почти что пшик и засорение интернета сгенерированным мусором и бредом с невероятной скоростью. LLM не создают ничего нового и не добавляют в копилку знаний и опыта человечества абсолютно ничего. Они создают весьма незначительную добавленную ценность для пользователей по сравнению с тем количеством ресурсов, которое они потребляют.
Трагизм и юмор ситуации ещё и в том, что чем больше пользователей они привлекут, тем больше денег они сожгут, потому что при текущих ценах и архитектурах LLM они платят за каждого нового пользователя. И бесконечно поднимать цены тоже не выйдет. И инфраструктура для обслуживания новых пользователей очень дорого масштабируется из-за огромной ресурсоёмкости и нерентабельности гигантских LLM в текущем виде. Если бы всё было хорошо, они бы не ограничивали количество запросов к моделям для платных пользователей.
Почему DeepSeek вызвал такой переполох? Потому что китайцы пообещали снижение затрат на порядки. Как на самом деле пока не понятно, но скорее всего китайцы что-то недоговаривают.
Вангую, что через год все эти "AI"-компании будут сжигать ещё больше миллиардов, а на выходе будет всё тот же пшик. Если конечно кто-то не совершит настоящий прорыв, очень сильно снизив затраты на работу этих инструментов при этом значительно повысив их полезность в решении реальных проблем цивилизации. Но если такое когда-то и случится, вряд ли это произойдёт через год.
С deepseek как раз все понятно. Они кучу расходов не включили в сумму которой хвалились. При этом действительно много чего сделали для удешевления, этого тоже нельзя отрицать.
Но вот qwq:32b выглядит уже реально вкусно. Пока именно на коде не щупал, только на обычных запросах, типа обьяснения грамматики или составления планов/набросков архитектуры, но выглядит так будто бенчмарки не сильно то и врут, и реально к уровню deepseek приближается. Проигрывает по уровню знаний разве что, но тут rag или поиск в интернете может помочь, по идее.
Вот я слушаю это всё, а потом иду и пробую пользовать передовые модели. И знаете что? Они похожи на старательных джунов, не более. Ну понапишут они кучу кода и шо? Нейросетка не всегда нормально одну функцию меняет, не поломав приложение. В упор не видит корявые импорты, переменные. Очень часто подходит к вопросу не оптимально. Т.е то, что будет написано, на текущих моделях, будет работать дольше, железа потреблять больше, не защищено от багов и в целом плохо поддерживается. Даже на тысяче строк кода проблем валом, а теперь представьте миллионы
Вы просто слишком многого ожидаете от предсказывателя следующего наиболее вероятного токена.
Мы ожидаем ровно то, что нам обещает CEO или автор данного поста. Если реальность не совпадает с обещанным - вполне валидно этим поделиться ;)
Если реальность не совпадает с обещанным
«...то попробуйте отрегулировать свои настройки восприятия объективной реальности.»
а вы экстраполируйте, лет 5 назад даже в мыслях не было такого, что бы компьютер писал хоть иногда осмысленный код, года 3 назад в презентациях openai были робкие и смешные примеры сгенерированных нейронкой программ по текстовому описанию, смешно, просто, примитивно... сегодня в топовые компании в серьез пилят operator (openai) / computer use (anthropic) и он выглядит как старательный джун, дико тупящий в сложных ситуациях, но джун!
А что будет еще через пару лет?
На текущий момент, все исследователи в голос показывают нереализованные возможности, линейное улучшение качество ИИ от экспоненциальных затрат ресурсов, на выбор либо при обучении либо при исполнении (reasonong модели), и края пока не видно, кроме дырок в кармане.
"Экстраполировать", т.е. пофантазировать в данном случае?
Есть такой бенчмарк Уилл Смит ест спаггети:
https://www.youtube.com/watch?v=XQr4Xklqzw8
https://www.youtube.com/watch?v=bXKkZh2UEEA
Если посмотреть разницу, то она просто невероятная.
Реальность так не работает. Если что-то было до, ни откуда не следует, что точно такое же что-то будет и далее. Прогресс может останавливаться, могут возникать различные пределы - инженерные, экономические, вычислительные, и т.д. Не говоря уж о банальных пределах самой архитектуры LLM.
Статья вообще-то про агенты и инструменты. Интересно что все обсуждают, что сказал CEO такой-то компании.
Принимать помощь от ИИ это значит соглашаться с ее решением, которое зачастую почти всегда не оптимально. За каждым таким решением следует увеличение сложности программы что ведет к невозможности ее поддерживать. Понять что код переусложнен можно лишь умея самому писать качественный простой код. Принимая во внимание тот факт, что очень много проектов, которые использовались для обучения скорее всего имеют посредственное качество, просить нейронку отрефакторить что то лишь повлечет мутацию из одного состояния в другое - разное на вид, но одинаковое по сути.
В итоге понадобится участие человека, обладающего знаниями в этой области, чтобы он помог. Но а останутся ли такие в будущем в достаточном количестве, если и дальше так сильно полагаться на нейронки? Как будто если давать новичкам такой легкий путь - они не смогут писать хороший код / отличать хороший код от плохого.
P.S Все очень быстро меняется, возможно все будет хорошо.
Всё и правда меняется. Если год назад было почти всегда как вы описали, то недавно меня удивила именно лаконичность и простота кода при создании очередной демки. Да, иногда ей надо ещё говорить, чтобы вынесла числовые параметры в константы, например, но часто и сама догадывается. Насчёт проектов с плохим качеством. Даже если такие проекты присутствуют в исходном коде, языковые модели знакомы с принципами программирования и в состоянии оценить и улучшить код. Именно таким могут заниматься агентские системы, выполняя итерации самооценки, что и любой программист делает.
На самом деле тут есть еще один ньюанс.
возьмем например узкую тему с сетевой художественной литературой, тех самых беременных от дракона попаданок к сталину спасающих СССР пока их не украдут аварские работорговцы из Содружества и не поставят рабскую нейросеть пилота :).
Раньше было как - либо для обложки тянули что-то с инета+фотошоп в меру навыков, если деньги есть - заказывали художнику. Иллюстрации внутри глав - да никогда - дорого, обложка к 17-й книге серии почти та же что и первая - дешевле ж.
Сейчас постепенно заметен переход на модель - обложку возможно заказываем но не факт, и добавляем нейрокартинки внутри глав. Ну и делимся опытом с другими такими же авторами.
Художники воют что их рынка лишают хотя скорее выглядит как будто - они не получают толком ничего от роста объема картинок. А читателю получают более качественное оформление. Ничего не напоминает? Стриминги например.
Я вот по себе замечаю что иногда пробую уже запросы делать на предмет "напиши мне код делающий X"(причем X - из другой области, в которой я основные языки даже толком не знаю, не говоря уже про библиотеки), для петпроекта какого полезного. Как начальная версия. Если будет польза - буду делать дальше (и может даже нормально в моем понимании). И вот для таких задач - оно очень даже полезно может быть. Ну пока не встанет например вопрос - ой а чего это все ТАК тормозит/жрет ресурсы как не в себя (потому что умный ИИ сделал FizzBuzzEnterpriseEdition на serverless лямбдах).
Ну и да - уже думаю на предмет посмотреть Cursor. Альтернатива тут скорее - берем книжку X in 24 hours по незнакомой технологии и ковыряем.
Кмк, roo code как то приятнее курсора выглядит. Как минимум агентский режим в нем бесплатный (и по сути основной). Только за апи плати к нейронкам (ну можно и ollama запустить, deepseek тот же, если вдруг есть железо соответствующее, но пока лучше всего результат с sonnet 3.7, да и авторы расширения его рекомендуют)
До появления AGI это пустые заявления. Создается впечатление интеллекта, на деле фейлы на элементарных вещах. Попался код, где каша из snake и camel нотации. Попробовал поправить с помощью Cursor + Claude 3.7. Епик фейл - инеднтификаторы пропускаются, иногда по непонятным причинам приводит camel как snake. Вот как такой штуковине можно доверять?) Вот запроектирует она что-то, напишет дефектный тест, грубо нарушающий элементарную логику, и потом само его пройдет.
Как программист решал бы подобную задачу? Ответственно и по шагам. Сначала создал бы каким-то образом список таких идентификаторов, потом вручную или средствами замены выполнил бы для каждого преобразование, потом оценил бы вероятность того, что этот метод что-то упускает, затем провёл бы какую-то самопроверку. При этом использовались бы разные инструменты (поиск, замена, в общем случае это мог бы быть браузер, калькулятор и т.д.).
Один запрос к языковой модели так устроен, что неспособен пока такое делать даже не говоря об инструментах. Не знаю, может голов внимания не хватает или ещё чего. Но агентские системы уже делают нечто очень похоже - формируют задачи, анализируют, работают в цикле столько, сколько потребуется для полного завершения всех пунктов, используют различные инструменты для разных задач. Вот из последних модных - Manus. Работает на виртуалке в облаке, сам выполняет поиск, анализ PDF, генерирует код как инструмент, это не исключительно под код заточенная система. Всегда виден текущий TODO и прогресс. В итоге демонстрирует более надёжное завершение сложных задач, хотя есть ещё ряд очевидных необходимых улучшений.
Было бы убедительно, если бы кто-нибудь из разработчиков LLM показал живой пример, вот скажем есть Microsoft Teams, который после старта, но до того как начнет что-то делать, отжирает 800 МБайт памяти (а то и больше), а вот мы всяли нашу LLM, агентов, трали-вали, вот это все, туда-сюда, и нате вам на выходе приложение с тем же функционалом, но жрущее кратно меньше ресурсов, и работающее кратно быстрее.
Ну или хотя бы для начала столько же жрущее и такое же тормозное, но работающее.
Ну или ладно, жрет кратно больше, тормозит кратно сильнее, но работает же ))
Пока не видно ни первого, ни второго, ни третьего, только обещания "вот-вот через год-полгода-месяц-завтра" как аккомпанемент к "дайте еще денег".
Скушно, девушки (c)
В этой теме есть некое недопонимание, на мой взгляд. Когда кто-то говорит: "ии скоро будет сам писать 100% кода", многие представители профессии слышат это как: "на рабочем месте вас скоро заменит ии", что и вызывает сопротивление. Притом что это, разумеется, неправда, и речь не о замене, а о появлении нового продвинутого инструмента для работы. Надо пояснять этот момент в обсуждении, тогда и реакция будет менее острой.
Речь о новом уровне абстракции скорее, чем о полной замене. Вряд ли люди научатся скоро доверять тому что там машина натворила не глядя. Да и llm в текущей архитектуре вряд ли до такого уровня разовьются чтобы их можно было без пригляда оставлять совсем.
Об инструменте принято говорить, когда человек хотя бы по каким-то параметрам превосходит инструмент. С ИИ таких параметров может и не оказаться. Тогда от человека останется только задание цели, но это задача уже не для программиста.
Ну-ну. Вот тебе проект на миллион строк добавь туда фичу не сломав и не поменяв вообще ничего больше.
Будем честны, большинство работают все же над заметно меньшими по размеру проектами. И в целом не особо то сложными. Круды на бекенде, формочки на фронте + какая то логика прикручена не сильно сложная и туда и туда. А учитывая моду на микросервисы на беке и многомодульность в случае андроид приложений например - ИИ вполне может работать над небольшими изолированными фичами. Да и агентские системы совершенствуются, способны например прикинуть по имени функции какие файлы стоит изучить, выбрать нужные методы, затем рекурсивно пройтись по файлам которые нужная фича задевает (или погрепать по имени функции через терминал), и внести правки точечно. Но без контроля давать ИИ работать точно не стоит, может наворотить + любит говнокодить.
вас скоро заменит ии
Лучше и 'умнее' инструмент - эффективнее и больше работы будет делать человек с его помощью.
Объем работ увеличиваться не собирается, а значит количество людей для его выполнения потребуется меньше.
Поэтому лишние люди на выход... об этом и говорится
Объем работ увеличиваться не собирается,
Вот не факт.
Когда появились паровозы и машины, объем перевозимых грузов вырос на порядки. И количество людей сейчас занятых в транспортировке грузов сильно выше по сравнению с извозчиками до паровозов.
Объем работ в том числе ограничен производительностью труда, которая ограничивает цену на услугу/товар снизу, что ограничивает спрос.
Я так понимаю, что моё обучение на Manual QA можно выкинуть в помойку с такими тенденциями 🥲
А еще через 2 года ИИ поймет, что посредники в виде кожаных - это очень медленное, нерациональное и неэффективное в плане ресурсов звено. И примет окончательное решение.
Кстати, на примере того же aider можно посмотреть как меняется соотношение написанного человеком и LLM кода
ИИ будет писать 90% кода. А затем через 12 месяцев мы можем оказаться в мире, где ИИ будет писать по сути весь код.
Если хочется всё видео целиком, то вот оно (таймкоды - 14:10 и 16:10): https://www.youtube.com/live/esCSpbDPJik . Простите, оно почему-то не захотело встраиваться в Хабр-новость :(
Специально зашел по ссылке и прослушал:
1)Essentially переводится еще и как "в большинстве случаев"
2)дальше он говорит, что все зависит от кучи факторов и сферы применения
Т.е. вы переврали интервью и ни о каких "ИИ напишет весь код" речи не идет.
Ну прям код писать не будет, но уже сейчас многие шаблонные вещи за меня дописывает IDE, и делает это очень неплохо. Все эти кучи строк по коннекту к БД, циклам, разборке json, вызову rest, реально надо только начать строку.
Фактически, я сам, своими руками, набиваю от силы 5-10% символов в коде.
Интересно, а что тут с юридической точки зрения. Кому принадлежат права на интеллектуальную собственность (кода сгенерированного ИИ):
а) программисту заплатившему за подписку? есть ли такой пункт в условиях подписки?
б) компании нанявшей программиста?
в) компании создавшей этот ИИ?
"Через полгода 100% кода будет писать ИИ, люди которые это не осознают просто не могут принять реальность" И показывают TS файл, который создаёт ИИ.
Мой персональный сайт уже 2 года на 100% пишет ИИ. 30 лет формошлепство появилось, веб давным давно заточён под написание по без кода.
Как это с остальным программированием связано?
В микроконтроллерах у меня ИИ только смог только веб интерфейс написать. Прям вообще туго. В плис ещё хуже. В десктопе и Коде на с++, он очень плох.
У меня приложение под миллион строк кода. Для работы с таким кодом он должен иметь окно 10-100 миллионов токенов.
То есть нужно на запрос в 1000-10000 больше ресурсов тратить.
Вылитый Pointy-Haired Boss из комиксов про Dilbert-а.
Все это мне напомнило старый опус "Десять байт которые потрясли мир" аж от 2005 года
https://proza.ru/2005/07/06-185
"Виpус взбудоpажил миpовую общественность, ибо тепеpь самовозникновение виpусов в pезультате случайных сбоев стало из невозможного пpосто маловеpоятным. Идеологи ВКП(П) усмотpели в этом шиpокую пеpспективу: настанет вpемя, когда пpогpаммы будут писаться сами собой, а пpогpаммисты будут только игpать в DOOM и Beholder, пить пиво и спать."
Ага. А через 2 года - 200%
Игорь Иваныч – это пока пузырь из разряда доткомов. К сожалению, он не умеет думать, у него нет нейронов, а самое главное – он не несёт ответственности за результат.
а ты не пробовал Zed ? https://habr.com/ru/news/828102/
по идее, VSCode - это look-aliek Atom'a. Когда Майкрософт купил и убил Atom, некоторые его пользователи решили пилить его дальше. Некоторые даже решили сначала его переписать на нативный язык, Rust - и получился Zed.
Там еще интересные рассуждения про модальные редакторы, кажется были, если ни с чем не путаю.
Ну и, по твоей теме, они изо всех сил кричат, что Zed лучший редактор для нейросетей, и что именно с ними его вкус раскрывается полностью. Скорее всего им процент платят от пользования, как Гугл платит браузерам. Впрочем, это их дело. Но любопытно их хвальба про лучший ai-редактор на чём-то основаны?
Обожаю читать подобные статьи от людей которые ни хрена не понимают в агентах и AI )))
Вот прямо через год заменит AI. Огааа
А потом приходишь на работу как AI Engineer и пытаешься заставить агента не умирать на 10+ сабтаске при просадке 80% по качеству. Это с учетом продвинутой роевой архитектуры, механизмов самовосстановления и отличного промптинга, а главное понимания как все это работает.
Что уж говорить по 100 + задач в плане для агента ))
Заменит нас именно агент Cursor команды ребят которые третий месяц не могут починить в своем форке VSCode работу переменных окружения и стандартных плагинов.
Зачем вам virtualenv c Python у вас же агент теперь есть )))
Мне страшно подумать какие у вас задачи решает агент если у вас 8 из 10 задач решается.
Задачи уровня напиши кривой и не работающий говнокод видимо.
Они своим агентом свой же говнокод в порядок привести не могут, достаточно зайти на их форум и почитать восторженные отзывы.
Вот когда процент галлюцинация у LLM будет стремиться к нулю вот тогда и поговорим о замени разработчиков.
Cursor команды ребят которые третий месяц не могут починить в своем форке VSCode работу переменных окружения и стандартных плагинов.
Зачем вам virtualenv c Python у вас же агент теперь есть )))
А можно подробности? Я пользуюсь Cursor потому, что местный AI помощник соображает в разы лучше, чем Copilot из VSCode. Но каких-то особых проблем с ним в последнее время не замечал. Всё нужные плагины работают (vim, pyright, ruff и т.п). Нет дурацких ограничений, когда доступность AI функций привязана к организации на GitHub, где находится тот или иной репозиторий.
Я ещё 10 лет назад писал, что в будущем люди будут «хичировать» (термин я сам придумал), а не программировать.
Это вполне логичное развитие технологий.
Может быть завтра кто-то недовольный тем, как много кода ему постоянно приходится писать, напишет среду, которая позволит разворачивать очень короткие спецификации в двоичный код. Назовёт её как-нибудь вроде «сетка Хича», и через 30 лет люди будут не программировать, а хичировать. А все потом будут говорить, что уже 20 лет назад было понятно, что за хичированием будущее, потому что оно позволяет сразу оценить результат идеи, которая воплощается во всех деталях мгновенно после одной только мысли о ней. И остаётся только сохранить результат или сформировать новую идею. Весь процесс программирования сводится к отбору подходящего результата из нескольких вариантов, сгенерированных сетью. И люди будут спорить, что, на самом деле, хичирование и программирование — не одно и то же, потому что во время программирования ты создаёшь код, а при хичированиии ты хичируешь сгенерированные образы. И нет смысла велосипедить, занимаясь программированием, если гораздо проще схичировать образ, который будет работать сразу на всех устройствах.
CEO Anthropic: через полгода 90% кода будет писать ИИ. Через год — 100%