Обновить

Комментарии 41

Copilot сегодня примерно за 2 минуты решил задачу, которую я решал несколько лет назад примерно за 3 месяца. Причём выданный им код уже был намного более производительный и минималистичный, чем мой базовый аналог, который я дооолго оптимизировал ручками...

Наверное, все таки верна теория о том, что весь нужный человечеству код уже написан. ИИ это своего рода закрывающая технология, достающая старые решения и обновляющая их...

Расскажите, какую задачу вы решали 3 месяца?

Дело не в том, что задача может быть не слишком сложной, и что у человека возможно не хватало квалификации для ее решения (додумываю, да). Все мы недостаточно квалифицированы по сравнению с кем-то, смотря с кем сравнивать.

Задачу-то какую решали?

Я, например, решал задачу уравнения напряженности электрического поля произвольной точки пространства от равномерно заряженного тетраэдра, когда даны координаты его вершин и плотность заряда. Вольфрам в свое время мне не помог, а ИИ легко.

нет, дело именно в том. так-то ошеломительных фельетонов можно нагенерить пачку о задачах которые решал 8 лет, а копилот за микросекунду

3d viewer для модели поверхности, получаемой с 3д сканера. Там специфичный формат данных был, но самое плохое, что у клиентов были слабые видеокарты (в основном встроенные, даже на тогда совсем не топ). Поэтому приходилось серьёзно оптимизировать фильтрацию данных и отрисовку, чтобы на слабом железе тянуло. Плюс интерактивность надо было. Проект был классов на 20.

А копилот сделал примерно то же, но в одном классе. И работало (у меня по крайней мере) быстрее за счёт шейдерно буферной магии. Жаль, что на целевой системе того времени запустить уже не получится...

Хоть бы рассказали, что за задача? А то по готовому решению подготовить промпт оно, конечно, проще.

Я решал одну задачу год назад. Задача не давалась три месяца. И конца и края не было видно (Keycloak/Spring/AngularTS. Все последних версий, google не помогал совсем). Даже с чатом решение заняло полтора месяца. Auth+Security (XSS, CSRF и пр.) не так просто не только решить, но и настроить. Потом ещё месяца три допиливал понемногу (например, синхронизация разлогина в разных вкладках). Не сказал бы, что сильно ускорило работу, но преодолеть отсутствие внятных примеров в доках Spring и Keycloak помогло.

Так что мне иногда помогает найти решение, но не придумать что-то с нуля отлично работающее.

подозреваю что дело тут не в "сложности" задачи, а в том самом , что нет документация написана криво и нет примеров.

 отсутствие внятных примеров в доках Spring и Keycloak помогло.

Ну а в памяти ИИ такие примеры нашлись

Ну а в памяти ИИ такие примеры нашлись

ИИ же не google, который по сути ищет по ключевым словам релевантный текст, но в тексте нельзя задать вопрос автору. Мне понравилось, что с ИИ можно строить рассуждения с учётом контекста. Но всё-таки я сторонник того, чтобы понимать решения, предлагаемые ИИ.

Поэтому, по теме текущей статьи я не согласен. Для себя вижу, как ИИ помогает мне, забирая на себя как раз рутинную работу и оставляя мне квалифицированную работу, потому что именно я решаю как должно быть.

Что за задача была? Из веба?

Это произошло от того что эту задачу кто-то раньше решил минималистично и производительно

"турагенты лишаются сложного планирования маршрутов и расчета стоимости поездок". Ой, вэй... чего там сложного-то? А по нормальному, у агента может быть инфа которой нет у ИИ - "там поезд притормаживает- спрыгните с поезда, там подъедете на подводе с цыганами". Или "пять минут назад в стране похитили президента, поэтому аэропорт не принимает".
И так далее. ИМХО, ИИ забирает работу где не надо думать, а надо делать, пусть и щелкая клавишами.

У турагентов давно все автоматизировано, еще до ИИ - куча сервисов автоматического бронинования гостиниц и билетов, с построением оптимального маршрута.

Их главная задача - работа с людьми. Предлагать, впаривать, продавать, решать конфликты и проблемы.

В travel индустрии всё сложнее, чем вам кажется. С подобным настроем люди в трубу вылетают и тратят первыем 2-3 года зарплату на штрафы от авиакомпаний и других провайдеров услуг. Это вам не однотипные микросервисы пилить по образу и подобию. Тут ситуация, тарифы и правила постоянно меняются. Ну-ка, быстренько сообрази, как оформить билет на перелет в каком-нибудь Габоне, где нет альтернатив, чтобы пассажира в авиакомпании на фиг не послали? На бланке какой авиакомпании? Аэрофлоте? А ты уверен, что у Аэрофлота есть соглашение с этой местной компанией? А бабки эта компания увидит? А если нет - иди со своим билетом туда, кто выписал. Вот ты и уже залетел на бабки и штрафы. ИИ тебе это расскажет? У него инфа 2-летней давности. А сайта может и не быть, или оплата в местных тугриках. И это так, пример навскидку. Так что не знаете, что такое сложные маршруты, - не пишите. А так да, билет oneway или round trip Москва - Питер ума не требуют совсем.

 Ну-ка, быстренько сообрази, как оформить билет на перелет в каком-нибудь Габоне, где нет альтернатив, чтобы пассажира в авиакомпании на фиг не послали? 

Стесняюсь спросить, а что, основные бабки делаются в этом бизнесе на таких хитровывернутых случаях, или таки там, где поток туристов многомилионный и в головах и в $$$ ? Может, просто не стоит заморачиваться на такие экстремальные случаи сразу, а идти проторенной дорогой?

Клод отличный советник, если работать с ним точечно и знать, что делаешь. Но стоит отпустить вожжи, и его несет не в ту степь.

соннет или опус?

Соннет

Оценка сложности субъективна.

Ну почему же? В какой-то степени мы все же можем оценить сложность задач, рынок же как-то это делает, ключевая особенность задач заключается в абстрактном труде затраченном на задачу, иначе нельзя было бы ввести деньги, как эквивалент туда(тут я говорю про стоимость, а не про цену), тем более есть теоретические оценки сложности программ, среднее количество человеко-часов, потраченных средним специалистом в данной области, умноженное на среднюю стоимость часа этого специалиста, по-сути, это и есть средняя сложность решения задачи. Из больших чисел можно понять закономерность.

Уточню: оценка сложности для человека и для ИИ различна. То, что легко для человека, сложно для (некоторых текущих реализаций) ИИ и наоборот. (Люди тоже очень разные и "средний специалист по ***" - обычно очень локальное определение.)

Одного заголовка хватило. Серьезно? Т.е. они считают что квалифицированные кадры на нужны?

К примеру, они хотя бы видели что их творение начнет выдавать в плане кода если не сумеет понять суть ошибки или задачи или при конкатенации запросов в целом не говоря про лимиты контекста. Когда перевалит за 5000 строк там без квалифицированного кадра с бутылкой водки в одной руке и валерьянки в другой не разобраться вообще.

Всё очень даже логично. Тебе нужно быть образованным, чтобы понимать ошибки

Прямо сейчас ввел запрос:

5 200 000 000 000 / 150 000 000

Обзор от ИИ
Результат деления 5 200 000 000 000 (5,2 триллиона) на 150 000 000 (150 миллионов) равен
34,666... (тридцать четыре целых, две трети), или, если округлить, приблизительно 34,67. Это число получается путем сокращения нулей и последующего деления 520 на 15.

Пошаговый расчет:

  1. Запишите числа: 5 200 000 000 000 / 150 000 000

  2. Сократите нули: Можно убрать 6 нулей с обеих сторон (поскольку 150 000 000 имеет 8 нулей, а 5 200 000 000 000 — 12 нулей, то сокращаем 8 нулей с обеих сторон):

  3. Выполните деление: 5200 / 15 = 34,666... (где 6 повторяется бесконечно). Таким образом, 5 200 000 000 000 / 150 000 000 ≈ 34,67.

Вот это ИИ, 2026ой год. И ведь оно даже цепочку рассуждений использовало (будто бы), для этой сложной задачи.
Не понимаю как оно пишет код, и еще больше не понимаю - как этому коду доверяют в серьезных случаях.

Математические вычисления "в уме" - это не правильный способ применения ЛЛМ.

Ради интереса взял самый осталый на сегодня Qwen3 max. Его результат

Не понимаю как оно пишет код, и еще больше не понимаю - как этому коду доверяют в серьезных случаях.

Отлично пишет, лучше чем большинство сеньоров, которых я видел за последние 16 лет.

Разве что хорошо форматирует. Красиво) Но логика строится на тех задачах, что уже были где-то найдены.
Однако, ошибается постоянно. Последнее что делал - задача по физике для 9 класса, нужно посчитать силу действующую на 2 опоры и балку на них висящую, с учётом выхода балки за 1 из опор. Пока решается в лоб - всё ок. Решить другим способом? Ни за что. Когда добавил момент, что часть балки имеет нулевой или иной вес, то решить не может, вообще никак. Хотя, с ~50 раза получилось добиться правильного выполнения, но для этого пришлось расписать алгоритм целиком и очень подробно. Nолько тогда ИИшка смогла повторить его. Но что если чуть поменять условия? Опять по новой)
То же со старыми либами или новыми. Поменялась работа - они ничего сделать не могут. О старых, похоже, просто нет примеров использования. Вот для того, чтобы причесать код можно использовать

Вроде по тестам математика и физика у DeepSeek лучше всего выходит. Да, ИИ действительно пишет код по уже решенным задачам. Но абсолютное большинство проектов состоят из задач которые уже были решены. Я лично встречал всего несколько задач которые ИИ ну прям совсем не мог решить, потому что там нужно было думать совершенно не тривиально. В остальном с небольшой доработкой он хорошо научился решать тривиальные задачи из которых состоит на 90% почти любой проект. По крайней мере в вебе.

Попросил Дипсик посчитать. Он начал хорошо, даже показал правильный ответ как результат промежуточных вычислений, но потом стал проверять и запутался, и в качестве ответа выдал хрень. Но! Я написал "Проверь еще раз". Он подумал и... чуть было не пошел по ложному пути, но в результате всё же выдал правильный ответ.
Ну а если бы я не умел делить (зачем, если есть ИИ?), а результат шел бы в конструкцию ракеты на Марс?

Вы как раз и подтвердили тезис статьи что рутинное деление с калькулятором в руках пока достается людям :)

В этом как раз и проблема - вы не понимаете как работают llm. Заставлять llm считать - это как утюгом забивать гвозди.

Сделайте простейший MCP с доступом к математическим операциям на уровне кода, напишите промпт который будет заставлять llm вызывать данный тулинг. Думаю в таком случае она решит ваши задачки без особых проблем.

Зато оно относительно хорошо пищет статьи как оно нас везде и всюду заменяет.

Оно замечательно пишет код. Вы перечитайте статью, там прямо про это написано: модель - это не калькулятор, это огромный набор вентилей состояния. Когда вы просите её посчитать что-то, она ничего не считает, а пробегается по вентилям возвращая наиболее вероятный результат. Т.н. "рассуждения" - это хак для более точечного выстраивания цепи Маркова (вектора вентилей), для возможности захвата в фокус вектора более "правдоподобных" значений.

Не давеча как вчера, так нахваливаемый тут везде Opus полчаса не мог мне выровнять чекбокс с подписью к нему на одну линию. Хотя казалось бы - Java и swing это не что то редкое. С n-ой итерации худо бедно сделал, да все равно с погрешностью в пару пикселей. Так что с квалифицированной работой это слишком смелое заявление

Потому что модель "не видит" результат своей реализации. У ней лмпчки выстроены в последовательность выведения "наиболее вероятного" ответа для впихиваемого в неё диалога. Попробуйте вместе с диалогом скормить ей изображение того как есть сейчас и как должно быть, прям жпег. А также попробуйте модель не сделать для вас конкретную реализацию, а предложить варианты решения и выбрать из них наиболее оптимальный.

Попробуйте вместе с диалогом скормить ей изображение

Так я так и делаю обычно

Я тоже заметил этот эффект год назад. Он заключается в том, что искусственный интеллект не меняет социальное распределение людей. Компетентные люди остаются компетентными, а некомпетентные — некомпетентными. ИИ не может превратить некомпетентного человека в компетентного.

ИИ может помочь человеку превратиться в компетентного, поскольку в ней есть возможность дистилляции знаний. То, что в вумных книжках описано костным языком, ИИ может преподнести в человекочитаемом виде, с разбором, аллегориями и примерами. Тут только вопрос в том, чтобы человеку это реально было надо и он сам мог связывать буквы в слова, чтобы модель могла "понять" что от неё хотят, а не искать шершавых кабанчиков.

На метре вышла хорошая статья о том как ии замедляет работу разрабов. С подробным описанием исследования. https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

Помоему пора уже сворачивать лавочку про дикое ускорение работы.

ускорение сферической работы в вакууме👌

как считать % в случаях когда ллм в принципе не может помочь никак? работы на час с перекурами, но командиры принимают решение два дня.

в случаях когда делает только хуже отталкиваясь от неверных предпосылок и предлагая тупиковые пути решения? не потому что ллм дура, так карта лягла с несоответствием написанного в гите пером, вырубленному в авс топором.

в случаях "бессмысленного ускорения", когда сам дебажишь взаимодействие незнакомых модулей на незнакомых языках, и с ллм за 3 часа можешь добиться того на что у самого ушел бы день, но коллега 5 лет эти модули писавший, взглядом моряка смотрит на проблему и за 5 минут выдает то же решение что и ллм? т.е. в каких-то крайних случаях толк есть, но в мирное время одна лишь суета.

ну и в случаях когда нужно набросать по быстрому скрипт на питоне, коих набросаны миллионы, где сам бы потратил час с гуглением и отладкой, а с ллм справляешься за 2 промпта на 15-20 минут с проверкой скрипта в бою?

работа абсолютно всё вышеперечисленное. а считать как, всё взять и поделить? или взять самые простые случаи, потому осмысленно измеримые, отбросив все остальные потому что это другое?

Вот ещё задача, которую не смогла решыть DeepSeek без подсказок, но может быть сможет ваша нейросеть:
консольная програма, текстовый файл с каким-то текстом (например, "Hello, world"). Надо, штобы при закидывании этово текстфайла в окно консоли, в окне показался ево текст.

В интрнэте решение не нашёл.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости