runaway_llm15 янв в 20:10

ИИ забирает квалифицированную работу, оставляя людям рутину: парадокс исследования Anthropic

2 мин

26K

Искусственный интеллектМашинное обучение *

+19

Комментарии 41

Racheengel 15 янв в 21:45

Copilot сегодня примерно за 2 минуты решил задачу, которую я решал несколько лет назад примерно за 3 месяца. Причём выданный им код уже был намного более производительный и минималистичный, чем мой базовый аналог, который я дооолго оптимизировал ручками...

Наверное, все таки верна теория о том, что весь нужный человечеству код уже написан. ИИ это своего рода закрывающая технология, достающая старые решения и обновляющая их...

dmitryez 15 янв в 23:32

Расскажите, какую задачу вы решали 3 месяца?

Shiaju 16 янв в 05:16

Дело не в том, что задача может быть не слишком сложной, и что у человека возможно не хватало квалификации для ее решения (додумываю, да). Все мы недостаточно квалифицированы по сравнению с кем-то, смотря с кем сравнивать.

lilpuf 16 янв в 06:45

Задачу-то какую решали?

mlnw 17 янв в 10:16

Я, например, решал задачу уравнения напряженности электрического поля произвольной точки пространства от равномерно заряженного тетраэдра, когда даны координаты его вершин и плотность заряда. Вольфрам в свое время мне не помог, а ИИ легко.

kostylierro 17 янв в 12:04

нет, дело именно в том. так-то ошеломительных фельетонов можно нагенерить пачку о задачах которые решал 8 лет, а копилот за микросекунду

Racheengel 16 янв в 23:40

3d viewer для модели поверхности, получаемой с 3д сканера. Там специфичный формат данных был, но самое плохое, что у клиентов были слабые видеокарты (в основном встроенные, даже на тогда совсем не топ). Поэтому приходилось серьёзно оптимизировать фильтрацию данных и отрисовку, чтобы на слабом железе тянуло. Плюс интерактивность надо было. Проект был классов на 20.

А копилот сделал примерно то же, но в одном классе. И работало (у меня по крайней мере) быстрее за счёт шейдерно буферной магии. Жаль, что на целевой системе того времени запустить уже не получится...

AlexXYZ 15 янв в 23:55

Хоть бы рассказали, что за задача? А то по готовому решению подготовить промпт оно, конечно, проще.

Я решал одну задачу год назад. Задача не давалась три месяца. И конца и края не было видно (Keycloak/Spring/AngularTS. Все последних версий, google не помогал совсем). Даже с чатом решение заняло полтора месяца. Auth+Security (XSS, CSRF и пр.) не так просто не только решить, но и настроить. Потом ещё месяца три допиливал понемногу (например, синхронизация разлогина в разных вкладках). Не сказал бы, что сильно ускорило работу, но преодолеть отсутствие внятных примеров в доках Spring и Keycloak помогло.

Так что мне иногда помогает найти решение, но не придумать что-то с нуля отлично работающее.

sergeyns 16 янв в 09:24

подозреваю что дело тут не в "сложности" задачи, а в том самом , что нет документация написана криво и нет примеров.

отсутствие внятных примеров в доках Spring и Keycloak помогло.

Ну а в памяти ИИ такие примеры нашлись

AlexXYZ 16 янв в 12:15

Ну а в памяти ИИ такие примеры нашлись

ИИ же не google, который по сути ищет по ключевым словам релевантный текст, но в тексте нельзя задать вопрос автору. Мне понравилось, что с ИИ можно строить рассуждения с учётом контекста. Но всё-таки я сторонник того, чтобы понимать решения, предлагаемые ИИ.

Поэтому, по теме текущей статьи я не согласен. Для себя вижу, как ИИ помогает мне, забирая на себя как раз рутинную работу и оставляя мне квалифицированную работу, потому что именно я решаю как должно быть.

Arondy 16 янв в 05:30

Что за задача была? Из веба?

inikonzs 17 янв в 19:10

Это произошло от того что эту задачу кто-то раньше решил минималистично и производительно

Daddy_Cool 15 янв в 23:42

"турагенты лишаются сложного планирования маршрутов и расчета стоимости поездок". Ой, вэй... чего там сложного-то? А по нормальному, у агента может быть инфа которой нет у ИИ - "там поезд притормаживает- спрыгните с поезда, там подъедете на подводе с цыганами". Или "пять минут назад в стране похитили президента, поэтому аэропорт не принимает".
И так далее. ИМХО, ИИ забирает работу где не надо думать, а надо делать, пусть и щелкая клавишами.

agat000 16 янв в 02:16

У турагентов давно все автоматизировано, еще до ИИ - куча сервисов автоматического бронинования гостиниц и билетов, с построением оптимального маршрута.

Их главная задача - работа с людьми. Предлагать, впаривать, продавать, решать конфликты и проблемы.

4J_UN 19 янв в 05:27

В travel индустрии всё сложнее, чем вам кажется. С подобным настроем люди в трубу вылетают и тратят первыем 2-3 года зарплату на штрафы от авиакомпаний и других провайдеров услуг. Это вам не однотипные микросервисы пилить по образу и подобию. Тут ситуация, тарифы и правила постоянно меняются. Ну-ка, быстренько сообрази, как оформить билет на перелет в каком-нибудь Габоне, где нет альтернатив, чтобы пассажира в авиакомпании на фиг не послали? На бланке какой авиакомпании? Аэрофлоте? А ты уверен, что у Аэрофлота есть соглашение с этой местной компанией? А бабки эта компания увидит? А если нет - иди со своим билетом туда, кто выписал. Вот ты и уже залетел на бабки и штрафы. ИИ тебе это расскажет? У него инфа 2-летней давности. А сайта может и не быть, или оплата в местных тугриках. И это так, пример навскидку. Так что не знаете, что такое сложные маршруты, - не пишите. А так да, билет oneway или round trip Москва - Питер ума не требуют совсем.

jorgvonfrundsberg 19 янв в 12:35

Ну-ка, быстренько сообрази, как оформить билет на перелет в каком-нибудь Габоне, где нет альтернатив, чтобы пассажира в авиакомпании на фиг не послали?

Стесняюсь спросить, а что, основные бабки делаются в этом бизнесе на таких хитровывернутых случаях, или таки там, где поток туристов многомилионный и в головах и в $$$ ? Может, просто не стоит заморачиваться на такие экстремальные случаи сразу, а идти проторенной дорогой?

wmns 16 янв в 00:30

Клод отличный советник, если работать с ним точечно и знать, что делаешь. Но стоит отпустить вожжи, и его несет не в ту степь.

Dmitriila 16 янв в 01:38

соннет или опус?

wmns 16 янв в 02:12

Соннет

Robastik 16 янв в 02:31

Оценка сложности субъективна.

Andrew_Developer 19 янв в 05:26

Ну почему же? В какой-то степени мы все же можем оценить сложность задач, рынок же как-то это делает, ключевая особенность задач заключается в абстрактном труде затраченном на задачу, иначе нельзя было бы ввести деньги, как эквивалент туда(тут я говорю про стоимость, а не про цену), тем более есть теоретические оценки сложности программ, среднее количество человеко-часов, потраченных средним специалистом в данной области, умноженное на среднюю стоимость часа этого специалиста, по-сути, это и есть средняя сложность решения задачи. Из больших чисел можно понять закономерность.

Robastik 20 янв в 02:31

Уточню: оценка сложности для человека и для ИИ различна. То, что легко для человека, сложно для (некоторых текущих реализаций) ИИ и наоборот. (Люди тоже очень разные и "средний специалист по ***" - обычно очень локальное определение.)

DEgITx 16 янв в 04:09

Одного заголовка хватило. Серьезно? Т.е. они считают что квалифицированные кадры на нужны?

К примеру, они хотя бы видели что их творение начнет выдавать в плане кода если не сумеет понять суть ошибки или задачи или при конкатенации запросов в целом не говоря про лимиты контекста. Когда перевалит за 5000 строк там без квалифицированного кадра с бутылкой водки в одной руке и валерьянки в другой не разобраться вообще.

RogersCodeTalker 16 янв в 05:31

Всё очень даже логично. Тебе нужно быть образованным, чтобы понимать ошибки

Netguy 16 янв в 05:36

Прямо сейчас ввел запрос:

5 200 000 000 000 / 150 000 000

Обзор от ИИ
Результат деления 5 200 000 000 000 (5,2 триллиона) на 150 000 000 (150 миллионов) равен
34,666... (тридцать четыре целых, две трети), или, если округлить, приблизительно 34,67. Это число получается путем сокращения нулей и последующего деления 520 на 15.

Пошаговый расчет:
Запишите числа: 5 200 000 000 000 / 150 000 000
Сократите нули: Можно убрать 6 нулей с обеих сторон (поскольку 150 000 000 имеет 8 нулей, а 5 200 000 000 000 — 12 нулей, то сокращаем 8 нулей с обеих сторон):
Выполните деление: 5200 / 15 = 34,666... (где 6 повторяется бесконечно). Таким образом, 5 200 000 000 000 / 150 000 000 ≈ 34,67.

Вот это ИИ, 2026ой год. И ведь оно даже цепочку рассуждений использовало (будто бы), для этой сложной задачи.
Не понимаю как оно пишет код, и еще больше не понимаю - как этому коду доверяют в серьезных случаях.

poruchik 16 янв в 07:57

Математические вычисления "в уме" - это не правильный способ применения ЛЛМ.

Ради интереса взял самый осталый на сегодня Qwen3 max. Его результат

Не понимаю как оно пишет код, и еще больше не понимаю - как этому коду доверяют в серьезных случаях.

Отлично пишет, лучше чем большинство сеньоров, которых я видел за последние 16 лет.

SAWER 16 янв в 11:28

Разве что хорошо форматирует. Красиво) Но логика строится на тех задачах, что уже были где-то найдены.
Однако, ошибается постоянно. Последнее что делал - задача по физике для 9 класса, нужно посчитать силу действующую на 2 опоры и балку на них висящую, с учётом выхода балки за 1 из опор. Пока решается в лоб - всё ок. Решить другим способом? Ни за что. Когда добавил момент, что часть балки имеет нулевой или иной вес, то решить не может, вообще никак. Хотя, с ~50 раза получилось добиться правильного выполнения, но для этого пришлось расписать алгоритм целиком и очень подробно. Nолько тогда ИИшка смогла повторить его. Но что если чуть поменять условия? Опять по новой)
То же со старыми либами или новыми. Поменялась работа - они ничего сделать не могут. О старых, похоже, просто нет примеров использования. Вот для того, чтобы причесать код можно использовать

sidorovkv 16 янв в 19:46

Вроде по тестам математика и физика у DeepSeek лучше всего выходит. Да, ИИ действительно пишет код по уже решенным задачам. Но абсолютное большинство проектов состоят из задач которые уже были решены. Я лично встречал всего несколько задач которые ИИ ну прям совсем не мог решить, потому что там нужно было думать совершенно не тривиально. В остальном с небольшой доработкой он хорошо научился решать тривиальные задачи из которых состоит на 90% почти любой проект. По крайней мере в вебе.

Daddy_Cool 16 янв в 22:17

Попросил Дипсик посчитать. Он начал хорошо, даже показал правильный ответ как результат промежуточных вычислений, но потом стал проверять и запутался, и в качестве ответа выдал хрень. Но! Я написал "Проверь еще раз". Он подумал и... чуть было не пошел по ложному пути, но в результате всё же выдал правильный ответ.
Ну а если бы я не умел делить (зачем, если есть ИИ?), а результат шел бы в конструкцию ракеты на Марс?

myaut12 17 янв в 13:49

Вы как раз и подтвердили тезис статьи что рутинное деление с калькулятором в руках пока достается людям :)

sandro2803 19 янв в 05:26

В этом как раз и проблема - вы не понимаете как работают llm. Заставлять llm считать - это как утюгом забивать гвозди.

Сделайте простейший MCP с доступом к математическим операциям на уровне кода, напишите промпт который будет заставлять llm вызывать данный тулинг. Думаю в таком случае она решит ваши задачки без особых проблем.

aleksandr55575 19 янв в 05:26

Зато оно относительно хорошо пищет статьи как оно нас везде и всюду заменяет.

qrotux 19 янв в 08:01

Оно замечательно пишет код. Вы перечитайте статью, там прямо про это написано: модель - это не калькулятор, это огромный набор вентилей состояния. Когда вы просите её посчитать что-то, она ничего не считает, а пробегается по вентилям возвращая наиболее вероятный результат. Т.н. "рассуждения" - это хак для более точечного выстраивания цепи Маркова (вектора вентилей), для возможности захвата в фокус вектора более "правдоподобных" значений.

Einherjar 16 янв в 06:18

Не давеча как вчера, так нахваливаемый тут везде Opus полчаса не мог мне выровнять чекбокс с подписью к нему на одну линию. Хотя казалось бы - Java и swing это не что то редкое. С n-ой итерации худо бедно сделал, да все равно с погрешностью в пару пикселей. Так что с квалифицированной работой это слишком смелое заявление

qrotux 19 янв в 07:54

Потому что модель "не видит" результат своей реализации. У ней лмпчки выстроены в последовательность выведения "наиболее вероятного" ответа для впихиваемого в неё диалога. Попробуйте вместе с диалогом скормить ей изображение того как есть сейчас и как должно быть, прям жпег. А также попробуйте модель не сделать для вас конкретную реализацию, а предложить варианты решения и выбрать из них наиболее оптимальный.

Einherjar 19 янв в 07:55

Попробуйте вместе с диалогом скормить ей изображение

Так я так и делаю обычно

vsradkevich 16 янв в 09:23

Я тоже заметил этот эффект год назад. Он заключается в том, что искусственный интеллект не меняет социальное распределение людей. Компетентные люди остаются компетентными, а некомпетентные — некомпетентными. ИИ не может превратить некомпетентного человека в компетентного.

qrotux 19 янв в 08:08

ИИ может помочь человеку превратиться в компетентного, поскольку в ней есть возможность дистилляции знаний. То, что в вумных книжках описано костным языком, ИИ может преподнести в человекочитаемом виде, с разбором, аллегориями и примерами. Тут только вопрос в том, чтобы человеку это реально было надо и он сам мог связывать буквы в слова, чтобы модель могла "понять" что от неё хотят, а не искать шершавых кабанчиков.

vinchenso 16 янв в 20:54

На метре вышла хорошая статья о том как ии замедляет работу разрабов. С подробным описанием исследования. https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

Помоему пора уже сворачивать лавочку про дикое ускорение работы.

kostylierro 17 янв в 12:42

ускорение сферической работы в вакууме👌

как считать % в случаях когда ллм в принципе не может помочь никак? работы на час с перекурами, но командиры принимают решение два дня.

в случаях когда делает только хуже отталкиваясь от неверных предпосылок и предлагая тупиковые пути решения? не потому что ллм дура, так карта лягла с несоответствием написанного в гите пером, вырубленному в авс топором.

в случаях "бессмысленного ускорения", когда сам дебажишь взаимодействие незнакомых модулей на незнакомых языках, и с ллм за 3 часа можешь добиться того на что у самого ушел бы день, но коллега 5 лет эти модули писавший, взглядом моряка смотрит на проблему и за 5 минут выдает то же решение что и ллм? т.е. в каких-то крайних случаях толк есть, но в мирное время одна лишь суета.

ну и в случаях когда нужно набросать по быстрому скрипт на питоне, коих набросаны миллионы, где сам бы потратил час с гуглением и отладкой, а с ллм справляешься за 2 промпта на 15-20 минут с проверкой скрипта в бою?

работа абсолютно всё вышеперечисленное. а считать как, всё взять и поделить? или взять самые простые случаи, потому осмысленно измеримые, отбросив все остальные потому что это другое?

Belarus 21 янв в 21:07

Вот ещё задача, которую не смогла решыть DeepSeek без подсказок, но может быть сможет ваша нейросеть:
консольная програма, текстовый файл с каким-то текстом (например, "Hello, world"). Надо, штобы при закидывании этово текстфайла в окно консоли, в окне показался ево текст.

В интрнэте решение не нашёл.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий