Комментарии / Профиль flancer / Хабр

Alex Gusev@flancer

Я кодирую, потому что я кодирую…

3,1

Рейтинг

Подписчики

ПрофильСтатьи130Посты3Новости1Комментарии2.1K

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 29 сен 2025 в 08:57

Судя по уходу от прямого ответа, вы всё-таки под UB имели в виду именно "Undefined Behavior". Значит, я успешно использовал LLM и получил правильный ответ, но вы не можете поступать так же из-за ваших собственных убеждений.

ОК, продолжайте гуглить, раз вам так удобнее.

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 29 сен 2025 в 08:21

Что вы имели в виду под "UB" в своём комменте?

Если что-то другое, чем то, что ответила мне LLM (тут UB значит Undefined Behavior), то я соглашусь, что вы правы - LLM лжёт, а Гугл нет :)

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 29 сен 2025 в 08:05

А почему это "undefined behavior" в выдаче гугла - это верная расшифровка, а "undefined behavior" в выдаче LLM - неверная? :)))

Мне LLM, получается, солгала, а вам Гугл правду сказал? Но ведь ответ-то один и тот же?! :)

Вы, в силу своих ограничений, не доверяете одним источниками информации и доверяете другим. Я, в силу своих ограничений, делаю то же самое. Просто у нас ограничения разные.

А UB можно сильно по-разному переводить, в зависимости от контекста.

Топ языков программирования в 2025 году: рейтинг IEEE и влияние на него языковых моделей

flancer 29 сен 2025 в 04:49

Всё чаще требуется дисциплина и переход на TypeScript или ESM

Тут ещё в тексте и ESM дополнительно выделили. Не дай бог это разделение ещё и до рейтинга доберётся.

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 29 сен 2025 в 04:28

Смотрите, я задал LLM-ке впорос:

Что означает UB в данном контексте? `` Одно дело функция myGeatF не документирована. Тут все просто - не используем ее. И совсем другое дело если функция println с документацией "выводим строку в stdout" с вероятностью 0.1 процент делает rm -f / UB везде.``

Мне она ответила:

Алекс, тут UB значит Undefined Behavior («неопределённое поведение»).
...

Вот пример простейшего использования. Мелочь? Разумеется. Но попробуйте это погуглить.

Есть множество сценариев, как использовать LLM "с UB в каждом ответе". И есть люди, которые работают с этими сценариями, а есть, которые их отвергают, как бесперспективные.

У каждого свой путь.

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 28 сен 2025 в 17:07

Начните с простого и усложняйте задачи по мере освоения инструмента.

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 28 сен 2025 в 14:23

А не лучше сразу погуглить? Зачем двойную работу делать?

... и, это, ответы Гугла - тоже не истина, так-то.

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 28 сен 2025 в 14:20

Ну, нейронка это просто инструмент. Она может делать некоторые вещи и может делать их на приемлемом уровне. Как её использовать - на ваше усмотрение. Если вам проще гуглить - не используйте нейронки. Мне, например, проще сделать скриншот с настройками IDE или с сообщением об ошибке и задать вопрос в контексте. Гугл уже встроил Gemini в свой поиск и для общих вопросов иногда вполне хватает вывода Gemini.

По-большому счёту, это вопрос вашей персональной интеграции с этим инструментом. Если вам проще гуглить - гуглите.

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 28 сен 2025 в 07:03

Ага, я понял теперь, о чём вы. Это не про "неполную документацию", и не про "частично неверную документацию", и вообще не про документацию к софту. Это про сам софт, который в 99.9% случаев выполняет что-то полезное, а в 0.1% случаев при тех же условиях уничтожает Вселенную. Да, в таких условиях действительно использование подобного софта является преступлением против человечества.

Просто то, что вы описали никакого отношения к LLM не имеет. Нейросети себя так не ведут. Они просто соединяют токен за токеном, пользуясь накопленной при обучении статистикой. Что делать с полученным результатом - дело человека.

Я на практике использую LLM для поиска способов конфигурации, например, VSCode. Да, что-то не подходит (10%), но основное (90%) очень даже сокращает время. Просто взять текстовый конфиг какого-то сервиса (`/etc/...`) и попросить LLM'ку переписать его с другими установками. Всё это очень успешно работает и не уничтожает ни человечество, ни файлы на моём компьютере.

Вы же буквально описали источник которому в принципе нельзя доверять ни в чем. 90 процентов правды и 10 процентов вранья с виду похожего на правду это гораздо хуже чем 100 процентов вранья.

Да, так и есть. Я молотком тоже не всегда по гвоздю попадаю, но я его использую. Считайте, что враньё нейросетки в ответе - это ваш криво составленный запрос :)

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 27 сен 2025 в 06:48

Вопрос не в том, обновляться или нет - по условиям задачи вы уже работаете со второй версией. Вопрос в том, читать или не читать доки, верные всего лишь на 90%.

Есть такое понятие "недокументированные возможности", которое наводит на мысль, что очень многие документы не отражают предмет с точностью в девятках.

Я очень долгое время имел дело с Magento, где софт работал правильно на наиболее популярных функциях и страшно глючил на редко-используемых. В своё время это была очень популярная платформа в е-коммерции. Так что, софт бывает всякий, но не все могут использовать всякий софт.

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 27 сен 2025 в 06:30

Агенты это всё в контейнере делают, там можно :) А кто Агента на прод запустил - тот сам себе злобный буратин и там уже не важно, какие у Агента права.

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 27 сен 2025 в 06:26

Я в своих отношениях с ИИ тоже пришёл к выводу, что каждому сгенерированному файлу с исходным кодом должна соответствовать иерархия файлов документации (страничек, в вашей терминологии). Такое дерево документов, где уровень абстракции понижается от корня к листьям. Одни файлы документации (стволовые) используются для генерации практически каждого исходного файла проекта, другие (конечные ветки) - только для генерации конкретного исходника.

Но мой вопрос был именно про confluence. Мне кажется, что держать документацию в md-файлах раздельных репозиториев и комбинировать репозитории для конечных проектов - это гораздо удобнее, чем confluence.

Как работать с нейросетями эффективно: теория и практика

flancer 26 сен 2025 в 03:53

Феномен «Потеря в середине»
Что это? Снижение качества работы с информацией, расположенной в середине длинного контекста.
Проявление Модель чаще игнорирует или искажает данные из центра документа, лучше запоминая начало и конец.
Причина Особенность работы механизма самовнимания, который придает меньшее значение средним частям последовательности.

Что значит "длинный контекст" в данном случае? Насколько он должен быть длинным, чтобы можно было наблюдать этот эффект? Когда феномен "потеря в середине" сменяется просто вытеснением данных из контекста ("забыванием")? Как это объясняется с точки зрения работы LLM (инференса) - за счёт чего искажаются данные в середине контекста?

Мне кажется, что этот феномен является свидетельством "оптимизаций" проводимых различными производителями "движков" в целях снижения стоимости вычислений (того самого инференса). Он должен проявляться на больших контекстных окнах (более новых моделях) и отсутствовать на малых (старых моделях).

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

flancer 25 сен 2025 в 04:28

А для чего confluence? Почему не держать всё в файловой системе - в md-файлах? Можно разнести по разным репозиториям, если надо: доки - отдельно, код - отдельно.

Виктор Исключительный

flancer 24 сен 2025 в 05:23

По названию и половине первого предложения определил автора. Эх... опять жанр производственной фантастики появился на Хабре.

+16

Дело об убитых воспоминаниях или почему ваш гейм-дизайн стал местом преступления

flancer 19 сен 2025 в 03:55

Совершенно не интересуюсь гейм-девом, но... наверное, это лучшая публикация на Хабре, что я прочитал за последние несколько месяцев. Умеете вы манипулировать вниманием (y)

Жгите варваров, топите корабли. Пунктирная история греческого огня

flancer 16 сен 2025 в 05:06

Зависит от длины фитиля. У моей бабушки тоже была керосиновая лампа. У меня она тоже коптила и воняла. Но я её на максимум выкручивал. А если язычок фитиля сделать поменьше, то хорошо работает. Купил себе современную, пару раз попробовал - так же всё регулируется, как и в бабушкиной. Света мало, конечно, зато тепло.

ADSM: границы возможностей Моделей

flancer 10 сен 2025 в 20:05

Я тут пытался донести мысль, что Модели, как и Люди, устроены похоже друг на друга. Как один человек похож на другого, так и одна модель-трансформер похожа на другую. Мы все обучаемся на каких-то общих данных и у нас у каждого есть свой персональный опыт.

Есть круг вопросов, на которые люди в массе своей дают очень похожие ответы. Это как раз область популярных общих данных. Чем более общий вопрос мы задаём Человеку или Модели, тем больше вероятность получить одинаковый ответ на этот вопрос.

Другими словами, есть круг вопросов, ответы на которые будут совпадать между Моделями и Людьми вплоть до идентичности, а есть - когда ответы будут разниться очень сильно. При создании приложений при помощи агентов можно и нужно использовать Модели именно в таких вопросах и крайне желательно обрезать их творческую составляющую, как непредсказуемую.

Claude Code: лучшие практики агентного программирования

flancer 10 сен 2025 в 12:40

Для Клода работает, скорее всего.

ADSM: ролевые игры

flancer 10 сен 2025 в 04:01

BASE - Bot Aided Software Engineering? Ну, то же вариант.

-1