Обновить

Мы пробили новое дно: change request-ы и баг-репорты, которые никто не понимает

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели17K
Всего голосов 54: ↑46 и ↓8+55
Комментарии50

Комментарии 50

Не знаю, что тут происходит, но какие-то глюки с комментариями. Если что - это просто тест.

Уважаемый автор, мозг взрывается от выражения "с техподдержки" в тексте :-(

Я сначала не понял, а потом как пОнял! (с). Пофиксил, спасибо.

Спасибо, плюсую исправление здесь, так как кармы не хватает. Хотя на Хабре любят минусовать за такого рода комментарии.

Уважаемый автор, мозг взрывается от выражения "с техподдержки" в тексте :-(

Если с выражений "что бы" и "в конце-концов" не взрывается, то и от "с техподдержки" не взорвется.

Тоже починил, спасибо - в следующий раз обязательно напомню себе проверить текст на орфографические ошибки.

мозг взрывается от выражения "с техподдержки"

Одесситам норм!

ИМХО, если это не мелкий стартап на полтора человека где все в течении дня общаются и обсуждают проблемы, то баготикеты, или ченч реквесты должны быть максимально структурированы.

Описание проблемы

Шаги воспоизведения

Текущий результат после шагов воспроизведения

Ожидаемый результат

А уж кто это заполнит, человек, или ЛЛМ, если все пункты детерминированны, вообще ни капельки не важно.

Если в шагах воспроизведения галлюцинации, грош цена такому багрепорту. Мало того, "плавающие" баги по такому шаблону не зарепортить в принципе, а ловить их надо.

и что? от людей тоже приходили с галюцинациями, или с незаполненными полями, просто баг автоматом возвращается на того, кто его создал с отпиской - не воспроизводится.

плавающие баги - отдельная боль, но в данном случае она становится болью репОртера, ибо во многих случаях он плавающий только потому-что до конца не разобрались как его воспроизвести. если уж совсем никак не получается у прослойки между клиентом и программером установить шаги воспроизведения и сделать из него детерминированный, то такой баг уже приходит через менеджера отдельно, с кучей бекграунда, что было сделано, чтоб разобраться.

Я бы подчинился таким правилам на словах, но не фактически. Нейронки вполне можно использовать по формуле "артефакты + качественные промпты" чтобы генерить/тюнить репорты и прочие тексты для читателей с разным уровнем подготовки и вовлечения. Такие тексты не воняют ИИшной рефератоманией.

Про поэта и ДТП было вроде у Чапека. Читалось весело.

Насчёт баг-репортов согласен полностью. Нужно ведь опсание проблемы как её увидел человек, а не как понял ИИ. Ну а дальше уже баг-репорты можно прогонять через ИИ для быстрого поиска решения проблемы.

Нужно ведь опсание проблемы как её увидел человек,

Ну вот скажет тебе человек про барабан и палочки, как из этого определить, что пошло не так?

так надо уточнять у человека.
А нейросеть, как скажет, что пошло не так?

Если второй абзац - это стохастически-литературно обработанный с потерей информации первый, то зачем он нужен вообще?

Для спокойствия пишущего - чтобы он знал, что "прислал что-то нормальное, а не просто собственный бред".

Да, начинают потихоньку розовые очки спадать) ибо нейронки всё "знают" и умеют очень правдоподобно и глянцево обосновать свои фантазии.

Это всего лишь освоение инструмента, который начали пихать во все дырки, но, зачастую, не тем концом.

Чаще вообще боком

Если честно, я вообще не понимаю, как можно доверять описывать свои(!) мысли ИИшке. Но почему-то именно такое её применение наиболее массово.

нет, ИИшка транслировала жалобу в фикс. В ходе этой трансляции была сгенерирован не только фикс, но и описание проблемы и описание фикса.
Конечно так не должно быть. Должна быть цепочка и ИИ на первом звене должна была поискать и базе оцифрованных коммуникаций поддержки, не является ли случай банальным недопониманием клиента, неинтуитивным сайтом, недостаточно понятной документацией и т.п. Сюда должен быть включен и анализ логов. Если это звено эскалирует, то тогда должна быть попытка воспроизведения проблемы. И если проблема существует то только тогда должен быть сформирован кейс и отдан в производство фикса. Это систематический подход. Он сработает. А если все бессистемно отдать в ИИ в виде одного черного ящика, то дальше надо закрывать фирму и идти отдыхать.

А потом эта llm даст пользователю указание как удалить аккаунт, вместо нормальной рекомендации, потому что его проблема подхожа. Когда он удалив аккаунт не вернётся - запишет это в успешный кейс, и будет планомерно уничтожать пользовательскую базу пока все вокруг будет рисковать стрелочки вверх по успешности решения проблем до эскалации)

95% не могут внятно выражать свои мысли, и любой, кто работал в поддержке крупных массовых продуктов, подтвердит. Нытье, агрессия, требования, жалобы, эмоции - всё, кроме здравого смысла и полезной информации. ИИ прям панацея от этого - тот же чат-бот выуживает информацию по крупицам из безумного потока сознания просителя, и сотрудник поддержки сходу видит короткое резюме, что же случилось.

Для первой линии поддержки где нужно отфильтровать эмоции и оставить суть - да, это спасение, но статья про внутренние коммуникации (продакт -> разработка). На этом уровне невнятные мысли недопустимы, и ИИ не должен быть костылем для некомпетентности коллеги

95% не могут внятно выражать свои мысли,

Поверьте, это не самая большая проблема. Гораздо большая проблема, когда люди внятно выражают свои мысли, только их понимание проблемы особенное, мягко выражаясь.

Пример: жалоба "принтер выдаёт чистые листы". Спрашиваем - "совсем чистые, на листе ничего нет?" Ответ -" ничего нет". Приезжаем, смотрим - на половине листа есть текст. Немой вопрос в глазах (наших). Проблема в картридже.

Или совсем недавно - "принтер ничего не печатает. Посылаем с компьютера, а ничего не выходит. Думали, что кончились картриджи (принтер цветной), поменяли, всё тоже самое" Путём длительных переговоров сначала выясняем, что лист бумаги из принтера всё-же выходит. Потом - что на листе цветные части есть, нет чёрного цвета. Тут уже таки принтер оказался.

А мысли выразили вполне внятно.

Так это же и есть невнятное выражение мыслей в силу невнятной привязки слов к объектам реального мира. Вместо того, чтобы внятно сказать "из принтера не вышло ни одного листа с нужным содержимым" человек небрежно сокращает до "ничего не выходит". Может, у него лист - это лист на экране в программе, и этот лист не вышел через принтер, поэтому на бумаге нет того, что нужно.

А llm дополнит невнятные мысли пользователя правдоподобной версией произошедшего - не имеющий никакого отношения к реальности. Пользователь скандалит и пишет, что он не может войти в систему, llm превращает это в кейс с неработающей авторизацией после ввода корректных логина и пароля, а на деле - там у человека интернет отвалился, и он видит пустой экран вместо сайта.

Уж лучше эмоции и неопределенность, чем определённость на основе догадок, которых нет в первоначальных данных.

Жаль, нет хотя бы условных примеров подобных комментов:(

Есть еще другая стадия, когда еще пм добавляет, я спросил у сонета и он сказал, что сделать можно и дело плевое!

Аргумент "ИИ сказал" вообще должен быть запрещен в технических дискуссиях...

ИИ не знает контекста проекта, ограничений железа и техдолга, он знает только сферический код в вакууме

У меня сотрудница на испытательном, попыталась закрыть одну из задач, с комментарием - "Это не решаемая задача, я спрашивала у всех чатботов, они не смогли решить".

ИИ-репорт аккуратный.Без эмоций.Без «я не уверен, но кажется».Без странных, неудобных деталей - идеально написан.

Получилось прямо какое-то хокку белым стихом )

автору не нравится, когда его кормят нейрослопом.
но сам он не стесняется кормить нейрослопом других.
как это понимать ?
должность позволяет плевать на нижестоящих ?

Понимаете, есть разные ситуации.
Когда я прошу ИИ слегка отредактировать мой текст и потом сам его перечитываю и правлю – это одно. А когда человек закидывает в ИИ свою переписку с клиентом за несколько дней, просит его сгенерировать баг-репорт и сам не понимает, о чём речь (даже после генерации текста) – это уже совсем другое.

В первом случае ИИ – инструмент. Во втором – замена понимания. Для меня нейрослоп - именно это.

Тут вопрос не в должностях и не в "плевках вниз", а в том, используешь ли ты инструмент осознанно или перекладываешь работу головы на автогенератор.

А вот ваша КДПВ - это инструмент или нейрослоп?

Скрытый текст

Пофиксить Жьiгу!

Ф4???:;→

Сде&а̡гь как-то:..>

x%@$!

Баг 100500 – email

Ну и @@РАГРА!

Ни смысловой нагрузки, ни визуальной значимости. Это же мусор. Неужели вам самому приятно на неё смотреть? Неужели совсем ничего не ёкает? Сде&а̡ли как-то:.., ну и @@РАГРА с ней, а что такого.

Как раз таки в контексте статьи это инструмент, а не украшение. КДПВ намеренно выглядит "извращением" – ровно потому, что отражает реальность проблемы, а не глянцевую версию "как должно быть". Можно не считать метафору удачной, но это не мусор ради мусора.

Ну и кроме того, раз она привлекла ваше внимание – значит, сработала.

А вот ваша КДПВ - это инструмент или нейрослоп?

можно понять, простить и игнорировать.
на КДПВ все равно никто не смотрит.
кстати, тоже лишний этап.

@panzerfaust - вам те же аргументы.

Так это как раз иллюстрация к отсутствию смысловой нагрузки в ИИ баг-репортах. Репорт есть, а смысла в нем нет.

Я бы поверил, что это такая хитрая и намеренная иллюстрация, если бы я не видел точно такой же мусор в каждой третьей статье на хабре. Смотрите не только текст, который "это у меня такая метафора", смотрите всю картинку целиком, визуальную составляющую тоже.

Понимаете, есть разные ситуации.

это_другое.jpg

я прошу ИИ слегка отредактировать мой текст и потом сам его перечитываю и правлю

если действительно "слегка" (есть вопрос метрики и расстояний в пространстве текстов, я не знаю как это измерить) и если действительно "потом сам его перечитываю и правлю", то ИИ лишний этап. а тогда зачем оно ?

когда человек закидывает в ИИ свою переписку с клиентом за несколько дней, просит его сгенерировать баг-репорт и сам не понимает, о чём речь (даже после генерации текста) – это уже совсем другое.

и у вас обоих внутренние документы утекли в ИИ, будут использованы для обучения ИИ, и вам обоим за предоставления материала для обучения не заплатят.

это_то_же_самое.jpg

будут использованы для обучения ИИ, и вам обоим за предоставления материала для обучения не заплатят.

Ваш комментарий тоже будет использован для обучения ИИ и вам тоже за предоставление материала для обучения не заплатят (и мне, кстати, тоже).

ИИ тексты видно за километр и все они выглядят однообразно, как спам. И там очень туго с аналитикой. Только человек может переосмыслить проблему, сказать "да ну его нафиг с этим возиться давайте вообще все выкинем и сделаем по другому". Конечно правильно не допускать генераций в работе. У меня в сервисе ии публикации запрещены - стало гораздо чище, содержательней и приятней. Надеюсь, Хабр тоже к этому придет..

Иронично, что вы ругаете ухарей, которые подсовывают вам нейрослоп, но сами вы для КДПВ выбрали такой же кондовый нейрослоп. Нет, я все понимаю. Нарушение рабочих обязанностей несравнимо с кривыми картинками. Но "корень зла" тут один. ИИ действительно инструмент, но ситуация такова, что 99% усилий вкладывается в инструменты и 1% в обучение их грамотному и этичному использованию. Результат повсюду.

Мне кажется, что иллюстрация получилась идеальной метаиронией - картинка от ИИ с бессмысленным текстом репортов к статье о том, как ИИ порождает эти бессмысленные репорты.

Проблема даже не в том, что репорты пишет ИИ, а в том, что нарушена цепочка ответственности. Если продакт сгенерировал репорт и подписался под ним, он обязан понимать каждое слово, если он не может ответить на уточняющий вопрос без помощи гпт, значит он не владеет контекстом. ИИ тут просто подсветил давно существующую проблему глухого телефона в коммуникациях, сделав ее более заметной из за гладкого слога

Заметили, что у части людей это(баг рапорты и rnd) чуть ли не основная работа, но если вы её будете делать с помощью ИИ и будет просто ужасно, вас никто не уволит. Просто будут игнорировать рапорты.

Шикарно, да?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации