Обновить
4
0.1

Пользователь

Отправить сообщение

1. Промпт-инжиниринг для тестировщика

и до этого было

Как будто за окном не 2026 год, а 2010.

Так и хочется написать, "как будто за окном не 2026, а 2024 что по-прежнему про промпт-инжиниринг спрашивают".

Почему "напиши тесты для этой формы" работает хуже, чем детальное описание контекста и ожиданий.

Вот на самом деле? При настроенном Claude.md и subagents??? Мы точно в 2026 году?

Чем отличаются агенты для разных задач: генерация кода, анализ требований, работа с документацией. Какой инструмент выбрать для какой задачи. Как комбинировать несколько агентов в работе.

Инструмент - это про что? Типа Chat GPT? Или GH Copilot? Или тот же CLI (Claude, Codex, Gemini)??? Или тут речь о внутренних тулах компании, о которых никто не слышал, чтобы можно было потом сказать про "слабак". В догонку - "анализ требований", "работа с документацие" - судя по вопросу про агенты видимо тут надо было прописать специфику инструкции и используемых тулов? При наличии некоего "секретного" инструмента, про который надо угадать на собеседовании??? Ответ же - "Claude Desktop' будет воспринят как "а вот и не правильно"???? Или "а это не агент"??? А что агент? Нечто сделанное при помощи "какой-то матери" (c) copilot studio?

Народ до сих пор не пришёл к конценсусу на тему "что такое агент" (пока это скорее LLM с тулами и с некоей автономностью), а тут уже есть "правильные агенты"?


Извините, накипело (c)

а они просчитали сколько из этих 900 млн уйдут после появления рекламы?

Вы сделали свой Databricks и у вас не так чтобы сразу получилось?

Да, но можно и в кэш не попасть - тогда наступает интересная история с "дороже". Вроме того, защита вида <random> промпт </random> убивает кеш - и становится совсем грустно для кеширования :)

GPT не помнит длинные диалоги. Если пользователь писал несколько сообщений подряд, модель начинала путаться: объединяла их в один запрос, забывала детали или отвечала на старый вопрос.

Это фраза многое объясняет :) Делали первый проект по автоматизации, не так ли?

По поводу "«постсоветский управленческий синдром»" и "российской компании" - оначает ли это, что подобная пробема не характерна для эффективных менеджеров из UK/USA/FR/DE? (тонкий намёк - "разницы нет"). Ключевая проблем в "эффективных менеджерах" и стилях "эффективного управления". А "осознанные выбор работодателя" не гарантирует, что завтра начальнеком не станет очередной "талантливый во всём" человек, со своим неповторимым стилем управления

Я бы добавил, что приличное время (месяцы, а не 1 видос на 15 минут) + изначальный (и не малый) опыт в разработке. Иначе потом начинаются вопли про "ИИ не работает". Сделать тетрис с одного промта не совсем тоже, что отрефакторить Legacy без потерь :)

Цена: $0.15 за обработку одного документа

Судя по цене, если отбросить всю радостную шумиху про "мы самые лучшие" вы явно прикрутили что-то вроде GPT (VLM) и решили проблему (вариант - протестировали какую-нибудь ламу/квена, которые с картинками могут работать, чтобы on-premise).
Иначе всё как-то слишком дорого

Мы не верим на слово — мы тестировали на стандартных бенчмарках

А мы, значит, дожны верить на слово очередному "проактивному и решившему все проблемы" продавцу? Точно-точно.

PS. Что-то мне это всё напомнило гендиректора одной недавно успешно сдувшейся компании. Один в один была стилистика выступлений. Везде абсолютный успешный-успех. Правда потом стали выясняться нюансы

Он просто гений. А про двухфакторку на телефоне не в курсе? А про обящанность отвечать на сообшения по разным важным мессенджерам от таких же менежеров тоже не в курсе? Так то шикарный совет в стиле "надо не болеть и надо быть богатым".

Интересно... Что за AI в гугле писал код до июля 2023. Причем в таких количествах.

я бы тут скорее сфокусировался бы на "...Я восхищаюсь тем, чего им удалось достигнуть..." - ребята смогли. А это не сильно тривиальная задача. Интересно, много ли пользователей Юбера жалуются на него также как на яндекс?

Кто бы мог подумать то… Я сейчас по дефолту считаю, что мне или AI звонит или «слежка безопасности сбербанка/гугла». И в первом случае крайне осторожно выбираю слова, чтобы чего внезапно не активировали. А во втором хоть душевно пообщаться с человеком (пока) можно :)

Мне кажется, что MS надо не останавливаться на достигнутом - уволить ещё 30% разработчиков и заменить их на ИИ (особенно операторов техподдержки). И вот тогда заживём. Отвал поиска будет восприниматься как мелкое недоразумение по сравнению с другими сбоями :)

Эффективность требует жертв :)

Ну на самом деле это не совсем так. 0-температура не гарантирует 100% повторяемость результата

Я с тем же успехом могу написать, что использование исключительно агенств это почти всегда провал. Как-минимум потому что задача агенства всё-таки максимально быстро закрыть вакансию и заработать денег. И агенствно не может (и не хочет ждать). В моей практике (Data Science + Data Engineering) случше всего срабатывала схема своего опытного рекрутера (не HR!) к крайне тесным взаимодействием рекрутер-техотдел. Для скалирования по примерно стандартным вакансиям могли на время подключать агенства (хотя ощущения оставались всегда так себе). Но только на время и отчётлово понимая, что результат будет так себе.
Хуже всего срабатывала идея, когда отдавали поиск и найм собственно на руководителей отделов (собственник эффективно решил эффективно сэкономить) - вот тут точно беда наступала.
Вариант, когда пытались просто перейти на агенство (видимо кто-то прочитал похожую статью) практически никогда не срабатывал (скорее - приводил к сильным конфликтам с последующим разрывом с агенствами). Что в принципе было весьма объяснимо, так как это тоже процесс, который надо выстраивать и у которого есть свои ограничения и область применимости.

А МГУ ставит конкурс выше 70, что гарантирует, что часть её задач решены.

Не гарантирует. Если

условный МГУ может обратиться в ФИПИ и добавить две-три своих задачи в ЕГЭ.

то чтобы гарантировать что какие-то задачи решили набравшие 70+ баллов, надо чтобы задач было условно 5. А так как вузов болше чем 2-3 штуки, то сильно сомневаюсь, чтобы балл ниже 100 мог что-то гарантировать.
Одно дело, если бы смотрели что включается в эти 70 баллов. Другое, когда стоит отсечка в 70 баллов и не важно что там (мы лишь можем полагать, что "гарантирует").
Где-то есть статистика распределения задач от разных вузов в ЕГЭ?

А где-то толком было написано зачем оно надо? Пока есть обтекаемое про ИИ, тестирование. Создаётся нездоровое впечатление, что кто-то или макетку заказал для игр с чипами (???) в которую будут впаивать и выпаивать нечто многоногое. Или я что-то не понимаю. Опять же, тестирование чипов нынче делается через запаивание-выпаивание?

И сразу маленький вопрос - на 2-3 мониторах я могу открыть 2-3 приложения развернув во весь экран. В случае с панорамой надо будет как-то озадачиватся правильной раскладкой окон на одном мониторе. Не сильно напрягает?

Информация

В рейтинге
3 652-й
Зарегистрирован
Активность