Заодно отвечу на «12- удалит базу а 13-ый сольет бакапы вашим конкурентам».
Почитайте, что ли, про пользователей с read-only правами в базе и про права пользователей в unix-подобных системах. Тот код, который ходит в базу, даже к файловой системе доступа не имеет.
как вы защищаете вашу инфраструктуру от злонамеренны сообщений?
Самая надежная защита — увольнение из крупной корпорации с оклада в $300K+ сотрудника, который попытался выполнить злонамеренное сообщение. Если внимательно прочитать два абзаца моего предыдущего комментария, а также принять во внимание, под каким текстом этот комментарий появился, то станет понятно, что злонамеренных сообщений там в принципе нет.
Но я все-таки немножечко профессионал, поэтому защита есть. Если очень вкратце — мы не пропускаем plain promts, вместо этого мы их суммаризуем, задаем наводящие и уточняющие вопросы, и по результатам такого общения генерируем свой promt из проверенных и санитизированных шаблонов.
сделать корректную и детерминированную аналитику на базе ИИ это тот еще квест
Да, но он вполне себе решаемый. Не скажу, что это прямо тривиальная задача, но мы понемногу справляемся. Да, там довольно много эвристик, и тем не менее.
Вы были бы абсолютно правы, если бы речь шла про актуальный репортаж в газете «Криминальные новости».
По вашей логике, один из романов Достоевского вообще бессмысленно читать после тридцатой страницы, посколько весь событийный ряд оказывается заспойлеренным примерно там.
А зачем мне с этим третьим знакомиться? Чтобы иметь возможность прийти в комментарии и поднасрать автору, с космического размера апломбом (это аллюзия, если вы вдруг знаете, что это такое) заявив, что текст написан не вручную?
Я в данный момент представляю сторону внедренцев: внутренний чат, помогающий аналитикам и продажникам очень крупной компании — по полубезумным запросам — получать данные из snowflake/amc.
В такой ситуации (сырые данные в труднодоступном месте) — такие помощники, которые не только SQL сделают, но и полученный результат в правильные таблички с комментариями сведут — бесценны. Мне пара человек умудряется стукнуться в чат при редеплое пода (запросы в snowflake — не всегда мгновенны), из-за чего теперь приходится обвешивать это всё логикой поддержки неразрывных соединений.
Если агент использует только LSP, вот что у него есть: textDocument/definition для userRepo возвращает PaymentService.java:4, textDocument/hover возвращает UserRepository, textDocument/references — список пар «файл:строка».
Всё, что агент знает о коде — то, что LSP посчитал нужным показать. Через LSP агент не может узнать, является ли UserRepository JPA-репозиторием и какие методы он наследует.
Есть гипотеза, что вы не понимаете, что буковка «P» означает в аббревиатуре «LSP».
То, что какая-то вами протестированная реализация (какая, кстати?) не поддерживает спецификацию — не означает, что протокол плох. Вот вам ссылка на то, как узнать всё про UserRepository.
Правильно имплементированный LSP, за которым стоит семантический анализ и граф зависимостей, — лучше, быстрее и аккуратнее любого IDE.
На всякий случай для зашедших и домотавших до конца: кроме надерганных из оригинала фраз и их довольно спорной интерпретации, сюжетные повороты не раскрыты вообще.
Боюсь, автор не понимает, о чем написана эта книга, я уж молчу про мотивы поведения всех троих.
Вы можете настроить инфраструктуру так, что при разрыве связи внутри — прокси, который торчит наружу — повторит запрос к внутреннему сервису несколько раз, если тот по таймауту отвалился, например. А клиент ничего и не заметит.
Сделать это можно только для идемпотентных запросов, очевидно, каковым POST не является. (Не нужно со мной спорить, я согласен, что это глагол ради глагола, я просто на ваш вопрос ответил.)
Те, которые сносят код с гитхаба и галлюцинируют — да, наверное. Решение, после которого коммиты на тысячу строк легко ревьюить и почти никогда не нужно править — лично мне обходится дороже тысячи в месяц (если перестать экспериментировать и не считать потраченное на опенсорсные библиотеки — только работа — выйдет евро восемьсот, примерно).
Обе приведенные фразы я лично запросто вставил бы в текст 20 лет назад — они неплохие.
Word, если я ничего не путаю, двойной дефис превращает по умолчанию в N-dash.
«Даже в „Типографской раскладке Ильи Бирмана“» — звучит смешно, как будто это устаревшее наколеночное поделие — единственный вариант работать с типографикой.
Вот именно по таким вдумчивым доносам, как ваш, людей в черных воронках и увозили навсегда; ненуачо, выглядит правдоподобно.
Как показывает среднее по больнице, человек мыслит значительно медленнее, чем пишет, и уж подавно — чем говорит. Так что да, производительность вырастет до 10К знаков в минуту, вот только на выходе будет получаться еще бо́льшая херня, чем в рукописном тексте.
Это не решает те ограничения о которых говорилось выше. Это не решает проблему потери середины. Это не решает проблему контекста. Это не решает много других проблем.
Предлагаю аккуратнее относиться к формулировкам, например так: «Я всё еще не понимаю, как это решает проблемы потери середины и контекста, хотя мне и два раза разжевали».
Я где-то сказал, что «RAG снимает ограничения ИИ»? Где?
Я сказал, что он «всегда успешно обходит все ограничения»? Где?
Мысль выше и так проще некуда, но могу переформулировать: RAG, правильно сделанный специально для проекта, обходит ограничение на размер контекстного окна. Всегда, потому что в MCP должен быть инструмент «приблизить»/«вглубь», а «R» из аббревиатуры должно оперировать абстрактным синтаксическим деревом, а не стеной текста.
будете вы переписывать свое ядро не так, что бы было красиво, а так что бы бизнес был доволен
Это очень спорное заявление. Во-первых, бизнес не может быть недоволен ядром, поскольку он про него ничего не знает. Во-вторых, адекватный бизнес с технарями советуется, а если не советуется — всегда есть в-третьих, бизнесов дохерищща, а я такой один — я просто в тот же день положу заявление на стол (и делал так дважды).
Код с которым работаю я не влезет в контекст ни в одного современного ИИ. И я бы с большим любопытством посмотрел, как он его будет смотреть...
Я не занимаю ничью сторону в этой дискуссии, но замечу, что RAG и запросы инструментов в MCP придумали неглупые люди, и мне удаётся упаковывать в контекстное окно 200К (1М/2М использовать не нужно, они не работают, вопреки обещаниям) весь относящийся к делу граф зависимостей.
Но этот RAG, разумеется, нужно сделать самому, то, что есть из коробки у флагманов — стыдно даже стажёрам показывать.
Заодно отвечу на «12- удалит базу а 13-ый сольет бакапы вашим конкурентам».
Почитайте, что ли, про пользователей с read-only правами в базе и про права пользователей в unix-подобных системах. Тот код, который ходит в базу, даже к файловой системе доступа не имеет.
Самая надежная защита — увольнение из крупной корпорации с оклада в $300K+ сотрудника, который попытался выполнить злонамеренное сообщение. Если внимательно прочитать два абзаца моего предыдущего комментария, а также принять во внимание, под каким текстом этот комментарий появился, то станет понятно, что злонамеренных сообщений там в принципе нет.
Но я все-таки немножечко профессионал, поэтому защита есть. Если очень вкратце — мы не пропускаем plain promts, вместо этого мы их суммаризуем, задаем наводящие и уточняющие вопросы, и по результатам такого общения генерируем свой promt из проверенных и санитизированных шаблонов.
Да, но он вполне себе решаемый. Не скажу, что это прямо тривиальная задача, но мы понемногу справляемся. Да, там довольно много эвристик, и тем не менее.
… и убитая неврастеником в конце еще, ну так, для полноты картины.
Да, иногда мне кажется, что людей надо заставлять сдавать экзамены каждые лет пять, а двоечникам — запрещать публичные высказывания в любой форме.
Вы были бы абсолютно правы, если бы речь шла про актуальный репортаж в газете «Криминальные новости».
По вашей логике, один из романов Достоевского вообще бессмысленно читать после тридцатой страницы, посколько весь событийный ряд оказывается заспойлеренным примерно там.
А зачем мне с этим третьим знакомиться? Чтобы иметь возможность прийти в комментарии и поднасрать автору, с космического размера апломбом (это аллюзия, если вы вдруг знаете, что это такое) заявив, что текст написан не вручную?
С такими фантазиями — это не ко мне, это к психотерапевту. Считать оукружающих глупее себя — довольно пагубно, можно прилюдно наделать в штаны.
Я в данный момент представляю сторону внедренцев: внутренний чат, помогающий аналитикам и продажникам очень крупной компании — по полубезумным запросам — получать данные из snowflake/amc.
В такой ситуации (сырые данные в труднодоступном месте) — такие помощники, которые не только SQL сделают, но и полученный результат в правильные таблички с комментариями сведут — бесценны. Мне пара человек умудряется стукнуться в чат при редеплое пода (запросы в snowflake — не всегда мгновенны), из-за чего теперь приходится обвешивать это всё логикой поддержки неразрывных соединений.
Мне лень искать и сканировать инструкцию, прошу поверить на слово: моющий робот пылесос меня огорошил вот такой сверхспособностью:
AI-powered mopping
Есть гипотеза, что вы не понимаете, что буковка «P» означает в аббревиатуре «LSP».
То, что какая-то вами протестированная реализация (какая, кстати?) не поддерживает спецификацию — не означает, что протокол плох. Вот вам ссылка на то, как узнать всё про
UserRepository.Правильно имплементированный LSP, за которым стоит семантический анализ и граф зависимостей, — лучше, быстрее и аккуратнее любого IDE.
На всякий случай для зашедших и домотавших до конца: кроме надерганных из оригинала фраз и их довольно спорной интерпретации, сюжетные повороты не раскрыты вообще.
Боюсь, автор не понимает, о чем написана эта книга, я уж молчу про мотивы поведения всех троих.
Вы можете настроить инфраструктуру так, что при разрыве связи внутри — прокси, который торчит наружу — повторит запрос к внутреннему сервису несколько раз, если тот по таймауту отвалился, например. А клиент ничего и не заметит.
Сделать это можно только для идемпотентных запросов, очевидно, каковым
POSTне является. (Не нужно со мной спорить, я согласен, что это глагол ради глагола, я просто на ваш вопрос ответил.)Те, которые сносят код с гитхаба и галлюцинируют — да, наверное. Решение, после которого коммиты на тысячу строк легко ревьюить и почти никогда не нужно править — лично мне обходится дороже тысячи в месяц (если перестать экспериментировать и не считать потраченное на опенсорсные библиотеки — только работа — выйдет евро восемьсот, примерно).
Обе приведенные фразы я лично запросто вставил бы в текст 20 лет назад — они неплохие.
Word, если я ничего не путаю, двойной дефис превращает по умолчанию в N-dash.
«Даже в „Типографской раскладке Ильи Бирмана“» — звучит смешно, как будто это устаревшее наколеночное поделие — единственный вариант работать с типографикой.
Вот именно по таким вдумчивым доносам, как ваш, людей в черных воронках и увозили навсегда; ненуачо, выглядит правдоподобно.
Как показывает среднее по больнице, человек мыслит значительно медленнее, чем пишет, и уж подавно — чем говорит. Так что да, производительность вырастет до 10К знаков в минуту, вот только на выходе будет получаться еще бо́льшая херня, чем в рукописном тексте.
Предлагаю аккуратнее относиться к формулировкам, например так: «Я всё еще не понимаю, как это решает проблемы потери середины и контекста, хотя мне и два раза разжевали».
В историю коммитов не заглядываю, считаю это бессмысленной и бесполезной тратой времени, сродни чтению телефонного справочника по алфавиту.
Я где-то сказал, что «RAG снимает ограничения ИИ»? Где?
Я сказал, что он «всегда успешно обходит все ограничения»? Где?
Мысль выше и так проще некуда, но могу переформулировать: RAG, правильно сделанный специально для проекта, обходит ограничение на размер контекстного окна. Всегда, потому что в MCP должен быть инструмент «приблизить»/«вглубь», а «R» из аббревиатуры должно оперировать абстрактным синтаксическим деревом, а не стеной текста.
Забавно. А я так никогда не делаю, например, но что из этого следует?
Это очень спорное заявление. Во-первых, бизнес не может быть недоволен ядром, поскольку он про него ничего не знает. Во-вторых, адекватный бизнес с технарями советуется, а если не советуется — всегда есть в-третьих, бизнесов дохерищща, а я такой один — я просто в тот же день положу заявление на стол (и делал так дважды).
Я не занимаю ничью сторону в этой дискуссии, но замечу, что RAG и запросы инструментов в MCP придумали неглупые люди, и мне удаётся упаковывать в контекстное окно 200К (1М/2М использовать не нужно, они не работают, вопреки обещаниям) весь относящийся к делу граф зависимостей.
Но этот RAG, разумеется, нужно сделать самому, то, что есть из коробки у флагманов — стыдно даже стажёрам показывать.