Pull to refresh
8K+
4
Дмитрий Кирпа@DmitryITMO

Разработчик, ML Laboratory, Yandex Infrastructure

18
Rating
Send message

Интересный опыт, спасибо, что поделились!

Насколько я понял вводные следующие:

  • рассматриваются только задачи кодовой генерации

  • документации и тикетов таск-трекера почти нет, поиска над ними тоже

  • у Вас есть ресурсы абсолютно весь важный контекст положить в md-файлики рядом с кодом

Вопрос в том, нужен ли тут поисковик самых релевантных кусков интранета, если уже всё описано в Claude.md. Если так, то поисковик тут действительно не критичен (разве что поиск по регуляркам в коде)

Почему поиск по интранету критичен для Яндекса:

  • У нас уже есть огромный накопленный опыт, осевший в виде тикетов, пулл риквестов и вики-страничек. А Claude.md люди придумали относительно недавно. Поэтому первый пункт - поисковики и RAG-и актуалны для компаний с большим опытом. Claude.md небесполезны, но положить в них десятилетия разработки сложно и не всегда целесообразно

  • Поиск и RAG можно давать людям, а CLAUDE.md людям не так удобен. Нужно будет либо искать документацию по регуляркам, либо всё равно реализовывать поисковик над этими файлами. Людям свой код тоже полезно понимать :)

  • Claude.md не должен сильно забивать контекст, поэтому он должен быть компактным. Раз есть ограничения на размер, то по любому есть и потеря информации. Например, сценарии вида “в проде ошибка X, помоги”. Вряд ли в Claude.md будут перечислены все возможные варианты ошибок, в тч из всех зависимостей кода. Если я даю агенту конкретную задачу вида “поменяй в ручке X в походе в базу таймаут”, то Claude.md топ. Если я говорю “хочу ускорить свой поиск, посмотри как это делают другие, выбери лучшие доступные в монорепе технологии”, то без поиска тяжело

  • Поиск - универсальное решение для разных профессий. В Яндексе трудятся не только разработчики и поэтому не всем актуально работать именно с кодом. Есть также некодовые знания, актуальные всем профессиям, включая разработчиков. Например, HR-запросы вида “как пойти в отпуск”. Их, скорее всего, в коде не напишут

Если что, я не говорю, что файлы-подсказки для агентов в коде не стоит делать. Интуиция подсказывает, что, как всегда побеждает дружба. Для локальных кодовых задач Claude.md крут, но в работе с большими проектами с кучей сложных зависимостей, не во всех из которых есть Claude.md, поиск поможет лучше

На последней картинке 85% - это аудитория Внутреннего поиска (то есть поисковой строки), а 25% - аудитория нашего AI Chat (то есть генеративного ответа). По всей видимости, путаница из-за третьего пункта, на картинке не очень ясно 25% аудитории чего. Спасибо за комментарий!

Information

Rating
425-th
Registered
Activity