Пока вижу реальную пользу именно от итеративного подхода, еще и начиная работу с подробной архитектуры сразу после подробной формализации требований. Пробовал "бутстрап" - он реально буксует после роста проекта выше уровня 5-7+ тысяч строк. То есть для прототипа - норм, но потом все заново писать. Разбираться и развивать дальше команда не готова...
А вот итеративный подход - весьма ускоряет работу и позволяет сохранить понимание кода, если не злоупотреблять согласиями, а контролировать то, что именно пишет сетка. Получается и средние по размеру проекты тащить. Правда, приходиться постоянно удерживать себя от "да и так сойдет" )).
Кстати, нюанс Firebase - там Gemini, она упертая и нагло глючит иногда. Выгладит все гладко и все довольны, а потом прошу ее написать полную подробную документацию на каждый файл проекта - и получаю глюки и фантазии местами, типа "здесь вызов модели OpenAI", хотя ее в проекте нет и не было никогда.. Еще и и упирается, показывает мне несуществующий код и убеждая, что права...
Спасибо, Валера, интересно! А как на практике вы находите баланс между улучшением качества ответов (используя техники вроде рефлексии, роутинга и реранкинга) и сохранением нормальной скорости ответа для пользователей? И с какими типичными задержками вы реально сталкиваетесь на разных этапах вашего продвинутого RAG-пайплайна?
Пока вижу реальную пользу именно от итеративного подхода, еще и начиная работу с подробной архитектуры сразу после подробной формализации требований. Пробовал "бутстрап" - он реально буксует после роста проекта выше уровня 5-7+ тысяч строк. То есть для прототипа - норм, но потом все заново писать. Разбираться и развивать дальше команда не готова...
А вот итеративный подход - весьма ускоряет работу и позволяет сохранить понимание кода, если не злоупотреблять согласиями, а контролировать то, что именно пишет сетка. Получается и средние по размеру проекты тащить. Правда, приходиться постоянно удерживать себя от "да и так сойдет" )).
Кстати, нюанс Firebase - там Gemini, она упертая и нагло глючит иногда. Выгладит все гладко и все довольны, а потом прошу ее написать полную подробную документацию на каждый файл проекта - и получаю глюки и фантазии местами, типа "здесь вызов модели OpenAI", хотя ее в проекте нет и не было никогда.. Еще и и упирается, показывает мне несуществующий код и убеждая, что права...
Спасибо, Валера, интересно! А как на практике вы находите баланс между улучшением качества ответов (используя техники вроде рефлексии, роутинга и реранкинга) и сохранением нормальной скорости ответа для пользователей? И с какими типичными задержками вы реально сталкиваетесь на разных этапах вашего продвинутого RAG-пайплайна?
Спасибо за статью. Мой первый комп - IBM AT, ностальгия ))
Удивительно, что, прими Эстридж предложение Джобса - и мы, возможно, увидели еще что-то интересное. Или нет, но прожил бы дольше...