Sonia_Black22 апр в 13:56

785 статей. 26 доменов. Для агентов, не людей

Средний

10 мин

7.5K

Искусственный интеллектМашинное обучение * Natural Language Processing * Open source * Программирование *

Кейс

Комментарии 7

НЛО прилетело и опубликовало эту надпись здесь

Sonia_Black 23 апр в 08:02

Спасибо, вопрос отличный. Домены помечены на обновление данных - у каждого свой интервал, в зависимости от скорости изменений в области. Алгоритмы и математика пересматриваются редко (год+), AI-инструменты и оптимизация инференса - через 60 дней. Когда домен достигает своего интервала, карточки в нём идут в очередь на пересмотр.

217th 25 апр в 16:25

Спасибо вам за статью и описание подхода!

Вопрос про пересмотр (по расписанию). Предположим, за прошедшее время накопилось несколько карточек. Они частично дублируют друг друга, какие-то описанные подходы перестали быть бест-практис, хотя по-прежнему технически актуальны.

Это все ручная компиляция?

И еще. Вы остановились на двухуровневой структуре: домены и статьи. Плюс - "плоские" ссылки. Экспериментировали ли с более сложными иерархиями?

И еще 2. Остаётся ли соблазн сберечь сырые исходники, оставив ссылки на них из статей?

И еще 3. Бывает ли, когда вам ценно сохранить в статье хронологию исследования или какого-то проекта? Как поступаете?

Спасибо ещё раз :)

Alexgoodman53 23 апр в 05:28

Да с тем же самым сталкиваюсь, по поводу архитектурных решений 5 летней давности... Проблема еще в том что если ты сам не имеешь актуальную экспертизу, ЛЛМ быстро убедит тебя в том что все в порядке, и что бест практис проектирования сейчас именно такой, в сфере внедрения ИИ, где сейчас изменения в подходах и в инструментарии меняются каждые полгода это реально проблема.

ITstaks 23 апр в 05:28

Крутая статья, главное полезная!

tiana27 23 апр в 05:29

Интересно про ресерч, так как я иду примерно тем же путем (сохранение сырых данных, фильтрация, - у меня дальше ревью/сверка данных с источниками и сверка корректности расчетов, потом как раз упаковка в локальную базу для дальнейшего использования полученных данных и определение связей между этими данными.
И спасибо за описание понятным языком для таких как я (кто не очень погружен в данное направление, но хочет немного понимать, как там все работает)

Sonia_Black 23 апр в 08:03

Спасибо за тёплый комментарий. Ваш шаг с ревью и сверкой корректности расчётов - это ровно то что у меня пока не формализовано, хотелось бы подсмотреть как вы это делаете. Правильно понимаю что это ручной шаг перед упаковкой в базу, или у вас через скрипты?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий