Комментарии 2
Идея интересная, но похоже еще сыровата, возможно английского норм. А так, спросил сеть про формат файла, а он подчеркивает словосочетание из 2-3 слов, довольно общих. И например ссылался на документ про миграцию в сша.
Вот легендарный судебный артефакт для отслеживания источников обучения нейросетей подъехал.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Институт Аллена запускает OLMoTrace: инструмент для отслеживания источников ответов языковых моделей в обучающих данных