В поисках «золотого датасета»: OpenAI собирает реальные рабочие задачи и файлы для тренировки будущих ИИ-агентов / Хабр

OpenAI обращается к сторонним подрядчикам с просьбой загружать реальные задания и рабочие файлы с текущих или прежних мест работы — чтобы использовать эти материалы для оценки эффективности своих моделей следующего поколения. Об этом свидетельствуют документы OpenAI и компании Handshake AI, занимающейся обучающими данными, с которыми ознакомилось издание Wired.

Судя по всему, проект вписывается в более широкие усилия OpenAI по созданию так называемой «человеческой базы» — эталона выполнения различных задач, с которым затем можно сопоставлять результаты ИИ‑моделей. В сентябре компания запустила новый процесс оценки, позволяющий сравнивать работу своих ИИ с деятельностью профессионалов‑людей в самых разных отраслях. В OpenAI утверждают, что это один из ключевых индикаторов продвижения к AGI — системе ИИ, способной превосходить человека в большинстве экономически значимых задач.

«Мы наняли специалистов из самых разных профессий, чтобы они помогли нам собрать реальные рабочие задачи, смоделированные на основе того, чем вы занимались в своей постоянной работе, — так мы можем измерить, насколько хорошо ИИ‑модели справляются с подобными заданиями, — говорится в одном из конфиденциальных документов OpenAI. — Возьмите существующие фрагменты длительной или сложной работы (на часы или даже дни), выполненной вами в рамках профессии, и превратите каждый из них в отдельную задачу».

Как следует из презентации OpenAI по этому проекту, с которой ознакомилось Wired, подрядчиков просят описывать задачи, выполнявшиеся ими сейчас или в прошлом, и загружать реальные примеры проделанной работы. Каждый пример должен представлять собой «конкретный результат (не пересказ файла, а сам файл) — например, документ Word, PDF, PowerPoint, Excel, изображение, репозиторий», отмечается в презентации. При этом OpenAI допускает и загрузку вымышленных примеров — созданных специально для того, чтобы показать, как человек в реальности отреагировал бы в определённой ситуации.

OpenAI и Handshake AI отказались от комментариев.

Опубликованные документы проливают свет на одну из стратегий, с помощью которых ИИ‑лаборатории готовят свои модели к выполнению задач из реального мира. Такие компании, как OpenAI, Anthropic и Google, нанимают целые армии подрядчиков, способных производить высококачественные обучающие данные, — именно на них опирается разработка ИИ‑агентов, призванных автоматизировать корпоративную работу.

Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.

Источник.

В поисках «золотого датасета»: OpenAI собирает реальные рабочие задачи и файлы для тренировки будущих ИИ-агентов

Другие новости

Информация