Nvidia оказалась в центре нового юридического скандала: компанию обвиняют в том, что она пыталась получить доступ к миллионам пиратских книг, размещённых в теневой библиотеке Anna's Archive, чтобы использовать их для обучения своих ИИ‑моделей. Об этом говорится в расширенной коллективной жалобе группы авторов, сообщает издание TorrentFreak.
В документе утверждается, что представители Nvidia, «испытывая конкурентное давление», решили связаться с Anna's Archive. По данным жалобы, компания интересовалась возможностью получить высокоскоростной доступ к незаконно собранным книгам и другим материалам для включения в тренировочные датасеты больших языковых моделей.
Согласно жалобе, Anna's Archive предупредила Nvidia, что библиотека была незаконно собрана и поддерживается, и запросила подтверждение внутреннего одобрения сделки. По версии истцов, в течение недели руководство Nvidia дало «зелёный свет», после чего Anna's Archive предоставила компании доступ к своей коллекции пиратских книг.
Авторы жалобы утверждают, что Anna's Archive предложила Nvidia данные общим объёмом около 500 ТБ, включающие миллионы книг, часть из которых обычно доступна только через систему цифровой выдачи Internet Archive. По их словам, эти произведения использовались для обучения ИИ‑моделей без разрешения и компенсации, а сама Nvidia извлекла из этого коммерческую выгоду.
Помимо эпизода с Anna's Archive, истцы заявляют, что Nvidia использовала и другие пиратские источники. В расширенной жалобе компании также вменяется скачивание книг из LibGen, Sci‑Hub, Z‑Library, а также использование датасета Books3. Авторы требуют компенсации ущерба за нарушение авторских прав в рамках коллективного иска.
