Как стать автором
Обновить

В ближайшие недели Reddit начнёт блокировать доступ большинства автоматических ботов к своим общедоступным данным. Компаниям потребуется заключить лицензионное соглашение, как это сделали Google и OpenAI, чтобы использовать контент Reddit для обучения моделей ИИ и других коммерческих целей.

Reddit обновила свой файл robots.txt, который определяет, каким веб-сканерам разрешён доступ к сайту. «Это сигнал для тех, у кого нет соглашения с нами, о том, что им не следует иметь доступ к данным Reddit», — говорит главный юрисконсульт компании Бен Ли. 

robots.txt в первую очередь определял, могут ли поисковые системы, такие как Google, сканировать веб-сайт для индексации его в выдаче. В обмен поиск Google приводил трафик. Однако в последние пару лет компании, занимающиеся искусственным интеллектом, начали использовать все данные, которые могли найти в Интернете, для обучения своих моделей.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

Публикации

Истории

Ближайшие события

27 августа – 7 октября
Премия digital-кейсов «Проксима»
МоскваОнлайн
28 сентября – 5 октября
О! Хакатон
Онлайн
3 – 18 октября
Kokoc Hackathon 2024
Онлайн
10 – 11 октября
HR IT & Team Lead конференция «Битва за IT-таланты»
МоскваОнлайн
25 октября
Конференция по росту продуктов EGC’24
МоскваОнлайн
7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн