Как стать автором
Обновить

Разработчик создал бесконечный лабиринт для поимки ботов для обучения ИИ

Время на прочтение2 мин
Количество просмотров9.6K
Всего голосов 13: ↑13 и ↓0+18
Комментарии23

Комментарии 23

Описать разрешенные страницы в robots.txt, кто не послушался - плохой бот и пусть гуляет до бесконечности?

Ну так тут описаны боты Опен АИ которые слушаются. Да и не будет он до бесконечности гулять, уверен там есть аварийный сброс от числа вложенных ссылок. Иначе давно бы померли от мошеннических сайтов что это практикуют давным давно

Недавно был расследование о том что Опен АИ сканирует сайт игнорирую запрет на это в robots.txt

Про этом расследование?

TollBit не называет конкретных компаний, но Business Insider сообщает, что OpenAI и Anthropic, разработчики чат-ботов ChatGPT и Claude соответственно, также игнорируют robots.txt.

https://gagadget.com/ru/569151-hyperx-quadcast-2-i-quadcast-2s-topovyie-usb-mikrofonyi-dlya-strimerov/

Это не аварийный и не глубина вложенности, а просто чем более востребованный сайт у пользователя, тем больше ссылок в нём индексируется за день. Обычные поисковики не используют жадный алгоритм. Качают каждый день по чуть чуть нового, по чуть чуть обновить старое.

Заблудился как-то хакер молодой,
В дебрях файловой системы сетевой
Все симлинки да симлинки на пути,
И назад ему дороги не найти.

Все возвращается по кругу...

Для опенсорсного проекта хостим репозиторий на своём сайте, вебвью репы скрапят так активно, что становится невозможно сделать пулл/пуш. Мечтаю сделать подобную штуку для злых ботов, качающих код древних ревизий по тысяче раз на день.

В гугл давно есть защита от всякого разного спама просто openai ещё новенький в этом деле, у них был вначале приоритет все просканировать несмотря на какие либо там проблемы лишь бы обучить нейросети, выжать из них максимум. Они сказали на это потребуется 3-5 лет когда железо сравняется с софтом и потребностями рынка

Таааак... А что если ещё на каждой странице генерировать малосвязный текст, который после прочтения человеком будет классифицирован как белиберда. И этот попавший в ловушку ии не только будет пойман, а ещё и научится мусору? Интересно, если скажем он уже обучился неплохо, то такой белибердосайт запустит в нем альцгеймер?

Эта штука называется Веб.

И ханипоты!

Интернет превращается в паноптикум для извлечения денег

Ух ты, и это осмеливаются писать на Хабре, который, внезапно, и содержится как раз для извлечения денег?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости