Комментарии 13
А как на выдаче что-то сильно обучишь?
Я думаю тут по запросам в Binge, компании обучают своих чат-ботов
О, дофига как, градиент релевантности ответов на запрос готовый например. И альернативный гуглу (хотя бинг сам скорее всего с гугла учится)
Насколько я понимаю, ChatGPT встроили в Bing. А проект Alpaca, о котором на хабре есть несколько статей так и получился: взяли фейсбучного чат-бота LLaMA и дообучили его на ответах ChatGPT
И как они собираются это контролировать? Даже получив веса нейронки практически невозможно доказать, что она обучалась вот именно на поисковой выдаче конкретного поисковика. А уж если ещё и веса закрыты - вообще тухло.
Кроме того, этим запретом они рубят сук, на котором сидят: их-то бот тоже обучался на куче текстов, создатели которых не давали на это разрешения. И если MS подадут в суд, вопрос о лицензионной чистоте их собственного бота там гарантированно всплывёт.
Про нейронки не знаю, но вспомнилась история про географические карты. Как в этой сфере боролись за авторские права.
В самом деле, как доказать, что конкурент срисовал карту с вас? Ведь он всегда может сказать, что он нарисовал эту реку и эту дорогу не потому что взял в вашем атласе, а потому что они на самом деле там есть, ведь и ваш атлас и его - лишь отражения реальности.
В итоге стали хитрить, добавлять в карты фейковые локации, населенные пункты или какие-то заведения, которых в реальности не существовало. И обнаружив которые на чужой карте можно было точно сказать, что он свою карту срисовал у вас.
Разумеется возникло много веселых историй, как люди искали несуществующие в реальности, но отмеченные на карте объекты. Но это уже отдельный вопрос.
Может и с ИИ что-то такое придумают.
Думаю, что ИИ может перевернуть мир поиска, но совсем не в красивом для основной массы людей виде.
Сейчас есть какая-то устоявшаяся экономическая модель, что люди делают сайты, информация на которых полезна для других, поисковая система позволяет его найти, а реклама как-то окупить.
После перехода на ИИ — какой смысл платить авторам контента? Если их труд, переработанный ИИ перестает быть их и это стоит копейки в рамках каждого запроса. Если на каждый запрос можно получить ответ, даже не переходя на сайт автора. Какой останется доход?
Кажется, человечество изобрело дешевый способ отъема интеллектуальных прав.
Если на каждый запрос можно получить ответ, даже не переходя на сайт автора. Какой останется доход?
Далеко-не-на-каждый-запрос можно получить правильный ответ — творческий (человеческий) разум никто не отменял.
То, что я (например, сегодня) выдам на Хабре в качестве статьи ни один ИИ не выдаст в ближайшие 1000 лет.
Никто не говорит, что ИИ заменит авторов. Тут о том, что ИИ один раз прочитает вашу статью, и будет пересказывать её содержимое всем своим милионам пользователей, вас не упоминая. Просмотров у вашей статьи будет около нуля, и вам не закажут следующую статью в корпоративный блог.
Ничего страшного — если сломается нынешняя «экономическая модель», то неизбежно возникнет новая — иначе ИИ будет просто не на чем «паразитировать».
Ну то же самое можно сказать и про вертикали (колдунчики в яндексе). Уже сейчас по половине вопросов с гугла, на сайт переходить не обязательно. Но в какой то момент ии проголодается, в смысле контент все равно нужен, ну вот и будут авторы писать его на зарплате у корпорации, как программисты - за выработку а не за пожизненное владение. Если честно, мне кажется это справедливым.
Microsoft запретила компаниям обучать ИИ-ботов на основе поисковых данных Bing без разрешения