Согласен, нам было бы так проще и спокойнее. Но так почему-то ни у кого не получается. Масштабировать получается, а по шагам выстраивать интеллект - нет.
В этом хвосте, очевидно, нет никакой поведенческой информации, мы совершенно не знаем, в какие документы пользователи переходят по этим запросам.
В таком случае могут помочь умные текстовые факторы, которые позволят не только находить общие слова между запросом и веб-страницей, но и общую семантику. Для этого активно применяются "'эти самые нейронные сети". Об этом скоро будут следующие публикации, ждите :)
Да, это проблема персонализации в ранжировании. Она сейчас стоит довольно остро, просто поднимать страницы со словами из поискового запроса все более менее научились, а вот делать ранжирование персональным под человека уже сложнее.
Я здесь особой проблемы не вижу, если я правильно понял Ваш вопрос.
Если у Вас есть признак «сильная любовь данного пользователя к боевикам», есть собранный датасет, где люди, у которых есть этот признак, выбирали сеансы с боевиками, то модель легко выучит такое взаимодействие. Тогда новым людям с таким признаком модель будет показывать боевики.
Если же у Вас люди в признаковом пространстве никак не разделяются, и есть только признак «сильная любовь всех пользователей к данному жанру», то тогда будет показываться, что в среднем любят пользователи. В этом случае советские мультфильмы, да.
Согласен, нам было бы так проще и спокойнее. Но так почему-то ни у кого не получается. Масштабировать получается, а по шагам выстраивать интеллект - нет.
Не очень понял комментарий, если честно.
Оси у Каплана логарифмические. То что в них линия, в нормальных осях степенной закон. Что это меняет?
Зря вы думаете, что фанг тупой, почему-то они смогли построить миллиардные компании :) бабло, кстати, не кончилось.
Точно никто не знает.
Для книг есть еще авторское право, с OpenAI тут даже активно судятся
В генеративных моделях от мозга только название «нейронные сети» :)
Терминология не самая удачная, согласен.
Это математическая модель, ее не развивают так, чтобы она была похожа на мозг.
Нам и не нужно воспроизводить мозг.
Нам нужна технология, которая даст определенную способность.
Чтобы летать над землей не нужно воспроизводить механику птицы.
Достаточно наполнить газом шар :)
Я не спорю, что несмотря любые бенчмарки, модели глупее 5-летнего ребенка.
Я также не готов спорить, кто «умнее» Лекун или Суцкевер :)
С чем я готов спорить: что на текущая технология плоха, потому что она «т9».
Никто не знает, как работает наш мозг, даже Хинтон. Тот факт, что батут (т9) работает сейчас неоспорим и его будут масштабировать дальше.
думаю, что обратной дороги уже не будет - придется смириться и делать ИИ :)
В таком случае могут помочь умные текстовые факторы, которые позволят не только находить общие слова между запросом и веб-страницей, но и общую семантику. Для этого активно применяются "'эти самые нейронные сети". Об этом скоро будут следующие публикации, ждите :)
Если у Вас есть признак «сильная любовь данного пользователя к боевикам», есть собранный датасет, где люди, у которых есть этот признак, выбирали сеансы с боевиками, то модель легко выучит такое взаимодействие. Тогда новым людям с таким признаком модель будет показывать боевики.
Если же у Вас люди в признаковом пространстве никак не разделяются, и есть только признак «сильная любовь всех пользователей к данному жанру», то тогда будет показываться, что в среднем любят пользователи. В этом случае советские мультфильмы, да.