Comments 111
Вам мало источников получения «интересного контента»?
Один раз поискал через яндекс где в городе продают туалетную бумагу. Полтора месяца реклама бумаги теперь преследует… :( да я через 10 минут её купил, зачем вы мне её пихаете с такой настойчивостью? Я ведь правильно понял, что с вашей системой туалетная бумага будет меня преследовать и в подборке публикаций?
У вас нет желания сделать отдельный поиск, типа «Я.Информация», запросы которого будут генерить рекламу не «вот тут можно это купить», а «вот тут можно найти еще инфы по этому вопросу»?
а сервисов типа «сейчас мы вам всяких статей накидаем» пруд пруди… еще в браузере этого не хватало.
ps. И название странное. Настоящий дзен сервис не предоставлял бы никакого контента.
Крайний раз, когда я пробовал Яндекс.Браузер, раздражало отсутствие индикации проигрывания звука на вкладках, поэтому снова вернулся к Chrome. Раньше вы говорили, что причина в использовании NPAPI-версии Flash. Если я не ошибаюсь, в Linux уже довольно давно вы используете PPAPI-вариант. В таком случае — когда же уже? Я правда хочу его попробовать, но при этом не хочется лишаться ни одной привычной полезности.
Значит, с учётом того, что на Linux у вас всё равно только бета — можно уже ставить и всё будет?
Я уже не говорю про встроенную банеро-резку и оптимизацию трафика для медленных соединений.
Персонализированную ленту новостей там тоже пилят, кстати: http://www.opera.com/blogs/desktop/2016/05/personal-news-feed-vpn-update/
Очень интересно, но не специалист в этой области. Подскажите куда копать, не очень себе представляю как вектор соотносится в итоге со смыслом текста?
«Смысл смысла для компьютера только в том, что один смысл отличается от другого.»
Если Яндекс научился «понимать смысл», то ему надо, как минимум, присуждать Нобелевскую премию.
Пишите, пожалуйста, правду — «С помощью наших математико-лингво-статистических ухищрений мы, как бы, понимаем смысл».
Попробуйте загуглить «мёд порно». оба поисковика упорно ищут «мед» а надо «мёд». И ничто их разубедить не может.
А когда к этому подключится искусственный интеллект он не только заместо мёда будет предлагать мед-сестёр но и заместо порно будет искать эротику…
С элементами социальных сетей. В рамках модных концепций типа месседжеров.
Всё возвращается на круги своя…
И так немного мыслей. То есть вся технология это:
- какой-нибудь Tensorflow
- обученная модель на русском языке для тэгирования текста, ну вот например
- далее там надо распознавать картинки и текст на них, не вопрос — ловите вот
- надо написать аннотацию к изображению, не вопрос вот
- далее берем это все как признаки и делаем что-нибудь типа классификации или алгоритма ранжирования (тут столько вариантов как это сделать, что жуть)
Если звучит слишком резко, то прошу поправьте. Google имеет полный набор инструментов, чтобы похожий пак алгоритмов собрать у себя на компе. Ну вот с выборкой и индексом правда могут быть проблемы.
По поводу онбординга, судя по тому, что там ограниченный набор, значит и весь индекс рекомендаций содержит ограниченный набор сайтов. Готов поспорить. То есть там не весь индекс Яндекса, а типа 1000-5000 сайтов с контентом.
Ну и наконец последние пять копеек в вижн. А не проще брать сайты из закладок пользователя или табло и выводить заголовки оттуда? Ну типа проверить гипотезу вообще :)
По поводу онбординга, судя по тому, что там ограниченный набор, значит и весь индекс рекомендаций содержит ограниченный набор сайтов.
Онбординг не ограничивает сайты. Он лишь задает вектор для будущих рекомендаций. В ленте будут и другие ресурсы. И даже больше. Будут ресурсы и другой тематики в рамках борьбы с самоизоляцией пользователя.
делаем что-нибудь типа классификации
Machine learning так еще никто не называл :)
А не проще брать сайты из закладок пользователя или табло и выводить заголовки оттуда?
Это загоняет в очень узкие рамки. У большинства пользователей нет закладок, а 8 сайтов в Табло слишком мало. Получится просто автоматизация RSS-подписок. И замыкание пользователя на тех сайтах, которые он и так посещает.
Что будет если вывести рандом из статей с похожих на те, которые я и так посещаю? Проводили сравнение? Например в музыке часто рандом работает лучше чем композиция несколько алгоритмов.
Machine learning так еще никто не называл :)
Ну почему, вообще задача классификации это раздел обучения с учителем или без. Простите если вас это задело.
Мне кажется, тут дело не в рандоме vs алгоритмах. А в разнообразии и борьбе с дубликатами. Слишком жесткие алгоритмы, которые ищут слишком похожие материалы, могут плодить дубликаты или замыкать в слишком узкой теме. Неудивительно, что в этом случае рандом сработает лучше – он просто разнообразнее и будет меньшим из двух зол.
В ленте будут и другие ресурсы. И даже больше. Будут ресурсы и другой тематики в рамках борьбы с самоизоляцией пользователя.
А можно услышать пару слов о том, как будет осуществляться подбор ресурсов по другой тематике? Просто рандомно, или на основе каких-то данных?
P.S. Вы не в курсе, ведутся ли какие-то работы, чтобы научить машину слушать музыку, чтобы предлагать хороших исполнителей, которых ты ещё не нашел сам?
Насколько я знаю, наши Музыка и Радио уже в какой-то степени учат машину «слушать» музыку.
По факту, достаточно легко можно написать движок, который будет собирать из открытых API данные про ваши песни (которые у вас в вашей медиатеке), и пытаться предложить вам что-то похожее.
В добавок к этому можно анализировать тексты и само содержание песен, что так же может расширить базу для рекомендаций.
Или открыл «woman.ru» и всё! Все ссылки только с него.
В мобильной версии не хватает проверки качества сайта. Открываешь интересный материал, а у ресурса нет нормального перенаправления на мобильную версию и открывается главная.
Часто помогает пролистать вниз, и там оказывается то, что вы видели, хотя и не всегда.
Когда планируется
1) 64-bit для windows и 32-bit для linux?
2) Боковые вкладки
3) Вариант оформление браузера в тёмных тонах
К идее боковых вкладок вернемся, когда закончим с текущими вкладками (сейчас их активно дорабатываем).
Темное оформление – это интересная мысль.
До этого яндекс браузером не пользовался и удивил один момент, он при установке каким-то образом подтянул не только сохраненные пароли из хрома, но и даже сессии. И все расширения из хрома также подтянулись. Круто!
Но вцелом — хорошо. Надеюсь, что чёрный список вскоре полноценно заработает и будет редактируемым.
Но есть гораздо более лучшая стратегия для продвижения такого продукта и соответствующие ей фичи.
Как мне кажется, нужен принципиально иной подход. Переходить от плоского вектора цифровых фич в их онтологии.
Потом туда будут добавлять рекламу и получим «рекомендательную помойку».
Может быть стоит добавить возможность вручную переключаться между несколькими Дзен-профилями
Разработчики подобных систем стремятся к тому, чтобы пользователю не нужно было что-либо настраивать/фильтровать. Стоит задача приучить человека доверять выбору системы — она «лучше» знает, что тебе показывать. Только так можно эффективно пропихивать рекламу.
Когда у человека не будет выбора, можно легко прогнозировать количество показа рекламного контента.
Так что любой ваш инженерный функционал гасится об мерзкий нагроможденный прямоугольниками дизайн браузера. И меня удивляет что вы свято считаете его эталонным для себя.
А так как яндекс.браузер у многих просто стоит якобы обеспечивая вам % аудитории
Простите, но статистика Ли.ру и Метрики — это статистика именно использования, а не установок. По этой статистике использования он второй после Хрома на десктопе. Поверьте, после запуска альфы и беты мы собрали СТОЛЬКО фидбека, что пришлось долго и нудно допиливать интерфейс. У текущего варианта есть недостатки, но их стало уже сильно меньше. Именно поэтому его раскатили на всю аудиторию (и дали возможность вернуть старый в настройках, конечно же). А сейчас уже идет этап допиливания.
Можете рассказать, какие проблемы у Вас с ним возникают сейчас?
Вообщем думаю не только не пользоватся яндекс браузером но и вообще сервисами яндекса…
Вам же цвет дорожных знаков не меняют каждый день?
Это элемент управления и я не хочу думать куда мне нажать.
Лично я каждый раз напрягаюсь понимать какая из вкладок сейчас активная.
Будущее браузеров и искусственный интеллект. Дзен в Яндекс.Браузере