Pull to refresh
-7
0
YARUS.ru @YARUSru

User

Send message

Elasticsearch vs Sphinx

Reading time3 min
Views14K

Каждый разработчик приложения рано или поздно сталкивается с таким важным вопросом, как выбор поискового движка. Мы рассмотрели два популярных, но принципиально разных варианта – Sphinx и Elasticsearch – и объяснили, почему сделали выбор в пользу первого для своего приложения.

Читать далее
Total votes 11: ↑3 and ↓8-5
Comments11

С какими трудностями столкнулись разработчики при создании ЯRUS

Reading time4 min
Views1.6K

При создании приложения не все получается идеально с первого раза. Многие разработчики сталкиваются с различными препятствиями. О возникших сложностях при создании приложения и путях их решения рассказал технический директор ЯRUS Дмитрий Илюхин.

Читать далее
Total votes 12: ↑0 and ↓12-12
Comments9

Как ЯRUS ежедневно собирает более 56 000 новостей из источников и выбирает из этого самое интересное

Reading time3 min
Views1.1K

Сегодня уже мало кто заходит на один единственный сайт, чтобы почитать новости. Медиаполе современного человека соткано из множества инфопотоков и ресурсов, и для многих вопрос информационной гигиены стоит очень остро. Где и как организовать удобную новостную ленту, которая бы имела максимально широкий охват источников, но при этом выдавала бы из них только интересные конкретному пользователю материалы? Именно эту проблему решает раздел новостей в приложении ЯRUS, о котором пойдет речь ниже. 

Ежедневно агрегатор мониторит около 10 тысяч новостных ресурсов и собирает не менее 56 000 новостей для парсинга. Со стороннего ресурса берутся заголовок, текст и изображения, поэтому у пользователя приложения есть возможность прочесть новость, не покидая его. При этом в ленте отображаются не только заголовки, но и лид, что дает возможность быстро оценить, стоит ли открыть новость и продолжить чтение или же листать дальше.

Читать далее
Total votes 13: ↑0 and ↓13-13
Comments0

Рекомендательная система подбора новостей в ЯRUS без влияния рекламы

Reading time2 min
Views935

Люди привыкли читать новости на специальных агрегаторах. Но все чаще начинают звучать жалобы на то, что рекламных баннеров с каждым не то что годом, а месяцем становится все больше. И, надо сказать, недовольство читателей небезосновательно.

Читать далее
Total votes 4: ↑1 and ↓3-1
Comments1

Рекомендательные системы: как алгоритмы ЯRUS подбирают пользователям новости

Reading time4 min
Views1.9K

Руководитель технической дирекции ЯRUS, Дмитрий Илюхин

Сегодня мы поговорим о внутренней кухне рекомендательных систем на примере приложения ЯRUS. Разработчики предлагают ярусный контент – новости, видео, события, музыку и многое другое. Однако цель команды ЯRUS – не только собирать разнообразный контент на одной площадке, но и правильно показывать его пользователям, за что и отвечает рекомендательная система. Что же такое рекомендательные системы и как они работают, расскажет руководитель технической дирекции ЯRUS Дмитрий Илюхин.

— Привет, как ты долго занимаешься проектом?

— В ЯRUS я с самого его основания, с июля 2020 года. Многое, что вы можете увидеть сейчас, – итог наших общих трудов с командой.

Расскажи чуть подробнее, как связаны приложение и рекомендательная система?

— Наше приложение выступает не только как социальная платформа, но и как агрегатор. Основная задача проекта – это собрать контент: аудио, видео, текст и изображения для пользователя так, чтобы он ему был максимально интересен. Для этого и используются рекомендательные системы. 

Есть два типа подходов. Первые основаны на том, что смотрит группа пользователей; вторые – на предпочтении конкретного человека. Мы учитываем всё.

Например, к нам в систему ежедневно подтягивается около 56 000 новостей от 10 000 источников СМИ. Все они проходят внутреннюю чистку: на качество, язык и прочие параметры. Оставляем только литературные тексты.

После этого идет формирование новостного сюжета. При выборе главной новости используются разные веса: новизна и объем новости. Это и станет той базой, что мы будем рекомендовать пользователям, используя различные алгоритмы ранжирования.

Читать далее
Total votes 9: ↑1 and ↓8-6
Comments0

Information

Rating
Does not participate
Registered
Activity