Привет Хабр. В свободное время я поддерживаю бесплатный сервис Авакари. Основная его функция - фильтрация сообщений из многих тысяч разных источников (RSS, Telegram, Fediverse, ...). В двух словах, вы определяете критерии поиска, Авакари "просеивает" то, что вам интересно и присылает результаты. Интеграция с Fediverse появилась недавно и содержала на своём пути нетехнологические грабли, к которым автор не привык. В этой статье я расскажу о них, возможно, мой опыт будет кому-то полезен.
Программист
Найти золото в потоке
Поиск в интернете - это поиск иголки в стоге сена. В случае поиска в потоке в режиме реального времени это скорее просеивание золота. Обычные стиральные порошки поисковые системы, вроде Google или Bing выполняют поиск только в прошлом. Поэтому они не помогут в поиске чего-либо, что может произойти в будущем. В этой статье я расскажу о том, как не пропустить важные новости, выгодные предложения, упоминания чего-либо или кого-либо.
RSS лента результатов поиска в Awakari
Awakari — бесплатный сервис поиска и фильтрации сообщений в режиме реального времени. Сервис ищет то, что интересно пользователю, среди тысяч сообщений в час из множества источников, таких как Fediverse, ленты RSS, каналы Телеграм.
Исторически Awakari интегрирован с Телеграм, используя его для идентификации пользователя и уведомления о результатах. В дополнение к Телеграм, теперь также доступны:
Поиск в будущем
Привычный поиск, вроде Google, работает сугубо в прошлом. То есть любые результаты, которые вы можете увидеть - это то, что уже произошло. Кроме того, есть ещё дополнительные временные издержки на индексирование: дни или даже недели. Неплохо для исторических справок, но всегда слишком поздно для важных новостей.
Есть и другой путь - "перспективный" поиск. Суть его в том, чтобы получить результат в будущем. Лучше всего подходит для наблюдения за СМИ, поиска работы и других типов выгодных предложений.
ActivityPub в Awakari
Сегодня всё больше и больше сервисов объявляют о своей поддержке ActivityPub, в том числе даже такие, как Tumblr или Threads. И это ожидаемо, так как ActivityPub позволяет сохранять контроль над собственными данными, в отличие от закрытых сервисов Meta. Кроме того, это позволяет обмениваться данными более независимо (Fediverse). Применение ActivityPub не ограничивается социальными сетями и блогами. Есть сервисы для хостинга изображений, видео, музыки и многое другое.
Если рассматривать все эти активности как события, то это позволит сервису Awakari открыть целое новое измерение в Fediverse. Используя Awakari можно отслеживать интересные события из неограниченного множества источников.
После RSS
В свободное время я занимаюсь разработкой сервиса "Awakari", идея которого - фильтрация интересных событий из неограниченного числа различных источников. В этой статье я расскажу о способах извлечения публично доступной информации в интернете за пределами RSS-лент и телеграм-каналов.
Почему не RSS?
В современном мире важно быстро получать новости, в том числе о работе, товарах и прочем. Однако, чтобы проверять обновления среди множества сайтов и приложений каждую минуту, нужно тратить слишком много времени. Можно делать это реже, например, раз в день, но тогда полученная информация становится более запоздалой. Хуже того, она может быть вообще уже неактуальна или потеряна.
Awakari: от чат-бота к PWA
Пару месяцев назад в публичном доступе появился телеграм-бот Awakari. Он позволял управлять подписками и источниками, получать и отправлять сообщения в систему. После успешной интеграции с Telegram естественным образом возник вопрос - почему бы не интегрировать Awakari также с WhatsApp, WeChat и так далее? Однако дублировать одни и те же функции интерфейса в разных чат-ботах желания не нашлось. В итоге, было решено остановиться на web UI для функций управления подписками и источниками. Мессенджеры должны эксплуатироваться по своему прямому назначению - для отправки и доставки сообщений. В этой статье я расскажу о том, что из этого вышло.
Публикация в Awakari из произвольных источников
Доброго времени суток. В комментариях к предыдущей статье было одно пожелание, которое оказалось особенно полезным. Спасибо автору @iamoblomovза развернутый отзыв. Как это обычно бывает, один человек не может вообразить себе все варианты возможного использования, поэтому отзывы пользователей всегда приветствуются. В тот раз речь шла о том, чтобы пользователь мог добавлять произвольные источники событий в систему, такие как публичные каналы телеграм или ленты новостей RSS. Теперь это реализовано и в этой статье я расскажу об этом подробнее.
Использование Awakari на практике
Продолжение цикла статей об Авакари. В прошлый раз я рассказывал о запуске телеграм бота. Настало время подробнее рассказать о том, как и зачем этим можно пользоваться.
Авакари — сервис для публикации и подписки на релевантные сообщения
В предыдущей статье "Дерево Киви для поиска шаблона по тексту" я рассказывал, как можно эффективно находить по входящему сообщению все удовлетворяющие "поисковые запросы", избегая их перебора "в лоб" и прямого сопоставления. Это можно применить реализации полноценной Pub/Sub-системы, дополняющей уже существующие, такие как Nats, Apache Kafka или AWS SNS новой возможностью поддерживать действительно масштабируемое число wildcard-подписок. В этой статье я расскажу о такой системе.
Дерево Киви для поиска шаблонов по тексту
История этого эксперимента началась где-то в 2022 году с желания фильтровать поступающую из разнородных каналов информацию. В современном мире люди вынуждены находиться в бурном потоке всевозможных новостей, публикаций и коммерческих объявлений и вручную пытаться найти в этом потоке то, что им нужно.
Оумуамуа — решение парадокса Ферми (2)
Предыдущая статья Оумуамуа — решение парадокса Ферми вызвала довольно живой интерес несмотря на свою довольно узкую специализацию. Изначально она задумывалась довольно короткой, но оказалось, что довольно сложно лаконично описать. Это также отчасти является причиной критики - некоторые детали были не раскрыты и опущены в угоду краткости и простоте научно-популярного повествования. В новой статье можно более подробно рассмотреть некоторые детали.
Оумуамуа — решение парадокса Ферми
...во Вселенной должно существовать значительное количество технологически развитых цивилизаций. С другой стороны, отсутствуют какие-либо наблюдения, которые бы это подтверждали. Ситуация является парадоксальной и приводит к выводу, что или наше понимание природы, или наши наблюдения неполны и ошибочны. Как сказал Энрико Ферми: «ну, и где они в таком случае?»... - Парадокс Ферми (Википедия)
Дефицит цветов в современных фильмах
Настал небольшой отпуск и я решил посмотреть наконец несколько фильмов. В процессе просмотра меня посетило ощущение, что в современных фильмах что-то не так, что раньше трава была зеленее и тому подобное. Больше всего выделялось то, что на экране большую часть времени очень мало цветов (как правило, два). Субъективно, эти два преобладающие цвета - это оранжевый и сине-зелёный.
Записки о миграции на Java 10
О том, какие разновидности боли ждут нас, можно узнать под катом.
Оумуамуа: фрагмент разрушенной приливом кометы
Открытие первого межзвёздного объекта в конце 2017 г. сразу же поставило перед наукой теоретические проблемы. Открытое небесное тело выглядело немного не так, как предсказывала теория.
Первый открытый межзвёздный объект оказался необычным
Свидание с ʻOumuamua. Впервые открыт межзвёздный объект в Солнечной Системе
Information
- Rating
- Does not participate
- Location
- Санкт-Петербург и область, Россия
- Registered
- Activity