Pull to refresh

Insider API: поиск трендов и быстрая навигация в текстах соц. и традиционных медиа

Reading time2 min
Views2.6K
Как часто, имея массив текстов (любой тематики) мы хотим увидеть тематическую выжимку? Какие темы обсуждаются? Какие наиболее популярные? Как было бы здорово ввести поисковые слова и получить тренды вокруг них!
image


Система умеет:
  • Получать массив данных и сохранять их под Вашим пользователем.
  • Строить список тем с группировкой документов по темам.
  • Делать realtime поиск по документам и строить темы по найденной выборке.


Все перечисленные функции доступны через API, которым легко воспользоваться, подключившись к одному из тарифных планов (есть бесплатный триал на месяц!).

Мы проиндексировали соц. медиа (твиттер, facebook, вконтакте) в начале осени 2015 года и сделали скриншоты системы для визуальной оценки.

Консьюмерский сегмент: Магнит.
image

Yota:
image

Политика: выступление Путина в ООН.
image

Так выглядит тема изнутри:

image

На предыдущем скриншоте представлено содержимое темы “ООН 2015”, включающее 7 новостей.

Как видно из скриншотов, система представляет из себя полноценную поисковую систему (с поддержкой русской морфологии) и является удобным инструментом для быстрой навигации по массивам информации. У нас нет ограничений по поддерживаемым тематикам и типу данных — соц. медиа, новостные ленты либо Ваши корпоративные документы. Все описанные функции доступны как в виде SAAS продукта с пользовательским интерфейсом, так и в составе Insider API, который можно встроить в Ваши существующие системы и мобильные приложения.

Принцип применения API:

1. Загрузить данные (посты, статьи) в систему.
End-point: /articles/uploadJson
Тип запроса: POST
[
  {
   "id": 2134657,
   "title": "Оскар",
   "description": "Наши дети уже не поймут всех этих приколов про Лео и Оскар. Ушла эпоха. Мы - особое поколение.",
   "link": "https://twitter.com/palnom6/status/704979632127418369"
  }
]


В одном запросе можно переслать до 50 текстов. В ответ API отвечает кодом 200, если всё прошло успешно.

Обратите внимание на параметр id: по значению этого параметра мы получим привязку данного поста к определенной теме / тренду на следующем шаге.

2. Получить тренды: либо по документам в целом, либо в привязке к ключевым словам.

End-point: /articles/cluster
Тип запроса: POST
{
  "query": ""
}


В ответ API генерирует тренды.

[
  {
    "labels": [
      "Оскар"
    ],
    "score": 1.510325122396045,
    "docs": [
      "2134657",
      "2134656",
      "2134655",
      "2134654"
    ]
  },
  {
    "labels": [
      "Политика"
    ],
    "score": 1.2447816860782057,
    "docs": [
      "2134653",
      "2134652",
      "2134651",
      "2134650",
      "2134649",
      "2134648"
    ]
  }
]


Значение score отображает релевантность данной тематики запросу пользователя.
На шаге два можно передать и некоторое ключевое слово, вокруг которого будут построены темы / тренды.

Insider API доступен здесь: market.mashape.com/dmitrykey/insiderapi

Помимо трендов, другими удобными фичами являются:

Only registered users can participate in poll. Log in, please.
Сфера применения
81.82% Мне интересен такой API для собственных небольших проектов9
18.18% Я бы порекомендовал(а) Insider API своей компании / отделу по работе с массивами данных2
0% Ротации текстов в 24 часа достаточно0
18.18% Ротации текстов в 24 часа недостаточно — нужно хранить историю — готов(а) платить дополнительно2
18.18% Не хватает фич (каких? Пишите в комментариях)2
11 users voted. 6 users abstained.
Tags:
Hubs:
-1
Comments15

Articles