
Совсем недавно – 20 мая, компания
Yahoo! объявила о выходе своего нового продукта, на данный момент не имеющего аналогов –
Yahoo! Placemaker, сервисе гео-парсинга, основной целью которого является извлечение гео-релевантной информации из документов различного формата. Презентация прошла, как принято говорить, «при большом стечении народу» и закончилась
«аплодисментами, переходящими в овацию» – задумка и реализация определенно понравилась, и какое-то время в Твиттере можно было наблюдать довольно-таки позитивный поток комментариев на эту тему. Но вот представление окончено, все расходятся по домам, и начинают задавать вопросы: так что же это такое?
Что такое Placemaker
Как уже было сказано, Placemaker – это веб-сервис, который позволяет извлечь гео-релевантную информацию из некоторого документа. Тут есть сразу несколько моментов, которые нуждаются в пояснении. Во-первых, что это за документы, из которых можно извлекать информацию? А во-вторых, что это за такая гео-релевантная информация, а самое главное – кому и зачем она нужна?
С документами все довольно просто. На данный момент Placemaker поддерживает текст (ну он и в Африке текст), HTML-документы (хотя здесь не все так просто), а так же XML-производные форматы аггрегации новостей — RSS и Atom. Кроме того, Placemaker «понимает» расширение RSS и Atom, известное как
GeoRSS, а также способен извлекать дополнительную информацию из
микроформатов, которые встраиваются в HTML документ. Про информацию-то и следует поговорить поподробнее.
Что Placemaker может
Если очень кратко, то все возможности PlaceMaker можно определить в три группы, а именно:
- Какие места (географические) упоминаются в документе и какова их важность?
- Среди всех мест, с одинаковым названием, о котором именно говорится в документе?
- О каком месте идет речь в документе вцелом?