Научная конференция «Будущее веб-поиска» состоялась 19-20 мая в Барселоне (Испания) и была организована при участии Yahoo. Спустя некоторое время в онлайне были опубликованы доклады.
Список презентаций включает 26 научных работ на самые разные темы: анализ ссылок, алгоритмы, извлечение информации, структурирование данных, интеграция поиска с другими средами, дата-майниинг. О своих разработках рассказали ученые из Германии, Испании, США, Великобритании, Италии, Финляндии, Венгрии, Израиля, Канады и Голландии, а также исследователи из компании Yahoo.
«Хабрахабр» публикует полный список презентаций со ссылками на файлы PDF. Каждая из презентаций включает ключевые слайды. Слайдов может быть разное количество: от шести до трех десятков, но они обычно предельно насыщены информацией. Это основные тезисы работы плюс сопутствующие графики и формулы. Кстати говоря, многие из научных работ можно найти в открытом доступе в Сети в архивах научных журналов.
Анализ ссылок
«Расслоение графов: изоморфизм графов и PageRank» (Graph Fibrations, graph isomorphism and PageRank, PDF);
«Теоретический анализ ссылочного ранжирования» (Theoretical analysis of Link Analysis Ranking, PDF);
«Использование распространения позиции и вероятностного подсчета для обнаружения ссылочного спама» (Using Rank Propagation and Probabilistic Counting forLink-based Spam Detection, PDF);
«Поиск в вебе с помощью близкой аппроксимации» (Searching the Web with Low Space Approximations, PDF).
Алгоритмика
«Оценка объема выборки с помощью запросов» (Estimating Corpus Size via Queries, PDF);
«Компактная индексация версий документов» (Compact indexing of versioned data, PDF);
«Музыка (p)сфер» (Music of the (p)Spheres, PDF);
«Смешанные модели и алгоритмы совместной фильтрации» (Mixture Models and Collaborative Filtering Algorithms, PDF);
«Эффективные »ленивые« алгоритмы для семантики с минимальными интервалами» (Efficient Lazy Algorithms forMinimal-Interval Semantics, PDF).
Основы извлечения информации (Retrieval Foundations)
«Применение диаграмм влияния для извлечения информации» (Applications of Influence Diagrams to Information Retrieval, PDF);
«Тюнинг: оптимизация ошибок при извлечении данных «на лету»» («Tuning»: Error Optimisation inAd-Hoc Retrieval, PDF);
«Текущие исследования по извлечению предложений и определению изменений» (Ongoing research on sentence retrieval and novelty detection, PDF).
Структурированное извлечение (Structured Retrieval)
«XML-сжатие и поиск» (XML Compression and Search, PDF);
«Семантическая структура при извлечении структурированных документов» ((Semantic) Structure in Structured Document Retrieval, PDF);
«Гибкие методы извлечения XML с использованием резюме» (Flexible XML Retrieval using Summaries, PDF);
«Разработка временных функций для структурированных запросов» (Exploiting Temporal Features for Structured Queries, PDF).
Поиск в другой среде (Search in Other Environments)
«Мобильный поиск и повсеместная совместная аннотация объектов пространства» (Mobile Search on Ubiquitous Collaborative Annotations of Space, PDF);
«Семантические пересекающиеся сети для пирингового веб-поиска» (Semantic Overlay Networks for P2P Web Search, PDF);
«Эффективная и децентрализованная аппроксимация PageRank в пиринговых сетях веб-поиска» (Efficient and Decentralized PageRank Approximation in a P2P Web Search Network, PDF);
«Поиск изображений в реальном времени» (Image Search «Live», PDF).
Веб-поиск и извлечение данных (Web Search and Mining)
«Современные подходы к персонализированному веб-поиску» (Current Approaches to Personalized Web Search, PDF);
«Приложения для извлечения запросов» (Applications of Query Mining, PDF);
«Повышение быстродействия поисковых движков с помощью логов поисковых запросов» (Boosting Performance of Web Search Engines Using Query Logs, PDF);
«Извлечение данных из веба для задач проектирования естественного языка» (Web mining for natural language engineering tasks, PDF).
Доклады на общем обсуждении
«Эффективные запросыTop-k для извлечения информации через XML» (Efficient Top-k Queries for XML Information Retrieval, PDF).
«От поиска информации с помощью запросов — к поставке информации на базе анализа контекста» (From query based Information Retrieval to context driven Information Supply, PDF).
Список презентаций включает 26 научных работ на самые разные темы: анализ ссылок, алгоритмы, извлечение информации, структурирование данных, интеграция поиска с другими средами, дата-майниинг. О своих разработках рассказали ученые из Германии, Испании, США, Великобритании, Италии, Финляндии, Венгрии, Израиля, Канады и Голландии, а также исследователи из компании Yahoo.
«Хабрахабр» публикует полный список презентаций со ссылками на файлы PDF. Каждая из презентаций включает ключевые слайды. Слайдов может быть разное количество: от шести до трех десятков, но они обычно предельно насыщены информацией. Это основные тезисы работы плюс сопутствующие графики и формулы. Кстати говоря, многие из научных работ можно найти в открытом доступе в Сети в архивах научных журналов.
Анализ ссылок
«Расслоение графов: изоморфизм графов и PageRank» (Graph Fibrations, graph isomorphism and PageRank, PDF);
«Теоретический анализ ссылочного ранжирования» (Theoretical analysis of Link Analysis Ranking, PDF);
«Использование распространения позиции и вероятностного подсчета для обнаружения ссылочного спама» (Using Rank Propagation and Probabilistic Counting for
«Поиск в вебе с помощью близкой аппроксимации» (Searching the Web with Low Space Approximations, PDF).
Алгоритмика
«Оценка объема выборки с помощью запросов» (Estimating Corpus Size via Queries, PDF);
«Компактная индексация версий документов» (Compact indexing of versioned data, PDF);
«Музыка (p)сфер» (Music of the (p)Spheres, PDF);
«Смешанные модели и алгоритмы совместной фильтрации» (Mixture Models and Collaborative Filtering Algorithms, PDF);
«Эффективные »ленивые« алгоритмы для семантики с минимальными интервалами» (Efficient Lazy Algorithms for
Основы извлечения информации (Retrieval Foundations)
«Применение диаграмм влияния для извлечения информации» (Applications of Influence Diagrams to Information Retrieval, PDF);
«Тюнинг: оптимизация ошибок при извлечении данных «на лету»» («Tuning»: Error Optimisation in
«Текущие исследования по извлечению предложений и определению изменений» (Ongoing research on sentence retrieval and novelty detection, PDF).
Структурированное извлечение (Structured Retrieval)
«XML-сжатие и поиск» (XML Compression and Search, PDF);
«Семантическая структура при извлечении структурированных документов» ((Semantic) Structure in Structured Document Retrieval, PDF);
«Гибкие методы извлечения XML с использованием резюме» (Flexible XML Retrieval using Summaries, PDF);
«Разработка временных функций для структурированных запросов» (Exploiting Temporal Features for Structured Queries, PDF).
Поиск в другой среде (Search in Other Environments)
«Мобильный поиск и повсеместная совместная аннотация объектов пространства» (Mobile Search on Ubiquitous Collaborative Annotations of Space, PDF);
«Семантические пересекающиеся сети для пирингового веб-поиска» (Semantic Overlay Networks for P2P Web Search, PDF);
«Эффективная и децентрализованная аппроксимация PageRank в пиринговых сетях веб-поиска» (Efficient and Decentralized PageRank Approximation in a P2P Web Search Network, PDF);
«Поиск изображений в реальном времени» (Image Search «Live», PDF).
Веб-поиск и извлечение данных (Web Search and Mining)
«Современные подходы к персонализированному веб-поиску» (Current Approaches to Personalized Web Search, PDF);
«Приложения для извлечения запросов» (Applications of Query Mining, PDF);
«Повышение быстродействия поисковых движков с помощью логов поисковых запросов» (Boosting Performance of Web Search Engines Using Query Logs, PDF);
«Извлечение данных из веба для задач проектирования естественного языка» (Web mining for natural language engineering tasks, PDF).
Доклады на общем обсуждении
«Эффективные запросы
«От поиска информации с помощью запросов — к поставке информации на базе анализа контекста» (From query based Information Retrieval to context driven Information Supply, PDF).