Открыта регистрация на конференцию по компьютерной лингвистике «Диалог»

    image30 мая – 3 июня в подмосковном пансионате «Бекасово» пройдет крупнейшая российская конференция по компьютерной лингвистике «Диалог». Подробно о том, что такое «Диалог» и почему ABBYY организует эту конференцию, мы подробно писали здесь.

    В этом году главными темами станут:

    Оценка тональности текста (sentiment analysis). Для решения этой проблемы (как понять отношение автора к тому, что он описывает) используются как методы, основанные на лингвистических правилах, так и методы компьютерного обучения на больших тестовых коллекциях документов (в которых эксперты вручную расставили оценки тональности, а компьютер пытается разобраться, какие именно свойста тестового текста связаны с оценкой, чтобы на их основе оценивать новые тексты). Думаю, многие сталкивались с «правильными» оценками тональности статей в российских системах мониторинга СМИ (не будем называть имён), так что тема очень актуальная.

    Создание новых корпусов текстов для лингвистических исследований. Что такое корпуса? Корпуса текстов (это могут быть и записи речи) это тот исследовательский материал, на котором компьютерная лингвистика пытается построить модели для автоматической обработки языка. Современные корпуса могут включать миллионы специальным образом отобранных и обработанных текстов. Но даже таких корпусов оказывает недостаточно для работы мощных алгоритмов статистической обработки, которые сегодня используются. Поэтому ставится задача создавать такие корпуса автоматически, используя в качестве практически неограниченного источника Интернет.

    Традицией «Диалога» становится проведение соревнований систем автоматического анализа документов. Цель таких состязаний не спортивная, а исследовательская: разработка надежных критериев и методик оценки систем автоматического анализа. В этом году под эгидой «Диалога» проведено два таких соревнования: тестирование систем синтаксического анализа текстов на русском языке (синтаксических парсеров) и тестирование систем, производящих оценку тональности текстов на русском языке. Итоги этих тестов будут подведены на Диалоге (по окончании конференции мы опубликуем их в этом блоге, следите за обновлениями).

    Поскольку «Диалог» — международная конференция, традиционно в ней принимают участие специалисты по компьютерной лингвистике мирового масштаба. В этом году – Дэн Молдован (Dan I. Moldovan) – профессор компьютерных наук Техасского Университета в Далласе, США, и Джон Кэрролл (John A. Carroll) – профессор компьютерной лингвистики из Университета Сассекса, Великобритания.

    Рабочие языки конференции – русский и английский.

    Заявки на участие принимаются до 28 мая по адресу secretary@dialog-21.ru. Всю дополнительную информацию вы можете узнать на сайте конференции «Диалог».
    ABBYY
    228,00
    Решения для интеллектуальной обработки информации
    Поделиться публикацией

    Комментарии 0

    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

    Самое читаемое