Pull to refresh
0
Content AI
Решения для интеллектуальной обработки информации

Сегментно-статистический подход к интернету как корпусу — новый семинар в серии ABBYY Open

Reading time 1 min
Views 2.2K
imageМы продолжаем серию семинаров по компьютерной лингвистике ABBYY Open. Очередное мероприятие пройдет 31 января в 17.00 в московском офисе ABBYY. Тема – «Сегментно-статистический подход к интернету как корпусу (на примере анализа блогосферы)». На семинаре выступит Владимир Беликов – доктор филологических наук, доцент Отделения теоретической и прикладной лингвистики филфака МГУ, ведущий научный сотрудник Института русского языка РАН.

Его доклад посвящен разумным методам извлечения достоверной лингвистической информации из интернета. В докладе проводится сравнительный анализ Национального корпуса русского языка и различных интернет-корпусов как источников сведений о русском лексическом узусе разного типа. На материале русских толковых словарей и отдельных лингвистических исследований анализируются типичные ошибки и неточности, ставшие результатом игнорирования современных корпусных методов в лексикографии.

Рассматривается сегментная структура русскоязычной блогосферы, демонстрируются разнообразные результаты ее анализа сегментно-статистическим методом при исследовании синхронного состояния и динамики изменений в общерусской и региональной лексике, фразеологии, грамматике. Детально излагается методика лингвистически ориентированного поиска в блогосфере и способы преодоления возникающих при этом трудностей.

Подробная информация и регистрация – на странице ABBYY Open.

Update: видеозапись семинара выложена здесь.
Tags:
Hubs:
+10
Comments 10
Comments Comments 10

Articles

Information

Website
www.contentai.ru
Registered
Founded
Employees
101–200 employees
Location
Россия