Комментарии 10
Что-то подсказывает, что в словосочетании «дескриминантной силы» ошибка?
В результатах исследований первые два итога — получилось забавно :)
В результатах исследований первые два итога — получилось забавно :)
Тема интересная, но постить сюда публикации в чистом виде, мне кажется, не самая лучшая идея — теряете часть аудитории. Адаптированная статья выглядела бы лучше (стиль изложения, ну и проще надо быть, более доступным языком объяснять для несведущих в теме исследования).
Насколько я понял, вложенность понятий определяется только исходя из их состава? То есть связь «поиск» — «вертикальный поиск» обнаруживается, а «поиск» — «нахождение результата» — нет?
Для статей подобного формата существуют специальные журналы, утверждённые ВАК. В том числе по компьютерной лингвистике и обработке естественного языка. Здесь принято писать менее формальным языком.
Можно предложить сколь угодно методов автоматического построения тезаурусов лексических онтологий, но почему в статье нет раздела про апробацию полученного ресурса? Какова актуальность работы? Чем указанный подход лучше ручной разметки или других известных решений?
Можно предложить сколь угодно методов автоматического построения тезаурусов лексических онтологий, но почему в статье нет раздела про апробацию полученного ресурса? Какова актуальность работы? Чем указанный подход лучше ручной разметки или других известных решений?
Пока в качестве апробации есть один пример
>> пример такого корпуса ниже рассматривается массив аннотаций электронных препринтов arXiv (www.arxiv.org) за 2007-2010 годы по тематике информационного поиска (рубрика cs.IR) объемом 550 записей.
Про актуальность — в первом содержательном абзаце.
А сравнения действительно пока нет, поправим в ближайшее время.
>> пример такого корпуса ниже рассматривается массив аннотаций электронных препринтов arXiv (www.arxiv.org) за 2007-2010 годы по тематике информационного поиска (рубрика cs.IR) объемом 550 записей.
Про актуальность — в первом содержательном абзаце.
А сравнения действительно пока нет, поправим в ближайшее время.
Утверждение в первом содержательном абзаце ничем не обосновано: нет ни обзора существующих работ, ни ссылок на обзорные работы. Автоматизация построения онтологий — чрезвычайно важное (и интересное) направление исследований, но нельзя начинать с нуля. Мне кажется, статью можно улучшить добавлением отдельного раздела про особенности и недостатки существующих решений. В англоязычных работах это называется Related Work.
Апробация тезауруса может выполняться двумя способами. Можно взять какую-нибудь дорожку РОМИП и сравнить результат работы вашего ресурса с известными результатами на этой дорожке. Можно сопоставить ваш ресурс с каким-либо золотым стандартом, но здесь всё сложнее, потому что нужно найти хорошо изученную онтологию по вашей тематике. Ну, есть ещё третий вариант — выполнить экспертную оценку, но это слишком долго и дорого. Обозначенная рубрика arXiv.org — всего лишь неразмеченный набор данных. Как вы собираетесь оценивать по нему свою онтологию?
Апробация тезауруса может выполняться двумя способами. Можно взять какую-нибудь дорожку РОМИП и сравнить результат работы вашего ресурса с известными результатами на этой дорожке. Можно сопоставить ваш ресурс с каким-либо золотым стандартом, но здесь всё сложнее, потому что нужно найти хорошо изученную онтологию по вашей тематике. Ну, есть ещё третий вариант — выполнить экспертную оценку, но это слишком долго и дорого. Обозначенная рубрика arXiv.org — всего лишь неразмеченный набор данных. Как вы собираетесь оценивать по нему свою онтологию?
Исходный код программы есть в свободном доступе?
делал подобное еще 10 лет назад… Но не повезло мне тогда найти кого-то, кто этим бы занимался.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Создание сетей терминов на основе анализа текстов