Pull to refresh
0
0
Дмитрий Грановский @Granovsky

User

Send message
В следующей статье можете сравниться, к примеру, вот с этой моделью деления на предложения.
Геоданные можно нагенерировать из Википедии или из OpenStreetMap. Так что если в документации не описано, какой формат поддерживает geo-agr, это, наверно, неправильно.
Ну вот, например, была отличная статья Михаила Коробова.
Да, мы всё добавляем. В одной системе успешно предсказываются, в другой нет — мы не хотим за этим следить :-)
Алексей, вы можете создать здесь тикет со списком слов, мы добавим в течение максимум пары дней.
Миша, спасибо за пиар :-)
У нас в течение нескольких месяцев, предположительно, появится API, тогда все желающие смогут сделать плагин хоть для чего.
Думаю, это просто таймауты. Хабраэффект.
Не можем обещать, но обсудим :-)
Тут есть, как мне кажется, два аргумента.

1. Эти «неизбежные работы» могут занять неопределённое время. Мы больше двух лет потратили только на адаптацию словаря и выработку разных решений по морфологии.
2. Большинству потенциальных потребителей наших данных даже корпус без связей, а только со снятой морфологической омонимией уже будет очень полезен.
Предполагается, но пока этого нет, поскольку это уже синтаксис, а мы пока занимаемся морфологией.

Теоретически — да, можно было бы вместо того, чтобы просить людей определять падеж прилагательного, просить их связывать прилагательное с существительным. Наверное, когда-нибудь сделаем и так.
Это бы прекрасно работало, если бы определяемое существительное стояло сразу после определяемого им прилагательного или если бы у нас был синтаксический анализатор со 100% точностью (а если меньше 100%, то всё равно вручную проверять).
А как лучше написать? «Хочу ещё заданий»?
Какую, например, статистическую информацию?

Про жанры есть на странице «Статистика» внизу. Или имеется в виду что-то другое?
Пока не было.

Тут примерно такая дилемма: увеличивая число аннотаторов, мы получаем в среднем больше случаев, когда их ответы не совпадают и должны быть просмотрены модератором => растёт нагрузка на модератора. Выигрыш мы получаем только в том случае, если все (допустим) трое предыдущих отвечавших ответили неверно, а четвёртый ответил верно.
Да, как уже написано выше, геймификация в процессе, не хватает дизайнера. Банальный счётчик почти сделали, может быть, на днях будет.
Ошибку 310 не могу воспроизвести. В какой момент нужно обновить страницу?
Если сделать это обязательным — результаты будут не очень. Уже был опыт со студентами :-)

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Works in
Registered
Activity