Но ведь саммари в 17% — это гораздо больше, чем автореферат в 20%, при условии что саммари писал человек, который не просто сокращает обьем текста, но и перефразирует. Поэтому может оказаться что автореферат имеет свой порог «полезности»
Еще любопытно было бы сравнить те же самые показатели на другом объеме рефератов (больше или меньше 20%), если конечно другие инструменты поддерживают соответствующие проценты выборки при реферировании. Как меняется картина? Есть ли кардинальные изменения? Быть может какой-то инструмент эффективнее на малых выборках, тогда как другой — на средних и даже больших?
Стоит отметить что смысл реферированного текста может значительно измениться, если в предложениях используются местоимения. Два предложения, не идущих друг за другом в оригинальном тексте могут в реферате стоять рядом и, в случае если второе содержит местоимение (например, указательное "такой") создать таким образом иллюзию, что речь идет об объекте из первого.
От такого эффекта можно попытаться избавиться малой кровью, искусственно занизив рейтинг разорванных предложений с местоимениями или добавив рейтинга смежным (предстоящим?) предложениям с местоимениями.
Возможно, более надёжным способом избавиться от такого поведения было бы построение семантического графа предложений/текста и корректировки весов предложений с ним (с вероятной также заменой местоимений соответствущими объектами).
Согласен, хорошая вещь. Сам был приятно удивлен, когда увидел ее в действии — ее обычно в одиночку кидают на встроенные системы (роутеры, например) и она там точно так же и швец, и жнец, и на дуде игрец :-)
Спасибо, поправил. Но насчет переводов строк не понял. Если вы про комментарии в конфигах — я оставил их на английском, чтобы не было проблем с кодировкой и т.п. при слепом копипасте.
Обратите внимание на дату оригинала поста. Мне тема показалась довольно интересной, поэтому его и взял, однако следует учитывать что оригинал написан в 2005 году :)
Не все знают о его существовании, думаю. Если бы знали — нагуглили бы. А так, возможно, ссылаются на не очень высокое качество монитора или еще на что. Всякие люди ведь бывают.
Нет, скорее автор имел ввиду что если что-то не работает у прожженого пользователя Win он решает эту проблему так, как он привык. Зеленый же пользователь либо вообще забьет на эту проблему, либо попробует поискать наугад решение, либо просто в интернете поищет. И, конечно, будут «слабонервные», которые просто плюнут и разочаровавшись в Linux не будут делать дальнейших попыток.
Хороший вопрос. Может быть и есть, может быть он разрабатывается. может быть он просто с закрытым кодом и доками, поэтому им нет смысла кичиться стандартизированым API и тем, что на винде все работает изкаропки и т.п.
Это пока что понарошку интегрировано — кнопки есть, но они не работают и не запускают нужные сервисы. А еще даже если запустить индексирование, то все равно при поиске вывод, например, писем, будет выглядеть очень жутко.
Кхм… Было бы неплохо указать что вы не имеете отношения к написанию предидущих статей этой серии — а то мне в личку уже писали с просьбой перенести пост в блог KDE, а я по незнанию даже опешил и предложил человеку подождать написания статьи…
Действительно, не сурово. Просто удобнее и привычнее домашним телефоном чем в микрофон на столе и колонки на всю комнату будут вещать ваш разговор. Это не всегда приемлемо.
Да и стандартные скайп-телефоны имеют жуткий угловатый дизайн чаще всего. Никогда этого не понимал.
От такого эффекта можно попытаться избавиться малой кровью, искусственно занизив рейтинг разорванных предложений с местоимениями или добавив рейтинга смежным (предстоящим?) предложениям с местоимениями.
Возможно, более надёжным способом избавиться от такого поведения было бы построение семантического графа предложений/текста и корректировки весов предложений с ним (с вероятной также заменой местоимений соответствущими объектами).
Хотелось бы уточнить:
Что такое IR? В тексте статьи не нашёл.
Да и стандартные скайп-телефоны имеют жуткий угловатый дизайн чаще всего. Никогда этого не понимал.