Pull to refresh
8
Denys Astanin@denysA

User

2
Subscribers
Send message
Ну Шева тоже. RAVEman вон уехал учиться на PhD и Ватерлоо с медалью.
Вопрос только в том, как этот рейтинг получить. Похоже, это невозможно для простых смертных
Ради такого стоит жить.
Я где-то читал, что обычно в запросе выдается 2 слова. На одно из них гугл уже знает ответ, а второе вводится пользователем. Т.е, скорее всего, бОльший вес имеет слово, которое гугл уже знает.
Spelling correction писал другой человек :)

На 70% я изначально не опирался. Это, скорее, для «затравки». Точность зависит от объема тренировочных данных и, как вы уже заметили, от того, насколько эта тренировочная выборка соответствует тестовой.
90% — это, скорее, фантастика :)
Всё верно. Спасибо за дополнение. Оно, пожалуй, лучше самой статьи :)
Со стороны, безусловно, виднее. Скорее всего, нужно было писать с бОльшим количеством примеров. Постараюсь в будущем это учесть.
Что такое PMI? PMI — pointwise mutual information или поточечная взаимная информация. Действительно упустил это, сейчас подправлю.
По сути, вы проверяете как часто какой-то биграмм из предложения встречается рядом с хорошими и рядом с плохими словами, а потом находите разницу между ними.

Точность считалась на датасетах из социальных медиа. По ним проводился человеческий аудит и впоследствии сравнивались результаты.
2

Information

Rating
Does not participate
Location
Киев, Киевская обл., Украина
Registered
Activity