Как собрать биграммы для корпуса любого размера на домашнем компьютере
Совершенно верное и правильно замечание. К сожалению для подсчёта двусочетаний такой подход не применим, т.к. у юниграмм частотность высокая почти у всех. Для триграмм и выше — очень помогает.
0
ПосмотретьКак собрать биграммы для корпуса любого размера на домашнем компьютере
Обязательно посмотрю в этом направлении. Скажу, однако, что реализация всей идеи заняла у меня несколько часов и все вычисления, а также действия по агрегации, производятся в рамках одной JVM.
0
ПосмотретьКак собрать биграммы для корпуса любого размера на домашнем компьютере
Вы отчасти правы. Но порог вхождения в Hadoop довольно высокий и в данной задаче вполне достаточно использования стандартных инструментов Java.
0
ПосмотретьСюда
12 ...
78
9Туда
Информация
- В рейтинге
- Не участвует
- Откуда
- Железнодорожный (Московск.), Москва и Московская обл., Россия
- Зарегистрирован
- Активность