Как собрать биграммы для корпуса любого размера на домашнем компьютере
Совершенно верное и правильно замечание. К сожалению для подсчёта двусочетаний такой подход не применим, т.к. у юниграмм частотность высокая почти у всех. Для триграмм и выше — очень помогает.
0
LookКак собрать биграммы для корпуса любого размера на домашнем компьютере
Обязательно посмотрю в этом направлении. Скажу, однако, что реализация всей идеи заняла у меня несколько часов и все вычисления, а также действия по агрегации, производятся в рамках одной JVM.
0
LookКак собрать биграммы для корпуса любого размера на домашнем компьютере
Вы отчасти правы. Но порог вхождения в Hadoop довольно высокий и в данной задаче вполне достаточно использования стандартных инструментов Java.
0
LookHere
12 ...
78
9There
Information
- Rating
- Does not participate
- Location
- Железнодорожный (Московск.), Москва и Московская обл., Россия
- Registered
- Activity