Как стать автором
Обновить

Комментарии 2

А на деле придется учитывать то что числа распознаются отдельно. Если следом за числом не идет действие — числа суммируются до тех пор, пока парсер не встретит математическое дейтсвие. И потом производит его с такой же суммой чисел. Как-то так я это вижу.
Для приветствия существует тип поиска keyword search, читайте справку по параметрам `-kws` и `-kws_search`. Этот метод распознает лучше чем грамматика.

Однако чем меньше словарь — тем быстрее поиск по нему и зачем нам хранить в оперативке словарь на 500000 слов

Словарь весь не грузится — только те слова, что используются в языковой модели.
<n3> = (сто|двести|триста|четыреста|пятьсот|шестьсот|девятьсот)[<n2>|<n1>];

Можно переписать оптимальнее:

<n34> = ( три | четыре ) ста ; <n59> = ( пять | шесть | семь | восемь | девять ) сот ; <n3> = ( сто | двести | <h34> | <h59> ) [ <n2> | <n1> ] ;
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации