Интересно. А как вы обошлись без векторизации, если в нескольких словах?
А у нас в силу специфики — словарь очень простая штука, поэтому «зашит» в программу. Очень вряд ли что в ближайшее время откроют новые химические элементы, которые могут быть использованы в соединениях.
Построение системы оптического распознавания структурной информации на примере Imago OCR