Pull to refresh
0.6

PDF

Interplanetary electronic documents format.

Show first
Rating limit
Level of difficulty

Dedoc: как автоматически извлечь из текстового документа всё и даже немного больше

Level of difficulty Medium
Reading time 11 min
Views 407

Привет, Хабр! 

Мы команда разработчиков Института Системного Программирования РАН, занимаемся Computer Vision в обработке электронных документов. Мы разработали open-source библиотеку dedoc, которая помогает разработчикам и дата-сайентистам в пару строк кода читать различные форматы текстовых документов и изображений с текстом, и далее приводить информацию к единой аккуратной структуре.

Читать далее
Total votes 3: ↑3 and ↓0 +3
Comments 0

Authors' contribution