Pull to refresh
75.25
Rating
ABBYY
Решения для интеллектуальной обработки информации

Как научить Windows Search искать информацию в картинках

ABBYY corporate blog

Некоторое время назад мы уже писали об одном из вариантов использования ABBYY Recognition Server, сегодня расскажем вам ещё об одном. Все знают виляющую хвостом собаку, которая появляется в Windows XP при нажатии F3. За ней скрывается удобная поисковая служба Windows Search, позволяющая находить затерявшиеся на компьютере файлы по названиям, а иногда и по содержимому. Поиск по содержимому в Windows по умолчанию поддержан только для файлов текстовых форматов.

Недавно мы выпустили новый продукт ABBYY Recognition Server IFilter – специальное дополнение к Windows Search, которое помогает этому поисковому сервису индексировать файлы графических форматов – TIFF, JPEG, PDF и др., хранящиеся на компьютере, чтобы потом можно было легко находить их с помощью полнотекстового поиска. Для извлечения текста из документов-изображений задействуется ABBYY Recognition Server, установленный в корпоративной сети.



Работает эта система так:

На рабочие компьютеры сотрудников устанавливается IFilter – маленькое лёгкое приложение, которое умеет передавать изображения на удаленный ABBYY Recognition Server и получать оттуда в ответ распознанный текст. Windows Search можно настроить на индексирование определенных папок и почтовых ящиков на компьютере. Все текстовые документы и письма из выбранных папок Windows Search индексирует сам, а все изображения, найденные в этих папках и вложениях в письма, передает через IFilter в Recognition Server для распознавания. Распознанный текст возвращается обратно на компьютер и добавляется в индекс – изображение становится доступно для полнотекстового поиска.

image

Сам IFilter потребляет минимум системных ресурсов – все ресурсоемкие процессы происходят на сервере в корпоративной сети. Копии изображений хранятся на сервере только во время распознавания, после распознавания они с сервера удаляются.

Ну и приятный бонус – IFilter умеет автоматически отсеивать фотографии (чтобы не мучить сервер распознаванием красот Египта и Турции).

Update по просьбам читателей: приложение работает под Windows 7, Vista, XP :)

Вера Серова
Аналитик по технологическим продуктам
Tags:ABBYYrecognition serverifilterOCR
Hubs: ABBYY corporate blog
Total votes 37: ↑25 and ↓12+13
Views6.9K

Top of the last 24 hours

Information

Founded
Location
Россия
Website
www.abbyy.com
Employees
1,001–5,000 employees
Registered