Как стать автором
Обновить
0
Content AI
Решения для интеллектуальной обработки информации

Как научить Windows Search искать информацию в картинках

Время на прочтение2 мин
Количество просмотров7.2K

Некоторое время назад мы уже писали об одном из вариантов использования ABBYY Recognition Server, сегодня расскажем вам ещё об одном. Все знают виляющую хвостом собаку, которая появляется в Windows XP при нажатии F3. За ней скрывается удобная поисковая служба Windows Search, позволяющая находить затерявшиеся на компьютере файлы по названиям, а иногда и по содержимому. Поиск по содержимому в Windows по умолчанию поддержан только для файлов текстовых форматов.

Недавно мы выпустили новый продукт ABBYY Recognition Server IFilter – специальное дополнение к Windows Search, которое помогает этому поисковому сервису индексировать файлы графических форматов – TIFF, JPEG, PDF и др., хранящиеся на компьютере, чтобы потом можно было легко находить их с помощью полнотекстового поиска. Для извлечения текста из документов-изображений задействуется ABBYY Recognition Server, установленный в корпоративной сети.



Работает эта система так:

На рабочие компьютеры сотрудников устанавливается IFilter – маленькое лёгкое приложение, которое умеет передавать изображения на удаленный ABBYY Recognition Server и получать оттуда в ответ распознанный текст. Windows Search можно настроить на индексирование определенных папок и почтовых ящиков на компьютере. Все текстовые документы и письма из выбранных папок Windows Search индексирует сам, а все изображения, найденные в этих папках и вложениях в письма, передает через IFilter в Recognition Server для распознавания. Распознанный текст возвращается обратно на компьютер и добавляется в индекс – изображение становится доступно для полнотекстового поиска.

image

Сам IFilter потребляет минимум системных ресурсов – все ресурсоемкие процессы происходят на сервере в корпоративной сети. Копии изображений хранятся на сервере только во время распознавания, после распознавания они с сервера удаляются.

Ну и приятный бонус – IFilter умеет автоматически отсеивать фотографии (чтобы не мучить сервер распознаванием красот Египта и Турции).

Update по просьбам читателей: приложение работает под Windows 7, Vista, XP :)

Вера Серова
Аналитик по технологическим продуктам
Теги:
Хабы:
Всего голосов 37: ↑25 и ↓12+13
Комментарии28

Публикации

Информация

Сайт
www.contentai.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия

Истории