Pull to refresh
0
Content AI
Решения для интеллектуальной обработки информации

ABBYY Labs. Q&A: начало

Reading time 3 min
Views 5.4K
Новый учебный год только начался, а нам уже есть что написать про ABBYY Labs.
ABBYY Labs? Что это?
Идея студенческих лабораторий очень проста: мы собираем команду студентов, которые занимаются решением задач под руководством наших специалистов. В МФТИ это проходит в рамках годового курса «Инновационный практикум». Цель проекта – дать возможность студентам в процессе обучения решать задачи, в большей степени приближенные к реальным, чем это бывает в обычном учебном процессе. И «погрузить» их при этом в соответствующее окружение: среда, в которой проходит разработка, – реально действующая IT-компания.
Проекты прошлых лет
Распознавание формул
Постановка задачи: image Студенческие лаборатории ABBYY
Решение задачи: image ABBYY Labs – what's new?

На этот раз студенты были поделены на 2 группы для параллельной работы над 2 проектами с рабочими названиями «LingvoGames» и «Q&A». Первый проект — мобильное приложение под Android. Более того, игра! Про неё обязательно будет отдельный пост после того, как она попадёт в топ Google Play. А второй — это не «квешенс и ансверс», как вы могли бы подумать. Хотя постойте-ка…

Когда в рамках инновационного практикума в МФТИ (факультет ФИВТ) был представлен проект Q&A, на него быстро набралась команда. Это, конечно неудивительно, хотя конкурентов было немало. А вот что удивительно — так это то, что слава практикума уже вышла за пределы ФИВТ: 4 из 8 студентов на проект набрались с ФОПФа (факультет общей и прикладной физики), на котором и курса-то такого нет. Куда ж деваться — взяли ребят, конечно.

Как рассказал куратор проекта Алексей Штукатуров (руководитель разработки Lingvo, преподаватель в МФТИ), ребята были на удивление хорошо самоорганизованы, особенно если учитывать размер команды. За 2 месяца работы добились неплохих результатов и явно не собираются останавливаться на достигнутом.

Для написания приложения, которое позволит в большом объёме текста находить ответ на вопрос, ребятам была дана возможность использовать лингвистический парсер, основанный на технологии ABBYY Compreno (чуть больше про это можно почитать в image Ответы генерального директора ABBYY Сергея Андреева на вопросы читателей Хабра. Часть 1). Применив парсер для разбора имеющихся текстов, реализовали 2 разных алгоритма (чтобы лучший выбрать в конце концов), задачей каждого из которых является нахождение предложения, содержащего ответ на вопрос. Вопрос, конечно, на естественном языке, куда ж без этого. Да и тексты классические. И работает вполне прилично, сами смотрите:



Чтобы получить ответы на такие вопросы, система автоматически получает информацию о структуре предложения и использует дерево понятий (это дерево представляет собой универсальную иерархию понятий и модель отношений между ними). Нужно это дерево, чтобы поиск понимал, что гравитационное поле обычно кукурузой не засевают. И, надо сказать, вполне понимает. «Побочным эффектом» «понимания» текста является возможность постановки вопроса на одном языке с получением ответа на другом.



Инновационный практикум, в рамках которого и происходит работа над проектом, имеет цель для высшего образования весьма необычную: не только разработать приложение, но и продать его (не пытайтесь найти упоминания этого факта по ссылке, но так оно и есть — студенты подтвердят). В связи с этим дальнейшее развитие проекта видится участникам в виде разработки веб-фреймворка, который позволит владельцам форумов и прочих интернет-пространств «прикрутить» умный поиск к своим базам.

Так что если вам это интересно и вы готовы поддержать студентов с их начинаниями рублём — следите за нашим блогом, мы обязательно объявим о готовности продукта.
Tags:
Hubs:
+24
Comments 0
Comments Leave a comment

Articles

Information

Website
www.contentai.ru
Registered
Founded
Employees
101–200 employees
Location
Россия