Существует много споров на тему copycаt’ов (повтрение оригинальной идеи, без внесения изменений). Стоит ли повторять западные аналоги, если да, то стоит ли это вуалировать и хотя бы видоизменять интерфейс. Пока нет единого мнения на этот счет. Мы же решили повторить один из западных стартапов.
Многие наверное слышали про сервис Aardvark, и про последующую его покупку Google-ом. Мы не сразу его повторили. Выждали какое-то время, чтоб понять будет ли Google его адаптировать. Когда мы поняли, что в этом направлении не предпринимается никаких шагов, то решили попробовать себя в социальном поиске, тем более что сами регулярно пользовались Aardvark’ом и сталкивались с проблемой отсутствия поддержки русского языка и отсутствия достаточного количества пользователей из русскоязычного региона.

Так появился huti.ru. В его основе заложена та же идея, что и у Aardvark’a — социальный поиск, в котором можно задать вопрос, а сервис сам определяет тему вопроса и ищет подходящих людей, которые могут на него ответить. Для начала работы необходимо зарегистрироваться и указать свои экспертные области. Дальше нужно добавить себе в контакты бота, которому можно в любой момент задать интересующий вопрос.
Алгоритм, который мы заложили в Хути, такой:
1. Пользователь задает вопрос.
2. Система выделяет ключевые слова на основе частотных характеристик, подобных TFIDF.
3. Далее система строит список тем с весами, которые соответствуют выделенным словам и словосочетаниям. Знания о темах и словах которые их описывают были получены на основе публичной информации в которую входят Google ответы, Yandex ответы, Википедия, дмоз.
4. Далее система ищет пользователей, чьи темы наиболее соответствуют темам и весам вопроса.
5. Данный вес умножается на характеристики пользователя — как часто он отвечает, как часто его ответы устраивают спросивших, насколько их возраст соответствует и т.п.
6. Система опрашивает пользователей одного за другим, пока кто-то не ответит и пока спросивший не отреагирует на ответ. Таким образом в этот процесс вовлечено наименьшее число человек и (по задумке) беспокойство участников системы минимально.
7. Вопрос закрывается, как только получено достаточное число удовлетворительных ответов или превышен максимум людей которые видели вопрос. Так мы обеспечиваем быстрое закрытие нерелевантных вопросов, а так же тех вопросов, ответ на которые уже получен.

Основная проблема, с которой столкнулись на начальных этапах и которая актуальна до сих пор — недостаточное ядро пользователей и тем. А поскольку система на любой вопрос в любом случае находит людей, которые по ее мнению могут на него ответить, то бывают случаи, когда найденный пользователь тематически на самом деле находится достаточно далеко от темы вопроса. Эту проблему мы надеемся решить с увеличением количества пользователей и соответственно расширением тематической базы.
На сегодняшний день статистика такая:
Пользователей: 600
Вопросов: 1700
Ответов: 4300
Средняя скорость получения ответа на вопрос: 30 мин
Поддерживаемые мессенджеры: GTalk, Jabber, ICQ (не всегда онлайн). Был еще бот для Facebook чата, но его забанили, видимо заподозрили неладное.
Будем рады, если сервис кому-то поможет быстро находить ответы на вопросы, или если вы готовы делиться своими знаниями с другими.
Чтоб зарегистрироваться можно воспользоваться сайтом. После этого вам нужно указать свой Мессенджер контакт на соответствующей странице и затем добавить себе в контакты бота Хути (Хути сам не будет стучатся к вам даже после того, как узнает ваш контакт).
Или же пойти более быстрым huti-путем — добавить себе в мессенджер новый контакт (список контактов тут — huti.ru/staticpages/about_better), отправить ему текст habr_huti_invitation, и пройти быструю регистрацию в режиме вопрос-ответ.
Update: Изза встречающихся недочетов сайта рекомендуем пользователям GTalk и Jabber пока что регистрироваться и общаться с Хути при помощи мессенджера. Как залогиниться на сайте тем, кто зарегистрировался через мессенджер, см п.5 — huti.ru/staticpages/about_help
Многие наверное слышали про сервис Aardvark, и про последующую его покупку Google-ом. Мы не сразу его повторили. Выждали какое-то время, чтоб понять будет ли Google его адаптировать. Когда мы поняли, что в этом направлении не предпринимается никаких шагов, то решили попробовать себя в социальном поиске, тем более что сами регулярно пользовались Aardvark’ом и сталкивались с проблемой отсутствия поддержки русского языка и отсутствия достаточного количества пользователей из русскоязычного региона.

Так появился huti.ru. В его основе заложена та же идея, что и у Aardvark’a — социальный поиск, в котором можно задать вопрос, а сервис сам определяет тему вопроса и ищет подходящих людей, которые могут на него ответить. Для начала работы необходимо зарегистрироваться и указать свои экспертные области. Дальше нужно добавить себе в контакты бота, которому можно в любой момент задать интересующий вопрос.
Алгоритм, который мы заложили в Хути, такой:
1. Пользователь задает вопрос.
2. Система выделяет ключевые слова на основе частотных характеристик, подобных TFIDF.
3. Далее система строит список тем с весами, которые соответствуют выделенным словам и словосочетаниям. Знания о темах и словах которые их описывают были получены на основе публичной информации в которую входят Google ответы, Yandex ответы, Википедия, дмоз.
4. Далее система ищет пользователей, чьи темы наиболее соответствуют темам и весам вопроса.
5. Данный вес умножается на характеристики пользователя — как часто он отвечает, как часто его ответы устраивают спросивших, насколько их возраст соответствует и т.п.
6. Система опрашивает пользователей одного за другим, пока кто-то не ответит и пока спросивший не отреагирует на ответ. Таким образом в этот процесс вовлечено наименьшее число человек и (по задумке) беспокойство участников системы минимально.
7. Вопрос закрывается, как только получено достаточное число удовлетворительных ответов или превышен максимум людей которые видели вопрос. Так мы обеспечиваем быстрое закрытие нерелевантных вопросов, а так же тех вопросов, ответ на которые уже получен.

Основная проблема, с которой столкнулись на начальных этапах и которая актуальна до сих пор — недостаточное ядро пользователей и тем. А поскольку система на любой вопрос в любом случае находит людей, которые по ее мнению могут на него ответить, то бывают случаи, когда найденный пользователь тематически на самом деле находится достаточно далеко от темы вопроса. Эту проблему мы надеемся решить с увеличением количества пользователей и соответственно расширением тематической базы.
На сегодняшний день статистика такая:
Пользователей: 600
Вопросов: 1700
Ответов: 4300
Средняя скорость получения ответа на вопрос: 30 мин
Поддерживаемые мессенджеры: GTalk, Jabber, ICQ (не всегда онлайн). Был еще бот для Facebook чата, но его забанили, видимо заподозрили неладное.
Будем рады, если сервис кому-то поможет быстро находить ответы на вопросы, или если вы готовы делиться своими знаниями с другими.
Чтоб зарегистрироваться можно воспользоваться сайтом. После этого вам нужно указать свой Мессенджер контакт на соответствующей странице и затем добавить себе в контакты бота Хути (Хути сам не будет стучатся к вам даже после того, как узнает ваш контакт).
Или же пойти более быстрым huti-путем — добавить себе в мессенджер новый контакт (список контактов тут — huti.ru/staticpages/about_better), отправить ему текст habr_huti_invitation, и пройти быструю регистрацию в режиме вопрос-ответ.
Update: Изза встречающихся недочетов сайта рекомендуем пользователям GTalk и Jabber пока что регистрироваться и общаться с Хути при помощи мессенджера. Как залогиниться на сайте тем, кто зарегистрировался через мессенджер, см п.5 — huti.ru/staticpages/about_help