Мы запатентовали собственную разработку для «Умного поиска» и вошли в число финалистов конкурса Роспатента «Успешный патент» где выявляют самые классные изобретения по итогам 2020-2021 годов. В конкурсе приняли участвовали еще 128 российских правообладателей.
Мы постоянно работаем над улучшением нашего сервиса. И стараемся делать так, чтобы дата-сайентистам не предлагали вакансии сантехников. С каждым годом мы все ближе к космическому идеалу. В 2020 году мы получили патент на изобретение автоматизированного поиска релевантных резюме и вакансий для рекомендательной системы «Умный поиск hh.ru» с использованием машинного обучения и понижением размерности многомерных данных.
Компонент Умного поиска hh.ru был изобретен нашими профи по анализу данных и машинному обучению – Георгием Даньщиным, Виктором Реушкиным и Александром Сидоровым. Наше изобретение позволяет за сотни миллисекунд выбирать из миллионов резюме и сотен тысяч вакансий правильные, и соотносить друг с другом те, у которых похож не только текст, но и смысл. Наша фича проделывает это куда лучше и эффективнее, чем подобранные вручную правила.
Благодаря этому улучшается качество рекомендаций резюме и вакансий и требуется меньше вычислительных ресурсов – мы экономим память и процессоры серверов.
Чтобы рекомендовать вакансии в последние два года мы применяем более сложные ML-модели с большим количеством признаков. Запатентованные изобретения позволяют ощутимо уменьшать объем данных, сохраняя существенную часть их смысла. Затем эти данные используются для очень быстрого предварительного отбора вакансий и резюме, а затем модели выбирают наиболее подходящие.
Из больших полноразмерных данных мы получаем сжатые. Однако они должны сохранять определенный смысл, чтобы без потери качества и скорости обработки мы могли рекомендовать подходящие резюме для вакансий и наоборот. Наше изобретение используется и для обработки запросов работодателей при поиске по резюме, и для обработки запросов соискателей при поиске вакансий.
Благодаря hh.ru сотни тысяч работодателей и соискателей находят друг друга в России и за её пределами. Чтобы это происходило быстрее и оптимальнее, наши разработчики используют прикладной искусственный интеллект. Наши решения сильно отличаются от применяемых, например, в веб-поиске. Всё из-за очень большого разнообразия и специфики предметной области наёма и работы, и очень высоких требований к качеству выдачи, которую видят пользователи.
В 2018 году нам потребовалось сделать рекомендации резюме для вакансий, с учётом географического местоположения и интересов. На тот момент в нашей базе уже было больше 40 млн резюме и 600 тыс. вакансий. Посчитать вероятность, что каждое резюме пригласят на каждую вакансию с помощью сложных математических моделей, подобранных посредством машинного обучения – невозможно. Тем более онлайн, за 50 мс, пока пользователь ждёт отрисовки веб-страницы или экранного мобильного приложения.
Для решения этой проблемы можно попытаться придумать эвристики и классификаторы резюме и вакансий. Но профессий десятки тысяч, так что этот подход имеет ограничения по качеству и масштабированию. Поэтому мы использовали подход на основе машинного обучения. Мы оцифровываем резюме и вакансии, представляем их в виде векторов чисел. Затем снижаем размерность этих векторов, представляем их в виде хешей. При этом, мы используем для вычисления этих хешей такую функцию, которая выдаёт похожие хеши для резюме и вакансии, если работодатель позвал кандидата на собеседование. Дальше мы сохраняем эти хеши в поля базы, и когда приходит работодатель с вакансией – делаем запрос «выдать все резюме, хеш которых отличается не более чем на N бит». И уже получив несколько десятков тысяч резюме, применяем к ним более сложные и ресурсоёмкие модели. Технические подробности – в нашем патенте, который подготавливали для участия в конкурсе Юридический департамент – Юрий Донников и Дарья Першенкова.
В результате мы смогли запустить рекомендации резюме на вакансии. С тех пор их использование выросло настолько, что работодатели приглашают большинство соискателей не благодаря поиску по базе, а из резюме, которые рекомендуются на их вакансии. Это позволяет тратить на поиски подходящих кандидатов примерно в 6 раз меньше времени, а значит делает наем и поиск работы проще и быстрее.
Мы решили запатентовать это решение не только для его защиты, но и чтобы поделиться им с вами. Мы верим, что подобный подход может пригодиться и в других компаниях, которые применяют искусственный интеллект на практике, чтобы стать удобнее, полезнее и эффективнее для своих клиентов. Особенно это касается многосторонних маркетплейсов. Это сделает жизнь людей немного лучше.
Мы очень рады и горды, что Российское патентное ведомство удостоило нашу разработку в сфере искусственного интеллекта такого внимания и признания. Надеемся, это изобретение поможет и вам.