Комментарии 21
Без указания региона до города ищет меньше 5% пользователей, успешность поиска по таким запросам – обычная. Даже если кардинально улучшить качество поиска для такой доли пользователей, общая польза будет не очень большой.
С пустым запросом ищет около половины пользователей, ещё несколько десятков процентов — с неоднозначными однословными запросами и без заданных условий, т.е. большинство. Поиск на ML обеспечивает улучшение качества выдачи для таких запросов.
Задача про склейку дублей есть, оценка трудоёмкости у неё довольно высокая, т.к. качественная склейка нечетких дублей, с измерением этого качества и механизмом исключений, выбор самого подходящего для пользователя дубля, корректировка количества найденных резюме, с учётом того, что часть из них дубли — не такая уж элементарная вещь. Доберёмся в порядке приоритета.
Без указания региона до города ищет меньше 5% пользователей
Примерно половину людей в IT сфере интересует исключительно удалёнка. Возможно это 5% от всех ваших пользователей. Но думаю, что дело не в этом. Я 2 раза покопался (по другому этот процесс назвать не могу) у вас на сайте, и больше у меня желания на него заходить нет. У вас вакансий больше, чем, например, на тутошнем «моём круге», но я лучше зайду на последний, чем буду рыться в мусоре. И, полагаю, что так поступает подавляющее большинство. Отсюда и берутся ваши 5%. В интернете все голосуют ногами, когда что-то не устраивает — благо всегда есть конкурент. Странно, что вы этого не понимаете.
Особенно в сниппете «Вам подойдут эти вакансии», из 6-и — все отвеченные, две — отказ. Ну и зачем они мне опять? Глубину просмотра вам улучшать?
Весь ваш форум забит тикетами на эту тему.
Результаты зависят от конкретных резюме, вакансий и запросов. Модели выучивают закономерности, с какими резюме по таким запросам на какие вакансии соискатели обычно откликаются, и кого после этого работодатели приглашают. Поэтому, к примеру, если у кандидата резюме full stack developer’а со знанием Java, то по запросу «JavaScript» ему/ей, в первую очередь, поиск покажет вакансии full stack developer’ов с Java, примерно такие же, как по запросу «Java».
К сожалению во многих, средних и малых компаниях, подбором занимаются секретари не понимающие разницы. Я уже не говорю о разнице между Java SE и Java EE.
Интересно, а coloborative filtering не даёт желаемых результатов? И ещё очень интересно смотрите ли вы в сторону spark за вместо hadoop
Я golang разработчик, у меня резюме называется golang разработчик, дополнительный язык php.
И вот, что я получаю в рассылке:
Fullstack JavaScript Developer
Senior Backend Developer (PHP)
Backend Rust developer
KDB/Q Developer — GM Mercury
Clojure developer
Senior PHP developer
Итого: релевантных текущему резюме 0%,
релевантных прошлому опыту 33%
Разработчик Golang
Fronт-end разработчик
Разработчик BigData
Руководитель разработки в платёжную систему
Программист Go/Java
Лучше: теперь релевантных 40% и относительно релевантных (с вакансией руководителя, у которого есть golang упоминание в навыках) 60%
Но на мой взгляд, результаты по прежнему странные. Не думаю, что рекомендации или автопоиск сейчас пригодны, по крайней мере, для не массовых спецов.
А последним годам опыта не придается больший вес? Ну даже пусть с ним с php, откуда javascript, rust, kdb/q (даже не слышал о таком) и зачем рекомендовать такое странное?
Вашему совету вниму в любом случае и посмотрю на те рекомендации, что будут приходить по запросу "golang разработчик".
Модели выучивают закономерности из откликов пользователей. Например, если кто-то с резюме, похожим на ваше, много откликался на вакансии с rust и kdb/q, модели могут это выучить. Также могут выучить, что те, кто знает php, часто откликаются на вакансии, в которых есть js. Для частых запросов+резюме+вакансий есть много примеров, поэтому закономерности могут быть более качественными, чем для редких, для которых в train может быть всего несколько отдельных откликов, иногда странных.
Если вам приходят так себе подходящие вакансии, дело может быть в этом: нужно просто обновить резюме.
Не хочу. Если я обновлю резюме, то оно попадет в первые страницы выдачи поиска резюме. И начнутся звонки. И это уже активный поиск. А подходящие вакансии интересны при пассивном поиске, когда иногда смотришь на похожие варианты и думаешь «а может и правда?...».
Умный поиск: как искусственный интеллект hh.ru подбирает вакансии к резюме