Pull to refresh

Comments 4

В целом подход понятен. А что у вас вкладывается в "использование API GitHub", кроме определения числа строк кода того или иного кандидата и предсказания числа использованных технологий?

По сути, с помощью API делаем полный обход репозиториев и юзеров. Сбор информации о коммитах и звездочках. Собираем данные из readme.

Дальше уже просто парсинг самих файлов с кодом без использования API.

Вам повезло, что удалось найти кандидата, чей опыт можно отследить по Github. В реальности же у большинства разработчиков на гитхабе будет написано "100500 contributions in private repositories".

Автор, молю тебя сделать отдельный пост о том как регаться на Linkedin из России без тонны геморроя, тор браузера и виртуальных симок. Либо в качестве альтернативы, подскажи плз, как парсить странички кандидатов и их резюме из Linkedin по своим фильтрам без учёта github данных?

Sign up to leave a comment.

Articles