Если интерпретировать историю пользователя как цепочку событий то можно. Каждое событие — отдельное «слово» в словаре. А дальше работаем как с текстами ))
Не так долго как могло бы показаться — это же хобби ))
Краулер был написан еще в начале лета под задачу подсчета статистики активности в ЖЖ. Чуть больше недели на обработку данных и борьбу с SVD и несколько дней на конвертер для графов и их визуализацию — весьма такое творческое занятие. Ну и по паре дней (ночей) на написание фронт-энда для блогов и вина. Я не очень большой специалист в js-разработке, а некоторые аспекты рендеринга на svg и библиотеки d3js осваивал в процессе.
Адекватные деньги это сколько? Есть AWS с его спот-микро-инстансами, есть пачки прокси. Я не спец именно по ботам для поисковых систем, но мне кажется подход то один.
Краулер был написан еще в начале лета под задачу подсчета статистики активности в ЖЖ. Чуть больше недели на обработку данных и борьбу с SVD и несколько дней на конвертер для графов и их визуализацию — весьма такое творческое занятие. Ну и по паре дней (ночей) на написание фронт-энда для блогов и вина. Я не очень большой специалист в js-разработке, а некоторые аспекты рендеринга на svg и библиотеки d3js осваивал в процессе.
Я его использую в своих хобби-проектах, но если о чем-то коммерческом говорить — то там ограничения по лицензии, вот неспешно подыскиваю замену.
это про что?