Pull to refresh
3
11
Send message

И вот это мне позволило сделать "простую" модель. Я достал из стандартного заголовка признаки: модель, память. И там с помощью OHE получилась бинарная табличка с 49 признаками: все модели и объемы (64 ГБ, 128 ГБ, 256 ГБ, 512 ГБ, 1 ТБ). И только из этих штук у меня получилась крутая модель. Я также пробовал работать с описанием и рейтингом продавца, но значительных улучшений не принесло. Даже немного путало. И я остановился на такой простенькой модели. Но с таким же успехом я бы мог просто взять средние или медиану по каждой вариации модель+память - и да, но я все еще работаю с проектом. Возможно я найду ещё какие-нибудь инсайты и закономерности на рынке.

Да были моменты, когда такие вот уникомы, например, ставили цену 9999999₽. Либо наоборот ставили цену 100 рублей и писали - обмен. Я их отбрасывал с помощью квантилей. А так обычно цены +/- адекватные

Так как я работал с айфонами - у них там стандартные заголовки "Модель, Память". Авито предлагает пользователям релевантные заголовки при создании объявления. Обычно все его и оставляют. Но есть те, кто что-то еще добавляет. Ну вот пару примеров:
iPhone 14 Plus 256gb все родное Sim+Sim
iPhone 14 Plus, 256 гб,nanoSim/eSim
iPhone 14 pro 128 гб Space black SIM+eSIM
iPhone 14 Pro 128gb Deep Purple Sim+eSim
iPhone 14 pro 128gb dual sim
iPhone 14 Pro / 128 gb / Deep Purple / Sim + Esim
iPhone 14 Pro 128gb Sim+eSim
iPhone 14 pro 256gb dual sim
iPhone 14 Pro Deep Purple 256GB (sim+esim)
iPhone 14 pro 256 гб dual-sim
iPhone 14 Pro 256 GB Space Gray, dual SIM (2x SIM)
iPhone 14 pro 256 гб sim+esim
iPhone 14 Pro 256gb Deep Purple eSim


Вот и на кой так усложнять, если вот человеческие заголовки:

Я предполагаю, то что как раз такие пользователи "знают цену", и пытаются ее "отобразить" в заголовке. Но так как цель моего проекта - это "выявлять недооцененные товары у частных продавцов бывшего пользования для последующей перепродажи" - для меня не выгодно, чтобы они знали его цену) И вот можно сказать это такой "фильтр" от шарющих. Обычные бы пользователи не стали бы париться. Ну вот большинство и не париться.

Information

Rating
619-th
Registered
Activity

Specialization

ML Engineer
Intern
Git
SQL
Python
PostgreSQL
Docker