Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    После подбора семантики для действующего интернет-магазина вас ожидает неприятное открытие: структура магазина скорее всего не позволит разместить все ключевые фразы. Придется или откладывать оптимизацию до лучших времен (когда затеете редизайн), или втискивать новые страницы в имеющуюся структуру, запутывая и усложняя ее.


    Если компромиссные решения не для вас, адаптируйте структуру под новую семантику.


    Но как спроектировать разделы/подразделы, чтобы они, с одной стороны, вместили тысячи ключей из ядра, а с другой — улучшили навигацию? Покажем на примере.



    Исходные данные


    Возьмем для примера молодой региональный интернет-магазин домашнего декора, сувениров и подарков.


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Текущая структура имеет такой вид:


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Для интернет-магазина собрано и вычищено от «мусора» и «пустышек» семантическое ядро на 1000 фраз (сформировано на основе названий товаров и рубрик магазина).


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Задача — разработать новую структуру магазина, которая будет отражать реальные поисковые потребности пользователей. Решать ее будем в три этапа.



    Этап 1. Кластеризация


    Кластеризация — это группировка ключевых фраз на основе схожести результатов поисковой выдачи по ним.


    В отличие от группировки на основе семантической близости, кластеризация позволяет избежать ошибок, связанных с размещением на одной странице запросов с разным интентом.


    Например, фразы «картина для спальни купить» и «картины для спальни» при группировке на основе семантики наверняка бы попали в одну группу. Но если посмотреть на поисковую выдачу по ним, то она окажется разной.


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    А все потому, что у фразы «картины для спальни» коммерческий интент (пользователь выбирает товар), а у фразы «картина для спальни купить» — транзакционный (пользователь выбрал картину и готов ее купить). Поэтому выдача по первой фразе содержит фото, подборки идей и страницы с товарами, а по второй — только страницы интернет-магазинов.


    Для кластеризации есть онлайн-сервисы (Just Magic, PixelPlus, PromoPult и др.) и десктопные программы (KeyAssort, KeyCollector). Работают они по похожему принципу (разве что в KeyCollector кластеризация требует специфической подготовки): загружаете список запросов, указываете регион, точность кластеризации и получаете сгруппированное ядро.


    При кластеризации особенно важно задать правильную точность — количество совпадений результатов выдачи в ТОП-10, при котором фразы попадают в одну группу. Например, при точности 3 запросы попадут в один кластер, если в выдаче по ним будет три и более одинаковых результата.


    Если точность низкая, то кластеры получаются слишком обширными, а если высокая, то ядро может быть излишне раздроблено.


    Чтобы не гадать и не переплачивать за лишние итерации, удобнее всего задать точность диапазоном. В этом случае вы получите несколько кластеризованных ядер, но заплатите только один раз. Такая функция есть в кластеризаторе PromoPult. Задаем точность от 3 до 7, устанавливаем приоритетную поисковую систему, регион и запускаем процесс:


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Загружаем отчет и сравниваем результаты кластеризации при разной точности. Наша задача — выбрать «золотую середину», чтобы кластеры были и не слишком обширными, и не раздробленными. В нашем примере оптимальной видится точность 6.


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    После кластеризации сталкиваемся с проблемой: существующая структура интернет-магазина не позволяет разместить группы запросов.


    Например, есть кластеры «деревянные подсвечники» и «купить свечи в интернет магазине». Мы не можем размещать эти кластеры на одной странице — у них разный интент. Но на сайте товарные группы с такими названиями расположены как раз на одной странице, что с точки зрения оптимизации неверно.


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Логика подсказывает: почему бы просто не создать раздел «Свечи» и оптимизировать его под кластер «свечи купить», а раздел «Подсвечники, канделябры, свечи» переименовать в «Подсвечники» и оптимизировать под «деревянные подсвечники»?


    Но все не так просто: а что делать с другими кластерами вроде «подсвечник в подарок»? Размещать в разделе «Подсвечники»? Или «Праздники»? Или еще каком-то? И таких кластеров около 200 — и каждый из них по-своему «проблемный».


    Этап 2. Лемматизация кластеров и классификация лемм


    Для формирования структуры магазина необходимо классифицировать кластеры на основе общих признаков и сгруппировать их. Здесь поможет лемматизация — разбиение исходных фраз на отдельные слова и приведение их к именительному падежу единственному числу (лемме).


    Копируем названия кластеров (не ключей!), вставляем их в лемматизатор и запускаем процесс.


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Переносим слова из раздела «Лемматизированные слова» в Excel и каждому слову присваиваем классификационный признак.


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Признаки кратко характеризуют лемматизированное слово. Например, слово «купить» можно описать как процесс. Поэтому напротив этого слова ставим признак «процесс». Вы бы могли назвать его по-другому (допустим, «действие»). Это не принципиально — суть в том, чтобы сгруппировать все слова по схожим признакам.


    В нашем случае признаков получилось девять:


    • время («март», «год», «февраль»);
    • место («дом», «магазин» и т. д.);
    • повод («рождение», «свадьба» и т. д.);
    • предмет («подарок», «украшение» и т. д.);
    • процесс («купить», «вышивать»);
    • свойство («искусственный», «настенный» и др.);
    • стиль («стиль», «прованс», «лофт», «шебби»);
    • товар («картина», «цветок» и др.);
    • человек («парень», «подруга» и т. п.).

    Сортируем список лемм по признакам и переносим данные в столбцы для удобства визуализации.


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Пока это не готовая структура. Но мы уже на финишной прямой.


    Этап 3. Формирование структуры интернет-магазина


    Анализируем леммы по каждому признаку и продумываем, под какие из них создать разделы/подразделы или фильтры.


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Признак «время» сразу отсеиваем. Сюда попали слова, относящиеся к «поводу». Также удаляем признак «процесс», поскольку слово «вышивать» нерелевантное, а «купить» и так будет фигурировать практически на всех страницах магазина.


    По признаку «товар» больше всего слов. Поскольку у нас интернет-магазин, то имеет смысл вынести все товары в отдельный пункт меню. Назовем его «Каталог».


    Также логично создать пункт меню по признаку «место». Назовем его «Виды декора». Подпункты — «Для гостиной», «Для кухни», «Для сада» и т. п.


    Аналогично вынесем в меню признак «повод». Назовем пункт «Праздники». Подразделами будут «Декор на Новый год», «Декор на день рождения» и т. п.


    На основе признака «человек» сформируем пункт меню «Подарки» с подразделами «Подарки парню», «Подарки подруге», «Подарки бабушке» и т. п.


    И последний пункт меню — «Стиль», сформированный на основе одноименного признака. Подпункты — «Декор прованс», «Декор шебби шик», «Декор лофт».


    Остаются признаки «предмет» и «свойство». На основе первого признака нет смысла выделять пункт меню или фильтры, мы их будем использовать в названиях разных рубрик. А вот на основе слов из признака «свойства» делаем фильтры:


    • цвет (обязательно — черный, белый, красный, зеленый + другие цвета);
    • материал (дерево, железо, бронза, фарфор, стекло, кварц, винил);
    • расположение (напольный, настенный, настольный, подвесной декор);
    • форма (круглый, овальный, квадратный, неправильной формы);
    • размер (высокий, мелкий, большой);
    • дополнительные характеристики (светящийся, романтический, резной, ароматизированный).

    Выстраиваем структуру магазина:


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Остается рассортировать кластеры поисковых запросов по разделам и подразделам.


    Как разработать структуру интернет-магазина на основе кластеризации и лемматизации семантики

    Естественно, разделов и подразделов не хватит, чтобы разнести все 200 кластеров. Под оставшиеся кластеры создаются страницы с результатами фильтрации (например, будут страницы «Белый декор», «Круглый декор», «Романтический декор» и т. п.). Если и после этого останутся кластеры, под них оптимизируются релевантные карточки товаров.


    Метод легко масштабируется на любой проект


    Благодаря кластеризации и лемматизации семантики вы без проблем сгруппируете фразы по поисковому интенту и сформируете на их основе структуру интернет-магазина, учитывающую реальные интересы целевой аудитории.


    Преимущество метода в масштабируемости. Он подходит как для небольших площадок, так и для интернет-магазинов с десятками тысяч ключей. Причем именно на больших проектах, когда ручная интуитивная работа становится невозможной, метод проявляет себя лучше всего.

    PromoPult
    71,81
    Автоматизированная рекламная платформа
    Поделиться публикацией

    Комментарии 7

      0
      По стилистике. Пишите «картина для спальни купить» и «картины для спальни». И тут уже «картины для спальни» и «картина для спальни купить» (наоборот). И сразу уже не понятно что тут «первое», а что «второе».

      Признак «время» сразу отсеиваем. Сюда попали слова, относящиеся к «поводу».
      Это вручную смотрели или как определили?

      В целом методика интересная. Я подобным не интересовался — может это конечно и банальщина от КО, расписанная 300 раз. Поищу еще материалы по теме.

      Свой продукт попиарили. Но вот тему толком не раскрыли, остается много вопросов. По-нормальному надо было делать на экспериментальном сайте, и выложить действующий пример «до» и «после». Например, даже по затронутой вами же теме. «Деревянные подсвечники» понятно куда ушли. А вот «канделябры» где?

      И по поводу самого сервиса. Не знаю как он работает, маленький лимит не дает толком протестировать, может позже пополню баланс. Но юзабилити — жуть. Примитивная страница кластеризации не влезает в экран (> 2/3 места при этом — пустота, огромные отступы либо необязательные / дублирующиеся поля). Варианты «или» мало того, что не очевидны, так еще и по-разному оформлены. Все заполнил, нажал кнопку запуска — открылось модельное окно регистрации. Заполнил форму — обратно выбило страницу кластеризации. Часть полей при этом были сброшены (хорошо хоть не все). «Сравнение ТОПов» для интереса кликнул по «Задать точным числом» — ползунок при этом стал полностью серым, не сразу понял что он не неактивный (а просто так выглядит в сброшенном виде). Зачем это «точное число» вообще надо, если его можно задать ползунком (избыточность). «Яндекс (Москва) Google (Москва)» — не сразу понял как менять регион. Оказывается есть огромная кнопка ниже, но ее не сразу видно. Убирайте эту кнопку (избыточность), делайте регион подчеркнутым: «Яндекс (Москва) Google (Москва)» — проблем не будет (я вообще underline предпочитаю только для ссылок, а для диалоговых окон — пунктирное подчеркивание через нижний border). После регистрации и дозаполнения сброшенных полей опять нажимаю кнопку «запустить» — вроде что то грузится. Но непонятно, это так и должно быть, или глючит. Секунд 15 «грузилось», нажимал кнопку еще пару раз. Спустя некоторое время обновился список задач. Непонятно — это оно так работает или просто баг был. Это по памяти за 5 минут пользования 1 страничкой. Может сервис и хорошо работает, но с первой пробы «не очень» все удобно. ИМХО!
        0
        Спасибо за интерес к статье, сервису и развернутый комментарий :)

        Пишете «картина для спальни купить» и «картины для спальни». И тут уже «картины для спальни» и «картина для спальни купить» (наоборот). И сразу уже не понятно что тут «первое», а что «второе».

        — Пример с этими фразами мы привели, чтобы показать разницу в поисковой выдаче и, как следствие, невозможность продвижения подобных запросов на одной странице. Все дело в разном поисковом интенте. Кластеризация позволяет более точно сгруппировать фразы, а не гадать «по логике». В пояснении мы указали, что «у фразы «картины для спальни» коммерческий интент (пользователь выбирает товар), а у фразы «картина для спальни купить» — транзакционный (пользователь выбрал картину и готов ее купить)».
        Вроде бы путаницы не должно быть)

        Признак «время» сразу отсеиваем. Сюда попали слова, относящиеся к «поводу». Это вручную смотрели или как определили?

        — Да, вручную, тут только логика работает. Кнопка «Разработать структуру сайта» была бы полезной, но увы – пока не изобрели) приходится работать руками и головой. Ну и инструменты по мере возможности подключать.

        По-нормальному надо было делать на экспериментальном сайте, и выложить действующий пример «до» и «после»

        — Мы показали применение методики на реальном примере.
        Задача была в том, чтобы описать логику процесса. Ключевой месседж — при проработке структуры нужно учитывать интент целевой аудитории. Если, условно, 80% пользователей ищут подсвечники на день рождения, то именно этот пункт нужно вынести на видное место и заточить под него страницу. Другой вопрос – определить эти потребности. Тут уже собираем семантику, кластеризуем. А чтобы в голове у проектировщика не было ада от обилия ключей, лемматизируем семантику – это чисто вспомогательная техника, которая позволяет упорядочить гору фраз и ничего не упустить.

        Деревянные подсвечники» понятно куда ушли. А вот «канделябры» где?

        — Канделябры ушли в Товары, по аналогии с подсвечниками. Просто там длинный перечень, не хотели делать скрин-сосиску)

        по поводу самого сервиса. Не знаю как он работает, маленький лимит не дает толком протестировать

        — Рассмотрим возможность увеличения бесплатного лимита по инструменту для тестирования. По работе сервиса предлагаем детальный гайд с примерами blog.promopult.ru/seo/kak-sgruppirovat-klyuchevye-zaprosy-s-pomoshhyu-klasterizacii.html

        Все заполнил, нажал кнопку запуска — открылось модельное окно регистрации. Заполнил форму — обратно выбило страницу кластеризации. Часть полей при этом были сброшены (хорошо хоть не все)». «Зачем это «точное число» вообще надо, если его можно задать ползунком (избыточность).


        Еще раз спасибо за эти и другие замечания по работе сервиса, обязательно передадим разработчикам.
          0
          Вроде бы путаницы не должно быть)
          Я другое имел ввиду:
          Например, фразы «картина для спальни купить» и «картины для спальни» при группировке на основе семантики наверняка бы попали в одну группу.

          Далее:
          А все потому, что у фразы «картины для спальни» коммерческий интент (пользователь выбирает товар), а у фразы «картина для спальни купить» — транзакционный (пользователь выбрал картину и готов ее купить).

          И ссылка на них:
          Поэтому выдача по первой фразе содержит фото, подборки идей и страницы с товарами, а по второй — только страницы интернет-магазинов.

          И тут по ходу чтения я задумался — первая фраза это «картина для спальни купить» или «картины для спальни»? Посмотрел на скриншот, перечитал еще раз, понял. На самом деле, эта мелочь не стоит такого внимания. Но некоторые люди, как и я, все же могут «подвиснуть» на таком моменте.

          — Канделябры ушли в Товары, по аналогии с подсвечниками. Просто там длинный перечень, не хотели делать скрин-сосиску)
          Это понятно. Я имел ввиду конечную структуру (предпоследний скрин). Просто интересно куда их засунули. Как подкаталог свечей?

          Спасибо за развернутый ответ.
            0
            — Пример с этими фразами мы привели, чтобы показать разницу в поисковой выдаче и, как следствие, невозможность продвижения подобных запросов на одной странице. Все дело в разном поисковом интенте. Кластеризация позволяет более точно сгруппировать фразы, а не гадать «по логике». В пояснении мы указали, что «у фразы «картины для спальни» коммерческий интент (пользователь выбирает товар), а у фразы «картина для спальни купить» — транзакционный (пользователь выбрал картину и готов ее купить)».
            «невозможность продвижения подобных запросов на одной странице» — SEO оптимизатором работал лет 15 назад, мои знания уже могут быть изрядно неактуальными. Но все же мне кажется их вполне успешно можно продвигать на одной странице. Другое дело:

            1. Нужны ли нам сейчас такие посетители? Или пока лучше дожать транзакционные запросы. Бюджеты то лимитированы.
            2. Насколько мы готовы менять контент страницы в сторону удаления ее от транзакций? Иначе будут плохие поведенческие из-за тех, кто пока просто интересуется.

            Т.е. технически тут проблем вроде нет. Проблема просто в целесообразности. Кто хочет покупать — тому корзину в руки. Кто просто интересуется — полезную страничку блога, со ссылками на разделы и тематические товары. И то, если у компании есть деньги на «прикормку». Как-то так.
              0
              Я имел в виду конечную структуру (предпоследний скрин). Просто интересно куда их засунули. Как подкаталог свечей?

              — Да. Товаров много, а меню «Каталог» перегружать не хотели, поэтому сформировали укрупненные категории и по ним уже разносили товары. Раньше канделябры и подсвечники были на одной странице, теперь на разных – каждая страница заточена под свою семантику. В пункте «Подсвечники» теперь «Канделябры», «Менора», «На одну свечу» и т. п.
              пока лучше дожать транзакционные запросы. Бюджеты то лимитированы.

              — В идеале лучше работать в комплексе — делать контент под разный интент и «цеплять» пользователей на разных этапах воронки. Например, по фразе «картины для спальни» выдача смешанная, много результатов вроде «100 лучших идей», «картины в интерьере» и т. п. Выйти в ТОП по этой фразе больше шансов у тех, кто делает именно такой полезный контент. Ну а бюджет — дело субъективное. У кого-то он есть, у кого-то его нет. Тогда уже нужно смотреть по ситуации. Понятно, что при бюджете в пару тысяч рублей в месяц заказывать лонгриды было бы странно. Тут нужно сайт довести до ума, провести базовую оптимизацию, устранить ошибки, проработать семантику, наполнить критически важным контентом — на главную, в разделы каталога и т. п. А потом уже по мере возможности развивать.
              Насколько мы готовы менять контент страницы в сторону удаления ее от транзакций?

              — это далеко не всегда нужно. Суть в том, чтобы правильно распределить запросы по страницам. Например, запрос «картины для спальни купить» уходит на страницу с товарами «Картины для спальни» — прописываем тайтл «Купить картины для спальни». А под запрос из ядра «картины для спальни» делаем подборку идей использования картин для спальни и размещаем эту статью в блоге. В любом случае смотрим по ситуации. Возможно, в блоге уже есть подобная статья, но низкого качества — тогда дооптимизируем ее. Кстати, в одной из следующих статей как раз расскажем про дооптимизацию блога. Так что следите)
          0
          Для интернет-магазина собрано и вычищено от «мусора» и «пустышек» семантическое ядро на 1000 фраз
          — и в самой первой же строке ключ «искусственные цветы из». Гениально. Сразу видно работал профессионал и дальше можно не читать.
            0
            Спасибо за замечание.
            В самом начале цель была не отшлифовать ядро до идеала, а собрать ключи, которые будут:
            а) относиться к тематике конкретного магазина,
            б) характеризовать потребности аудитории и не быть «нулевыми».
            Парсер выдал ключ в таком виде — для исходного списка это не имеет решающего значения. При лемматизации этот ключ раскладывается на «искусственный» и «цветы». И именно эти части нам важны для формирования структуры. А на этапе постановки ТЗ авторам подобные ключи легко корректируются.

          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

          Самое читаемое