Списки для рассылок: цивилизованный сбор и чистка списков

    Пост больше подходит для хаба «Спам и антиспам», но глобально пост все-таки для оффтопика «Я пиарюсь».

    Недавно у меня появилась задача по сбору адресов email школ для приглашения участия в межшкольных конкурсах. На Хабре было несколько постов, посвященных сбору email с коммерческих и некоммерческих сайтов. Ни одного действительно эффективного и цивилизованного варианта для автоматического или полуавтоматического варианта я не видел, хотя периодически такая необходимость возникает. 99% инструментов – генераторы email и «продажные базы», либо десктопные глючные софтины, которыми пользоваться нет никакого желания.

    Лирическое отступление. Тема спама и антиспама – очень тонкая грань, поэтому сразу дам определение: цивилизованный (или деликатный) способ – в плане уважения к тем, кто будет получать рассылку. Ручной вариант составления списка самый оптимальный, но скорость современной жизни вынуждает автоматизировать все, что можно, т.к. задача любой рассылки – проинформировать большое число людей за минимальный срок.

    Пару недель назад ко мне обратился разработчик сервиса spider-post.com, который решает эту задачу. Он предложил мне протестировать ресурс и разместить обзор на Хабре. Я согласился, т.к. тема мне интересна, а аналогичных инструментов я не нашел. Буду рад увидеть в комментариях ссылки на другие сервисы.

    Все ваши вопросы будут переданы авторам разработки. Ответы на них появятся в комментариях.

    Вариант компромиссного решения задачи сбора email мне виделся таким:
    • по определенным критериям отобрать сайты, имеющие отношение к вашему бизнесу;
    • забрать с них email;
    • проверить на валидность;
    • провести чистку вручную от email, вид которых вызывает сомнения;
    • сделать пробную рассылку с предложением подписаться на постоянной основе.


    Spider Post использует похожий подход.

    • вы выбираете регион и задаете списки ключевых фраз, которые характеризуют ваш бизнес;
    • сервис отбирает по указанным параметрам сайты в поисковых системах и собирает списки email. Готовый список можно получить в течение нескольких часов. Как утверждает разработчик, сервис анализирует то, что написано после «@» и проверяет, жив ли сайт и email, каков возраст ресурса, является ли он коммерческим;
    • после этого списки можно скачать и почистить вручную (в отчете присутствуют так же и адреса сайтов, чтобы провести чистку эффективнее).


    Я провел тестирование по нескольким темам, в которых что-то понимаю (средние школы, люминофоры, охрана периметра). Результаты и выводы ниже.

    Скриншот страницы выполненного заказа:


    Подробная информация по результатам:


    Впечатление неоднозначное.
    1. Задавал узкоспециализированные запросы, чтобы минимизировать возможность попадания в итоговый список мусора.
    2. Во всех случаях база email получалась с десятками тысяч адресов и большим количеством «странно выглядящих» email.
    3. «Прошерстить» такой документ вручную просто нереально, а большая часть рынка B2B вряд ли может похвастаться таким числом участников, а соответственно, и email.


    Несколько советов разработчикам по функционалу. Что хотелось бы добавить в функционал:
    1. Возможность использования языка запросов поисковых систем, благодаря которому получится сузить число сайтов для отбора.
    2. Сбор дополнительной информации. Кроме адреса сайта – рубрику и его описание из Я.Каталога или из выдачи поисковика.
    3. Возможность указать, с каких именно сайтов нужно собрать адреса (например, по моей задаче со школами есть федеральные ресурсы)


    Эти простые дополнения уменьшат процент мусора в списках и упростят дальнейшую его чистку.
    • –3
    • 1,4k
    • 9
    Поделиться публикацией
    Комментарии 9
      +1
      Я правильно понимаю, что собираются все email с сайтов, подпадающих под поисковый запрос?
      То есть какой-нибудь простой форум, размещенный на школьном сайте даст кучу адресов, к школе отношения не имеющих
        –2
        Именно так и получилось. Поэтому список, созданный в итоге сервисом, для меня оказался непригоден. Я собрал нужный список вручную.
          +1
          Надо ввести опцию — «Только с главной страницы».
            –2
            Я вот подумал, что еще нужен инструмент для фильтрации и работы с созданным списком. Фильтр по доменам, по сайтам, по названиям.
              0
              Про то с каких страниц собираются адреса, Получил ответ от разработчиков:
              проверяются страницы: главная, контакты, а так же все страницы первого уровня, так как на коммерческих сайтах, а именно они в первую очередь наша цель, контакты, как правило, расположены на страницах первого уровня.
          +1
          Топик о том, как купить автоматически собранную базу адресов по какой либо тематике. Жалко что мне кармы не хватает влепить минус вам.
            –4
            Один и тот же инструмент можно использовать и во благо, и во вред. С помощью топора можно создать дом, а можно и ногу отрубить. Я вполне отдаю себе отчет, что тема спама и антиспама — очень больная. Именно поэтому я описал, для чего я искал подобный инструмент.

            Если посмотреть хаб «спам и антиспам», можно найти массу постов, которые так или иначе посвящены сбору email. Ценность этих публикаций будет у каждого своя.

            Надеюсь на понимание.
            0
            А если это не очень большой секрет, скажите, а каковы размеры цен за данную услугу. Что-то на сайте я не нашел этой информации
              0
              Про стоимость собранных email ответ разработчиков: цена $5 за 1000 штук.

            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

            Самое читаемое