snakers412 июн 2017 в 18:24

Очень грубый подход к определению языка человека (или как понять язык человека по обычной корпоративной базе)

5 мин

4.2K

Growth Hacking * Веб-аналитика * Интернет-маркетинг * Повышение конверсии *

Комментарии 6

Tortortor 13 июн 2017 в 04:42

как раз байеса я в вашей работе и не увидел. ни критериев, ни весов. ни обучения, ни проверки.

snakers4 13 июн 2017 в 04:47

Так написано же — применяем последовательно эвристики, которые предполагают к примеру, что вероятность, что человек китаец, если у него домен почтовый — qqq, стремится к 99%.

Чтобы сделать такую же работу 100% научно — нужно собрать очень основательную статистику, что я не смог сделать за 2 часа, которые у меня были на эту задачу.

Поэтому статья и называется «Очень грубый подход».

Про проверку — это можно сделать, если бы у компании в базе было на порядок-два больше адресов почты, но это в принципе нецелесообразно в данных условиях.

Tortortor 13 июн 2017 в 05:51

если «применяем последовательно эвристики», то зачем пол-статьи про байеса?

snakers4 13 июн 2017 в 06:26

Кто не знает про него заинтересуется и мир станет чуточку светлее

Hedgehogues 14 фев 2018 в 06:34

Такое ощущение, что раньше эту статью я видел на хабр. Ну, да ладно. Вопрос задам.

Даже в Вашем примере, мне не совсем понятно, как Вы расставляет веса? Берете их с неба? поясните пожалуйста

snakers4 14 фев 2018 в 06:42

Я был в бане на Хабре. Мб все что было до этого, стало непублично, а как я вышел из бана — вернулось, а рассылка это edge кейс и там timestamp не из той таблицы берется.

> Даже в Вашем примере, мне не совсем понятно, как Вы расставляет веса? Берете их с неба? поясните пожалуйста

Еще тупее — если X, то Y. Условно набор правил, которые применяются со 100% вероятностью

Зарегистрируйтесь на Хабре, чтобы оставить комментарий