В статье рассмотрим, как и зачем применять mapping. Нужен ли он вообще и в каких случаях. Я приведу примеры его установки, а так же постараюсь поделиться некоторыми полезными хитростями, которые могут помочь вам в усовершенствование поиска на вашем сайте.
Всем, кому интересен современный поисковый движок ElasticSearch, прошу под кат.
Вопрос умной категоризации чего-либо встаёт остро при разработке очень многих сайтов. Конечно, всегда можно отдать это на заполнение человеку и результат поначалу будет куда лучше машинного, но, что если категоризировать нужно в реальном времени сотни и тысячи «товаров».
Придется отдать это на откуп машине. Тут вариантов не так много, а написание собственного ИИ для 99.9% задач пустая трата времени.
Заинтересовавшимся как это решить с помощью ElasticSearch прошу под кат.
Когда автор пишет пост на хабре, он старается дать читателям максимально полную и полезную информацию по теме. А вот если правильного ответа или решения нет? Тогда этот пост просто пища для ума, а ценность заключается в коллективном разуме.
Зашел я из далека, не спорю, но надеюсь на ваше понимание и поддержку. Озвучивая решения повседневных проблем разработчика, в частности на фреймворке Yii, я предлагаю решение нашей команды. При этом, интересуют идеи сообщества. Ну, довольно пудрить вам мозги.
Вперёд.
Буквально пару абзацев я уделю внимание особенностям взаимодействия этой библиотеки с фреймворком Yii, остальное же в полной мере универсально и будет интересно всем, кто использует или планирует использовать эту библиотеку.
Если вы уже хорошо знакомы с Purifier, то можете смело начинать читать отсюда
Немного о HTML Purifier
Если вы не слышали о такой прекрасной библиотеке (а поиск на Хабре говорит о не такой уж большой популярности) как HTML Purifier, то советую обязательно к ней присмотреться, особенно если ваши пользователи генерируют контент в html формате. Это может быть рядовой пользователь, модератор или даже администратор.
Что же делает эта библиотека?
Согласно конфигурации она очищает любой html код от всех вредоносных, невалидных, запрещенных (вашей конфигурацией) частей кода, в том числе отдельные атрибуты.