Как стать автором
Обновить
50
0
Антон Сердюк @m00t

Software Engineer

Отправить сообщение

PHP под С-шным дебаггером: копаемся внутри Zend Engine

Время на прочтение6 мин
Количество просмотров5.2K
Как-то пришлось мне столкнуться с проблемой: веб-краулер на PHP работает себе нормально, работает, а потом вдруг (через 3-6 часов работы) перестает что-либо делать и начинает кушать 100% CPU. Как искать такую проблему? Как узнать, где он зацикливается? А что если подключиться к PHP сишным дебаггером и узнать оттуда все, что необходимо? Подробности под катом.
Читать дальше →
Всего голосов 82: ↑78 и ↓4+74
Комментарии41

Определение кодировки текста в PHP, часть 2 — биграммы

Время на прочтение3 мин
Количество просмотров8.1K
В прошлой статье был реализован алгоритм автоматического определения кодировки текста на основе частот распределения символов. В комментариях отметили: если использовать биграммы (триграммы), результат будет более точный. Тогда я отмахнулся, мол, и на одиночных символах неплохой результат получается. Но сейчас подумал, что неплохо было бы добавить надежности и точности в алгоритм, тем более использование биграмм вместо одиночных символов сильно кушать не просит.

Под катом — пример реализации алгоритма на биграммах, исходники и результаты его работы.
Читать дальше →
Всего голосов 62: ↑61 и ↓1+60
Комментарии30

Версионная миграция структуры БД: от теории к практике

Время на прочтение3 мин
Количество просмотров12K
В топике рассматривается еще одна простая система версионирования структуры БД, а также ИМХО, почему нам не подходят другие.
Читать дальше →
Всего голосов 31: ↑25 и ↓6+19
Комментарии68

Определение кодировки текста в PHP — обзор существующих решений плюс еще один велосипед

Время на прочтение7 мин
Количество просмотров104K
Столкнулся с задачей — автоопределение кодировки страницы/текста/чего угодно. Задача не нова, и велосипедов понапридумано уже много. В статье небольшой обзор найденного в сети — плюс предложение своего, как мне кажется, достойного решения.

1. Почему не mb_detect_encoding() ?


Если кратко — он не работает.
Подробнее - под катом
Всего голосов 115: ↑104 и ↓11+93
Комментарии82

Zend_Search_Lucene + PHPMorphy — это просто

Время на прочтение2 мин
Количество просмотров2.7K
Когда-то смотрел документацию по Zend_Search_Lucene. Все хорошо, все понятно. Бери и встраивай в свой сайт. Только вот ни слова там нету про то, каким образом прикрутить стеммер или морфологический анализатор к этой штуке. На деле оказалось, что подружить его, например, с PHPMorphy, очень просто.
Собственно, как это сделать — под катом.
Заметка в первую очередь будет полезна разработчикам, перед которыми проблема полнотекстового поиска на сайте еще не стояла.
Тут вы не найдете мануала по настройке Lucene или PHPMorphy — этой информации и так предостаточно в интернете.

Читать дальше →
Всего голосов 15: ↑12 и ↓3+9
Комментарии3

Информация

В рейтинге
Не участвует
Дата рождения
Зарегистрирован
Активность