shamanis Jun 4 2012 at 08:11

Класс для реализации UNIX-демонов на PHP

5 min

2.5K

PHP*

From sandbox

+36

102

Comments 102

mejedi Jun 4 2012 at 08:29

posix_kill($this->getPID(), 9);

Может не стоит сразу SIGKILL посылать?

shamanis Jun 4 2012 at 08:32

Честно, не вдавался в подробности сигналов. Почитаю на досуге подробней, исправлю и закомичу в репу. Там же вроде SIGTERM нужно посылать?

mkaz Jun 4 2012 at 08:40

От целей зависит. Мне вот субъективно кажется, что в рассматриваемом случае KILL вполне уместен.

mejedi Jun 4 2012 at 08:46

В смысле демон на PHP по определению настолько убог, что ему никогда не потребуется выполнить какую-либо зачистку перед остановкой?

mkaz Jun 4 2012 at 08:46

Да, можно и так читать.

DmitryKoterov Jun 4 2012 at 11:29

9-й сигнал, к сожалению, и правда лучше как можно реже использовать — потому что не все ресурсы IPC, занятые процессом, освобождаются при такой смерти. Например, семафоры и страницы shared memory нужно явно освобождать (что демоны часто делают в своих обработчиках смертельных сигналов). Я сам в такое не верил, пока не убедился на собственном опыте (в моем случае в какой-то момент ни одного процесса apache в живых не осталось, т.к. я все убил по 9-му сигналу, но ресурсы занимались и переполнились — man ipcs).

mkaz Jun 4 2012 at 11:32

Вот с этим точно не поспоришь — на неосвобожденные IPC'шные очереди и семафоры, например, я и сам насмотрелся, была возможность.

mkaz Jun 4 2012 at 08:38

Да раз уж метод stop() называется, вполне логично kill -9 послать. Вот если бы был метод kill(), то аргумент с номером сигнала был бы очень уместен.

mejedi Jun 4 2012 at 08:42

Речь не о том, чтобы кастомизировать посылаемый сигнал. Разницу между SIGKILL и SIGTERM знаете?

shamanis Jun 4 2012 at 08:44

Исправил на SIGTERM. Проверил. Закоммитил.

mkaz Jun 4 2012 at 08:45

Знаю конечно. Вы когда процесс убиваете обычно, просто kill ему шлете? У меня вот стопроцентная привычка: если уж дошло до убийства, то KILL и послать. Понятно, что у вас могут быть умные красивые демоны, которые в ответ на SIGTERM запишут логи, дампы, отправят отчет по e-mail и xmpp и мирно завершатся. Ну тогда и измените метод stop().

shamanis Jun 4 2012 at 08:47

Вот над этим нужно подумать еще. Как бы это первая еще «сырая» версия. Я по-этому и опубликовал, чтобы узнать мнение чего здесь не хватает.

mejedi Jun 4 2012 at 08:55

Есть набор соглашений, которых рекомендуется придерживаться при разработке демонов. SIGTERM для завершения, SIGHUP для обновления конфигурации и тп.

Правильный демон можно использоваться совместно с системой типа launchd или xinetd — и получать такие плюшки как on demand запуск и автоматический рестарт при падении.

dsd_corp Jun 4 2012 at 16:09

Ну так-то оно так, но это скорее уже к системным сервисам относится, чем к демону как таковому.
Здесь, как я понимаю, автор привел схему простейшей демонизации php-скрипта, главнейшая цель которой — отвязать скрипт от терминала и дать ему работать в фоне «вечно». Со своими обязанностями класс справляется.
Предложенные вами вещи конечно неплохо бы дописать(коль уж вываливаем на всеобщее обозрение в репозитарий), но пусть они тогда будут отключаемыми.
Ну может конфиг при создании класса передавать какой с настройками.
У меня еще при стартах демонов выполняются такие вещи:

ini_set("max_execution_time", "0");
ini_set("memory_limit", "-1");
ob_implicit_flush();
define("IS_WIN", (stristr(php_uname('s'), 'windows')==FALSE)?false:true);

Если IS_WIN, то демонизация не происходит — запускается просто как консольный скрипт. Винда — это отладочный полигон.

=====================

Ну и еще допишу, это уже не на ваш комментарий, а автору поста на заметку(лениво новый камент писать).

У меня при создании подробнейших логов(tcp-сервер все-таки, писать в логи всегда есть чего) как-то обнаружилось, что логи больно дофига места занимают. И соответственно потом при жалобах, что кто-то чего-то не смог разобраться в системе, когда надо лезть в логи и смотреть, чего там юзер куда клацал и куда ломился, оказывается, что скакать по большим логам в общем-то удовольствие сомнительное.
Поэтому были дописаны некоторые авто-функции:

Тыц сюда

  function gen_log_subdir() {
     $tmv=time();
     return sprintf('%08X_', $tmv).date("dmY_His", $tmv);
  }

  function check_log_subdir($tsize=100000000) {
     $root=$this->log_dir.$this->log_subdir;
     $res=0;
     if ($dir = @opendir($root)) {
        while (($file = @readdir($dir)) !== false) {
           $fn=$root.$file;
           if (is_file($fn)) {
               $res+=@filesize($fn);
               if ($res>$tsize) break;
           }
        }
        @closedir($dir);
     }
     $this->log_add=sprintf('%10u', $res);
     return ($res<$tsize);
  }

  function get_log_subdir() {
     $suf=($this->log_subdir=='')?'_':'';
     while ($this->log_subdir=='' || !$this->check_log_subdir()) {
        $this->log_subdir=$this->gen_log_subdir().$suf.'/';
     }
     $lsd=$this->log_dir.$this->log_subdir;
     if (!file_exists($lsd)) mkdir($lsd);
     return $this->log_subdir;
  }

  function log_subdir() {
     return $this->log_dir.$this->get_log_subdir();
  }

  function print_log($str) {
    $this->log_file=$this->log_subdir()."daemon.log";
    $fp = @fopen ($this->log_file, "ab");
    if (!$fp) return false;
    if (@flock($fp, LOCK_EX)) {
      if ($str!='') $str=date("[d-m-y H:i:s] ").'['.$this->log_add.']'.$str;
      fputs ($fp, $str."\n");
      @flock($fp, LOCK_UN);
    } else {
      @fclose ($fp);
      return false;
    }
    @fclose ($fp);
    return true;
  }

Привожу их как есть, красиво форматировать «для всех» некогда. Впрочем это просто идея, реализация может быть и другой, более продуманной.
Смысл этих функций — писать логи, разбивая их на куски.
То есть мы при старте создаем субдиректорию с человекочитаемой временной меткой и символом '_' в конце имени, пишем в нее логи. Как только размер логов в этой субдиректории достигают заданного размера, мы генерим новую субдиректорию с временной меткой в имени, но уже без '_' в конце, и продолжаем писать логи уже в нее. И так далее.
Метка '_' в имени ставится только первой субдиректории при старте демона, поэтому глядя в подкаталог логов можно сразу видеть в какое время был старт(рестарт) демона.
Если нужно найти логи за определенное время, в списке поддиректорий сразу можно понять, в какую надо идти и какой лог смотреть. Это удобнее, чем гигабайтные портянки логов листать.
Подробные логи всегда дублируются общим неподробным. Туда пишутся только имена пришедших комманд и временные метки. В результате на 100метровую директорию неподробный лог метра четыре весит. По нему быстро можно глянуть, в какое точно время началась активность нужного юзера, а потом уже по этой метке найти в подробном логе все параметры комманд, ответы сервера и т.п.

Пример листинга директорий с логами

4EC2691D_15112011_162901_
4EC67040_18112011_174832
4ECCC14D_23112011_124757
4ED24B49_27112011_173801
4EDD37F5_06122011_003029
4EE1ACA0_09122011_093720
4EE71107_13122011_114703
4EEC5EEC_17122011_122044
4EF086F2_20122011_160034
4EF33912_22122011_170506
4EF73ED1_25122011_181841
4EF9AC85_27122011_143117
4EFBBD1F_29122011_040639
4EFDD4F1_30122011_181249
4F02CB36_03012012_123238
4F09DBA9_08012012_210841
4F0ED584_12012012_154348
4F15046A_17012012_081730
4F1A7124_21012012_110244
4F1FA0B1_25012012_092657
4F24ECC9_29012012_095257
4F28E8F9_01022012_102545
4F2E7DBE_05022012_160150
4F32BCD4_08022012_212004
4F3810BF_12022012_221927
4F3CD2EE_16022012_125702
4F42007B_20022012_111243
4F475F9E_24022012_125958
4F4C8C59_28022012_111209
4F50E0EB_02032012_180203
4F55E8A6_06032012_133622
4F5739F0_07032012_133528_
4F5754EA_07032012_153034
4F5B9B13_10032012_211859
4F5CEAAB_11032012_211051
4F6192AD_15032012_095645
...

Первые 8 HEX-символов это unix timestamp, который далее идет расшифрованным, как [uts_дата_время].
По меткам '_' видим, что демон стартовал 15.11.2011 в 16:29:01, работал несколько месяцев, был перезапущен 07.03.2012 в 13:35:28 (обновление исходников, поддержка новых комманд).

В основном коде сервака вызывается только функция print_log(), как-то так:

$daemon->print_log("alarm! very important tcp-client connected") ;

А там оно само разбирается, в какой лог в какой поддиректории писать.

В результате(пример из реальных данных) в неподробном логе появляется что-то типа:

[04-06-12 15:43:00] [     19410][check_logged_in 1CE9020C55E72313CD0EDEF5E3AC3058] :KEY_9
[04-06-12 15:43:00] [     24273][db_set_value 1CE9020C55E72313CD0EDEF5E3AC30585F1A34060BD5|confirmed|1] :KEY_9

А в подробном такое(две принятые комманды и отосланные ответы на них):

Тыц мышей

[06-04-12 15:43:00] received from 192.168.50.18:3060 [KEY_9]:
0x00000000  2A 00 00 37 00 00 00 01 00 00 00 00 00 00 00 00  *..7............
0x00000010  04 00 00 0F 63 68 65 63 6B 5F 6C 6F 67 67 65 64  ....check_logged
0x00000020  5F 69 6E 04 00 00 20 31 43 45 39 30 32 30 43 35  _in....1CE9020C5
0x00000030  35 45 37 32 33 31 33 43 44 30 45 44 45 46 35 45  5E72313CD0EDEF5E
0x00000040  33 41 43 33 30 35 38                             3AC3058

Data:
array (
  0 => 'check_logged_in',
  1 => '1CE9020C55E72313CD0EDEF5E3AC3058',
)


[06-04-12 15:43:00] sended to 192.168.50.18:3060 [KEY_9]:
0x00000000  2A 9B 00 0C 00 00 00 01 00 00 00 00 00 00 00 00  *›..............
0x00000010  02 00 00 02 00 C8 04 00 00 02 4F 6B              .....И....Ok

Data:
array (
  0 => 200,
  1 => 'Ok',
)

[06-04-12 15:43:00] received from 192.168.50.18:3060 [KEY_9]:
0x00000000  2A 00 00 52 00 00 00 01 00 00 00 00 00 00 00 00  *..R............
0x00000010  04 00 00 0C 64 62 5F 73 65 74 5F 76 61 6C 75 65  ....db_set_value
0x00000020  04 00 00 2C 31 43 45 39 30 32 30 43 35 35 45 37  ...,1CE9020C55E7
0x00000030  32 33 31 33 43 44 30 45 44 45 46 35 45 33 41 43  2313CD0EDEF5E3AC
0x00000040  33 30 35 38 35 46 31 41 33 34 30 36 30 42 44 35  30585F1A34060BD5
0x00000050  04 00 00 09 63 6F 6E 66 69 72 6D 65 64 04 00 00  ....confirmed...
0x00000060  01 31                                            .1

Data:
array (
  0 => 'db_set_value',
  1 => '1CE9020C55E72313CD0EDEF5E3AC30585F1A34060BD5',
  2 => 'confirmed',
  3 => '1',
)


[06-04-12 15:43:00] sended to 192.168.50.18:3060 [KEY_9]:
0x00000000  2A E3 00 17 00 00 00 01 00 00 00 00 00 00 00 00  *г..............
0x00000010  02 00 00 02 00 C8 06 00 00 0D 04 00 00 02 49 44  .....И........ID
0x00000020  02 00 00 03 01 09 98                             ......

Data:
array (
  0 => 200,
  1 => 
  array (
    'ID' => 67992,
  ),
)

Заголовок пакета — 16 байт. То есть каждая первая строчка HEX-лога.
Все, что передано в пакете после заголовка, «расшифровывается» сразу за дампом пакета.

Imenem Jun 4 2012 at 08:32

А почему все методы объявлены финальными? А если я хочу, например, изменить папку, в которую пишутся логи или имена файлов логов? Или вместо echo «Starting...\n»; пробросить в конструктор логгер и сделать $this->logger->log(«Starting...\n»);?

shamanis Jun 4 2012 at 08:39

Для изменения путей к логам есть методы setLog() и setErr()

Imenem Jun 4 2012 at 08:50

Вопрос все-таки был «почему все финальное, особенно конструктор». Сеттеры и цепочки методов это конечно хорошо, DI-контейнеры позволяют описать инициализацию один раз и забить, но все-равно, я не вижу смысла лишать этот класс возможности перегрузки методов.

shamanis Jun 4 2012 at 08:54

Хм. Возможно вы и правы. А вот с конструктором я наверное просто погорячился.

azverin Jun 4 2012 at 08:43

Мне кажется не очень корректным вывод информации через echo.
Лучше просто вернуть строку, а что с ней делать уже распорядится тот, кто вызывает функцию.

shamanis Jun 4 2012 at 08:46

Какую строку? «Starting...\n» вот эти строки? Они как бы выводятся на консоль и отображают процесс запуска/остановки демона, ну и естественно выводят статус. Я думаю логично, если человек запрашивает php run.php status вывести ему информацию в консоль.

azverin Jun 4 2012 at 09:10

Выводом в консоль заведует метод handle — там по логике и должен быть вывод echo.

Как то так:

final public function handle($argv) {
        switch ($argv[1]) {
            case 'start':
                echo $this->start();
                break;
            case 'stop':
                echo $this->stop();
                break;
[...]

shamanis Jun 4 2012 at 09:11

Кстати да. Хорошая мысль. Нужно так и сделать. Благодарю.

kix Jun 4 2012 at 09:01

Забавно, хабрапарсер съел @-теги в докблоках, заменив их на разметку .

kix Jun 4 2012 at 09:02

… разметку <hh user="">

shamanis Jun 4 2012 at 09:02

Ага. Даже не знаю как исправить теперь.

azverin Jun 4 2012 at 10:05

Наверное так: @param
& # 64; без пробелов

shamanis Jun 4 2012 at 10:07

Благодарю. Помогло. Надо будет запомнить на будущее.

Anonym Jun 4 2012 at 09:17

И еще \n было бы неплохо заменить на PHP_EOL

shamanis Jun 4 2012 at 09:28

Тоже над этим думал. Руки не дошли. Сделал.

Fedcomp Jun 4 2012 at 09:31

а не подскажите для чего?

Anonym Jun 4 2012 at 09:35

В разных ОС символ конца строки разный. Если не ошибаюсь, в linux это \n, в macos \r, в windows \r\n.

josser Jun 4 2012 at 17:09

Я угадал ваш возраст по комментарию! )
\r в макос было до версии 9, в mac os x уже тоже \n

Fedcomp Jun 4 2012 at 09:30

есть еще нечто подобное phpdaemon.net/

DaleMartinWatson Jun 4 2012 at 09:31

Меня одного коробит при использовании слова «демон» в контексте программы? Неужели не существует более удачного перевода этого термина?

Yak52 Jun 4 2012 at 09:37

Устоявшийся термин еще со времен первых Юниксов.

DaleMartinWatson Jun 4 2012 at 10:13

Я знаю, но меня все ровно коробит. Хотя отрицать то, что PHP связано с демонами и прочей нечистой силой я не буду.

unwrecker Jun 4 2012 at 12:38

Ну да, сотрудникам патриархии стоит воздержаться от просмотра прав на файлы в бинарном представлении в юникс-системах:)

sefus Jun 4 2012 at 09:54

А про «зомби» слышали?

shamanis Jun 4 2012 at 10:01

Ага. Юникс кишит «зомби», «демонами» и прочей нечестью :)

IonianWind Jun 4 2012 at 12:36

Суть в том, что это название в *nix системах восходит еще к масвелловскому демону, так что перевод адекватен

dsd_corp Jun 4 2012 at 10:51

У меня используется такой же класс для демонизации. Ну понятно, что отличия есть, но реализовано все то же самое.
Вот статус проверять по-моему лучше, не только смотря файл с пидом, но и «пингуя» сам процесс:
У меня это сделано так:

  function check() {
     $pid = $this->read_pid();
     if ($pid>0 && posix_kill($pid, 0)) return true;
     return false;
  }

И еще КМК лучше реализовать реакцию на сигналы, приблизительно так:

  function sig_handler($signo) {
       $func=$this->term_func;
       switch ($signo) {                   
           case SIGTERM:
               // handle shutdown tasks
               $this->daemon_del_pid();
               exit;
               break;
           case SIGHUP:
               // handle restart tasks
               break;
           default:
               // handle all other signals
       }
       if ($func) $func($signo);
  }

И в методе demonize() уже где-то после второго posix_setsid() привязать сигналы приблизительно таким образом:

for ($i=1;$i<=SIGTERM;$i++) @pcntl_signal($i, SIG_IGN);

Здесь $this->term_func это поинтер на внешний обработчик сигналов. Т.к. у вас внешняя main() реализована переопределением метода run(), то вы так же можете и этот обработчик сигналов реализовать по-своему.

shamanis Jun 4 2012 at 11:01

Обработку сигналов я тоже думаю сделать. На днях поковыряюсь.

dsd_corp Jun 4 2012 at 11:22

Кстати у меня вопрос: вы проверяли работу переназначения STDOUT и STDERR?
У меня почему-то оно странно работает.
printf() попадает в stdout лог файл, как положено.
fprintf(STDERR, ...) валит notice в тот же stdout лог файл, что мол дескриптор 3 недоступен.
Такое ощущение, что STDERR не хочет так переназначаться или захватывает не тот дескриптор и двигло валит ошибку в stdout из-за недоступности STDERR.

shamanis Jun 4 2012 at 11:25

Странно. STDOUT проверял, а вот STDERR что-то и правда не работает.

shamanis Jun 4 2012 at 11:31

Сделал набросок для теста… В STDERR отказывается писать.

dsd_corp Jun 4 2012 at 12:11

Я тоже гонял это в разных вариантах. Не хочет и все тут.
Ну забил и юзаю только STDOUT-файл — ворнинги если есть, туда же валятся.
Да и тем более это крайняя редкость, сам код демона все-равно в отдельные логи все что нужно пишет.
Но тем не менее надо помнить — если уж STDOUT/STDERR закрыли, то надо с этим что-то делать. В закрытом виде бросать нельзя.
Иначе, если у вас в демоне сервер, он начнет акцептить клиентов и первые соединения попадут на дескрипторы STDERR/STDOUT, и тогда любой ворнинг может клиенту в сокет уйти вместо STDERR.

shamanis Jun 4 2012 at 12:10

Через fprintf() записать в STDOUT тоже не получается, а вот printf() и echo() пишутся в него. Пробовал уже в разных режимах открывать — не получается.

dsd_corp Jun 4 2012 at 12:15

А, забейте, это внутренняя кухня PHP балуется )
Константы STDOUT/STDERR остались 2 и 3 соответственно, но связанные с ними дескрипторы ресурсов(видимые из скрипта) захлопнулись. Вот fprintf и не хочет в числовые дескрипторы писать. Ему объект ресурса подавай.
Связать опять дескрипторы с этими константами мы не можем — это ж мало того, что константы, так еще и системные.

shamanis Jun 4 2012 at 12:19

Можно расширить класс и добавить что-то вроде put_log() и put_err(), чтобы облегчить жизнь, но с другой стороны, в метод run() ведь может просто запускаться метод стороннего класса (у меня так и есть), а сторонний класс переписывать уже не хорошо.

dsd_corp Jun 4 2012 at 12:26

Зачем? Смысл-то переназначения STDERR как раз в том, чтобы ошибки и ворнинги самого PHP туда валились. Добавляя put_err(), вы просто плодите функции print_log().
Ну я выше писал, я забил на этот глюк. Переназначение-то делаю, чтоб сокетам работать не мешало, но рельно этими файлами не пользуюсь.

dsd_corp Jun 4 2012 at 12:28

P.S. ну еще можно error_reporting функции заюзать и отлавливать PHP-шные сообщения там и писать в файл. Тже метод, если нужно для отладки. Критические ошибки парсинга он при попытке запуска в консоль вывалит, остальные будут писаться куда надо.

DmitryKoterov Jun 4 2012 at 12:34

Не делайте так. Есть ровно одно место, в которое сходятся все «грязные» логи ошибок: это stdout. Вот именно на этом уровне и надо осуществлять перенаправление, именно эта точка и есть «точка принятия решения с максимальной ответственностью».

dsd_corp Jun 4 2012 at 12:41

«Грязные» — это какие? Какие логи ошибок лезут в STDOUT и которые нельзя при этом перехватить через хандлеры в set_error_handler() и set_exception_handler()?
PHP делался для веба, и в частности CLI-версия предполагает, что при запуске из-под сервака в CGI-режиме лишнее в STDOUT валиться не должно.
Поэтому указанными выше хандлерами можно перехватить почти все, кроме критических ошибок на этапе предкомпиляции скрипта — но тут скрипт и не запустится вообще.
P.S. под error_reporting функциями я имел в виду именно набор функций работы с error_reporting, а не саму функцию error_reporting().

DmitryKoterov Jun 4 2012 at 13:27

— Ошибки, которые вывели вызываемые через system (или другие средства) внешние утилиты.
— Всякие системные сообщения, например, «core dumped», «segmentation fault» и т.д.
— Parse error и Fatal error в подключаемых файлах (например, в шаблонах).
Мой вам совет — переставайте уже ставить карандаш на острие, у него есть обратная плоская сторона, на которой он замечательно и устойчиво может стоять. :-)

dsd_corp Jun 4 2012 at 13:40

Внешние утилиты и их вывод в консоль при надобности контролируются пайпами.
Шаблоны и прочую лабуду я динамически к демонам не подключаю. Предпочитаю не создавать себе проблем заранее. Шаблоны если нужны — их можно вместо прямого подключения парсить. Тут вам выбор и раздолье: хоть кусками фиксированной длины через парсер прогоняйте, чтоб лишнюю память не жрать. Как реализовать правильный парсер — отдельная тема. А то вы мне опять тут сейчас скажете «низя не в коем случае» ))
«core dumped» и «segmentation fault» у меня такая редкость, что можно если что в режиме консоли запустить и погонять.

У меня все и так замечательно и устойчиво работает. Кроном я простые скрипты запускаю, которые и нужно запускать кроном. Но крону — кроново, а демону — демоново. Накой мне крон, когда мне нужен демон?

unwrecker Jun 4 2012 at 12:40

Для работы pcntl_signal нужно делать declare(ticks=1), а оно deprecated.

dsd_corp Jun 4 2012 at 12:48

А где указано, что deprecated? Не знал.
Я правда сигналами и не пользуюсь, завязываю все их на SIG_IGN, а демоны между собой общаются по TCP по своему протоколу. Так вроде глюков нет, все пучком.

DmitryKoterov Jun 4 2012 at 13:37

Тут дело даже не столько в том, что оно deprecated, сколько в механизме, как в интерпретируемых языках (что в PHP, что в Perl) вообще работают сигналы. А работают они… э-эээ… плохо. Когда вы пишете declare(ticks=1), вы заставляете интерпретатор через каждую минимальную опкод-инструкцию вызывать внутренний код проверки состояния (например, какие сигналы за последний квант времени накопились и, если они есть, выполнить обработчики). Такое поведение объясняется тем, что интерпретатор не является повторно входимым, поэтому он не может выполнить код обработчика непосредственно в момент возникновения сигнала — ведь он в этот момент может заниматься обработкой произвольной инструкции. (Честно сказать, та же самая проблема существует и в C++-программах: в обработчике сигнала нельзя выполнять сложные действия, нельзя даже память выделять новую malloc-ом — а значит, нельзя использовать string, vector и другие классы STL.)

У такого метода с declare, таким образом, 2 недостатка: во-первых, дополнительные тормоза при работе, а во-вторых, вы ведь можете и не попасть на следующую инструкцию вовсе (может зависнуть операция обмена данными с TCP-сокетами, в CURL это происходит периодически, и CURL-овые тайм-ауты тут не помогают даже). Так что сигнал так и останется необработанным.

Всего есть 2 разумных и безопасных действия, которые можно выполнить в обработчике сигнала:
1. Убить себя ~~об стену~~.
2. Поставить флаг «сделать что-то», который проверяется периодически где-то в основном коде.

В PHP случай 2 — под вопросом, т.к. требует declare(ticks), а по нему см. недостатки выше. Так что оба этих варианта приемлемо работают только в неинтерпретируемых языках.

gen Jun 4 2012 at 14:10

скажите, насколько улучшит ситуацию использование функиции pcntl_signal_dispatch() вместо declare(ticks=N)?

DmitryKoterov Jun 4 2012 at 14:19

Ну тормоза это уберет, конечно. (Фактически, pcntl_signal_dispatch() — это то же самое, что п. 2 в предыдущем комментарии.) Но вот только где гарантия, что скрипт дойдет до точки вызова pcntl_signal_dispatch(), не зависнув по дороге…

akalend Jun 4 2012 at 15:16

если использовать блокируемые соединения это 99,99% что не дойдет

akalend Jun 4 2012 at 15:15

по этому я использую libevent:
и обработка сигналов
и таймер
и TCP общение (клиент и сервер ) в обном флаконе

charon Jun 4 2012 at 10:52

неплохо написано. Жаль, что такого класса нет в стандартной библиотеке РНР.
А вы на утечку памяти демоны с использованием этого класса проверяли?

shamanis Jun 4 2012 at 11:06

У меня на этом классе работает серверная часть, которая работает с данными в БД. Утечек не наблюдается или они таки ничтожны.

akalend Jun 4 2012 at 15:19

текут в основном системные либы, используемые в экстеншенах,
У меня демон неделями висит без перезагрузки и мониторинг показывает ровную прямую,
так что, используем те либы, которые не текут.

cawabanga Jun 4 2012 at 11:10

System_Daemon ещё есть, например.

KingOfNothing Jun 4 2012 at 11:11

Я написал неблольшую обвязку для фреймворка Yii, чтобы демонизировать консольные команды при помощи вашего класса. Если интересно, я мог бы скинуть вам, и вы выложили бы в примеры использования.

shamanis Jun 4 2012 at 11:23

Вообще интересно. Можно было бы добавить в документацию на репозитории. Скидывайте на почту.

DmitryKoterov Jun 4 2012 at 11:23

Когда возникает потребность в постоянно работающем скрипте, как правило, обращают внимание на следующие аспекты:
1) Скрипт должен сопротивляться одновременному запуску себя в нескольких процессах (чтобы если кто-то дважды запустил демон, во второй раз он получил «я уже работаю, пропущено»).
2) Скрипт должен сам себя перезапускать через определенное число итераций (чтобы бороться с утечками памяти, которые рано или поздно все равно проявятся).
3) Скрипт должен уметь запоминать свое текущее состояние, чтобы после внезапной смерти (или перезагрузке, или вылете при превышении лимитов и т.д.) автоматически перезапуститься и продолжить работу примерно с того же места, где в прошлый раз остановился.
4) Скрипт должен иметь возможность запускать себя «не в режиме демона», для отладки.
5) Скрипт должен ставить тайм-аут на 1 свою итерацию, чтобы при внезапных подвисаниях вся система не вставала.
6) Скрипт, выводя что-то в STDOUT и STDERR, должен тем или иным способом снабжать это пометкой текущей даты-времени и PID-а для облегчения отладки.

По всем этим причинам лично я предпочитаю обходиться вообще без какого-либо кода на PHP для работы с «демонами», а запускать долгоиграющие процессы в кроне. Крон при этом используется не для запуска «по расписанию», а как watchdog — например, скрипт запускается кроном раз в минуту.

Какие у такого способа преимущества? В основном — вы волей-неволей оказываетесь вынуждены соблюдать все эти правила, иначе ничего не заработает (т.е. это своеобразный самоконтроль), плюс система становится сильно проще. Я прямо по каждому из пунктов выше пройдусь:
1) Вы волей-неволей должны реализовать и оттестировать защиту от множественного запуска, иначе получите миллион процессов, запущенных кроном.
2) Самоперезапуск для борьбы с утечками реализуется элементарно — достаточно вставить die(«Перезапускаюсь») в нужное место.
3) У вас не будет соблазна игнорировать проблему записи текущего состояния, иначе ничего не будет работать.
4) Т.к. «режима демона» нет, то и запуск в режиме отладки ничем не отличается от запуска в боевом режиме. Вы просто запускаете скрипт в консоли.
5) Т.к. скрипт готов к смерти в любой момент, то для реализации тайм-аута одной операции вы можете использовать SIGALRM без обработчика — в PHP это приводит к убиванию скрипта, даже если он висит где-то глубоко в IO-операции (весьма удобно).
6) Вы все равно не сможете в PHP предварять абсолютно любой output маркерами времени (потому что существуют всякие там внешние утилиты, fatal error-ы и т.д.), поэтому гораздо проще запускать скрипт в кроне через «php script.php 2>&1 | logger -t маркер» — это автоматтом даст нужный функционал.

Ну и самое главное преимущество: вы в любую секунду можете сделать на боевой машине killall php (или даже killall -9 php) и быть уверенным, что ваша система корректно поднимется, и ничего не сломается.

KingOfNothing Jun 4 2012 at 11:37

на мой взгляд, много команд в кроне неудобно поддерживать и развертывать на новые сервера. Проще написать такие долгоиграющие демоны, и уже в крон поместить скрипт, который раз в час, например, будет их аккуратно перезапускать.
Ну а что касательно логов и отладки — соглашусь, несколько усложняются эти пункты.

DmitryKoterov Jun 4 2012 at 11:48

В крон не надо, конечно, писать много команд, достаточно всего одну, как-то примерно так:

for s in /path/to/scripts/*.php; do php $s 2>&1 | logger -t $s &; done

И лучше не раз в час, а раз в минуту — это же watchdog, зачем ждать так долго.

KingOfNothing Jun 4 2012 at 12:10

А если в /path/to/scripts/ попадут «левые скрипты»?

А если в фреймворке, например, Yii, запуск команд делается так:

yiic commandName params

то их нужно будет перечислить как-то?

Поэтому я предпочитаю сделать команду в кроне: yiic runDaemons, в которой написать что-то типа:

foreach ($app->getDaemons() as $d) {
runDaemonIfNotRunning($d);
}

Это позволяется всё хранить внутри приложения.
А по поводу часа или минуты — все зависит от того, насколько часто они падают и насколько хорош/плох мониторинг падений. Если мониторинг налажен отлично, то крон и не нужен, по сути.

KingOfNothing Jun 4 2012 at 12:11

уточнение: код команды runDaemons находится в приложении, в кроне только запуск.

DmitryKoterov Jun 4 2012 at 11:52

Кстати говоря, «многопоточные» демоны (в смысле «многопроцессные») ровно через эту же механику очень легко реализуются. Достаточно только поменять код защиты от повторного запуска: например, при запуске выкидывать случайное число от 0 до 9 и блокировать ресурс, имя которого «замешано» на это число (для запуска в 10 потоков). Защиту от повторного запуска проще всего реализовывать через flock (а если нужна работа на нескольких машинах, то можно в случае, например, PostgreSQL делать pg_try_advisory_lock() на мастере).

shamanis Jun 4 2012 at 12:03

Вот именно от таких решений я и уходил, когда начал писать «демонов».
До этого все работало через крон.

dsd_corp Jun 4 2012 at 12:07

Сильно похоже, что вы ломаете свою систему сами, от того и столько требований.

— Часть требований основана на вашем субъективном восприятии. Нужны вам маркеры времени? Да не вопрос, делаем у демона функцию print_log($str), которая в начало этой $str добавит date("[d-m-y H:i:s] "), в конец добъет "\n" и выплюнет в файл с блокировкой оного flock() на время записи.

— Утечки памяти? Подвисоны итераций? У меня TCP-сервера на нескольких портах, написанные на PHP, обслуживающие клиентов и при этом еще и общающиеся между собой(перекидывают «неродные» запросы на того, кто его умеет обработать), работают по нескольку месяцев, перезапускаясь только при обновлениях исходников. При этом работают в асинхроне и в одном потоке(thread) одновременно.
Кстати будет время, вывалю статью и этот класс обработки множества соединений.
Никаких кронов, ватчдогов и прочего. Никаких утечек, никаких подвисонов. Это все зависит исключительно от программиста. И функционал серверов — не баклуши бить, изредка пописывая что-то в файлик. Конечно и не высоконагруженный проект, но до пары сотен запросов разных в минуту приходит. Помножьте на несколько месяцев. Мемори-лики завалили бы скрипт наверное за пару дней максимум, если бы они были. То есть проблема утечек не в самом PHP явно.

— Запуск не в режиме демона: Трудно строчку демонизации закомментировать? Или сделать выбор нужного режима параметром коммандной строки?

Все зависит от задач и от прямоты рук. Иногда лучше кроном регулярно подергивать(особенно простенькие скрипты, которые и отлаживать-то лень), а иногда нужен реальный демон. При этом геморроиться с Сями не всегда охота. Гибкий скриптовый язык удобнее.

DmitryKoterov Jun 4 2012 at 12:12

Кто-то пишет for ($i = 0; $i != 10; $i++), а кто-то — for ($i = 0; $i < 10; $i++). Вы просто, возможно, из первых (ПОКА из первых?).

dsd_corp Jun 4 2012 at 12:19

Действительно, ПОКА. Вы, как я вижу, оптимист )))
Не, я вторым способом пишу обычно.
А иногда и обратный while применяю, где это выгоднее и допустим рекурсивный отсчет:

$ind=count($arr);
while ((--$ind)>-1) {
...
}

shamanis Jun 4 2012 at 12:13

Плюсанул бы, если бы мог. Полностью согласен.

akalend Jun 4 2012 at 15:32

Дмитрий, Вы безусловно правы, и Ваши 6 пунктов — это неотъемлемая часть Правил написания демонов,
но есть круг задач, в которых скрипт должен быть демоном.

по этому, часть задач, например, на проверку повторного запуска, у меня делает rcd скрипт

еще не описана проблема ротации логов: Если демон «захватил» файловый дескриптор, то ротация не отработает,
а постоянно открывать/закрывать лог — это самоубийство. Ротацию логов: переоткрытие файловых дескрипторов я делаю по сигналу. Сигнал выдаю из prerotate: logrotate.

самопроверку реализую через таймеры

akalend Jun 4 2012 at 15:40

и еще через таймеры реализую статистику и мониторинг здоровья
отдаю данные в систему мониторинга через административный порт
так как система построена на либэвент, то по приходу пакета сбора статистики, отрабатывает скрипт отдачи статистической информации.

что мониторится:
— состояние соединений
— кол-во обработанных элементов (в зависимости от задачи)
— время простоя (в процентах от общего времени)
— скорость обработки (кол-во запросов в сек)

DmitryKoterov Jun 4 2012 at 17:19

Ротация логов сама собой происходит, т.к. логи в моем случае пишутся через стандартный logger (и могут, таким образом, ротироваться через logrotate).

Наверное, я немного неточно все же выразился: скрипт, запускаемый из крона, точно такой же демон. То, что он запускается снова и снова раз в минуту, вовсе не означает, что он должен работать не больше минуты! Он вполне может работать часами (при этом повторные его запуски будут отсекаться кодом контроля повторного запуска). Т.е. по сути — разницы нет особой.

akalend Jun 4 2012 at 19:42

да, я в одном проекте использовал такую схему:
— скрипт запускался по крону раз в минуту, если существовал пид — то скрипт завершался (контроль запуска)
— скрипт перезапускал сам себя раз в 5 мин

akalend Jun 4 2012 at 12:31

нужно обязательно реализовать обработку сигналов:
SIGHUP — перезагрузка конфигурации — рестарт
SIGTERM — мягкое завершение без потери данных

akalend Jun 4 2012 at 12:51

и еще необходимо написать про rcd скрипт, чтоб можно запускать
service mydaemon start

shamanis Jun 4 2012 at 12:52

до этого не дошел еще, но мысль такая была, да.

akalend Jun 4 2012 at 15:41

а логгирование, а мониторинг????

shamanis Jun 4 2012 at 16:14

мониторинг какого плана вы имеете ввиду. и что конкретно логгировать? логи они конечно пишуться, но они реализованы уже непосредственно в исполняемом коде демона — методе run(). А логирование самого демона, я не совсем понимаю, что там логировать. У меня подобный демон работает неделями и не падает. Занимается он только работой с базой (расчеты и отправка электронки), пока что для других целей я демоны не использовал.

akalend Jun 4 2012 at 19:38

мониторинг — что демон работает, основные его параметры по загрузки, параметры соединения, объем аллоцируемой памяти и тд…

логгирование работы демона: например сколько писем оправил, сколько из них не дошло, разного рода ошибки.

shamanis Jun 5 2012 at 03:21

Такое логирование сделанно в самом коде, который исполняется в методе run(), здесь же приведен всего лишь небольшой пример использования.

akalend Jun 5 2012 at 11:44

а ротация — или лог будет бесконечно увеличиваться?

shamanis Jun 5 2012 at 11:46

Это уже на совести того, кто будет писать код в методе run(). Хотите ротацию — делайте. Этот класс лишь запускает ваш код в режиме демона.

akalend Jun 6 2012 at 20:02

Это не совсем верно,
раз мы запускаем демона, мы должны продумать все детали, связанные с его запуском.

у нас из-за отсутствия ротации однажды лог съел все пространство :(
правда в лог постоянно сыпалась ошибка и лог быстро вырос до гигантских размеров.

mubinov Jun 4 2012 at 16:34

Не вздумайте пользоваться этим кодом, здесь проверка работы демона осуществляется по существованию файла. Если сервер перезагрузился, процесс аварийно завершился, упал php или еще один из миллиона вариантов катастроф, но при этом файл не был удален, то просто напросто новая копия демона не запуститься. это не теория, сам сталкивался с этим.
Автор, перепиши проверку работы демона на posix функции.а до этого лучше скрой статью.

shamanis Jun 5 2012 at 03:43

Эту ситуацию я уже исправил.

mubinov Jun 5 2012 at 08:32

Спасибо. Уже лучше. Но я имел ввиду немного другое.
При запуске скрипта нужно где-нибудь сделать отметку о том что процесс запущен: в базу или файл записываем pid процесса (получить можно так getmypid()). По окончании всех действий удаляем запись с нашим pid (в случае демона этого делать не надо, ведь мы считаем, что этот процесс всегда должен быть запущен).

При новом запуске скрипта, например по крону, смотрим в базу/файл на наличие записи о запущенном процессе. Если записи нет, то тогда спокойно запускаемся. Если же запись есть, то нужно проверить, действительно ли такой процесс запущен. Это можно сделать так: (bool) posix_getsid($pid); Ну и дальше действовать по ситуации.

Еще будет хорошо если рядом с отметкой о запуске с pid процесса будет timestamp запуска. Его можно использовать для разных целей. Например, убивать процесс, который длится больше недели. Так, на всякий случай, для борьбы с утечками и подвисаниями.

Минус этого способа наличие ничтожно малой вероятность неуникальности pid. Т.е. процесс завершился аварийно, не успев удалить отметку о запуске. А какому-то другому процессу присвоен этот самый pid. В итоге мы посылаем kill другому ни в чем неповинному процессу… Хотя по-моему этим же грешит и Ваш код. Как выход вместо posix_getsid() использовать exec('ps'); с дополнительными параметрами и смотреть не только pid, но еще и имя запущенного процесса.

Отписывайте в личку, если нужна помощь по доработке кода.

shamanis Jun 5 2012 at 08:41

Так у меня проверка и так выполняется. В PID-файл записывается PID процесса. Запустить второй раз его не получится, он скажет «Process is running on PID: XXXXX»

mubinov Jun 5 2012 at 08:50

Спасибо, не знал что posix_kill($pid, 0) так работает.

shamanis Jun 5 2012 at 08:46

Кстати, про таймштамп хорошая идея…

akalend Jun 5 2012 at 11:46

Если сервер перезагрузился, процесс аварийно завершился, упал php или еще один из миллиона вариантов катастроф, но при этом файл не был удален, то просто напросто новая копия демона не запуститься. это не теория, сам сталкивался с этим.

знакомая ситуация, существование pid проверяем из /proc/

shamanis Jun 5 2012 at 05:51

Добавил еще проверку function_exists('chroot') в setChroot(). А то у меня в блоге отписался человек, у которого старая версия PHP и нет функции chroot()

Epsiloncool Jun 6 2012 at 11:13

Можно уточнить, а чем phpDaemon хуже вашей реализации демона?