FrolovS Jan 24 2011 at 03:44

Самые быстрые настройки для PHP-скриптов

7 min

36K

PHP *

+74

192

Comments 192

p00h Jan 24 2011 at 03:55

К своему стыду ни разу не задавался вопросами подобной оптимизации и был приятно удивлен скоростью парсинга INI-файлов! Спасибо за сравнения, заставили задуматься :)

Gorthauer87 Jan 24 2011 at 08:47

Ну правильно, в случае парсинга ini файлов или же json'а вызываются Cшные функции, они всяко быстрее реализаций на чистом php

SailorMax Jan 24 2011 at 08:50

Если считаете, что уже достаточно овладели PHP, поизучайте язык более низкого уровня (C / Pascal), чтобы понимать как оно работает и подобными вещами вас будет уже не удивить ;)

Disturbed Jan 24 2011 at 09:03

Ну Си — да, а вот паскаль вряд ли поможет (:

matiouchkine Jan 24 2011 at 12:35

Pascal may be an admirable language for teaching beginners how to program

Это сказал некто Керниган.

Некто Дональд Кнут в 2000 году сам портировал TeX на Pascal — как думаете, с чего бы?

Не нужно оголтело равнять Pascal = Delphi’s VCL и делать поспешные выводы.

Disturbed Jan 24 2011 at 13:56

Для обучения новичков программированию Паскаль хорош. Потому что начинать с Си очень трудно. Но для того, чтобы понимать как работает PHP на более низком уровне знания Паскаля вряд ли помогут.

matiouchkine Jan 24 2011 at 14:33

В цитате главное слово — «how».

Вы хотите поговорить, как работает PHP на низком уровне? — Тогда нужно сначала попрограммировать на C/C++, а потом заглядывать в код функций PHP (а не программировать на PHP непосредственно).

Хорошая абстракция языка всегда подразумевает, что хорошему программисту на этом языке не нужно знать тонкости реализации. Это правильно, что p00h никогда об этом не задумывался. Об этом не нужно задумываться. По хорошему, я бы хотел увидеть пару функций store_config/load_config, и не задаваться вопросом, какой из стапятисот предложенных авторами языка методов мне выбрать.

Если вернуться к паскалю — гляньте на оператор «^». Или вообще на спецификацию посмотрите. А то на «низком» уровне все программировать научились, а смысл термина как-то стерся.

Disturbed Jan 24 2011 at 18:24

функции store_config/load_config — это уже не уровень языка, это более высокий уровень абстракции — фреймворки, etc, потому что config — это само по себе абстрактное понятие в отличие от xml, ini или что там еще.
А насчет паскаля — насколько я его помню, указатели в нем не настолько «продвинуты», как в Си. Поправьте меня, если я не прав.

plandem Jan 25 2011 at 08:28

ага, более. но никто не мешает делать все базовые вещи с указателями и в паскале. хотя конечно после С паскаль вспоминаешь как тихий ужас в этом плане.

Disturbed Jan 25 2011 at 08:38

а указатели на функции в нем есть? гугл так и не дал внятного ответа.

plandem Jan 25 2011 at 11:29

честно говоря лет 10 минимум уже не прикасался к паскалю. и тогда когда использовал, то не чистый паскаль был, а «дельфи». там была возможность.

hudson Jan 24 2011 at 08:54

Одна из первых заповедей оптимизации — используй native функции (если такая есть конечно). Они всегда быстрее. Альшанецкий говорил что в его практике только один раз кастомное решение на чистом PHP было быстрее нативной функции, а это о чем-то да говорит )

Gorthauer87 Jan 24 2011 at 08:59

Говорит о том, что нативная функция кривая, очевидно же.

neyronius Jan 24 2011 at 20:30

DevConf 2010?

hudson Jan 24 2011 at 20:33

Так точно )

kolpeex Jan 24 2011 at 11:27

Стоит заметить, что внешние файлы с настройками должны быть в закрытой папке, либо на уровень выше www.

FrolovS Jan 24 2011 at 11:30

В случае конфигов на PHP это не обязательно. Даже если злоумышленник найдет config.php и откроет его через браузер, он увидит пустую страничку.
Кроме этого, доступ к конфигам можно ограничивать через настройки сервера (как вариант, .htaccess).
Но, в сущности, Вы правы — защищать конфиги — первое дело каждого программиста.

adminimus Jan 24 2011 at 16:23

>В случае конфигов на PHP это не обязательно.

все так говорят, пока глюканувший сервер не начнет отдавать исходники скриптов :)

hostadmin Jan 24 2011 at 19:51

Когда начал читать, то тоже подумал, что INI будут хуже обычного PHP-файла с массивом. А оно вон как повернулось.

VitaZheltyakov Jan 24 2011 at 03:57

Прочитав статью меня чуть кондрашка не схватила…
Чтение сериализованного массива из файла и его последующая ансериализация быстрее чтения переменных из php-файла…

Сериализованные массивы в файлах эффективны, если ими можно заменить данные из БД.

p00h Jan 24 2011 at 04:04

Ваша кондрашка умеет читать? ;)

matiouchkine Jan 24 2011 at 07:16

Это Кондрашка им. Чехова.

UFO landed and left these words here

KReal Jan 24 2011 at 10:03

Нет, мимо станции проезжать умеет))

matiouchkine Jan 24 2011 at 12:37

Мимо станции умеет проезжать Шляпа™ им. Чехова, вы что-то путаете :-)

xexsus Jan 24 2011 at 09:32

Парсить сериализованный массив менее ресурсоёмко, чем парсить php-код. Всё верно.

xexsus Jan 24 2011 at 09:33

А на доступ к файлу смотреть не нужно, так как он имеет место в обоих случаях.

pwlnw Jan 24 2011 at 09:39

Но если php-код уже пропарсен php-акселератором, тогда его просто нужно выполнить.
Жаль не проверяли

Akdmeh Jan 24 2011 at 10:36

Самое интересное, что всю жизнь считал, что php-код будет как раз-таки быстрее, и кешировал ini-файлы в php-код. Теперь-то буду знать, что эти усилия никому, оказывается, не нужны.

bat Jan 25 2011 at 07:25

Настройки лучше кешировать в памяти.

Anonym Jan 24 2011 at 04:21

А сколько раз проводился каждый тест?

FrolovS Jan 24 2011 at 06:17

1000 последовательных запусков для каждого из алгоритмов.
Все тесты вместе перезапускал несколько десятков раз, чтобы проверить, что загрузка сервера не влияет на результаты. Результаты по времени между запусками отличались на незначимую величину :-)

kekekeks Jan 24 2011 at 04:25

Эцсамое, а нельзя подгрузить весь «тяжёлый» хлам, а потом схоронить где-нибудь в memcache в сериализованном виде?

alexius2 Jan 24 2011 at 06:06

Тоже самое подумал. Хранить конфиги надо там где удобно (база, ini или xml файлы, главное не define'ами ;)), и при проблемах с производительностью просто кэшировать их. Хоть в мемкэш, хоть даже в файлы в сериализованном виде. Будет и быстро и удобно.

MegafonUral Jan 24 2011 at 07:03

а чем так плохи defin'ы, можно поподробней?

alexius2 Jan 24 2011 at 07:10

Навскидку: глобальное пространство имен, невозможность переопределить.

FrolovS Jan 24 2011 at 07:12

Если в двух словах, то:

Они медленные
Они глобальные. Если переменные можно сделать локальными (включить определение переменных в теле функции, например), то константы — нет
Они ужасные: include(PROJECT_ROOT. "/lib/class.php") vs include("$project_root/lib/class.php")

MegafonUral Jan 24 2011 at 07:18

насчет медленных согласен, внешний вид это субъективно, а вот глобальность — почему это плохо?
если речь идет о глобальном конфиге сайта
почему это хуже чем например делать
$cfg = config::getInstance();
в каждом месте где нужно узнать project_root?

я прошу прощения за возможное ламерство, просто хочу восполнить пробел в понимании, пользуясь моментом :)

Ogra Jan 24 2011 at 07:27

Глобальность это всегда плохо, а вместе с невозможностью переопределения ведет к сильному связыванию и жесткой архитектуре. Даже с синглтонами можно манипулировать конфигами (пример синтетический):

config->switchInstance('additional');
runMethod();
config->switchInstance('main');

function runMethod(){
    $cfg = config::getInstance();
    ...
}

FrolovS Jan 24 2011 at 07:29

Вы в чем-то правы.
Но большинство реализаций с константами выглядят примерно так (схема главного скрипта):

include конфиг;
include классы x 10;
include коннект к базе данных;

константы при этом встречаются только в инклюдах в главном скрипте и в коннекте к базе данных. Вопрос: а смысл было их делать глобальными?

Хотя реализации, повторю, могут отличаться

Ogra Jan 24 2011 at 07:12

Невозможность определять массивы, объекты.

FrolovS Jan 24 2011 at 06:18

У меня только один вопрос — настройки подключения к memcache где хранить? :-)

likeit Jan 24 2011 at 04:38

Логичнее всего сохранять такую инфу в apc. 0.002 0.015 0.17

likeit Jan 24 2011 at 05:05

Интересно, но обычными инклудами получилось 0.08 против 0.17
Есть над чем задуматься

bazzzman Jan 24 2011 at 09:21

Смысла в ваших цифрах нет, железо и тестовые данные у вас с автором разное.
Выкладывайте тогда результаты всех тестов (txt, ini, xml, ...).

homm Jan 24 2011 at 04:44

Какая библиотека использовалась для кеширования опкода?

FrolovS Jan 24 2011 at 06:21

Важное уточнение. PHP 5.2.x + eAccelerator 0.9.6.x

homm Jan 24 2011 at 06:34

А ОС?

FrolovS Jan 24 2011 at 06:45

Linux Debian Lenny

Если интересно, то
Intel Core2Duo 3000 GHz
Memory 4GB 800 MHz
2x Western Digital RE3 RAID1

homm Jan 24 2011 at 06:51

Убедили :)
Просто если бы вы не использовали опкод кешер, или проводили тесты в Виндовсе, это сильно сказалось бы на времени подключения файлов.

Gruxon Jan 24 2011 at 05:15

Практический подход к оптимизации (на базе опытов).

Берем в руки микротайм и считаем в узловых точках скриптов время и считаем. В местах, где можно существенно сэкономить — экономим.

Я не могу сейчас уже привести примеры кода, но могу описать ситуацию, когда экономил на выводе больших массивов данных из базы. Удобно, например, при выводе детализаций по всякого рода аккаунтингу (трафик, звонки, смс и прочие тарифицируемые...). Такие данные характерны короткими справочниками с десятками записей и огромной таблицей CDR (собственно записей тарификации). Вот в таких ситуациях, чтение справочников целиком из базы в массив в памяти и использование этих массивов при выводе с одним простым запросом только к таблице CDR в базе, позволяется «разогнать» скрипт в сотни раз, по сравнению с решением в лоб — запросами с join-ами в базу данных.

Конечно, это скорее оптимизация СУБД, но средствами языка программирования. :)

Ogra Jan 24 2011 at 05:17

А все-таки стоит проверить хранение конфигов в базе данных. Да, конфиги в базе данных сильно проигрывают в скорости на указанных вами условиях работы. Но стоит рассмотреть другие варианты: чтение 20 настроек при определенных 1000, сохранение настроек.

FlexIDK Jan 24 2011 at 06:57

а хранить настройки подсоединения к БД? тоже в БД?

Ogra Jan 24 2011 at 07:04

Настройки подсоединения к БД можно ужать до одной строки (e.g. 'mysql://user:password@host:port'), где её хранить — некритично.

Veterinar Jan 24 2011 at 10:04

Некритично, но тупо.

alekciy Jun 4 2011 at 18:52

См. example для parse_url.

Serator Jan 24 2011 at 11:42

А БД бывают разные, к примеру, SQLite, которому только путь до БД нужен по сути.

slimus Jan 24 2011 at 05:51

В ваших примерах используются разные функции для чтения файлов. Мне кажется это тоже повлияло на результат исследования.

FrolovS Jan 24 2011 at 06:25

Старался по минимуму использовать PHP-wrapper'ы для работы с файлами, только там, где это действительно необходимо. А на оптимизацию работы с файловой системой на уровне ядра PHP большинство людей повлиять не могут, поэтому она не оценивалась.

slimus Jan 24 2011 at 06:29

а я и не говорю что нужно влиять. Нужно было при замерах использовать одну и ту же функцию для чтения файлов, думаю результат будет отличным от Вашего.

FrolovS Jan 24 2011 at 07:02

Например, вместо include($file) использовать eval('?'.'>'.file_get_contents($file).'<'.'?')
Или Вы имели в виду, что нужно избавиться от fopen/fgets/fclose и заменить на foreach (explode('\n', file_get_contents($file)) as $line)?
С последним, пожалуй, соглашусь, разница, наверное, будет.

slimus Jan 24 2011 at 07:10

последнее Вы верно поняли.

FrolovS Jan 24 2011 at 07:22

Добавил пример с file_get_contents. Вопреки ожиданиям, разница не очень существенна, и, в основном, заметна для больших конфигов.

TheShock Jan 24 2011 at 10:53

foreach (file($file) as $line)

LiaDesign Jan 26 2011 at 13:48

согласен с предыдущим оратором
и 5 копеек
$file_array = file($file);
foreach ($file_array as $line)

megahertz Jan 24 2011 at 06:05

Для полноты картины можно еще проверить JSON, YAML

megahertz Jan 24 2011 at 06:11

Хотя YAML должен быть достаточно медленным из-за отсутствия встроенных решений для парсинга, интереснее все же JSON.

CuamckuyKot Jan 24 2011 at 07:12

Очень удобно хранить настройки в YAML, который спокойно и быстро читает и пишет свежая версия Zend Framework.

psylosss Jan 24 2011 at 07:31

И благополучно конвертирует и кэширует их в pure php

UFO landed and left these words here

VolCh Jan 24 2011 at 11:55

Как бы есть нативное решение ru2.php.net/manual/en/book.yaml.php

FrolovS Jan 24 2011 at 06:51

Добавил JSON.
Методы парсинга данных средствами PHP, по идее, должны быть сравнимы с разбором текстовых файлов или даже медленнее.

megahertz Jan 24 2011 at 07:23

Спасибо. Чтобы возвращало массив — можно второй параметр указать, но не думаю что на результаты это сильно повлияет

FrolovS Jan 24 2011 at 07:31

Спасибо, не учел.
В 99% случаев использую json_encode :-)

VitaZheltyakov Jan 24 2011 at 06:27

Провел тесты приведённых скриптов на своей машине и о чудо… Настройки хранимые в php-скриптах на 20% быстрее, чем файлы с сериализованными массивами. Совершенно противоположные результаты.

Ошибка автора:
— Не учтено кэширование файлов ФС и кэширование данных PHP. Так как оба метода хранения данных (php-скрипты и сериализованные массивы в файлах) относительно мало различаются по скорости, то «играясь» с настройками кэширования можно добиться совершенно разных результатов.
На практике данный пример может действовать как и в положительную сторону, так и в отрицательную.

FrolovS Jan 24 2011 at 06:49

Согласен, не учел эти моменты.
А у Вас какие настройки кэширования данных PHP? Имеется ли какой-либо оптимизатор?

LiaDesign Jan 26 2011 at 13:52

«стандартный» (с версии php 6.0 — internal)
php_APC
для «крутатинушки-крутатастой»:
apc.stat = «Off»
ну а потом в «нужные моменты времени»
apc_clear_cache('opcode');

FlexIDK Jan 24 2011 at 06:57

XML надо было парсить через SimpleXML, результат был бы лучше. (проверено на собственной шкуре)
И еще, если на сервер поставить xcache — то чтение php файла с конфигом будет происходить мгновенно из рама (без учета дисковой операции). И по теории будет быстрее.

FrolovS Jan 24 2011 at 07:05

НапИшите примерчик? Буду благодарен!

Shvonder Jan 24 2011 at 07:14

function config($file)
{
    return simplexml_load_file($file);
}

FlexIDK Jan 24 2011 at 07:14

function config($file) {
    $xml = simplexml_load_file($file);
    $array = array();
    foreach($xml as $key => $value) {
        $array[$key] = (string)$value;
    }
    return $array;
}

Как-то так…
А xcache — это расширение для php

homm Jan 24 2011 at 07:16

habrahabr.ru/blogs/php/112402/#comment_3597034

AndryX Jan 24 2011 at 14:44

Насколько помню к SimpleXML Object можно обращаться как к массиву, потому ваш цикл for — излишен. Если тип данных критичен, то можно просто рекурсивно скастовать тип через array_walk_recursive.

AndryX Jan 24 2011 at 14:45

*SimpleXMLElement, старческая память

seriyPS Jan 24 2011 at 12:27

В случае файла настроек, который будет преобразован в хеш-массив а DOM как таковой нафиг не нужен, нужно парсить потоковым SAX парсером.

Melz Jan 24 2011 at 14:14

Если стоит задача только читать конфиг из програмы (менять только ручками в редакторе), то быстрее будет делать через XMLReader. Особенно заметно на больших файлах.

Правда конфиг прийдется привести к другому виду:

1
2
3

Melz Jan 24 2011 at 14:20

Парсер рулит ))
Вместо элетментов x1, x2, x3, ставить элемент param с аттрибутом name = x1, x2, x3.

sgzmd Jan 24 2011 at 07:05

Вообще-то если начинаешь задумываться о скорости, имеет смысл держать все в памяти – и настройки, и общие данные. Но в этом случае PHP, естественно, исключен.

jeje Jan 24 2011 at 07:13

Все эти танцы с бубном опять лишь для красоты, результаты предопределены. Вопрос в том, что делать дальше? Если это большой проект, где конфигурирование происходит из различных точек, никто не будет это переменными, ini файлами (многоуровневы конфигурации). Остается XML и JSON. Чаще всего применяется первый, не смотря на свою избыточность. Но никто не будет оставлять сборку и считыванию конфигов в голов виде. Будут кешировать на диск, в память, в memcache в результате ваша проделанная работа так и не раскрывает вопрос. Это сродни — функции работают быстрее классов, но мы ведь не будем все строить без ООП?

mr_avi Jan 24 2011 at 07:22

у нас ini + key-value кеш (redis, memcache)

o_O_Tync Jan 24 2011 at 07:28

Тестирование не совсем верное: нет гарантий что все использованные алгоритмы имеют линейную скорость работы и вдруг не завтормозят на десятке значений.
Правильно бы было сгенерировать конфиг файл длиной хотя бы несколько десятков строк: это будет ближе к реальной ситуации.

homm Jan 24 2011 at 07:30

Вы разве не об этом говорите?

Конфигурационный файл содержит 10, 100 или 1000 конфигурационных параметров, представляющих собой короткие строки

o_O_Tync Jan 24 2011 at 07:37

Ай, зевнул. Именно этим и занимаются люди по утрам, верно? :))

Palehin Jan 24 2011 at 07:36

Вот оно как всё… Никогда раньше особо не задумывался над конфигами.

redhummer Jan 24 2011 at 07:37

Простите мою глупость, но терзает вопрос, – Что за магические три числа в ваших результатах? Я не придираюсь, а правда не понял…

UFO landed and left these words here

alextam Jan 24 2011 at 07:45

Конфигурационный файл содержит 10, 100 или 1000 конфигурационных параметров, представляющих собой короткие строки. Соответственно 3 результата для каждого набора

Vladson Jan 24 2011 at 07:39

Это называется экономия на спичках. (Говоря русским языком, всё это онанизм для мозгов, и не более.)

Как я обычно говорю «если программисту кажется что тормозит язык программирования, значит тормозит сам программист.»

FrolovS Jan 24 2011 at 07:53

В чем-то Вы правы.
Чтение конфигов, по сути, редко является узким местом. Есть и более «узкие» места в скриптах.

UFO landed and left these words here

FrolovS Jan 24 2011 at 07:48

Спасибо!
Расскажите, пожалуйста, как Вы делаете диаграммы?
Я 90% времени в консоли, и, к стыду своему, не знаю, как это делается :-)

UFO landed and left these words here

matiouchkine Jan 24 2011 at 13:27

На Pure CSS3, надеюсь?

:-)

UFO landed and left these words here

o_O_Tync Jan 24 2011 at 08:46

В консоли тоже делается, gnuplot'ом :)

redhummer Jan 24 2011 at 07:49

Жесть. Не?

Вот как бы реально действующий код…

$Config = Helly_Config::GetInstance(); //Синглтон отнаследованный от ObjectArray

$Config['ТО'] = 1;
$Config['СЁ'] = 2'
$Config['ПЯТОЕ'] = 5;
//…
$Config['СТОПЯТОЕ'] = 105;
$Config['ОЛОЛОТРОЛОЛО'] = $Config['ПЯТОЕ'] == 5 ? 'это пять' : 'ничего подобного';

+ Автозагрузчик классов движка.

Ну и в результате можно везде делать Helly_Config::Get('ТО'); Helly_Config::Get('СЁ'); Helly_Config::Get('ПЯТОЕ'); Helly_Config::Get('ДЕСЯТОЕ');

Счастлив и не парюсь пока. Вчера сайт (сидящий по соседству с ещё десятком сайтов) пережил две с половиной тысячи уникальных посетителей без каких-либо тормозов. Процессор Atom и оперативной памяти 2Gb (То есть обычный жиденький «сервер»). Акселератора нет.

ИТОГО:
Со Smarty, DbSimple (работает с мускулом) и кучей классов движка (каюсь, подгружаются лениво) без какого-либо кеширования страница генерируется в среднем за 0,1 сек.

Или я чего-то не понял… Честно, извините.

redhummer Jan 24 2011 at 07:50

Ну и да. Попробуйте такое $Config['ОЛОЛОТРОЛОЛО'] = $Config['ПЯТОЕ'] == 5? 'это пять': 'ничего подобного'; в INI-файле сделать.

В ЖЖ наверное так за конфиги не гонят…

FlexIDK Jan 24 2011 at 08:23

> Вчера сайт (сидящий по соседству с ещё десятком сайтов) пережил две с половиной тысячи уникальных посетителей без каких-либо тормозов. Процессор Atom и оперативной памяти 2Gb (То есть обычный жиденький «сервер»). Акселератора нет.

Это не показатель крутости у меня на атоме, 1гб, около 60-80 тыс уников и 500 тыс просмотров
И проблема не в Атоме, а в том что канал всего 10мбит =)

Данные примеры будут полезны, только при очень большом наплыве пользователей

redhummer Jan 24 2011 at 08:33

Жуть! Многим до такого ого-го…
*Одел шляпу*
– Снимаю шляпу.
*Снял шляпу*

> Данные примеры будут полезны, только при очень большом наплыве пользователей

Ну почему у него в лучшем случае конфиг читается всего в два раза быстрее, чем у меня весь сайт работает (с известными шаблонизатором и БД)?!

FrolovS Jan 24 2011 at 08:37

А Вы какой конфиг имеете в виду — из 10 строк, 100 или 1000?

redhummer Jan 24 2011 at 15:58

Вот такой:
<?php

$Config = Helly_Config::GetInstance();

// Site pathes:
$Config['ROOT_DIR'] = ROOT_DIR;
$Config['WEB_DIR'] = 'http://lastproof.ru';
$Config['COOKIE_PATH'] = '.lastproof.ru';

$Config['DIRS_RIGHTS'] = 0755;
$Config['FILES_RIGHTS'] = 0644;

// Metadata:
$Config['META_TITLE'] = 'Последнее доказательство';
$Config['META_DESCRIPTION'] = 'LastProof.Ru – генератор доказательств, непредвзято доказывающий что угодно.';
$Config['META_KEYWORDS'] = 'доказательство, proof, спор, холивар, генератор доказательств, правосудие, пари, аргумент, доказательства, lastproof.ru';

// Behaviour:
$Config['SITE_DEFAULT_LANG'] = 'ru';
$Config['SITE_PRODUCTION_MODE'] = false;
$Config['SITE_SKIN'] = 'default';
$Config['SITE_CLOSED'] = false;
$Config['INVITES_ENABLED'] = false;

// Basic directory:
$Config['HELLY_DIR'] = HELLY_DIR;

$Config['APPLICATION_DIR'] = APPLICATION_DIR;
$Config['APPLICATION_WEB_DIR'] = $Config['WEB_DIR']. '/app';

$Config['DATA_DIR'] = $Config['APPLICATION_DIR']. '/data';
$Config['LANGUAGES_DIR'] = $Config['DATA_DIR']. '/langs';
$Config['MODELS_DIR'] = $Config['APPLICATION_DIR']. '/models';
//$Config['PLUGINS_DIR'] = $Config['APPLICATION_DIR']. '/plugins';

$Config['SKINS_DIR'] = $Config['APPLICATION_DIR']. '/skins';
$Config['SKINS_WEB_DIR'] = $Config['APPLICATION_WEB_DIR']. '/skins';
$Config['SKIN_DIR'] = $Config['SKINS_DIR']. '/'. $Config['SITE_SKIN'];
$Config['SKIN_WEB_DIR'] = $Config['SKINS_WEB_DIR']. '/'. $Config['SITE_SKIN'];

$Config['PUBLIC_DIR'] = $Config['ROOT_DIR']. '/public';
$Config['PUBLIC_WEB_DIR'] = $Config['WEB_DIR']. '/public';

// Config for Helly_Router:
$Config['HELLY_ROUTER'] = array (
'allowed_controllers' => array (
'home' => 'Controller_Home',
'errors' => 'Controller_Errors',
'gates' => 'Controller_Gates',
'pages' => 'Controller_Pages',
'proof' => 'Controller_Proof',
),
'default_controller'=> 'home',
'errors_controller' => 'errors',
);

// Config for Helly_Viewer:
$Config['HELLY_VIEWER'] = array
(
'compile_check' => (false === $Config['SITE_PRODUCTION_MODE']? true: false),
'caching' => false,
'samples' => array(
'content' => array('messages'),
'sidebar' => array('empty'),
),
);

// Config for Helly_Database:
$Config['HELLY_DATABASE'] = array (
'db_configs' => array (
'default' => array (
'type' => 'mysql',
'host' => '***.**.***.***',
'port' => '****',
'user' => '**********',
'pass' => '**********',
'db_name' => '**********',
'prefix' => '****',
'charset' => 'utf8'
),
'xbt' => array (
'type' => 'mysql',
'host' => '***.**.***.***',
'port' => '****',
'user' => '*******',
'pass' => '********',
'db_name' => '*******',
'prefix' => '****',
'charset' => 'cp1251'
),
),
'log_errors' => true, // Log sql errors.
'log_queries' => true, // Log all sql queries.
);

// Config for Helly_Cacher:
$Config['HELLY_CACHER'] = array (
'cache_enabled' => true, // bool
'cache_type' => 'memory', // string[files/memory]

'cache_prefix' => Helly_UriManager::ClearUri($Config['WEB_DIR']), // Prefix for files of cache
'cache_dir' => $Config['DATA_DIR']. '/cache', // Directory for files of cache

'memcached_servers' => array( // Settings for connecting to memcached servers
array(
'host' => '*************',
'port' => *****,
'persistent'=> true
),
),
'memcached_compression' => true, // Use memcached compression
);

// Sending E-mails:
$Config['HELLY_MAILER'] = array (
'type' => 'smtp', // string[php/smtp]
'email' => '*******************',
'from' => $Config['META_TITLE'],
'smtp_host' => 'smtp.yandex.ru',
'smtp_port' => 25,
'smtp_user' => '*******************',
'smtp_password' => '********',
'smtp_auth' => true,
);

// Logging:
$Config['LOGS_DIR'] = $Config['DATA_DIR']. '/logs';
$Config['LOGS_FILE'] = 'helly.log';

?>
↑ это в оригинале 143 строки

И там ниже ↓ – што-што, простите? Не понял – вы для генерации одной страницы «считываете конфиг» более одного раза?

homm Jan 24 2011 at 16:50

Ну есть же сервисы для обмена исходными текстами.

redhummer Jan 24 2011 at 21:56

Ну есть же нормальные, менее депресовые роботы.

FlexIDK Jan 24 2011 at 08:52

Возможно он использует FCGI… если вы свой сайт переведете на FCGI у вас тоже вырастит скорость…
Вот к примеру: ava.md/ — если без FCGI, тогда будет около 0.1-0.2сек, с FCGI 0.02 — и то 0.01 — тратится на PREG который ужимает HTML

FlexIDK Jan 24 2011 at 08:53

время генерации можно посмотреть, правой клавишей, вторая строчка =)

redhummer Jan 24 2011 at 16:00

У него растёт не скорость, а время выполнения. То есть всё очень МЕДЛЕННО. Или я чего-нибудь про единицы измерения не понял. Их разрядность…

FrolovS Jan 24 2011 at 10:01

> Ну почему у него в лучшем случае конфиг читается всего в два раза быстрее, чем у меня весь сайт работает (с известными шаблонизатором и БД)?!

Время считается для цикла из 1000 загрузок конфига. А у Вас генерируется 1 страница

UFO landed and left these words here

2tl Jan 24 2011 at 09:58

Может быть автор диаграммы в топик перенесет?

myadzel Jan 24 2011 at 07:50

Смею не согласится с автором.

Настройки читаются один раз и доступны на протяжении работы сценария, т. ч. считаю некорректным сравнивать способы их хранения и чтения. Вполне очевидно, что эти миллисекунды (один раз прочитать файл конфига), не так уж и важны, по сравнению с оптимизацией запросов и структурой БД.

Никто никогда не сомневался, парсинг XML в DOM это дорогая операция, но за удобство всегда нужно платить.

Откровенно говоря, все зависит от общей схемы работы и структуры.

Для меня удобнее хранить в XML (в атрибутах узлов я могу хранить что угодно и парсить данные на основе этого).

redhummer Jan 24 2011 at 07:51

> астройки читаются один раз и доступны на протяжении работы сценария
А это как написать :)

myadzel Jan 24 2011 at 07:56

Вы же не читаете файл конфига каждый раз при обращении за неким свойством, а первый раз читаете в массив к примеру.

redhummer Jan 24 2011 at 07:57

Ну я, положим, не читаю =)

velezh Jan 25 2011 at 01:03

Приходилось переписывать код, читающий настройки по одной из БД каждый раз, когда они становились нужны. Переписывал, и мысленно отрывал руки кодеру.

UFO landed and left these words here

redhummer Jan 24 2011 at 07:57

Где можно сделать запрос на Хабраэффект? :)

Ctacok Jan 24 2011 at 08:02

[a href=«yousite.com/»]сиськи здесь [/a] (В BB тегах потому что так надо :)

FrolovS Jan 24 2011 at 08:04

Зачем Вы положили yousite.com??? Они теперь страдают!

UFO landed and left these words here

seriyPS Jan 24 2011 at 12:36

[img]http://yousite.com/[/img] Так даже про сиськи писать не нужно

myadzel Jan 24 2011 at 07:58

Я сказал, что для оптимизации (обычно) есть более подходящие процессы.

kostyl Jan 24 2011 at 08:07

интересно было бы узнать какими либами и их версиями проводилось считывание, а также резличие в одних и тех же форматах для различных поставленных вами «условий»… а то картинка не чёткая…

abrwalk Jan 24 2011 at 08:10

модераторы удалите топик, не позорьте ресурс

homm Jan 24 2011 at 08:25

Ага, не понятно что делает технический топик на новостном и развлекательном ресурсе.

redhummer Jan 24 2011 at 08:35

Может ваш оппонент так смеётся над полученными данными?

ArtemLysenko Jan 24 2011 at 08:42

А я вообще ничего не понял, у меня и так все нормально работает.

Darivush Jan 24 2011 at 08:43

чтобы JSON возвращал не stdClass object, а массив надо в функции json_decode 2 параметром дописать true

clops Jan 24 2011 at 09:01

Опять экономят крохи не обращая внимания на слонов.
ini файлы — наиболее удобны в использовании, ими и надо пользоваться.

Disturbed Jan 24 2011 at 09:12

Когда как. Заглядите внутрь Мадженты и прикиньте как бы вы это делали ини-шками :)

clops Jan 24 2011 at 09:47

В Мадженте масса «слонов» :)

DIDJER Jan 24 2011 at 09:10

Кстати при увеличении массива данных, json_decode себя покажет куда лучше чем unserialize.

FrolovS Jan 24 2011 at 09:40

У Вас есть весомые аргументы для этого?

kirilloid Jan 24 2011 at 11:01

Массив заполняется $size (amount of enrites в результатах) случайными строковыми значениями:
8-16 символов ord(rand(32, 128));
Затем сериализуется.
Время выполнения предлагается:

$seconds = sqrt($size / 10000);

Дальше идёт адаптивная схема измерения времени выполнения

$time1 = microtime(true);
$time2 = $time1;
$calls = 0;
while ($time2 <= $time1 + $seconds) {
	unserialize($string);
	$time2 = microtime(true);
	$calls++;
}

время выполнения одного вызова (в мс):

($time2 - $time1)*1000 / $calls

Аналогично для json
data size — размер сериализованных данных.

amount of enrites: 10000
data size: 387860
    calls: 182
serialize: 5.4978132247925 ms
data size: 268961
    calls: 90
     json: 11.220910814073 ms

amount of enrites: 50000
data size: 1983594
    calls: 73
serialize: 30.974479121049 ms
data size: 1344695
    calls: 39
     json: 57.372336890754 ms

amount of enrites: 240000
data size: 9703391
    calls: 18
serialize: 276.30117538543 ms
data size: 6454491
    calls: 18
     json: 279.90789217722 ms

Другое дело, что в контексте статьи это утверждение бессмысленно, ибо конфиги (мы же их рассматривали?) на 250 тысяч записей — это какой-то кошмар. И скрипту при таких размерах данных 64МБ уже не хватает.

FrolovS Jan 24 2011 at 11:05

И ведь не поспоришь :-)
Да, такие большие конфиги я не рассматривал

UFO landed and left these words here

FrolovS Jan 24 2011 at 10:39

Спасибо!

FrolovS Jan 24 2011 at 10:39

Насчет file():
Попробовал, на маленьких файлах получается чуточку быстрее, на больших — медленнее.
Спасибо, как освобожусь — включу в статью дополнение

UFO landed and left these words here

FrolovS Jan 24 2011 at 10:54

Собственно, топик возник в результате размышлений над большими конфигами :-)

matiouchkine Jan 24 2011 at 13:39

Конфиг (на мой взгляд) — это просто набор обязательных параметров для старта приложения. А вы оперируете этим словом как неким метасимволом «все, что настраиваемо».
Например, конфиги бывают разные у разных пользователей (темы оформления, как один пример из тысячи).

Я вижу понятие «конфиг» как некий «ключ для входа в пространство приложения». Такой конфиг никогда не разростется даже до масштаба 100 строк, поэтому его можно читать хоть побуквенно.

Далее — уже встает второй вопрос. Есть туча настроек конкретно этой сессии. Что делать с ними? ini/php-файлы на этом этапе выглядят уже странно. Я стараюсь вытащить на старте сессии все из базы, и закешировать (да, для анонимных сессий — в памяти, для авторизаций — в зависимости от посещаемости ресурса).

UFO landed and left these words here

chEbba Jan 24 2011 at 17:43

Эт вам на JavaEE надо пописать: полдня конфигуришь — полчаса пишешь =)

ЗЫ утрирую, конечно, но конфиги там по полной используются.

VolCh Jan 24 2011 at 17:55

«Ключ для входа в пространство приложения» может занимать куда больше 100 строк даже без комментариев и пустых строк. Особенно в случае динамического связывания компонентов приложения, когда вам нужно чуть ли не для каждого поля класса (хорошо, если не объекта) указывать с какими другими классами и как он связан.

Progrik Jan 24 2011 at 10:25

В парсинге текстового файла можно ещё чуть-чуть ускорить работу заменив:
foreach (explode("\n", file_get_contents($file)) as $line) {
на
foreach (file($file) as $line) {

FrolovS Jan 24 2011 at 10:38

Попробовал, на маленьких файлах получается чуточку быстрее, на больших — медленнее.
Спасибо, как освобожусь — включу в статью дополнение

UFO landed and left these words here

FrolovS Jan 24 2011 at 11:03

С последним пунктом однозначно соглашусь — код должен генерировать по минимуму warning'ов и даже notice'ов. Но задача была оптимизировать работу скриптов по максимуму, избежать лишних проверок, и т.п. Чтобы не было «тормозов» из-за этих проверок. Поэтому код получился именно «тестовый», а не рабочий.

AmdY Jan 24 2011 at 10:41

исследование ни о чём, кофиги нужно хранить в удобном виде, а затем кэшировать в шареную память: smop, apc, memcache…
подход ни о чём. куча слов о железе, но сейчас нет ничего о том, как делались замеры. тестировать лучше сторонними утилитами и парокой левых инклудов, чтобы исключить влияние файлового кэша ОС. например, ab с конкурентными запросами, как в реальной жизни.

FrolovS Jan 24 2011 at 10:53

> исследование ни о чём

Позвольте с Вами не согласиться

> кофиги нужно хранить в удобном виде, а затем кэшировать в шареную память: smop, apc, memcache…

Вообще-то да. Но сколько % людей, которые программируют на PHP, так делают?

> подход ни о чём. куча слов о железе

Ровно 1 предложение о железе было добавлено после того, как получено достаточно комментариев открыто и в личку

> но сейчас нет ничего о том, как делались замеры

Еще я не написал, что мой любимый редактор — Vim. Мне показалось это излишней информацией. А Вы из этого сделали вывод, что исследование и подход ни о чем

> тестировать лучше сторонними утилитами и парокой левых инклудов

Почему сторонними? Тогда ведь нужно считать время старта PHP-интерпретатора. Я тестировал из командной строки, время считалось вызовами microtime() до и после 1000 итераций загрузки конфигов

> чтобы исключить влияние файлового кэша ОС. например, ab с конкурентными запросами, как в реальной жизни.

А почему его нужно исключать?.. В реальной жизни же все используют кэш ОС. И если какой-то из алгоритмов использует его более эффективно — то ура, товарищи!

kirilloid Jan 24 2011 at 11:04

>Вообще-то да. Но сколько % людей, которые программируют на PHP, так делают?
А скольки процентам людей реально нужны эти миллисекунды чтения конфигов? ;-)
Когда я писал менеджер конфигов в средне-нагруженном проекте, то использовал SQL+memcache.

FrolovS Jan 24 2011 at 11:17

Да вряд ли кому.
Я вот чисто для интереса поисследовал :-)

AmdY Jan 24 2011 at 11:43

>>Вообще-то да. Но сколько % людей, которые программируют на PHP, так делают?

те, кому нужно считать миллисекунды так делают.

>>Я тестировал из командной строки, время считалось вызовами microtime() до и после 1000 итераций загрузки конфигов

вот об этом я и писал, что ничего не было о том, как делаются замеры. а они делаются так как и предполагалось — цикл из ПОСЛЕДОВАТЕЛЬНЫХ запросов к ОДНОМУ файлу. эпик фэйл, не имеющий никакого отношений к реальной жизни.

я бы прошёл мимо, если бы не пришлось последних два месяца разгребать проект, сделаный такими горе-оптимизаторами. вы здесь понаписовали и многие принимают это за чистую монету и будут завтра с пеной у рта доказывать, они же на хабре прочитали. тьфу.

Urn Jan 24 2011 at 11:03

графиков нехватает… было бы намного удобнее подрезюмировать

kirilloid Jan 24 2011 at 11:04

Добрые комментаторы уже сделали =)
habrahabr.ru/blogs/php/112402/#comment_3597165

shaelf Jan 24 2011 at 11:05

Вообще, ИМХО исследование бесполезно по определению. Все равно, где хранить данный. Нужно выбирать тот формат, который удобней. Если вы рулите реально большой системой, на которой будет заметны такие мелочи, то вы будете кешировать конфиг.

than Jan 24 2011 at 11:17

Просто кешируем прочитанные с конфига значения и нам все равно сколько они парястя первый раз, главное что бы было удобно менять их.

FrolovS Jan 24 2011 at 11:18

Ага, и я так тоже решил :-)

Disturbed Jan 24 2011 at 14:30

С другой стороны можно сделать интерфейс к изменению конфига и тогда все равно в каком формате их хранить с точки зрения удобства изменения :)

Stamm Jan 24 2011 at 11:23

Выложите архив со скриптами для тестирования, чтобы каждый мог запустить на своей системе и проверить, что будет быстрей.

FrolovS Jan 24 2011 at 12:27

Пожалуйста.
Извините за написанный на скорую руку код :-)

mr_avi Jan 24 2011 at 11:34

Провел небольшой тест:

Код:

$time = new DateTime();
echo "Start:".$time->getTimestamp().PHP_EOL;

$mc= new Memcache;
$mc->connect('localhost', 11211);

$key = "_config1000";

for ($i=0; $i<10000; $i++) {
  $config = $mc->get($key);

  if (!$config) {
    $config = parse_ini_file('test.ini');
    $mc->add($key, serialize($config));
  }
}


$time = new DateTime();
echo "End:".$time->getTimestamp().PHP_EOL;

ini-файл, 1000 параметров, 10000 итераций, без использования кеша:

Start:1295868628
End:1295868639

(11 секунд)

этот же файл с использованием memcache:
Start:1295868721
End:1295868723

(2 секунды)

Очевидно что лучше его таки использовать:)

seriyPS Jan 24 2011 at 12:46

$mc->add($key, serialize($config));

serialize() то зачем? драйвер мемкеша его автоматически делает. И Unserialize вы не делаете.

И время соединения с мемкешем только один раз посчитали, хотя нужно на каждой итерации делать connect()

mr_avi Jan 24 2011 at 13:10

Да, я не заморачивался, ну суть в принципе та же

seriyPS Jan 24 2011 at 13:24

Но вывод, скорее всего, будет другой. Особенно если время connect() посчитать для каждой итерации.

Хотя, если мемкеш используется в самом проекте и коннект нужно делать в любом случае, то да, можно время коннекта отбросить

mr_avi Jan 24 2011 at 13:48

Прогнал с исправлениями, получилось:
Start:1295874910
End:1295874923

Start:1295874893
End:1295874896

Redis тоже, кстати, показал 3 секунды:

$time = new DateTime();
echo "Start:".$time->getTimestamp().PHP_EOL;

require_once 'Rediska.php';

for ($i=0; $i<100000; $i++) {
  $options = array(
    'namespace' => 'Auto3_',
    'servers'   => array(
        array('host' => '127.0.0.1',
              'port' => '6379'
        )
    )
  );

  $rediska = new Rediska($options);

  $keyn = "__conf1000";
  $key = new Rediska_Key($keyn);
  $config = $key->getValue($keyn);

  if (!$config) {
    $config = parse_ini_file('test.ini');
    $key->setValue($config);
  }
}

$time = new DateTime();
echo "End:".$time->getTimestamp().PHP_EOL;

mr_avi Jan 24 2011 at 13:52

Только там 10 000 итераций, а не 100 000

vstas Jan 24 2011 at 13:08

Еще конфиги можно хранить в формате YML.

Довольно приятно читается.

Для парсинга мы применяем компоненту из фреймворка Symfony (http://components.symfony-project.org/yaml/).
Результат кешируем в виде php кода.

После сохранения результата в кеш быстродействие будет сравнимо с хранением конфигов в виде обычного PHP.

UFO landed and left these words here

kivsiak Jan 24 2011 at 17:30

Я на пхп конечно давно уже не пишу. Но какой процент от общего времени выполнения занимает инициализация конфига?

UFO landed and left these words here

kivsiak Jan 24 2011 at 22:19

А можно точнее? в процентах, мне действительно интересно что побудило автора провести такое исследование.

UFO landed and left these words here

FrolovS Jan 25 2011 at 07:10

Предыстория простая.

Когда одним скриптом (ну, точнее, одним вызовом) генерируется большая HTML-страница — то % времени на чтение конфигов маленький. Ну, например, 1/1000 времени работы скрипта.

Когда скриптом генерируются картинки, то, возможно, чуть больше (зависит от многих условий, понятное дело). Условно, потому что картинки генерируются графическими библиотеками, там PHP-вызовов меньше.

Когда скриптом генерируются AJAX-ответы — то, бывает, еще больше.

Например, я недавно видел подобный скрипт, который позволял реализовать часы в браузере: время на часах через AJAX-запросы к серверу синхронизировалось с серверным. Так вот, чтобы отдать клиенту текущее время, скрипт предварительно лез в конфиги, чтобы посмотреть формат времени-даты. Это, конечно, можно считать мисдизайном, потому что формат можно было принимать от клиента. Но это как посмотреть.

Так вот, это я к чему… Чтение конфигов в этом скрипте составляло что-то около 90% времени. А запросов к нему было достаточно много (больше, чем к страницам). А теперь представьте, что этот скрипт случайно был бы включен в phpBB, и конфиги бы хранились в базе данных…

Отсюда и интерес к исследованию скорости: чем меньше скрипты и чем больше раз они вызываются, тем более оптимизированы они должны быть.

Disturbed Jan 25 2011 at 08:42

кхм, а почему бы время/дату не передавать в unix timestamp? конфиги вообще не нужны в таком случае :)

UFO landed and left these words here

cream_brule Jan 25 2011 at 13:06

пока не могу себе представить такой проект, в котором были бы сотни мегабайт настроек…

stolice Jan 25 2011 at 13:21

после длительного использования symfony привык держать конфиги в yml файлах. С кэшированием в php-массивы, разумеется. Читать и править такие конфиги удобно, на выходе очень гибкий и быстрый php-код, без необходимости что-либо парсить при каждом запуске скрипта.

charon Jan 26 2011 at 12:38

спасибо за полезную статью. Возьму на вооружение. Был удивлён высоким результатом ini-файлов.

0xy Jan 27 2011 at 10:29

Не пробовали хранить настройки в SQLIte? Интересно было бы добавить к тестам и такой вариант. Конечно он проиграет в сравнении с тем же INI или нативным PHP, но, иногда нужно дать возможность менять настройки через CMS, и вот тут выбор как лучше организовать хранение и куда писать эти настройки.