BreathLess 25 авг 2010 в 10:27

Несколько других советов для PHP-разработчиков

3 мин

9.8K

PHP*

+125

301

Комментарии 301

merkushin 25 авг 2010 в 10:38

Сразу бросилось в глаза. Не count() алиас, а как раз наоборот — sizeof() есть алиас для count():
ru2.php.net/sizeof

BreathLess 25 авг 2010 в 10:43

Спасибо, поправлю, переставил места в уме.

time php -r 'for ($a=0; $a<10000; $a++) count($_SERVER);' 

php -r 'for ($a=0; $a<10000; $a++) count($_SERVER);' 0,04s user 0,01s system 90% cpu 0,055 total

time php -r 'for ($a=0; $a<10000; $a++) sizeof($_SERVER);' 

php -r 'for ($a=0; $a<10000; $a++) sizeof($_SERVER);' 0,03s user 0,02s system 82% cpu 0,061 total

galaxy 26 авг 2010 в 01:16

Это отсюда следует вывод

sizeof() это синоним count(), работает быстрее

?
Ну-ну…

leotsarev 25 авг 2010 в 19:00

Аааа, бросилось в глаза.
Nobody cares ваще-то

НЛО прилетело и опубликовало эту надпись здесь

merkushin 25 авг 2010 в 22:45

Не знаю, поддомен автоматом подставляется, я пишу просто «php.net/{function_name}», когда обращаюсь к мануалу.

DmitriKadykov 25 авг 2010 в 10:48

Оптимизаторы, блин. Ну нет смысла гоняться за милисекундами, ясно ведь что это ничего реального не даст. А если будут реально мощные наргрузочки — по-любому придется масштабировать проект, далеко на профилировании PHP-кода с его последующей оптимизацией не уедешь.

Вот вераня мысль на эту тему, полностью согласен с Котеровым:

forum.dklab.ru/viewtopic.php?p=42214#42214

BreathLess 25 авг 2010 в 10:54

Например, 30 000 000 хитов в сутки * лишние 50-100 миллисекунд, это уже сотни часов серверного времени. Которые стоят денег.
И эти сэкономленные часы, могут отложить необходимость «железного» масштабирования, на месяц, может быть два.
Если вы бутстраппер, и стараетесь минимизировать расходы, это может сыграть свою роль.

Да и вообще, политики «тормозит — смени железо» и «главное — скорость разработки», приводит к тому, что в моей кубунте, питоньих скриптов скоро будет больше чем бинарников. Ничего против питона не имею, но реально — уже заметно тормозит.

+18

BreathLess 25 авг 2010 в 10:56

Кстати, в данном случае, не Котерова надо цитировать, а Дональда Кнута, он всё-таки был раньше.

DmitriKadykov 25 авг 2010 в 11:12

Что значит «стоят денег»? Хостер что ли подсчитывает время и выставляет чек? Нет. Пример с кубунтой кстати совсем другого рода. Раз тормозит, значит есть смысл подумать об оптмизации. Именно в таком порядке!

А Кнут вообще-то программист несколько другого рода. У нас же веб, тут свои законы и принципы.

Если о цитатах, то вот ещё можно взять книгу Фаулера «Рефакторинг». Там он разбирает рефакторит пример кода и при этом намеренно допускает ухудшение его производительности. Разбивает один цикл на два, каждый из которых с тем же количеством итераций. И дает насчет этого достаточно подробный и внятный комментарий.

-11

BreathLess 25 авг 2010 в 11:41

«У нас же веб, тут свои законы и принципы.»

Мы кажется диаметрально противоположны во мнениях.
В вебе, скорость загрузки, прямо влияет на продажи/регистрации/заказы.

В desktop-приложениях, обычно можно подождать, оно же уже стоит.
Это как разница между сферой услуг и производством.

Стоит денег, потому что секунды собираются в минуты, минуты в часы, и приходится увеличивать количество серверов.

По поводу Фаулера, ничто не мешает писать и быстро и понятно =)

DmitriKadykov 25 авг 2010 в 11:51

В вебе, скорость загрузки, прямо влияет на продажи/регистрации/заказы.

Для десктопных приложений характерно наличие тяжеловесных ресурсоемких и долговыполняющихся операций. И в этом случае разница между оптимизированным и неоптимизированным кодом будет выражаться в минутах — что для юзера ощутимо. В вебе такого обычно не бывает. Отправил запрос — получил ответ. И тут разница выражается в долях секунды — конечному пользователю до них по-барабану.

-6

BreathLess 25 авг 2010 в 11:55

Далеко не по барабану.
webo.in/articles/habrahabr/54-psychology-web-performance/

У нас всё-таки всё очень разное, и десктопы и минуты, думаю, мы не убедим друг друга ни в чём =)

Vladson 25 авг 2010 в 11:59

Если конечно всё не настолько плохо что страница после 30 секунд полной тишины вылетает с таймаутом, бывает такое на перегруженных сайтах, и честно говорю раздражает куда больше чем если бы она открывалась 60 секунд, но открывалась бы рано или поздно…

Но это касается развлекательных сайтов, если интернет магазин, проявляет признаки «тормозов» я незамедлительно иду в другой магазин.
(При покупке той или иной вещи, мне нужно быстро ознакомиться с вариантами. Ждать по 3-5 секунд каждую страницу, это отвратительно. Тем более что иногда информация о нужном товаре в 3-5 кликах, а если товаров ещё и несколько… Ужас короче.)

borisko 25 авг 2010 в 12:00

Пока программисты думают вот так:

А Кнут вообще-то программист несколько другого рода. У нас же веб, тут свои законы и принципы.

В вебе останется куча жуткого говнокода, за который надо расстреливать.

+14

BreathLess 25 авг 2010 в 12:09

Да, и нормальным PHP-шникам, придётся продолжать объяснять, что они не быдлокодеры, и ничем не хуже других.

atlete 25 авг 2010 в 19:00

Как я вас понимаю.
Для многих PHP равняется быдлокодерству, это печальная правда.

BreathLess 26 авг 2010 в 00:22

Ноги растут из того факта, что какой-нибудь вчера-прочитал-два-туториала-рубист, поискав работу пару месяцев, резко осознает, что не смотря на то, что он высшее существо, с синтаксическим диабетом, почему-то всем нужны быдло-PHP-шники.
(далеко ходить не надо, я сам вчера вакансию (Казань) опубликовал)
И у него начинается производство кирпичей.

Не холивара ради, но радует, что школота уже не считает PHP крутым, и идёт на более домохозяечные языки.

DmitriKadykov 25 авг 2010 в 13:25

В вебе останется куча жуткого говнокода, за который надо расстреливать.

А нифига

Многих читателей отталкивает факт использования языка низкого уровня, но Кнут считает свой выбор оправданным, так как привязка к архитектуре необходима для того, чтобы можно было точно судить о таких характеристиках алгоритма, как скорость, потребление памяти, и т. д.

ru.wikipedia.org/wiki/%D0%98%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%BE_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F

borisko 25 авг 2010 в 13:32

В вебе нет привязкии к архитектуре?

BreathLess 25 авг 2010 в 14:57

А есть?
Вопрос немного странный, если веб работает на C++, через CGI, то вообще-то привязка будет.
Или вы что имели ввиду?

Aux 26 авг 2010 в 14:47

Ну пока у вас десять посетителей в сутки, то никакой привязки конечно нет. А если у вас hi-load, то у вас постепенно и особенности PHP в ход начинают идти, и ORM улетает в небытие, а потом вдруг у вас форкнутый MySQL и собственный компилятор PHP.

Просто большинству вебо-быдло-кодеров никогда не работать с такими проектами, как Facebook, от того и отношение такое. Это на малых проектах вы можете себе позволить докупать по серверу в месяц, а когда вам приходится покупать по сотне серверов в месяц, то каждая микросекунда приносит кучу сэкономленного бабла.

Справедливости ради стоит отметить, что замена двойных кавычек всё-равно ничего не даст (:

BreathLess 26 авг 2010 в 14:50

Я примерно это и пытался донести, по поводу микросекунд и серверов.

remal 25 авг 2010 в 12:07

Бля! Да вы сначала добейтесь такого кол-ва хитов, а потом говорите о производительности. Посещаемость сайтов обычно увеличивается экспоненциально. И оптимизировать вы станете не такие мелочи, а реально узкие места.

Использование разных хитрых конструкций для мнимого увеличения производительности ухудшает читабельность кода, не давая никаких плюсов на 99% сайтов.

+15

BreathLess 25 авг 2010 в 12:17

Вы читали топик?

«Да вы сначала добейтесь такого кол-ва хитов, а потом говорите о производительности.»
Я не вчера пришёл в профессию, и, опыты были разные, и 30 000 000 qpd, это всего лишь 40 qps.
PHP, кстати, это не только сайты. Это, например, фронтенды систем сбора информации.

«Посещаемость сайтов обычно увеличивается экспоненциально.»
Ваш вывод основан на каких данных, с каких сайтов?

«хитрых конструкций»
Какая именно конструкция вам кажется хитрой? Я могу разъяснить.

«для мнимого увеличения»
Можете замерить для своего кода, поделиться с нами, это будет конструктивнее, нежели голословные обвинения в мнимости.

«не давая никаких плюсов на 99% сайтов»
99% сайтов, не поднимаются выше 100 хостов в сутки, конечно же, эффект будет не заметен.

Вас что разозлило до состояния «Бля!»?

+10

s1im 25 авг 2010 в 12:41

Просто люди и задачи бывают разные:
— те люди, которым посчастливилось запустить проект с огромной посещаемостью, как правило, уже познакомились с основами оптимизации и ваша статья не дала ничего нового;
— молодые разработчики, которые только начали свое вхождение в веб-разработку, обычно не делают ничего крупномасштабного: как правило это разработка всевозможных сайтов-визиток, промиков, и пр. «новости-статьи-фотогалерея-с-пхпББ-форумом». Посещаемость на таких проектах как правило крайне мала (ура! сегодня приходил яндекс-бот), тонкая оптимизация их не интересует, работы и так много — надо срочно дописать свою ЦМС. Часть из них что-то усвоит и скажет вам спасибо, остальные хабр возможно и не читают :)
— студенты-нерды: зазубрят каждую сторчку вашей статьи и будут «оптимизировать» где только можно и нельзя в своих лабораторных работах (не забыв заменить все двойные кавычки на одинарные!). Такие люди имеют шанс впоследствии стать неплохими специалистами, когда со временем придет опыт и юношеский пыл поутихнет (если не увлекутся чем-нибудь еще и не уйдут в другую отрасль).

Вывод: в первом случае цена железа может оказаться меньше стоимости оптимизации, во-втором случае оптимизация обычно не проводится (даже если нужна), в третьем нужна оптимизация или не нужна — не важно, она там будет, ибо fun.

BreathLess 25 авг 2010 в 12:46

Надеюсь, никто не будет зубрить мою статью.

Оптимизация, может быть не отдельным процессом, а больше стилем, вот я о чём.

s1im 25 авг 2010 в 12:50

Если вы про то, чтобы научить себя сразу писать оптимально и красиво, то да, это хороший стиль!

BreathLess 25 авг 2010 в 12:51

Именно про это, в противовес подходу «пойду-ка напишу скрипт для замены всех count и sizeof».

remal 25 авг 2010 в 15:02

Что в вашем понимании «стиль» применимо к оптимизации? Писать «simplexml_load_string( file_get_contents ('file.xml') )» вместо «simplexml_load_file('file.xml')»? Без дополнительного комментария рядом это — WTF.

Поймите: единственно верной статьей по оптимизации PHP может быть описание как пользоваться профайлером и описание где искать информацию по оптимизации базы и кеширования.

BreathLess 25 авг 2010 в 15:07

Единственно верным и надежным способом является набить всем шишки самому.
Но люди, зачем-то обмениваются знаниями и наблюдениями.

plandem 25 авг 2010 в 20:40

«фронтенды для сбора информации» чаще всего вообще-то переписывают на С++ :)

BreathLess 25 авг 2010 в 22:12

Я не про высоконагруженные сенсоры, а про проекты попроще, где важна универсальность и удобство PHP.

НЛО прилетело и опубликовало эту надпись здесь

denlem 26 авг 2010 в 01:28

Делать код быстрее имхо лучше чем делать «как знают все». Тыделаешь сайт для посетителей или для разработчиков?

remal 26 авг 2010 в 02:16

Почитайте что-нить нормально по оптимизации (например: habrahabr.ru/blogs/php/22881/) и не пишите чушь.

-1

denlem 26 авг 2010 в 02:37

По книжке конечно жить хорошо, но опечатки могут тебя подвести.
В серьезных проектах уже не действуют те законы оптимизации, которые можно применять к стандартным студенческим сайтам. К примеру проектирование базы данных — кардинально отличается… — как пример запросы на обычном не нагруженном сайте могут выглядеть как связка 2 -х 3-х и более таблиц, что довольно часто недопустимо на мега-проектах (я бы сказал веб системах) — там это может делаться в 2-3 отдельных запроса.
Типичный пример — эта статья — поверь, человек не просто дурью маялся. И иногда посидеть часок-другой над таким рефакторингом намного выгоднее чем платить лишнюю тысячу долларов на новый процессор или сервер.

-1

FanatPHP 26 авг 2010 в 03:03

Закон оптимизации только один — профайлинг. Других нету. Действует везде.
Профайлинг приложения в целом, а не искусственного кода на однопользовательской машине.

Человек именно что маялся дурью.
Тe самые запросы выполняются в миллионы раз дольше, чем высиженная здесь мифическая разница между count и sizeof. Весь этот «рефакторинг» высосан из пальца. И оптимизировать надо их, а не это фуфло.

Рефакторинг, my ass. Вот ты аффтару подсуропил. Он-то пытается сейчас закосить под девочку, выставить свои поучения как ни к чему не обязывающие советы, типа «Ну если все равно какую функцию использовать, то лучше „более быструю“. На этапе разработки, разумеется. Но даже он и в кошмарном сне себе не представит, что по его статье надо срочно садиться и перепахивать весь код на использование „более быстрых функций“.

Продолжай его защищать. С такими друзьями врагов не надо :)

denlem 26 авг 2010 в 12:19

Я не хочу с вами спорить, т к закон законом, но дело не в том. Это не подмена законов и т д, это дополнительные возможности сэкономить на железе, времени и деньгах.
Если вы исключаете для себя еще одну возможность ускорить свой код — продолжайте ограничивать себя дальше.

FanatPHP 26 авг 2010 в 12:34

В то-то и дело, что нет тут никаких дополнительных возможностей.
Даже автор уже изъюлился весь — «летают, но нызенько-нызенько! На разных осях/сборках/машинах все будет по-разному!!» Ну и толку-то тогда в этих советах, если у соседа они приведут не к экономии, а к расходам?
На самом деле — бред, конечно. Ни к экономии, ни к расходам этот набор заклинаний не имеет никакого отношения.
Дело не в том, какая функция быстрее или медленнее. А в том, что эта разница не влияет на конечный результат. Ключевое слово — конечный результат. На конечном результате мы получим неразличимую разницу — в пределах погрешности.
Это очень сложно понять тому, кто ни разу не пользовался профайлингом и не научился отличать значимое от незначительного. Но рекомендую хотя бы попытаться.

BreathLess 26 авг 2010 в 12:38

Ты клёвый, ты столько про меня знаешь, я уже привязался к тебе =)

wpm1 26 авг 2010 в 12:50

сами то не юлите? Туда сюда, конечный результат… Профайлинг — профайлингом. Писать то надо уметь, чтобы понять почему что-то тормозит.

denlem 26 авг 2010 в 12:59

Тупо отрицать то что работает. И если ты немного подумаешь, а не будешь прикрываться законами, то может поймешь, что можно применять и в большинстве случаев успешно.
Не как основное, а как дополнение.
Конечно можно орать что лучше когда сразу через хDebug все прогнать.
Есть куча возможностей по ускорению проекта на других уровнях (redis, memcached, memory tables, ssi, nginx) — но никто же из-за этого не отменяет оптимизацию.
Не будь ограниченным, бо из-за таких рамок можно пропустить очевидные вещи, которые могут ускорить проект.

tenshi 26 авг 2010 в 13:26

ну нашёл ты узкое место, а дальше что? а дальше открываем подобную статью и смотрим что в этом узком месте можно соптимизировать.

FanatPHP 26 авг 2010 в 13:48

Нет-нет! ни в коем случае!
Здесь это не работает.
Вот и автор даже сам уже сто раз повторил, что на других системах все будет по-другому (какой тогда вообще смысл было писать — это другой вопрос). То есть, он сам же и пишет, что НЕ НАДО обращаться к его статье.

Оптимизация — это процесс. Её нельзя просто «добавить». В каждом конкретном случае надо действовать по-разному.
Хороший пример — база данных.
Плохая статья напишет «добавь индекс на поле, по которому идет поиск». Хорошая — «изучай эксплейны для твоего КОНКРЕТНОГО случая». Это не всегда занимает 5 минут. Но это то, что реально помогает, и то, что приходится делать.

Но вообще, конечно, это все пустое. Подавляющее большинство комментаторов никогда в жизни не столкнутся с необходимостью опртимизации, а столкнувшись — будут решать ее совсем другими средствами. Не зря на форумах так много вопросов «какая самая ыбыстрая CMS»

tenshi 26 авг 2010 в 14:51

без статьи я бы и не узнал, что file_get_contents может быть быстрее file. как бы я об этом узнал читая эксплейны? или предложишь открывать исходники этих функций?

FanatPHP 26 авг 2010 в 14:54

Она не быстрее.

BreathLess 26 авг 2010 в 12:22

Найди слово рефакторинг в моей статье, потом с удовольствием выслушаю извинения, и рассуждения о «высосанности из пальца».

remal 26 авг 2010 в 03:21

Что вам, что автору сего топика советую прочитать Макконнелла «Совершенный код», раздел про оптимизацию. Там очень хорошо показано почему рулит профайлинг живого кода и почему никогда не следуют делать синтетические тесты для попыток что-то там померить.

BreathLess 26 авг 2010 в 12:39

Цитату из топика приведу:

«Замечу, что многое зависит от вашей архитектуры, и практически любой совет надо проверять на своём коде, не доверяя полностью чужому опыту.»

remal 26 авг 2010 в 14:08

Тогда еще раз повторю: единственно верной статьей по оптимизации PHP может быть описание как пользоваться профайлером и описание где искать информацию по оптимизации базы и кеширования.

Раз приходится делать подобные микро-оптимизации, у вас узкое место — PHP. Смените язык и не страдайте фигней. Много кода, слишком долог будет перенос на другую технологию? Ок, напишите модуль к PHP на С.

Та же самая Java, если ее знать, ничуть не медленнее для разработки сайтов, а вот в плане отладки и скорости выполнения обгоняет PHP на *порядки*.

Вы работаете с языком очень высокого уровня. Основные оптимизации — алгоритмы, архитектура, смена языка. Микро-оптимизации не принесут достаточного эффекта, чтобы о них даже задумываться.

BreathLess 26 авг 2010 в 14:24

Кстати, как раз уже неделю, изучаю JSP + Tomcat, java поражает скоростью, хотя пока непривычно.

FanatPHP 26 авг 2010 в 14:03

LOL
как я и говорил — аффтар тобой недоволен. Найди, говорит, слово «рефакторинг» в моей статье и извинись!
лизать-то тоже надо с умом, хе-хе

denlem 26 авг 2010 в 14:34

Я выражаю свои мысли (не всегда совпадающие с автором), которые доказал.
Отгадай такую задачку:
У тебя есть 5 спичек. Как сложить из них 4 треугольника так чтобы они не пересекались?
(Ответ — посмотри на них в трехмерном пространстве тогда помешь как это сделать)
Вывод:
Если ты смотришь на проблему в одной плоскости — успехов.

zerkms 25 авг 2010 в 17:48

пардон, конечно, но чтобы выиграть на нагруженном проекте 100мс путём таких оптимизаций — нужно чтобы код был совсем уж лапшой.

BreathLess 25 авг 2010 в 17:50

Очень просто, к примеру strtr в некоторых случаях (короткие аргументы), оказывается быстрее группы str_replace.

Как вы думаете, средний шаблонизатор, сколько делает замен за запрос?

-2

zerkms 25 авг 2010 в 17:55

1. Я комментировал статью, не надо придумывать на ходу другие примеры. Я прекрасно знаю, как ещё можно оптимизировать код. Я лишь уточнил, что примерами из статьи вряд ли удастся оптимизировать проект, который работает на 40rps (пускай загрузка будет равномерной). Итого — по 25мс на запрос. Т.е. оптимизировав код на 100мс, вы получится время выполнения (барабанная дробь) = -75мс. А теперь ещё добавим неравномерную загрузку и получим ещё более обескураживающие результаты

2. Если strtr в некоторых случаях и выигрывает, то, логично предположить, что в некоторых — проигрывает. Как вы будете производить выборку рантайм и какова будет итоговая маржа — тоже стоит лишь гадать. И на вашем месте про 100мс на указанных нагрузках я бы таки не вспоминал.

zerkms 25 авг 2010 в 17:57

ps: я вам поверил, а вы ошиблись — 30M rpd == 347.(2) rps, т.е. 2.88ms на запрос. Где вы тут оптимизируете на 100мс — ума не приложу.

BreathLess 25 авг 2010 в 18:09

Да, насчёт 40qps, я ошибся, это нагрузка у текущего проекта, сорри.

Число 100 было выбрано без задней мысли. Знаете, некоторые люди, называют хайлоудом проекты, у которых 2400ms на страницу.

Ситуация сильно меняется, если это выигрыш 10ms?
Если не ошибаюсь, там получается выигрыш в несколько сотен часов, и сути дела это не меняет.

zerkms 25 авг 2010 в 18:13

Суть дела меняет.

2.4s на запрос (забудем о нюансах) — это максимум 36rpd
2.39s на запрос — это максимум ~36151rpd

Для меня эта разница не принципиальна. А для вас? Ах, да — указанные 30М хитов проект с такой производительностью наберёт за 833.(3) дня. Т.е. за 2.28года. Выигрыш в 83.(3) часа (3 суток) за более чем 2 года — это насмешка над командой оптимизаторов.

BreathLess 25 авг 2010 в 18:16

Извините, я немного не понял, как 36rpd из 2.4s получилось.

Это 36 requests per day?

zerkms 25 авг 2010 в 18:16

36k, забыл суффикс. Это ведь очевидно. По вычислениям, кроме опечатки, есть претензии? :-)

BreathLess 25 авг 2010 в 18:24

Нет, это не претензия, я просто не понял =)

По поводу вычислений, соглашусь, но вам не кажется, что еще важна площадь кода?

И да, для меня это критично, чисто из перфекционизма, наверное. =)

zerkms 25 авг 2010 в 18:27

Я не против вашего подхода — я сам пользуюсь (исторически и интуитивно) почти всеми техниками, что и вы описали — мне просто не совсем понятен подобный подход к изложению. Лично я считаю, что новички сами должны до этого всего дойти, наступив на сотни граблей. В конце-то концов, у начинающих программистов нет таких нагрузок, где подобные спичечные оптимизации были бы эффективны, а для неначинающих вы Америку и не открыли…

Хотя я уже придираюсь, скорее, согласен )

zerkms 25 авг 2010 в 18:29

Во, понял что я хотел сказать, но никак не мог: ваши советы стоит преподносить как best practices, но не как руководство к действию при оптимизациях скорострельности.

BreathLess 25 авг 2010 в 18:32

Ну, теперь всё ясно, мир? =)

zerkms 25 авг 2010 в 18:33

Мир, да. Я сам к этому выводу пришёл только сейчас. Если с него и начинать — много времени бы сэкономили :-)

FanatPHP 25 авг 2010 в 23:39

bullshit это называется, а не best practices
обычные нубские рассуждения на тему «прирост в 5-10 раз!!!».
Что бы он ни лепетал в оправдание, но в головах у «джуниоров» оптимизация все равно останется не процессом, а набором цитат Мао. заменил инклюд_онс на инклюд — и порядок. ПОДХОД неверный в принципе.
О банальных вещах, вроде «одинарные кавычки вместо двойных», думаю, знают все, my ass. После этой фразы УЖЕ можно дальше не читать, все и так ясно. Че-то ты тормозишь. Не расшаркиваться надо, а запинать и поставить на место. Карму бережешь? нуну.

BreathLess 25 авг 2010 в 23:55

Могу нахуй послать, чтоб не было подозрений в кармадрочерстве, успокоит?
Нубские, наверное, даже будучи php-кодером 7-ой год, я рад, что мне есть куда расти, и чему учиться.

Кстати, попробуй переспать с живой женщиной, ну хотя бы с платной.
Это снимет болезненные приступы немотивированной аггрессии к незнакомым тебе людям. С правой рукой ты такого не добьешься, я гарантирую это =)

FanatPHP 26 авг 2010 в 00:31

Чувак сливается сплошь и рядом.
habrahabr.ru/blogs/php/102598/#comment_3188263
«летают, но нызенько-нызенько»

Фееричное, в соскдних предложениях:
1) «Даже на Debian и Ubuntu, PHP иногда ведёт себя по разному».
2) «Тут просто список особенностей поведения.»
Фигли писать список особенностей (зачем он вообще нужен — другой вопрос), если сам же тут же говоришь, на разных системах особенности даже не воспроизводятся.

Тут не сюсюкать надо. Тут за шкирку и в кучу носом натыкать.

-3

BreathLess 26 авг 2010 в 00:36

Неделя свободы осталась, понимаю Вас, беснуйтесь дальше.

1. Да, это распространённое явление, мейнтенеры могут иметь разные взгляды на параметры сборки.
2. Я указал список систем, которые наблюдал, и отметил, что могут быть отличия.

По поводу сюсюкания.
Ваша сила в интернете, как всегда повергают меня в благоговейный страх.

Bal 26 авг 2010 в 13:00

Э… Вы собираетесь 30М запросов отдавать в один поток?

Уже всего на сотне потоков получается 288мс на запрос :)

zerkms 27 авг 2010 в 05:43

1. У вас есть сто процессоров?
2. У вас все ресурсы так офигенно масштабируются: hdd, сеть, сторадж?

Bal 27 авг 2010 в 13:33

1. У меня четыре ядра и несколько сот потоков.

2. Именно потому, что ряд ресурсов не масштабируется, у меня несколько сот потоков. И 16Гб оперативки (ибо она «масштабируется» куда лучше, чем HDD).

…

30, не 30, но несколько миллионов запросов в сутки я отдавал даже на древнем Xeon-1800. И до 80-90 млн. SQL-запросов в сутки.

BreathLess 25 авг 2010 в 18:10

1. Вы отлично умеете придираться к цифрам, выдирая их из контекста. Я к слову, не указал в статье абсолютных цифр, чтоб таки не провоцировать таких вот споров.

2. Можно заранее знать, например, если это код, который превращает текстовые смайлики в графические.

zerkms 25 авг 2010 в 18:15

Правильно, вы указали их в комментарии. И я дал ответ на комментарий в контексте поста. Ваши необдуманно брошенные слова спровоцируют миллионы новичков на новые «подвиги».

2. Можно. Приведите цифры из конкретного проекта, в котором замена str_replace была решающей и в которой был bottle neck.

-1

BreathLess 25 авг 2010 в 18:21

«Ваши необдуманно брошенные слова спровоцируют миллионы новичков на новые «подвиги»»

Вы меня с Котеровым не путаете? Какие еще миллионы?
Вы сейчас, хотите, чтобы я сверхъественным образом отредактировал свой комментарий?
Или вы хотите, чтоб я раскаялся?

Я уже сказал, что цифра была выбрана абстрактно, моя ошибка, что это было неочевидно.

2. Те же смайлики, а также парсинг коротких тегов, позволяли сократить среднее время обработки на 10-15%, думаю, абсолютные числа с моего ноутбука или VDS вам не нужны?

-1

zerkms 25 авг 2010 в 18:24

Опять 10%. Опять необдуманно? Вы какой пример имеете ввиду — который 300rps, или который 2400ms на генерацию?
Если первый — тогда вы опять лжёте.
Если второй — тогда там есть куда более явные проблемы, чем поиск-замена смайликов.

-1

BreathLess 25 авг 2010 в 18:29

«Опять лжёте.»,
У меня, извините, слов нет, после таких заявлений.

Пример взял из своего конкретного кода, 20 ms -> 18 ms, устраивает? Может сорцами сверкнуть? =)

Просветите насчёт явных проблем, если уж решили идти до конца.

-1

zerkms 25 авг 2010 в 18:31

Явные проблемы — это 2400ms на страницу. Если только там нет в том же потоке кодирования видео/картинок/звука или математики — это уже запашок.

BreathLess 25 авг 2010 в 18:35

Эээ, могу в личку вам скинуть ссылку на популярный движок для городских сайтов, который даёт такие результаты на конфигурации 8 ядер/8 гигов.

zerkms 25 авг 2010 в 18:36

Не, меня изкоробочные CMS и прочие блогодвижки не интересуют. Да и никогда в жизни не интересовали :-)

BreathLess 25 авг 2010 в 18:37

Меня тоже, свой код держу в пределах 25-50 ms, но пришлось поддерживать эту жуть.

tenshi 25 авг 2010 в 22:46

ни одной.

BreathLess 25 авг 2010 в 23:02

покажи такой

tenshi 25 авг 2010 в 23:04

да любой

BreathLess 25 авг 2010 в 23:59

ну какой, например?

tenshi 26 авг 2010 в 00:18

смарти

BreathLess 26 авг 2010 в 00:25

grep -c 'replace' /usr/share/php/smarty/* 

/usr/share/php/smarty/Config_File.class.php:2

/usr/share/php/smarty/debug.tpl:0

/usr/share/php/smarty/internals:0

/usr/share/php/smarty/libs:0

/usr/share/php/smarty/plugins:0

/usr/share/php/smarty/Smarty.class.php:3

/usr/share/php/smarty/Smarty_Compiler.class.php:31

tenshi 26 авг 2010 в 00:50

$property_name = preg_replace_callback('/([A-Z])/', $camel_func, $property_name);

и чо?

BreathLess 26 авг 2010 в 01:33

/usr/share/php/smarty/Smarty_Compiler.class.php:
$compiled_content = str_replace($tag_guard, '<?', $compiled_content);

А вот чо.

tenshi 26 авг 2010 в 03:08

и сколько раз на странице происходит перекомпиляция шаблонов? х)

BreathLess 26 авг 2010 в 12:20

Признайте фейл, вот и всё.

plandem 25 авг 2010 в 20:31

сразу вопрос — а тестировалось-то с каким-нибудь компилятором?! тот же APC или еще что. А то вроде как про 30 млн хитов речь, а вот про тесты не понятно.

BreathLess 25 авг 2010 в 22:13

Цифры для иллюстрации, не с тестов.

BreathLess 26 авг 2010 в 12:40

Вопрос кстати не сразу понял. Вообще, xCache стоит.

Psih 25 авг 2010 в 10:57

Ну иногда проблемы бывают далеко не в базе, как посмотришь иногда на чужой код, так диву даёшься как это вообще ещё живо.

BreathLess 25 авг 2010 в 11:00

Я думаю, каждый хоть раз видел код, в стиле:

for ($a = 0; $a < count ($arr); $a++) do();

DmitriKadykov 25 авг 2010 в 11:15

Я кстати тестировал подобную конструкцию на произваодительность. Как оказалось, главный тормоз здесь — вычисление count ($arr) на каждой итерации цикла. Ну это так, к слову.

BreathLess 25 авг 2010 в 11:23

Кхм, вообще-то это как раз таки пример хрестоматийно медленного кода, и проблема с count() очевидна =)
Или это была ирония?

DmitriKadykov 25 авг 2010 в 11:40

Да нет, просто я сам в свое время понял, что главный тормоз здесь это count() только после того как сравнил результат с кодом, где count() вычислялся один раз. Не сказал бы что это настолько очевидно.

BreathLess 25 авг 2010 в 11:50

Если что, я не минусую оппонентов.

-1

leotsarev 25 авг 2010 в 19:04

Я бы тут предъявы кидал к интерпретатору, а не к разработчику.

BreathLess 25 авг 2010 в 19:59

Тут всё однозначно, причём тут интерпретатор?
Даже если он внутри кеширует результат каунта, то не стоит списывать со счётов расходы на вызов функции.

leotsarev 25 авг 2010 в 20:00

А Common subexpression elimination происходить не должен?

BreathLess 25 авг 2010 в 20:03

Насколько я помню, это из теории компиляторов.
В PHP видимо посчитали, что для интерпретатора такая замена не нужна.

leotsarev 25 авг 2010 в 20:20

Я к тому, что если $arr внутри вызова $do не модифицируется, я ожидаю, что нормальный компилятор сделает так:

$tmp_arr_count = count ($arr)
for ($a = 0; $a < $tmp_arr_count; $a++) do();

Если вдруг выяснилось, что он этого не делает, и у меня вдруг это вылезет как узкое место, я скажу «гм» и сделаю это сам. Но только если вылезет на профайлере. Вообще странно ожидать такого от программиста.

Это какой-то каменный век. Типа древного

Inc

в Borland Pascal. Компилятор разворачивал оператор:

i:=i+1;

в машинный код

 mov ax, [i]
 inc ax
 mov [i], ax

вместо того, чтобы делать:

inc [i]

Чтобы получить нормальный код, была специальная функция-макрос:

Inc(i);

LoneCat 25 авг 2010 в 20:33

Компилятор — это компилятор, у него во-первых есть время делать такие оптимизации, во-вторых есть возможность, так как чаще всего компилируемые языки — со статической типизацией, массивами, а не хешами, с ограниченной размерностью этих самых массивов и т.д.

for($a = 0; $a < count($arr); $a++) {
  array_push($arr, 'newvalue');
}

И оптимизация ломает логику, а в php это вполне себе работающая конструкция.

leotsarev 25 авг 2010 в 20:41

Я же написал, если do() не модифицирует $arr. Определить это в большинстве случаев можно.
В том числе и в языках с динамической типизацией и хитрыми массивами (javascript)

LoneCat 25 авг 2010 в 20:45

Это не всегда возможно, и не всегда доступно малой кровью, нежели гадать настолько-ли умен компилятор чтобы додумать программу за меня — мне проще написать самому for($i = 0, $j = count($array); $i < $j; $i++);, так как я-то точно знаю изменяется-ли размерность массива внутри цикла или нет.

leotsarev 25 авг 2010 в 20:50

Не надо ничего гадать, надо писать самым прямым способом. Если это было узкое место — оно на профайлере вылезет.
Если язык поощряет писать «непрямым» способом, значит что-то не так.

В данном случае не с языком, а с интепретатором.

LoneCat 25 авг 2010 в 21:05

Так предложенный мной способ — он и есть прямой, даже на компилируемых языках писать так — правильно, несмотря на то что на них отследить подсчет цикла более реально. Си-подобный цикл for выглядит так:
for(инициализация; условие; инкремент); — первое выражение выполняется единожды, последующие два с каждой итерацией, вынесение count() во второе выражение указывает что он и будет выполнятся каждую итерацию, то что какие-то компиляторы могут на достаточном уровне проанализировать код чтобы понять будет-ли изменяться размерность массива — еще не значит что так и надо писать.
Писать надо так, как оно в итоге должно выполнится, а не гонять потом программу в профайлере туда-обратно «угадал — не угадал?».

leotsarev 25 авг 2010 в 21:26

Писать так, как оно «в итоге должно выполнятся», не надо.

Компилятор — программа, созданная, чтобы упрощать мою работу. Программист должен писать «что нужно сделать», а не «как это нужно сделать». Чем более высокий уровень — тем больше простора мы даем нижним уровням для оптимизации.

В этом плане лучше всего написать foreach, на самом деле.

LoneCat 25 авг 2010 в 21:35

Интерпретатор — не компилятор, как я уже выше написал, у компилятора гораздо больше времени проводить оптимизации, от него никто не ждет результата здесь и сейчас, он может анализировать код часами, насчет «что нужно сделать» и «как нужно сделать» — это споры насчет империтивного и функционального программирования, обе методологии имеют право на жизнь, но «что нужно сделать» относится ко второй, а php — к первой.
Ну и мои хвалебные оды foreach в конце топика :P foreach — это правильный пример оптимизации и облегчения жизни программиста, это отдельная языковая конструкция у которой заведомо известно что и как она исполнит.

leotsarev 25 авг 2010 в 21:43

У других интепретируемых языков CSE есть. Не везде, но в hotspot — есть.

Да, я тоже в общем случае за foreach, именно потому что, она более высокоуровневая.

leotsarev 25 авг 2010 в 20:42

Кстати, простите тупого, а этот цикл закончится? Мы на каждом шагу добавляем новое значение и никогда не догоним count($arr). Или я чего-то не понимаю?

LoneCat 25 авг 2010 в 20:46

Закончится по истечению 30 секундного интервала, если через set_time_limit() не задан другой интервал, это в данном случае актуально?

leotsarev 25 авг 2010 в 20:47

Это я на всякий случай. :)

rilian 26 авг 2010 в 00:21

Компилятор может вынести результат count() за пределы цикла только если будет знать что выращение внутри count() не меняется во время выполнения цикла. Если для простого скрипта вывода это проверить можно, то для многопоточных выражений — нет. Поэтому в данном случае «оптимизация» — за программистом.

leotsarev 26 авг 2010 в 10:47

Для к-каких извините, многопоточных выражений? Если $arr не глобальная переменная, то как она может существовать в другом потоке?

leotsarev 25 авг 2010 в 20:25

Ну и что значит «не нужна». CSE даже javascript интерпретаторы делают, а им вдруг не нужна.

namor 26 авг 2010 в 06:32

имхо оставлять без особой необходимости в цикле вычисления которые из цикла можно вынести это писать плохой код.
компиляторы/интерпретаторы тут не виноваты.

leotsarev 26 авг 2010 в 10:44

Ага, давайте так:

foreach ($arr as $el)
{
   echo $el + 1/3;
}

Я правильно понял, что в этом цикле каждый раз будет выполнятся деление с плавающей точкой? И нужно писать на самом деле вот так:

$one_third = 1/3;
foreach ($arr as $el)
{
   echo $el + $one_third;
}

leotsarev 25 авг 2010 в 19:02

Мне вот тоже казались, что рассуждения какие кавычки быстрее в приличном обществе давно запрещены.

Ogra 25 авг 2010 в 11:05

Если я правильно понимаю, то в этом посте не содержится советов по той самой «преждевременной оптимизации, что является корнем всех зол». Здесь рассмотрено несколько правил, улучшающих производительность не в ущерб разработке — т.е. использование более быстрых синонимов/аналогов, не ухудшающих читабельность кода.

BreathLess 25 авг 2010 в 11:06

Да, преждевременная оптимизация, обычно связана с неуместным усложнением архитектуры кешированием, предвыборками и т.п.

DmitriKadykov 25 авг 2010 в 11:32

Это тоже верно — если конструкции выглядят одинаково адекватно — почему бы и не применить наиболее быструю. Но вот о чем подумает новичок, прочитав такую статью? Он конечно же воспримет её как руководство к преждевременной оптимизации.

Например, нотисы. Почему их нужно избегать? В первую очередь — не из-за оптимизации! Допустим, некий прогер разработал проект в котором решил забить на нотисы. Т. е. начал написал код так, что нотисы возникают и это считается для него нормальным тоном. Все равно на продакшне display_errors = off. И тут оказывается что логи сервера разбухают непомерянно — на каждый хит нотисов вылезает десяток штук. Устанавливаем error_reporting пониже — получаем проблему с дебагом кода.

BreathLess 25 авг 2010 в 11:47

Я указал, что если аргумент с хорошим тоном не прокатывает, но программист беспокоится о скорости, это еще один рычаг воздействия, ни в коем случае, не первостепенный.

«Он конечно же воспримет её как руководство к преждевременной оптимизации.»
Мне кажется, это слишком однозначный вывод.

FanatPHP 26 авг 2010 в 00:03

На самом деле, конечно же, тоже неверно.
Большая часть всех этих «оптимизаций» не приведет к измеримому приросту скорости работы приложения.
И не выглядят они одинаково. С какой стати include_once стал выглядеть, как include? Оператор выбирается по требуемому функционалу, а не потому что какой-то дядя сказал, что один быстрее другого.

-2

FanatPHP 25 авг 2010 в 23:50

Нет, содержится.
Преждевременная оптимизация — это именно стремление оптимизировать там, где не надо.
Причем, что забавно — реально производительность как раз не увеличивается.
Вбор между count и sizeof может быть обусловлен чем угодно, но только не разницей в производительности.
Сам подход в принципе неверен. Вместо профайлинга, который и является единственным основанием к оптимизации, тут просто набор рецептов.
Оговорка «на вашей системе результаты могут быть другими» выдает автора с головой. Это именно попытка преждевременной оптимизации и ничто другое.

BreathLess 26 авг 2010 в 00:05

Слушай, срыв покровов прямо какой-то.
Я всегда думал, что преждевременная оптимизация, это стремление оптимизировать не тогда когда надо, как бы преждевременно. А ты мне глаза открыл =)

Даже на Debian и Ubuntu, PHP иногда ведёт себя по разному, чего говорить о мире RPM-based дистрибутивов.
Опять же, у меня нет под рукой FreeBSD, а на ней есть свои особенности.
Поэтому там и есть эта оговорка.

Набора рецептов, или практик, тут не было, вам показалось. Тут просто список особенностей поведения.
Каждый сам определит для себя их полезность.

1amer 25 авг 2010 в 11:07

Мы тут вчера решили профайлером пройтись по одному проекту, доставшемуся нам от фирмы «X».
400+ запросов к мускулу на 1 страницу. а вы тут на count() и sizeof() экономите…

+16

BreathLess 25 авг 2010 в 11:13

Ну, подобные проблемы, слава богу, давно в прошлом.
Я помню, в 2004 году, начинал писать свою систему на Athlon XP2400 / 256 RAM под windows, и у меня каждый лишний запрос, «кожей ощущался», можно было на вид определить сколько запросов было =)

В следующих топиках, затрону тему правильной предвыборки и поствыборки из хранилищ данных.

1amer 25 авг 2010 в 11:24

Проект новый. компания довольно известна в городе екатеринбурге, но проблема есть
клиент лучше будет платить за вдс с 1500мб памяти и кучей проца, чем один раз переделает сайт у фирмы с нормальными программистами. чтобы не быть голословным

BreathLess 25 авг 2010 в 11:43

Да, это странно, платить каждый месяц, вместо единовременных оптимизаций.

Ogra 25 авг 2010 в 11:07

Между прочим, от фразы «Преждевременная оптимизация — корень всех зол» недалеко ушла фраза «Как-нибудь сделаем, а потом исправим», и не надо путать одну с другой.

BreathLess 25 авг 2010 в 11:16

Да, вы очень правильно всё поняли.
Одно дело, прикрутить memcached к начавшему тормозить mysql, другое, grep-ать и search&replace'ить весь код, заменяя куски кода.
Это просто набор полезных ненапряжных привычек.

Vladson 25 авг 2010 в 11:14

Пусть simplexml_load_file работает хоть в 2 раза медленнее, но он при чтении файла выглядит логичнее. Стало быть если в какой-то из следующих версий РНР может его и сделают быстрее, то ваш некогда быстрый код, как читался неудобно так и будет читаться дальше, а это сильно скажется на дальнейшей поддержке кода. Особенно это будет заметно с file()

BreathLess 25 авг 2010 в 11:22

Приведу вам контр-пример.

У меня получение данных, абстрагировано классом, который скрывает реальный источник данных: БД, файлы, мемкешед, веб страница, и предоставляет единый интерфейс.

Я склоняюсь к соблюдению «unix way» и концепции «pipes» не только в целых скриптах, но и в функциях.
Мне нужна логика, которая разбирает xml. И только.

Как раз таки, когда мы берём под контроль процесс получения данных, мы повышаем гибкость и обслуживаемость кода, а не оставляем его на милость «может его и сделают быстрее».

Vladson 25 авг 2010 в 11:35

Вот вы и сами в попытке опровергнуть моё мнение, только подтвердили его.

В вашем случае у вас совершенно другая ситуация, вам будет нужен file_get_contents, НО, не потому что он работает быстрее чем «simplexml_load_file», а потому что У ВАС в приложении просто архитектурно не предусмотрен таковой, и вы передаёте данные именно в «simplexml_load_string»!!!

Вывод?
Все эти советы имеют обратные стороны, использовать или нет зависит сугубо от ситуации, и скорость в миллисекундах или даже в микросекундах никакого отношения к этому не имеет…

BreathLess 25 авг 2010 в 11:45

Нет, не соглашусь всё-таки.

file_get_contents — он, образно выражаясь, специалист по получению файлов.
simplexml_load_file — дилетант, который хватается за два дела.

Shedar 25 авг 2010 в 11:24

Часто еще забывают, что множественная конкатанация строк — очень медленная операция.
вместо

$result='';
for($i=0;$i<=100500;$i++){
$result.='<option>'.$result.'</option>';
}

лучше сделать

ob_start();
for($i=0;$i<=100500;$i++){
echo '<option>', $result, '</option>';//при echo используем запятую между фрагментами, а не точку
}
$result=ob_get_clean();

BreathLess 25 авг 2010 в 11:46

Об этом хорошо очень на phpbench.com написано, советую.
В своей статье, я решил не повторяться, об этом часто пишут, и часто забывают.

Shedar 25 авг 2010 в 11:57

На phpbench не увидел варианта, когда нужно в результате получить строку, а не вывести её. Как показывает опыт общения с программистами, ob_ функции очевидны далеко не для всех.

BreathLess 25 авг 2010 в 12:03

Мне кажется, в проекте echo должен быть только один, не смотря на преимущества ob_.
Тот, который выводит отрендеренную переменную.

Это повышает удобство отладки и ясность кода, имхо.

Shedar 25 авг 2010 в 12:12

На сайтах портального типа я сторонник блочного построения страницы, когда у каждого блока свои настройки кэширования. При отсутствии нужного блока в кэше — он рендерится в строку и ложится в кэш в соответствии со своими настройками. Как такого достичь без буферизации вывода — я не знаю.

BreathLess 25 авг 2010 в 12:20

Я к примеру, использую класс, который вызываю вместо echo, а он сам раскидывает это по своим внутренним массивам и внешним кешам.

Shedar 25 авг 2010 в 12:34

Можете описать чуть поподробней?
Например, есть страничка, на которой выводится телепрограмма (инвалидация в полночь), популярное видео (обновляется раз в час), последние новости (обновляется раз в 15 минут).
Как этого можно добиться классом, заменяющим echo?

BreathLess 25 авг 2010 в 12:48

Логичнее, наверное, в личку.
Сложно описать, не зная, какая у вас архитектура.

zerkms 25 авг 2010 в 18:22

Легко — вместо echo использовать return!!! )))

SabMakc 25 авг 2010 в 12:14

А разве если я делаю echo сразу заголовки страницы не отсылаются пользователю?
Просто могут возникнуть проблемы, если их менять будут.

BreathLess 25 авг 2010 в 12:18

Если ob_start() включён, то echo можно делать спокойно.
Если нет, заголовки после echo вы не измените.

Goodkat 25 авг 2010 в 19:10

for($i=0;$i

jandosul 26 авг 2010 в 03:39

Если output_buffering=off, то можно

$_temp = array();
for($i=0;$i<=100500;$i++){
$_temp[] = "<option>{$result}</option>";
}
$_temp = join('', $_temp);

SabMakc 25 авг 2010 в 12:03

Сравнивал в свое время скорость работы с public полем и вызова геттера/сеттера этого поля с работой магических методов __get, __set и __call.
Для 1000 итераций получились следующие значения (в секундах):

getFieldValue():0.0013

_field(получение):0.0003

__get():0.0010



setFieldValue():0.0014

_field(установка):0.0003

__set():0.0012



__call():0.0024

P.S. __get / __set / __call были реализованы следубщим способом:

  public function __get($name)

    {return $this->_field;}

  public function __set($name, $val)

    {$this->_field=$val;}

  public function __call($name, $arg)

    {return $this->_field;}

BreathLess 25 авг 2010 в 12:05

Магические методы очень медленные, это да.
Они бывают медленнее даже такой конструкции как

function get($Key)

{

 return $this->$Key;

}

SabMakc 25 авг 2010 в 12:22

В __get и getFieldValue() был одинаковый код. __get() оказался быстрее почти на четверть.

А медленней они простого getFieldValue за счет того, что в них помимо «return $this->Value;» надо какую-либо логику реализовывать.
Но это все равно не объясняет, почему Ваш get($Key) быстрее аналогичного __get.

BreathLess 25 авг 2010 в 12:24

Думаю, перед тем как вызвать магическую функцию, интерпретатору нужно пробежать по всей таблице методов и полей.

SabMakc 25 авг 2010 в 12:55

Согласен, что по идее так и происходит.
Но почему тест показал что __get быстрее?
getFieldValue():0.0013
__get():0.0010

Внутри один код в обоих случаях:
{return $this->_field;}

Возможно, при вызове __get сигнатуру метода мы уже знаем и нам не надо ее сопоставлять. А при обычном вызове функции надо сопоставить параметры.
Но все это догадки. Магические методы имеют особый статус и по особому обрабатываются. Простое получение поля все равно быстрее в 3 раза, а __call медленнее обычных методов в 2 раза.
Но тут надо помнить, что в свою очередь геттер медленнее получения public-поля в 4 раза.

BreathLess 25 авг 2010 в 12:57

Возможно, потому что получить неустановленное поле мы не можем, а установить — можем.
Потому и логика, и результаты отличаются.

Спасибо за статистику по геттерам, сам не использовал, подсознательно =)

zerkms 25 авг 2010 в 18:23

Не нужно. Операция поиска метода — O(1)

BreathLess 25 авг 2010 в 18:31

Есть альтернативные предположения?

zerkms 25 авг 2010 в 18:31

Зачем? Это не так?

BreathLess 25 авг 2010 в 18:33

Я имею ввиду, есть предположения, почему интерпретатор так себя ведёт =)

zerkms 25 авг 2010 в 18:35

А, хехе :-) Нет. Я над такими вещами не заморачиваюсь. Я пишу так, как мне удобно писать и как по моему разумению писать правильно.

Оптимизация — дело далёкого будущего.

А подобные микро-оптимизации — скорее всего вообще, несбыточного.

mdevils 25 авг 2010 в 18:43

Если в __get обратиться к полю в $this, то сработает еще один __get. Но дальше PHP как-то распознает, что это будет продолжаться вечно и просто выдает значение поля. Магические методы реализованы крайне странно в PHP)

BreathLess 25 авг 2010 в 18:46

На то они и магические =)

UJey 25 авг 2010 в 13:10

Спасибо за пост. Мне, как и многим другим, кто стремится сделать свой код лучше и быстрее — такое полезно.

Было бы здорово увидеть обзор многих других функций и блоков php в их сравнительной скорости выполнения.

BreathLess 25 авг 2010 в 13:15

Очень рад, что первый топик кому-то понравился.
Я разрабатываю свой фреймворк (как бы это банально не было), и набралось достаточно разных опытов, не только с простым php, но и с более сложными конструкциями.
Постараюсь писать топики почаще, спасибо =)

FanatPHP 26 авг 2010 в 00:12

А на самом деле надо стремиться сделать быстрее работу приложения.

-2

MastaEx 25 авг 2010 в 15:42

>>Скажу лишь, что перейдя на json-файлы для конфигурации…
А почему бы не хранить конфиги в нативных массивах php? Будет еще быстрее.

BreathLess 25 авг 2010 в 15:44

Прелесть конфигов в читаемых форматах, что их может редактировать человек, не знающий php.

MastaEx 25 авг 2010 в 15:49

Я бы не пустил незнающего человека редактировать JSON-конфиг тоже, но на вкус и цвет…

BreathLess 25 авг 2010 в 15:53

Не совсем незнающего, например системного администратора.

-1

MastaEx 25 авг 2010 в 15:47

Вот, кстати, добавлял ваш пост в закладки — нашел рядом еще один от Ивана Блинкова:
www.insight-it.ru/programming/php/na-puti-k-idealu/

BreathLess 25 авг 2010 в 15:55

Спасибо за линк, некоторые вещи устарели, но в целом, всё очень правильно.

leotsarev 25 авг 2010 в 20:55

Там автор очень суровый человек.
У него $i++ и ++$i в реальном проекте были узким местом.

soltpain 25 авг 2010 в 16:11

Насчет производительности множественной конкатенации строк осмелюсь оспорить. Если вы склеиваете много маленьких строк через массив — расходуется впустую память и процессорное время на операции с нею.

pastebin.com/Wz1QvZ74 — скрипт для тестирования предложеного мною случая и его вывод на моем сервере с php 5.3

warmup job: time: 0.003025 | memory: 606092
warmup flush: time: 0.003353 | memory: 532

array job: time: 0.002856 | memory: 605688
flush: time: 0.003168 | memory: 108

concat job: time: 0.001687 | memory: 100096
flush: time: 0.001697 | memory: 104

10к элементов по 10байт — в случае с массивами расход памяти в 6 раз больше, расход процессорного времени — 2 раза. Также заметно, что PHP требуется больше времени, чтобы освободить память после работы с массивом. Это тоже надо учитывать.

Склейку через массивы можно производить с большими строками (в webdev такое редко), а не преподносить как общую панацею от тормозов.

В моем случае я тоже склеивал раньше все через массивы, пока не перешел к более-менее серьёзным объемам, от которых пхп начал вываливаться за memory limit 256Мб, при объеме данных на 2-5Мб, кусочки были разные, 100-10Байт, просто их было много. Переход к тупой последовательной склейке строк дал мне расход памяти на эту операцию всего в районе 16Мб и немного увеличившееся время генерации содержимого.

BreathLess 25 авг 2010 в 16:13

Баланс между памятью и скоростью, это, к сожалению, вечный компромисс.

soltpain 25 авг 2010 в 16:25

Погонял тестовый скрипт немного, на моей конфигурации паритет между методами (и память, и время) достигается при размере элемента склейки 1400 байт. Накладные расходы на выделение 10к элементов массива постоянны и равны 505Кбайт:

warmup job: time: 0.195462 | memory: 14506056
warmup flush: time: 0.197994 | memory: 520

array job: time: 0.201980 | memory: 14505740
flush: time: 0.204485 | memory: 96

concat job: time: 0.196722 | memory: 14000096
flush: time: 0.198964 | memory: 104

BreathLess 25 авг 2010 в 16:38

tenshi 25 авг 2010 в 21:32

ты память некорректно сравниваешь.
в версии с массивом ты измеряешь пиковое потребление
в версии со склейкой ты фактически измеряешь объём результата. без учёта используемого при склейке буфера.

soltpain 26 авг 2010 в 07:29

Я совсем не против увидать более корректный скрипт сравнения методов.

tenshi 26 авг 2010 в 12:05

$start_mem = memory_get_usage();
$start_time = microtime(true);

$ret = '';
$arr = array();
for ($i=0; $i

tenshi 26 авг 2010 в 12:10

$start_mem = memory_get_usage();
$start_time = microtime(true);

$ret = '';
$arr = array();
for ($i=0; $i$lt;$num; $i++) {
$arr[] = $chunk;
}

$ret = join ('', $arr);
$arr = array();

printf("\narray job: time: %f | memory: %d", microtime(true)-$start_time, memory_get_usage() — $start_mem);

$ret = '';

printf("\nflush: time: %f | memory: %d", microtime(true)-$start_time, memory_get_usage() — $start_mem);

soltpain 26 авг 2010 в 12:21

Ну вы же не глупый человек, я измеряю память которая требуется для проведения операции склейки, а не итоговую (а вот пиковая память, memory_get_peak_usage может дать еще больше).

Какой мне профит от того, что результат склейки займет пять мегабайт в памяти, но при этом сама склейка вывалится из-за memory_limit на строке $ret = join ('', $arr), а может и того раньше?

tenshi 26 авг 2010 в 12:28

ага, и у тебя получается, что потребляемая инкрементальной склейкой память вообще равно 0, потому как то, что ты вычисляешь — это объём результата. а все промежуточные буферы уже автоматически очищены.
в случае с массивом ты сам создаёшь буфер, но не очищаешь его перед измерениями

soltpain 26 авг 2010 в 12:39

правильно, ведь измерения как и проводились для того, чтобы измерить объем памяти, используемый массивом. Простите, мне уже невыносима роль Капитана Очевидность, позвольте сложить полномочия )8. Можете считать этот моим сливом в споре с Вами.

tenshi 26 авг 2010 в 13:21

но память используемую конкатенацией ты _не измеряешь_

soltpain 26 авг 2010 в 13:30

предположу (2xFINAL_STRING_SIZE — last_chunk_size), как освобожусь — постараюсь измерить, думаю в этом деле поможет memory_get_peak_usage

Мое предположение исходит из наивного алгоритма, которым пугают маленьких детей: выделить новый блок памяти размером (старый + строчечка), скопировать туда данные, грохнуть старый блок. Т.е. наибольшее использование памяти, когда выделены оба блока.

tenshi 26 авг 2010 в 13:37

при таком алгоритме странно, что оно работает в 2 раза быстрее.
на самом деле по ощущениям кажется, что он не выполняет реальную склейку, а лишь создаёт связный список.

soltpain 26 авг 2010 в 14:46

Скорее всего вы правы, погонял сейчас тесты на склейку строк — вне зависимости от размера элемента и их количества оверхед памяти ~1100байт на все данные.

Такое ощущение, что memory_get_usage говорит не всё. Имеет смысл погонять склейку при низких значениях memory_limit, чтобы из сообщений об ошибке узнать сколько памяти php хотел выделить на очередной этап.

tenshi 26 авг 2010 в 14:58

не, лучше вообще на виртуалке с критически низким количеством памяти гонять. а то когда я тестировал xslt эти функции показывали, что он ничего не кушает, а жрал он у меня огого по диспетчеру задач х)

FanatPHP 26 авг 2010 в 12:15

Более корректный — это ab на реально делающий что-то код.
Желательно — под нагрузкой.

soltpain 26 авг 2010 в 12:31

У меня реально работающий код под нагрузкой 1-10RPS (зависит от времени суток), немного, но хватает для получения опыта.

BreathLess 26 авг 2010 в 12:33

Советую попробовать siege вместо ab.

FanatPHP 26 авг 2010 в 12:48

Ну вот в этом реально работающем проекте поменять один сравниваемый метод на другой, померять, поменять обратно и снова померять.
Увидим разницу — начнем думать, как оптимизировать (hint: — совем не обязательно на тему смены одной функции на другуюю К примеру, в первом классе детей учат, что если возникают проблемы с чтением большого файла, надо не file() на file_get_contents() менять, а подход в целом, не запихивая весь файл в память целиком)
Не увидим — просто пожалеем о потраченном времени и пойдем займемся чем-нибудь полезным. Профайлингом, например. Который нам заранее скажет — стоит ли возиться с данной конкретной разницей между конкатенациями, или нет.
В этом интересно покопаться с теоретической точки зрения. Но для практической оптимизации — только профайлинг. Качественный, а не искусственный. профайлинг приложения, а не кода, который ничего не делает

soltpain 26 авг 2010 в 15:18

Да, подходы меняю потихоньку… поменял strtok на ExplodeIterator от WikiMedia, это из серии «читать, не запихивая всё сразу в память»

LoneCat 25 авг 2010 в 17:32

Странно что foreach упомянают в суе, по сравнению с конструкцией

while (list($key, $value) = each($item))

он всегда будет быстрее, each это наследие старых версий php.

BreathLess 25 авг 2010 в 17:35

Да, но 9 из 10 статей о производительности, отрицают этот факт, почему то.

LoneCat 25 авг 2010 в 17:45

Ну наверное потому что это не круто :) не видно факта оптимизации :) можно еще по массиву так:

for(reset($array); $key = key($array), $value = current($array); next($array));

пройтись, так совсем оптимально :)

BreathLess 25 авг 2010 в 17:46

Вы сняли штаны с foreach() :-)

mephisto 25 авг 2010 в 18:00

Недавно ради интереса тестировал пару подобных мелочей.
Выяснилось, что двойные кавычки в последних версиях php таки быстрее одинарных, как бы странно это не звучало. Разумеется, если не использовать упоминание переменных прямо внутри строки, для этого используется конкатенация.

А foreach оказался быстрее, чем for(;;) на массиве с числовыми индексами, расположенными по порядку. Это еще более странно, но факт.

Можете проверить)

LoneCat 25 авг 2010 в 18:07

foreach всегда был быстрее! foreach — лучший! foreach — наш чемпион! foreach! foreach! :P
А быстрее он потому что оптимизирован под то чтобы бегать по массивам, в случае for идут отдельные накладные расходы на инкрементацию счетчика на уровне php, и поиск нужного индекса каждую итерацию при обращении $array[$index], foreach-же делает это все сразу скопом на уровне си, вот если-бы php был языком компилируемым, и массивы-бы у него были массивами а не хешами, и типизация статичной — то конечно for-бы выиграл.

zerkms 25 авг 2010 в 18:09

Рискну предположить, что массивы в пхп интерналс таки реализованы в виде хэшей.

LoneCat 25 авг 2010 в 18:11

Ну я как-бы про это и пишу :)

zerkms 25 авг 2010 в 18:16

А, пардон :-)

mephisto 25 авг 2010 в 18:21

Пожалуй вы правы, не задумывался об этом. Это конечно делает все намного понятнее)

FanatPHP 26 авг 2010 в 01:34

На самом деле foreach удобнее. Универсальнее.
А если на критическом к времени выполнения участке обрабатываемый массив имеет такой размер, что заходит речь о сравнении различных методов его перебора, то надо, префразируя известный анекдот, программистов менять, а не функции местами переставлять.
Копаться в потрохах всегда интересно. Но делать это в таких топиках — это играть с горе-оптимизаторами на их поле, в игру быстрее-медленнее.

romy4 26 авг 2010 в 02:08

надеюсь, for был не в такой форме

for($i=0;$i<count($array);$i++)

во всяком случае, $array[$i] заставляет каждый раз искать позицию в массиве пробегая его от первого элемента к последнему, когда как в foreach сдвигается лишь внутренний указатель на следующий элемент. На больших массивах это заметно

mephisto 26 авг 2010 в 04:31

Вы меня наверное за человека, первый раз пишущего программы принимаете :D
$cnt=sizeof($array);
for ($i=0;$i<$cnt;$i++)

$array[$i] уж точно не пробегает от первого к последнему, все массивы в php это же хэши по сути. Я думаю, поиск там побыстрее, чем полный перебор)

romy4 26 авг 2010 в 11:19

мало ли, лучше уточнить :)
массивы в пхп это связные списки или деревья (хотя в этом сомневаюсь), в любом случае for(;;) делает больше одного просмотра элемента

wpm1 26 авг 2010 в 12:47

Плохо знаю С++. залез в исходники. zend_hash.c:60
это структура похожа на двусвязный список с избыточными данными: с указателями на начало и конец, указателем на текущий элемент. Каждый элемент имеет указатель на следующий, предыдущий, свой номер ну и данные.

galaxy 26 авг 2010 в 13:35

Название файла ни о чем не говорит?
Хэш-таблицы там.

wpm1 26 авг 2010 в 14:21

Говорит-говорит. Я просто не реализовывал хештаблицу и не очень знаю её внутреннюю структуру. Читаю педивикию.

romy4 27 авг 2010 в 03:02

интересная у них функция вычисления хеша (hash.h:261) и магическое число 5381.
Используется хеш с открытой адресацией. Массив представлен в виде связного списка, каждый элемент которого получается, тоже связный список но уже конкретно значений.

На один табличный хэш-ключ могут приходиться разные значения искомого ключа, и после совпадения длин искомых ключей, хранимых в nKeyLength ещё сравниваются побайтово значения хранимого ключа в элементе массива с искомым ключом.

только что за 5381 и почему сдвиги на 5 позиций бит влево?

sylvio 25 авг 2010 в 18:44

Вы забыли написать, что echo быстрее print :D

BreathLess 25 авг 2010 в 18:45

Статей много, я решил не повторять все-все-все известные хинты.

-1

LoneCat 25 авг 2010 в 18:47

А мне вот не верится! Нужны детальные тесты под разные платформы, в условиях близких к идеальным и с соблюдением тех.процесса :)

mrmot 25 авг 2010 в 18:46

«Свой профайлер, я настроил (на testing-машине) на выброс исключений, при аномальном замедлении каких-либо участков кода (пример: «Achtung! 30% времени на подключение к MySQL»).»

А можно по подробнее, чем меряете?

BreathLess 25 авг 2010 в 18:48

XHProf и XDebug + KCachegrind, стараюсь перепроверять всё.
Но еще использую свой код, который в рантайме генерирует эти самые исключения.

andry 25 авг 2010 в 18:51

Ради всего святого в программировании, не пишите таких постов для новичков. Хотя бы припишите, что в подавляющем большинстве случаев так нельзя подходить к оптимизации кода. Вам тут правильно народ грамотный пишет, это не ботелнек и прикидки все ооочень натянуты. Определено инфа была бы полезной, если были бы видные нормальные тесты. А так это из серии MySql круто, Oracle гавно. Хотя все примерно так и есть, я сейчас не про базы)

BreathLess 25 авг 2010 в 18:55

Учту.

andry 25 авг 2010 в 19:22

видимо не учли. Удачного общения с такими новичками)

lexun 25 авг 2010 в 18:58

Автору спасибо! simplexml_load_string( file_get_contents ('file.xml') ) — понравилось… Не понимаю ниразу возмущающихся, человек показал на своем опыте как можно простыми вещами облегчить жизнь серверу, никто не заставляет кодить именно по показанным примерам, наоборот автор призывает самим анализировать работу тех или иных структур кода для определения оптимальной работы для той или иной архитектуры сервера, а если у вас стоят другие задачи то просто взять на заметку всегда полезно. Вообще обмен опытом это всегда хорошо…

andry 25 авг 2010 в 19:12

автор пишет для новичков, которые это рьяно берут на вооружение. Я сам работаю почти 10 лет, таких горе оптимизаторов навидался, которые с пеной у рта доказывали, что они знают в чем проблема «вот тут регулярка юзается, ща перепишу все за час и будет всем хорошо». Естесно все было не за час, а за 2-3 дня и результат ноль. Надо просто написать жирным шрифтом в начале топика, что в 98% случаев вы не сможете так оптимизировать приложение целиком.

BreathLess 25 авг 2010 в 19:57

В топике нет слова «панацея» =)

FanatPHP 26 авг 2010 в 01:12

На самом деле, чтобы облегчить жизнь серверу, надо переписать приложение так, чтобы ему не требовалось часто открывать большой файл.
Вот это действительно будет «облегчение».
А поиск функции, которая выполнит эту тяжелую операцию на 2% быстрее — это игра в куличики, а не оптимизация.

BreathLess 26 авг 2010 в 01:34

Ссылка на mmap присутствует. Этот алгоритм, даёт больше 2%.

katremer 25 авг 2010 в 20:04

Только хватаясь за JSON, важно не переборщить, ибо нет (я лично не видел) библиотеки, которая читала бы JSON последовательно. Так что для передачи больших объемов данных по-прежнему лучше XML: на передающем конце банально выводим его print'ами (если он простой, ну а если сложный, то придется, наверное, пользовать XmlWriter), на принимающем юзаем последовательный XmlReader.

BreathLess 25 авг 2010 в 20:05

Да, я в курсе про поточную генерацию, речь шла о небольших конфигах.
Кстати, про последовательный разбор JSON, отличная идея, попробую написать.

AndrewStephanoff 26 авг 2010 в 08:59

Вы видимо имеете ввиду SAX и DOM

katremer 26 авг 2010 в 10:51

Ну XmlReader вроде как и есть SAX-читалка. А в DOM я в данном случае смысла не вижу, ибо после парсинга XML предпочитаю иметь массивы, которые можно передать дальше в функции.

TEHEK 25 авг 2010 в 21:01

Deprecated: Function ereg() is deprecated…

Не стоит забывать.

BreathLess 25 авг 2010 в 22:16

Читайте топики иначе, чем по диагонали.
mb_ereg никто не отменял.

-1

НЛО прилетело и опубликовало эту надпись здесь

BreathLess 25 авг 2010 в 22:23

Потому что разговор о серверной оптимизации.

GZip — это клиентская, и она лишь увеличивает нагрузку на сервер, хотя и очень полезна.

Убирать кавычки, можно только если в аттрибутах ASCII без спецсимволов, да и валидатору это может не понравиться.

Не использовать ООП — это луддитский совет, но я согласен с ним наполовину, не стоит плодить классы ради классов (дедушка Оккам мне роднее настоящего =)).

А функции, они в любых языках с оптимизаторами, прекрасно жмутся, и, вообщем-то, ЕМНИП, код, целиком распиханный по функциям, будет работать лучше.

НЛО прилетело и опубликовало эту надпись здесь

BreathLess 26 авг 2010 в 00:00

Соединения с базой должны обрываться раньше рендеринга и вывода, я считаю.
Дык, сжатие тоже не дешёво даётся, и тоже висит скрипт.

Так что, гзип, палка о двух концах. Но повторю — необходимая.

Vladson 26 авг 2010 в 00:09

(режим К.О.)
Зависит от ситуации и от целей, иногда GZip может выиграть гигабайты трафика иногда мегагерцы процессора, иногда просто «просрать» мегабайты оперативки… Каждая ситуация уникальна, нужно только искать баланс (и он разный в разных случаях)

BreathLess 26 авг 2010 в 00:14

Абсолютно верно, не понимаю, почему многие так резко реагируют, как будто я на мраморе что-то выбил, и вожу джуниоров по пустыне.
Любой highload, это штучная вещь. И всё надо испытывать на своём коде, любое замечание.

Очень многие советы, у меня не срабатывали, просто из-за небольшой экзотичности системы, хотя в простых тестах, результаты совпадали.
Весь прирост может растеряться по дороге к выводу.

VolCh 26 авг 2010 в 00:42

Не панацея, но тоже вариант — поставить прокси (nginx например) перед веб-сервером

BreathLess 26 авг 2010 в 00:49

Реверсные прокси, уже вошли в джентльменский набор, хоть и не относятся напрямую к теме топика.
И кстати, на них можно и gzip сжатие вешать, надо бы провести тесты, что быстрее сжимает, php или nginx etc.

mephisto 26 авг 2010 в 04:36

Перед апачем стоит ставить фронтэнд, тогда время загрузки страницы клиентом абсолютно никак не скажется на времени висения апача и пхп в памяти для обработки запроса.

kozlice 26 авг 2010 в 01:25

Вынос CSS и JS в отдельные файлы и использование output buffer – это само собой в любом проекте, даже небольшом. Но вот за вёрстку без кавычек, отсутствие табуляции/форматирования кода и неинформативные названия переменных нужно, простите, бить лопатой. Для продакшна в высоконагруженных проектах можно использовать обфускацию, это действительно даст большой прирост производительности, но исходный код в таком виде – натуральная диверсия.

Plohich 25 авг 2010 в 23:21

explode("\n", file_get_contents('file.xml'));

не может заменить file(), так как нет в этом варианте учета разных окончаний строк. Это можно решить, но уверен что решение будет дороже чем использование file().

BreathLess 25 авг 2010 в 23:56

Я уже отвык, что существуют иные ОС, кроме nix-like, mea culpa.

В данном случае, мы можем \n заменить на константу, которую будем определять один раз, на базе PHP_OS.
Кстати, не удивлюсь, если есть уже такая в SPL.

LoneCat 26 авг 2010 в 00:43

Есть, PHP_EOL

BreathLess 26 авг 2010 в 00:46

О, спасибо, обновлю топик.

Plohich 30 авг 2010 в 22:51

поспешили (или я опоздал?)

PHP_EOL выдает окончание строки в зависимости от системы на которой бежит, что крайне удобно для вывода. Но, если попробуете использовать как написали, то файл с линуксовыми окончаниями на винде или маке прочитается как одна строка.

так что не вариант.

BreathLess 30 авг 2010 в 23:23

Ну в гомогенных условиях, прокатит =)

А вообще, я винду всерьёз не воспринимаю.

Plohich 31 авг 2010 в 13:52

здесь речь не о любви у винде или маку, а о работоспособности кода. Указанный пример не заменяет функционал file() и наверное стоит вынести это из статьи, дабы не вводить кого-либо в заблуждение. Скорей всего такой файл придет как user input на обработку и если не учитывать такой простой момент, то все кончится крайне плохо.

BreathLess 31 авг 2010 в 13:57

Можно либо зафиксировать это дело, либо определять на лету.

Plohich 2 сен 2010 в 12:37

проблему решить можно, но решение будет медленней чем file() и соответственно заменить эту функцию не может в пользу оптимизации. Как раз то что и написали про использование встроенных функций вместо своих велосипедов.

Plohich 30 авг 2010 в 22:52

Маки тоже nix-like, а окончания строк как раз другие.

AndrewStephanoff 26 авг 2010 в 01:01

почему не пишите, что дорогим может быть обращение к файловой системе? я бы рекомендовал держать конфиги в кеше, а не брать их из файловой системы

BreathLess 26 авг 2010 в 01:36

Кэширование, это не панацея, как раз таки.
Разумеется, можно держать без проблем весь проект в памяти.
Но это, не решение проблемы, а прокрастинация.

AndrewStephanoff 26 авг 2010 в 08:49

Я разве сказал, что нужно держать в памяти весь проект? Я говорю, что операции с файловой системой достаточно дорогие на высоких нагрузках.

BreathLess 26 авг 2010 в 12:20

Я разве спорил, или приписывал вам свои слова? =)

galaxy 26 авг 2010 в 01:14

советую заменить file() на
explode("\n", file_get_contents('file.xml'));
Прирост будет еще больше, чем в случае с xml.

Бред. Если бы вместо гадания на кофейной гуще о том, как устроена функция file(), автор посмотрел в исходники, то увидел бы, что собственно чтение файла реализовано абсолютно одинаково у обеих функций, и вообще чуть ли не все файловые функции используют один и тот же php_stream_xxx интерфейс.
Я даже протестировать не поленился — в пределах погрешности один в один.

BreathLess 26 авг 2010 в 01:35

Если поделитесь кодом, которым тестировали и описанием окружения, будем признательны.

galaxy 26 авг 2010 в 01:55

Извольте:

<?php

if (!file_exists('test.file')) {
  $f = fopen('test.file', 'w');
  for($i=0; $i<500000; $i++) fwrite($f, "String #$i -- some padding -- $i$i$i$i$i --\n");
  fclose($f);
}

$ts = microtime(1);

for($i=0; $i<100; $i++) {
  $x = file('test.file');
  unset($x);
}

print "time: " . ((microtime(1) - $ts)*1000) . " ms\n";
$ts = microtime(1);

for($i=0; $i<100; $i++) {
  $x = explode("\n", file_get_contents('test.file'));
  unset($x);
}

print "time: " . ((microtime(1) - $ts)*1000) . " ms\n";
?>

time: 24141.930818558 ms
time: 25979.696035385 ms

----------------------------------

time: 23707.021951675 ms
time: 24928.278923035 ms

----------------------------------

time: 24311.058998108 ms
time: 24633.358001709 ms

----------------------------------

time: 24932.843923569 ms
time: 25643.95904541 ms

----------------------------------

time: 23347.62096405 ms
time: 24808.028936386 ms

----------------------------------

time: 23740.713119507 ms
time: 25628.977060318 ms

Linux 2.6.18 (CentOS 5) i686, контейнер OpenVZ
PHP 5.2.13

file() даже чуть быстрее, по понятным, впрочем, причинам.

BreathLess 26 авг 2010 в 01:58

Моя радость будет неполной без test.file, который вы можете положить например на pastebin

BreathLess 26 авг 2010 в 01:59

Ай, сорри, не заметил, что вы прям там его делаете.

BreathLess 26 авг 2010 в 02:05

У меня 3 из 4 запусков, file_get_contents сработал незначительно, но быстрее, 1 запуск практически совпал.
2.6.35 Kubuntu x64, desktop, php 5.3.2

Не зря я сделал оговорку в начале топика.

alist 26 авг 2010 в 02:12

Вот мне кажется, что для таких микрооптимизаций лучше подойдет не замена одних функций другими, а HipHop PHP developers.facebook.com/blog/post/358 Пусть всю грязную работу делает компилятор.

BreathLess 26 авг 2010 в 02:40

Одно другому не мешает, HipHop шикарная штука, в паре с gcc =)

alist 26 авг 2010 в 02:51

Конечно, не мешает. Я вот думаю, что люди пост почитают и будут соетами пользоваться — это очень хорошо. А вот старый код вручную лопатить, выискивая все вызовы одних функций и заменяя их на другие, наверное, не стоит. Лучше дать на съедение ХипХопу.

BreathLess 26 авг 2010 в 03:04

Я выше уже писал об этом, что есть смысл использовать, только если на интуитивном уровне, а не перелопачивать под каждый набор фактов =)

symbix 26 авг 2010 в 03:12

Да вашу мать. Вот прямо вижу как хабрашколота побежала в своих гениальных самописных cms менять file() на explode(file_get_contents()).

За указания «это быстрее чем то» без приведения кода бенчмарков, условий, в которых они проведены, и результатов оных, в приличном обществе записывают в, ммм, гуманитариев.

Более. За одну трату рабочего времени на такие «оптимизации» надо увольнять нахер.

Если ничего не тормозит — работает не трогай. Если есть тормоза — профайлинг, поиск боттлнеков, устранение.

>>Следствие этого:
>>simplexml_load_string( file_get_contents ('file.xml') )
>>работает быстрее, чем:
>>simplexml_load_file('file.xml')

На маленьких файлах пофигу. Большие вообще нефиг simplexml-ем трогать.

>> count() и sizeof()
>> UPD: sizeof() это синоним count(), работает быстрее, спасибо merkushin за поправку.

Вот даже сами запутались. Гы. На миллионе итераций разница в пределах погрешности измерения.

>> Допускать нотисы, это ужасно, да.
>> Но если ваш junior developer, не хочет признавать их важность, расскажите ему, что на
>> генерацию одного notice у PHP уходит время, за которое можно обойти и инкрементировать
>> массив из примерно 30-ти элементов.

Ага, в рамках государственной инновационной программы воспитываем нанооптимизаторов.

Джуниору надо втихаря подправить в незаметном месте его кода имя ключа в «засобаченном» массиве, например, l заменить на I. Пускай потрахается пару часов, и признает правоту наставника.

>> Цикл foreach, практически в каждой статье, посвящённой производительности PHP, предают анафеме

А зачем такие, прошу прощения, статьи, читать?

>> Проверять file_exists() затем делать include, дешевле

Здравствуй, друг из прошлого! Как там живется в MS-DOS? У нас тут, представляешь, многозадачные системы щас, и между file_exists и include может произойти что угодно. Ваще ужас, да.

>> Не знаю почему, но include_once, часто проигрывает по скорости конструкции с принудительной проверкой

Незнание в мире открытых исходников — это что-то паранормальное. Впрочем, для того, чтобы узнать ответ на этот вопрос, достаточно обычного strace. Надо использовать абсолютные пути и не очень древние версии PHP (statcache появился где-то между 5.1 и 5.2), тогда разница будет минимальна.

>> Свой профайлер, я настроил

А вот самое важное упомянуто только 1 раз и косвенно.

Напоследок дам новичкам один совет, который перекрывает все вышесказанное:

поставь opcode cacher, дубина!

AndrewStephanoff 26 авг 2010 в 08:52

и действительно, какие еще могут быть require и include на высоконагруженных проектах )))
поддерживаю Вас

BreathLess 26 авг 2010 в 12:36

Склеивание ZF в двухмегабайтный блоб, тоже не highload, хотя многим нравится.

BreathLess 26 авг 2010 в 12:33

Откуда вы знаете, куда записывают в приличном обществе?
С вашей аргументацией, могу сказать лишь «привет, коллега!».

«Ага, в рамках государственной инновационной программы воспитываем нанооптимизаторов.»
Да, понимаю, вам наноденьги попилить не дали, негодуете?

«У нас тут, представляешь, многозадачные системы щас, и между file_exists и include может произойти что угодно.»
Ну расскажите, что же может произойти?

«А вот самое важное упомянуто только 1 раз и косвенно.»
Профайлер, это не что-то очевидное, а?

«На миллионе итераций разница в пределах погрешности измерения.»
Чем эта фраза менее гуманитарна моей?

«Более. За одну трату рабочего времени на такие «оптимизации» надо увольнять нахер.»
Подозреваю, с таким уровнем диалога, максимум, кого вы увольняли, это кошку.

«Незнание в мире открытых исходников — это что-то паранормальное.»
Не смотрел в исходники, я наблюдение делал, а не исследование сырцов.

«За указания «это быстрее чем то» без приведения кода бенчмарков, условий, в которых они проведены, и результатов оных, в приличном обществе записывают в, ммм, гуманитариев.»
Вы топик читали? Я указал, почему нет абсолютных цифр.

«opcode cacher»
Это такая штука, которая помогает вам скрывать свой говнокод?

tenshi 26 авг 2010 в 13:32

цифры нужны для оценки масштабов. что-то сильно помогает, а что-то безтолку менять.

symbix 26 авг 2010 в 15:33

> Это такая штука, которая помогает вам скрывать свой говнокод?

Мдааааааааааааааааааааааааааааа…

Сходите, уважаемый, в гугл, и прочитайте, что такое opcode cacher. Подсказка — это не Zend Optimizer, подсказка 2 — это и не ioncube.

С таким уровнем Ваших познаний, пожалуй, продолжение обсуждения считаю бессмысленным.

BreathLess 26 авг 2010 в 15:44

Вы считаете, что я не смог бы погуглить opcode cacher, если б не знал, или настолько ~~тупы~~нечувствительны к иронии?

Про apc, xcache, eaccelerator и.т.п, не вам, и не мне рассказывать.

-1

symbix 26 авг 2010 в 15:57

Погуглили, отлично. Теперь погуглите, например, по strace :)

BreathLess 26 авг 2010 в 16:10

Я знаю что такое strace, тут не гуглить можно, а man в родной консоли набрать, если вы понимаете, о чём я.

-1

sectus 26 авг 2010 в 09:29

Интересно. В статье не сказано и слова про оптимизацию (может правда уже убрали это), но все видят в этой информации только это. Чего плохого в том, если будет знать человек эти подходы и использовать их сразу при написании кода? И тогда, может быть, сервера апгрейживать надо будет не сегодня, а послезавтра.

FanatPHP 26 авг 2010 в 10:13

Вот именно в этом и проблема. Что из этой статьи делается вывод, будто «эти подходы» имеют хоть какое-то отношение к апгрейду сервера.

BreathLess 26 авг 2010 в 12:35

И не было там слова «оптимизация».

sectus 26 авг 2010 в 12:56

Мне непонятна критика. Если эта статья не про оптимизацию, то почему её все тут стали упоминать с возгласами типа «Так нельзя оптимизировать».

BreathLess 26 авг 2010 в 12:57

Потому что, чтобы срать в комментах, топик-то читать необязательно =)

FanatPHP 26 авг 2010 в 13:40

Потому что «сделать что-нибудь такое, чтобы сервера не пришлось апгрейдить» — это и есть оптимизация. То есть вы тоже восприняли эту статью именно так. Другого-то смысла у нее и вовсе нету.

sectus 26 авг 2010 в 15:29

Я под оптимизацией понимаю это: есть код, изменяем его и получаем более быстро работающее приложение. А вот как называется процесс написания кода с использованием знаний о том какие конструкции работают быстрее — я не знаю.

remal 26 авг 2010 в 15:31

Прочитайте книгу Стива Макконнелла «Совершенный код». Там дается ответ на этот вопрос.

FanatPHP 26 авг 2010 в 15:49

«преждевременная оптимизация» :)

sectus 26 авг 2010 в 16:29

Не силён в подобной терминологии. Но пока ел арбуз то немного помедитировал на него. Оптимизация — это процесс изменения кода с целью улучшить (а в частности убыстрить) приложение. — Вот такой мой взгляд на этот термин. Другими словами для оптимизации код уже должен существовать.
Тогда в моём понимании «преждевременная оптимизация» — это процесс изменения гипотетического кода с целью улучшить будущее приложение. Ну, а, если я сразу знаю, что задача А решается подходом Б, то тут нет речи об изменении кода, гипотетического или реального.

А, вообще, это термин «преждевременная оптимизация» очень странный. Вот есть рефакторинг — это тоже изменение существующего кода (но с другими целями), но вот термина «преждевременный рефакторинг» не слышал.

Да и потом, вычисления длинны массива перед циклом Вы же не назовёте «преждевременной оптимизацией». А как Вы это назовёте?

FanatPHP 26 авг 2010 в 16:36

Именно так и назову. Потому что это она, родимая, и есть.
А насчет странности термина — это не к нам. Это к старику Кнуту, о котором флейм выше.

mindflow 26 авг 2010 в 10:10

По поводу «JSON vs XML»: в Symfony для хранения конфигурации используется YAML. Я попробовал использовать YAML в отдельном проекте — мне понравилось. А для человека, незнакомого с программированием, читается на порядок легче, чем XML или JSON.

В качестве парсера для YAML использовал Spyc.

symbix 26 авг 2010 в 12:22

Если уж говорить о производительности, то .php с массивом — идеал (сляжет в opcode cache сразу). Можно в него компилировать при необходимости :)

BreathLess 26 авг 2010 в 12:35

Уже выше обсуждалось, что конфиги и код, имеет смысл разделять.

symbix 26 авг 2010 в 15:30

А где я сказал, что их не надо разделять?

BreathLess 26 авг 2010 в 15:42

Разделять не по файлам, а по инфраструктуре.

symbix 26 авг 2010 в 15:58

И что же мешает?

BreathLess 26 авг 2010 в 16:09

Прочитайте комменты.
пхп код проигрывает по читаемости и уровню входа.

BreathLess 26 авг 2010 в 12:24

YAML не из коробки, потому и забыл, хотя формат хороший.

kozlice 26 авг 2010 в 13:15

YAML вещь отличная, но Spyc – страшно медленная штука. Расширения php_yaml или php_syck из PECL быстрее во много раз.

НЛО прилетело и опубликовало эту надпись здесь

gro 24 авг 2012 в 15:55

Но если ваш junior developer, не хочет признавать их важность, расскажите ему, что на генерацию одного notice у PHP уходит время, за которое можно обойти и инкрементировать массив из примерно 30-ти элементов.

В этом вся суть junior'ов и статей, которые они пишут :)
Наплевать, что делаем что-то не то и с ошибками. А вот псевдооптимизация это важно.

Показать лучшие за всё время

Несколько других советов для PHP-разработчиков

Комментарии 301

Публикации

Истории