mishamx Aug 29 2008 at 23:51

Советы для разработчиков CMS и фреймворков на PHP

2 min

2.2K

PHP *

+45

204

Comments 204

loststylus Aug 30 2008 at 00:10

Спасибо :) Уверен, что это многим поможет избежать ошибок.

alexshelkov Aug 30 2008 at 00:25

Поставил плюс в надежде на то, что автор позже напишет(как и обещает) более детальную и углубленную статью. Вот это будет действительно полезно. В этой статье тема освещена слишком поверхностно: дайте нам больше грязных подробностей =)

+14

mishamx Aug 30 2008 at 00:28

какой из пунктов разбирать первым?

Mel Aug 30 2008 at 00:36

Мне бы про №11 интересно было прочитать. Вообще конечно интересно прочитать о всех пунктах более деально :)

mishamx Aug 30 2008 at 00:41

хорошо, в ближайшее время постараюсь…

ivanr Sep 1 2008 at 12:10

тоже было бы интересно именно на тему более детально почитать.
Спасибо.

UFO just landed and posted this here

den_rad Aug 31 2008 at 15:50

Не особо понял смысл этой обертки.
Другое дело, если бы при первом обращении к Session стартовалась бы сессия.

UFO just landed and posted this here

den_rad Sep 1 2008 at 01:39

Также можно перед классом session_start(); вписать :)
Кстати, а вы сессии в базе храните или используете стандартные? Давно хотел узнать, дает ли хранение сессий в БД какие-то преимущества на сайтах < 1000 хостов в день.

UFO just landed and posted this here

maxic Sep 1 2008 at 18:58

Очень даже смысловая, особенно при использовании ajax fw (jquery например)…


if (session_id()==null) {
session_start();
}

alex4 Sep 23 2008 at 01:24

На счет именно этой обёртки не скажу, а вообще использование $_SESSION приводит к созданию немасштабируемого (горизонтально) приложения, т.к. данные сессии хранятся в файловой системе.

den_rad Sep 23 2008 at 12:59

Можно использоваться свой обработчик сессий (session_set_save_handler) и хранить их где угодно.
Я думаю, это более простой пусть чем делать свой класс сессий.

UFO just landed and posted this here

alex4 Sep 23 2008 at 01:25

Да, меня тоже прикололо. Я как-то не очень понял мысль автора.

l2k Aug 30 2008 at 16:17

#7, #8 если можно. Очень интересует оптимизация SQL таблиц!

Bygaga Sep 1 2008 at 12:47

Можно добавить эту статю в избранные, а потом пункты в этой статье делать ссылками… и будет маленький ман :)

chetzof Aug 30 2008 at 00:28

ах ты извращенец!: D

sbmaxx Aug 30 2008 at 00:54

Правило №2 — под большим вопросом, очень уж часто хочется видеть красивые URL, а через mod-rewrite это сделать очень просто, и как правило хватает одного правила:

RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule !\.(pdf|php|js|ico|txt|gif|jpg|png|css|rss|zip|tar\.gz)$ index.php

Правило №8: наиболее частая операция в web, как ни крути, — это SELECT, а там индексы помогают.

И да, объясните, что имелось ввиду под пунктом №11. Никогда ни с чем подобным не сталкивался, приведите пример, где эти суперглобальные переменные работать не будут. Хотя через обертку работать удобней, но много зависит от архитектуры проекта.

+24

mishamx Aug 30 2008 at 01:31

Вообще достаточно, т.к. в условии указано «если файл существует» иначе запрос обработает скрипт и если надо возратит Error 404, а вот обзор папок я думаю вообще не нужен…

RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^(.*)$ index.php

но у многи в .htaccess такой лес встречал, что… причем даже у многих коммерческих CMS

Правило №8: наиболее частая операция в web, как ни крути, — это SELECT, а там индексы помогают.

Помогать-помогают, но время записи в таблице увеличивается и иногда их лучше вынести в отдельную таблицу и делать выборку по ней. Во время записи в БД таблица блокируется, добавляется запись и обновляются индексы и только после этого все остальные могут ее читать. Следовательно, чем больше индексов, тем больше потребуется времени для их обновления.

Да и еще забыл написать, что нужно фиксировать длину текстовых полей например varchar(20), т.к. в MySQL используются статические буферы под которые соответственно выделяется память.

Да 11 пункт, очень специфичный, но дело в том, что проект из практики по мере его роста проходит не один этап масштабирования и код кочует с одного сервера на другой (например запустить PHP под FastCGI — производительность увеличиться), потом раскидывается на несколько, что тоже приводит к ряду проблем и все зависит от выбранного вами ПО. Я думаю в следующем посте стоит рассмотреть один из стандартных случаев масштабирования LAMP систем и на его примере попробовать решить эти задачи.

-3

ajaxtelamonid Aug 30 2008 at 11:24

Хм. Советовать избавляться от индексов, так как это тормозит БД при INSERT — это, по-моему, сродни совету бороться с головной болью путем отсекновению оной. INSERT в CMS — это как правило добавление страницы или коммента, т.е. очень редкое явление. А SELECT юзается при любой генерации страницы и по нескольку раз. Важнее оптимизаровать SELECT, а здесь индексы незаменимы.

У меня есть один проектик, где периодически идет массовый INSERT в таблицу с индексом по текстовому полю. Параллельно БД продолжает активно использоваться. Не наблюдаю какого-то заметного падения производительности в момент таких инсертов…

+11

Rusan Aug 30 2008 at 17:03

про локание таблицы — вы про какую БД говорите, если про MySQL, то про какой движок?

alex4 Sep 23 2008 at 01:27

Наверно имеется в виду MyIsam, у него блокировка «шире» (страничная против строковой у InnoDB). Чтобы «лочилась таблица» (в смысле — вся) не слышал :0

maxatwork Aug 30 2008 at 23:23

Помогать-помогают, но время записи в таблице увеличивается и иногда их лучше вынести в отдельную таблицу и делать выборку по ней. Во время записи в БД таблица блокируется, добавляется запись и обновляются индексы и только после этого все остальные могут ее читать. Следовательно, чем больше индексов, тем больше потребуется времени для их обновления.

Таблица блокируется в MyISAM, а в InnoDB, например, такого нет.

VasilioRuzanni Aug 30 2008 at 02:15

Кстати, в большинстве (80%) случаев хватает правила, которое определяет схему «контроллер/метод/параметры». Правило по-умолчанию используется в Ruby on Rails, ASP.NET MVC Framework, Castle MonoRail и это действительно очень правильно.

sbmaxx Aug 30 2008 at 02:24

Да, так оно и есть. Приведенное выше rewrite rule позволяет отдавать URL системе, которая сама знает чего с ним делать. Будь это стандартные 80% или что-то более экзотическое.

VasilioRuzanni Aug 30 2008 at 03:30

Ага, ну вообще даже по самой концепции REST должны быть контроллеры, у которых должно быть не более 7-ми методов, а остальное — параметры. И если информационная архитектура спроектирована правильно, то эта схема по идее должна быть применима вообще везде. Хотя, скорее это касается некоторых информационных систем, нежели веб-сайтов.

Sannis Aug 30 2008 at 13:39

Возможно это более распространено, чем я думаю, но по крайней мере в среде PHP исторически сложился вариант модуль/контроллер/метод. И в случае пропуска какой-то из частей она заменяется на значение по умолчанию. Так что как минимум прийдётся в .htaccess писать несколько правил: для случая когда после базового УРЛа идёт 1, 2, 3 параметра, указывающих либо на index/index/метод, либо на index/контроллер/метод, либо на модуль/контроллер/метод, плюс правило для захода на главную страницу, там вообще ничего дополнительного в УРЛе не будет.

marazmiki Aug 30 2008 at 20:28

А почему бы не заворачивать на php все запросы и не делать разбор им? :)

Sannis Aug 31 2008 at 04:21

Так и поступают, я в курсе, о чём и говорил: делать такое в .htaccess — не очень изящно.

SergeyKish Aug 30 2008 at 20:13

REST это CRUD веб-сервисов. Отлично подходит для простых запросов, например:
/articles/ SELECT * FROM article
/articles/1 SELECT * FROM article WHERE id = 1

Но бывают и более сложные запросы, более сложные веб-сервисы — посмотрите на Flickr API — www.flickr.com/services/api/

Для веб-сайтов — как вы реализуете login logout методы?

REST стоит использовать — это стандарт, но без фанатизма.

zhulan0v Sep 3 2008 at 01:17

А что непонятного с логин/логаут?
/user/login
/user/logout

SergeyKish Sep 3 2008 at 15:32

ну как это ложится в CRUD?

zhulan0v Sep 3 2008 at 19:24

А что, разве не ложится? Сессия — объект. При логине создаем, при добавление данных к сессии — апдейт, при логауте — делит.

SergeyKish Sep 4 2008 at 01:00

Вы можете просто прочитать? Я даже приведу то что написано парой строк выше (и то на что сам комментировал)

> Ага, ну вообще даже по самой концепции REST должны быть контроллеры, у которых должно быть не более 7-ми методов, а остальное — параметры.
> И если информационная архитектура спроектирована правильно, то эта схема по идее должна быть применима вообще везде.
> Хотя, скорее это касается некоторых информационных систем, нежели веб-сайтов.

Как вы думаете к чему относится «не более 7-ми методов, а остальное — параметры»?
Посказываю — RESTful.

Давайте читать дальше — «если информационная архитектура спроектирована правильно, то эта схема по идее должна быть применима вообще везде.».
Вы согласны?

Теперь читаем мой коментарий — «как вы реализуете login logout методы?»
И таки как эти методы вписываются в RESTful?

А вот и ваш кометарий! «А что непонятного с логин/логаут?»
Ну и к чему? Что вы пытаетесь доказать прочитав только крайний пост???

zhulan0v Sep 4 2008 at 01:44

Хорошо. В четыре часа ночи мысли начинают путаться)
Я понять не могу, по-вашему логин/логаут не укладывается в crud? или что?

=)

ashofthedream Aug 30 2008 at 04:19

По поводу правила номер два:
Если у сервака включены .htaccess, он при каждом запросе обходит все дерево в поисках этих файлов. На локальной машине, для девелоперского и тестового серверов — .htaccess вполне приемлим, но на продакшне лучше все эти условия кинуть в конфиг сервера, а .htaccess запретить вообще. Потому как явно на продакшне мы не будем каждый раз менять правила для различных директорий.

Вариант, когда мы на каком-нибудь шаред хостинге и у нас нет доступа к серверу, я, соответсвенно, не рассматривал :)

den_rad Aug 31 2008 at 15:54

Для хорошо нагруженых проектов это на 100% верно! А вот для сайта, меньше 500 хостов в день на шареде/VPS, можно и не напрягаться.

BaBL Aug 30 2008 at 09:36

Сейчас ЧПУ все чазе заказывают при разработке сайта, это всегда почти на первом месте, если заказчик хоть что-то слышал (или нанял посредника, который слышал) про SEO

Imenem Aug 30 2008 at 12:53

Директивы mod_rewrite можно писать в .htaccess в корне сайта (но это приведет к повторному разбору алиасов и парсингу ссылок)- по сути двойная нагрузка на Апач, а можно в httpdconf- и тогда ЧПУ будет работать без накладных расходов.

gopline Aug 30 2008 at 16:41

А можно чуть-чуть подробнее рассказать про эту возможность?

Imenem Aug 30 2008 at 19:32

Директивы вписываются в httpd.conf примерно так:

#если включен mod_rewrite
«IfModule mod_rewrite.c»

#включить движок Rewrite
RewriteEngine on

#применять RewriteRule, если запрашиваемое имя файла не совпадает с именем какого-нибудь реального файла на сервере
RewriteCond %{REQUEST_FILENAME} !-f

#и не совпадает с именем какой-нибудь реальной директории
RewriteCond %{REQUEST_FILENAME} !-d

#переадресация запроса на index.php в виде параметра
RewriteRule ^(.*)$ index.php? do=$1 [L, NA]

#конец блока настроек модуля
«/IfModule»

(сорри за кавычки, хабрапарсер)
Вобщем все как и в .htaccess, подробнее в Гугле

den_rad Aug 31 2008 at 15:57

Спасибо, не знал, как это делать. Раньше через обработку 404 делал

-1

Imenem Aug 31 2008 at 16:02

Обработка 404 приводит к распуханию логов Апача (а они ведутся на всех нормально настроенных серверах), можно и от хостера получить за это. Плюс своенравное поведение ИЕ. Так что лучше делать это через .htaccess (быстро, удобно, правильно) или через httpd.conf (если у вас свой сервер и hi-load сайт :)

ashofthedream Aug 31 2008 at 16:33

+ еще при таком подходе теряется POST. Что врядли может радовать.

Bonch Aug 30 2008 at 17:45

Вот этого

pdf|php|js|ico|txt|gif|jpg|png|css|rss|zip|tar\.gz

Здесь не надо. У вас же уже написано правило, что все, что не является файлом или директорией, отдаем скрипту.

И, кстати, чтобы что-то отдавалось скрипту, надо это указать, хотя бы через PATH_INFO: index.php/$1

Я бы написал так:

[IfModule mod_rewrite.c]
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^(.*)$ index.php/$1 [QSA, L]
[/IfModule]

Квадратные скобки — чтобы парсер не съел.

marazmiki Aug 30 2008 at 18:35

То есть Вы хотите всю статику скармливать php-скрипту? Оригинально-с :)

А что касается «чтобы что-то отдавалось скрипту, надо это указать, хотя бы через PATH_INFO»… Зачем всё уложнять? Ведь есть REQUEST_URI…

-2

nuit Aug 30 2008 at 18:55

>То есть Вы хотите всю статику скармливать php-скрипту?
а RewriteCond не видно? -d и -f

marazmiki Aug 30 2008 at 19:33

Я про

Вот этого
pdf|php|js|ico|txt|gif|jpg|png|css|rss|zip|tar\.gz
Здесь не надо. У вас же уже написано правило, что все...

Однако согласен, не конкретизировал придирку

-2

sbmaxx Aug 30 2008 at 19:21

>Здесь не надо. У вас же уже написано правило, что все, что не является файлом или директорией, отдаем
скрипту.

Да, но ведь может такое быть, что мы попытка открыть несуществующую картинку будет перенаправляться на index.php, а это нам не нужно.

sbmaxx Aug 30 2008 at 19:22

Почему меня хабр не любит…

Хотел написать, что у меня как раз и стоит условие на наличие mod_rewrite, просто я указал само правило, но спасибо за уточнение.

IntenT Aug 30 2008 at 01:06

и самое главное, не забудьте уточнить, как правила №№ 1, 2, 3 и 11 помогают с «распределением нагрузки при внезапно возросшей аудитории сайтов» ;)

chEbba Aug 30 2008 at 01:10

Правило #2
В любом случае нужно, чтобы переправить на индекс файл все запросы.

А так по делу вобщем-то.

Angerslave Aug 30 2008 at 01:13

Слишком категорично, имхо.
Если дальше пойти, можно добавить «не используйте memcached — на другом сервере его может не быть. Как и MySQL.»
Но в целом, вполне справедливо, если делать скидку на то, что CMS/CMF будет популярным и ставиться на множестве разных серверов. А масштабируемый код, думаю, по другим принципам пишется:)

+14

mishamx Aug 30 2008 at 01:43

«не используйте memcached — на другом сервере его может не быть. Как и MySQL.»

не понял связи со статьей…

А масштабируемый код, думаю, по другим принципам пишется:)

Я рассматривал именно случаи не прогнозируемого взлета посетителей, встречал много блогов которые могли из-за одного поста привлечь сразу тысячи посетителей.
Если сразу рассчитывать на большую аудиторию разрабатывая стартап, не думаю, что кто-то выберет PHP для реализации ;) да и остальные компоненты LAMP (ну кроме Linux конечно).

-2

do1banek Aug 30 2008 at 01:48

мне вот стало интересно, а что выберут?

loststylus Aug 30 2008 at 02:24

Python + Psyco, к примеру.

-1

mishamx Aug 30 2008 at 02:27

а это уже кто на чем может ;)
Perl, Ruby, Python, Java, C/C++

-1

Liferay Aug 30 2008 at 12:17

Хм, а что для Вас «прогнозируемый взлет посетителей», это сколько в среднем?

anycolor Aug 30 2008 at 17:13

А почему тогда фейсбук на пхп и та же википедия?

zhulan0v Sep 3 2008 at 01:21

и твиттер (хотя это не очень хороший пример)

Angerslave Aug 30 2008 at 01:52

Это относится ко второму и одинадцатому пунктам — рассматривается случай переноса на другой сервер. Странно, что переносить будем на сервер, на котором не сможем поставить тот же Apache, mod_rewrite или что-то не самое распространённое на хостингах. Уж если мы предусматриваем MySQL Master-Slave, то наверняка и для mod_rewrite место найдётся:)

mishamx Aug 30 2008 at 02:05

это уже выходит за рамки обычного хостинга и в примере рассматривалось распределение не на два сервера, их количество и тип зависит от нагрузки, а так же контента и специфики сайта.
Так же апач универсальная вещь, но как и все универсальные вещи он уступает узконаправленным веб-серверам, а так же MySQL Master-Slave имелось ввиду как мимнимум два разных физически сервера БД, работающих в простой связке репликации пишем на Master, читаем со Slaves.

tigrenok Aug 30 2008 at 09:05

Вы полагаете, у Хабра небольшая аудитория?

vladon Aug 31 2008 at 09:55

Википедия, Facebook, Вконтакте, Одноклассники, Мамба (знакомства) — небольшие домашние странички, использующие PHP, Mysql, apache…

marazmiki Aug 31 2008 at 12:23

Одноклассники используют PHP и Apache? О_О
А почему же в строке HTTP-ответа написано «Resin/2.1.16», а вместо страничек частенько выпадает что-то вроде такого?

500 Servlet Exception
one.ejb.control.client.ControllerFailureException: Can not obtain allowed
EJB service provider.
at one.app.community.dk.model.AWebModel.get(AWebModel.java:516)
at one.app.community.dk.model.AWebModel.handleEvent(AWebModel.java:444)
at one.app.community.dk.model.AWebModel.performLogin(AWebModel.java:280)
at one.app.community.dk.model.AWebModel.performLoginUser(AWebModel.java:268)
at one.app.community.dk.servlet.DesktopServlet.handleNotLoginnedException(DesktopServlet.java:240)
at one.app.community.dk.servlet.DesktopServlet.doPost(DesktopServlet.java:99)
at one.app.community.dk.servlet.DesktopServlet.doGet(DesktopServlet.java:54)
at javax.servlet.http.HttpServlet.service(HttpServlet.java:126)
at javax.servlet.http.HttpServlet.service(HttpServlet.java:103)
at com.caucho.server.http.FilterChainServlet.doFilter(FilterChainServlet.java:96)
at one.app.community.filter.BufferingFilter.doFilter(BufferingFilter.java:85)
at com.caucho.server.http.FilterChainFilter.doFilter(FilterChainFilter.java:88)
at com.caucho.http.filter.GzipFilter.doFilter(GzipFilter.java:128)
at com.caucho.server.http.FilterChainFilter.doFilter(FilterChainFilter.java:88)
at com.caucho.server.http.Invocation.service(Invocation.java:315)
at com.caucho.server.http.HttpRequest.handleRequest(HttpRequest.java:253)
at com.caucho.server.http.HttpRequest.handleConnection(HttpRequest.java:170)
at com.caucho.server.TcpConnection.run(TcpConnection.java:139)
at java.lang.Thread.run(Thread.java:619)

vladon Aug 31 2008 at 21:46

опаньки, сорри. значит одноклассников вычёркиваем.

но по сути крупнейшие сайты используют PHP/MySQL/Apache и с этим не поспоришь.

alitvinenko Sep 4 2008 at 20:53

одноклассники на яве писаны

ashofthedream Aug 30 2008 at 04:34

А если пойти еще дальше — то вообще не используйте ни php, ни apache, ни nginx — их отсутсвие может вас огорчить. Проще всего в такой ситуации нам будет написать свой собственный веб сервер на C, да и cms/cmf — тоже, вместе с базой данных в своем, нужном нам формате.

А в целом — советы никакие.

CTAPbIu_MABP Aug 30 2008 at 01:32

По первым двум пунктам я не соглашусь, всетаки apache + php + mysql самая распостраненная связка на хостингах, хотя если учитывать что то что вы описали аж никак не для маленьких домашних страничек. ф больше подходит под описание сильнонагруженых проектов, то тогда я думаю что разработчики используют на полную все аспекты выбраной конфигурации мало волнуясь за кросплатформенность

mishamx Aug 30 2008 at 01:50

ммм… я хотел донести смысл до тех кто сейчас делает мелкие проекты на своем движке, не вкладывая в них много денег и сил, что он будет спокойно спать зная, что если вдруг на его чудо сайт обрушится шквал посетителей, но он всегда сможет быстро среагировать и без особых проблем его масштабировать.

anycolor Aug 30 2008 at 17:16

Шквал посетителей не берется ни с того ни с сего и не удерживается долго. Если речь идет про одноразовые всплески пользователькой активности, то тут вполне подойдет элементарное кеширование, а заниматься масштабированием из-за таких всплесков — это из пушки стрелять по воробьям.

den_rad Aug 31 2008 at 16:01

Если аудитория моей домашней странички дорастет до аудитории Хабра, то простой оптимизацией тут не обойдешься. Нужно будет переделывать движек.

underwater Aug 30 2008 at 01:56

Готов поспорить насчет первого правила, во многих популярных cms/cmf все инклуды имеют расширение .module или .inc, что сделано для безопасности. Можно конечно define`ом проверять, но суть в том, что первое правило не совсем правильное.

LimeOrange Aug 30 2008 at 02:08

Почему этого не стоит делать (в большинстве случаев), написано здесь: habrahabr.ru/blogs/php/38007/, п. 17

-1

underwater Aug 30 2008 at 02:13

Кто не знает о том, что нельзя оставлять такие файлы доступными с веба — либо глупец, либо человек, поставивший cms и удаливший .htaccess

Мы говорим про программистов вроде, а не о тех, кто код с книжек копирует.

Sannis Aug 30 2008 at 02:13

Как же это помогает безопасности?

underwater Aug 30 2008 at 02:18

Куча, поверь мне, куча уязвимостей даже в таких cms(f), как Drupal, Php-Nuke и прочих очень известных именно в файлах, которые по задумке автора должны только подключаться.

underwater Aug 30 2008 at 02:19

Странно, вырезалась ссылка google codesearch

Sannis Aug 30 2008 at 02:24

Тогда можно было бы заменить это правило на правило «использовать подключаемые файлы только для объявления функций/классов, запускаемых в index». В таком случае можно обойтись и без дефайнов в начале.

underwater Aug 30 2008 at 02:28

Согласен, но каждый день на различных секьюрити — лентах появляются все новые и новые уведомления о подобных уязвимостях, а ведь сколько уже было написано…

Sannis Aug 30 2008 at 02:39

Мне казалось сейчас уязвимости в основном сместились в область SQL-inj и XSS :) Остаётся надеятся, что разработчики, которые столкнулись с проблемами масштабируемости и читают эту статью уже прочитали какой-нибудь FAQ по безопасности.

underwater Aug 30 2008 at 02:57

Те, кто уже двадцать раз прочитал о том, как не надо использовать mysql_query, include, eval и system, порой могут отмочить что нибудь еще :)

Часто вижу, что при проверке в базу данных переменные вроде User_agent или Client-IP (X-forwarder-for) кладутся вообще без проверок, безумное использование import_request_variables или extract и куча других. Вспоминаем недавний баг в WordPress, я думал авторы уже научены предыдущими уязвимостями.

В версии 2.5.0 они решили сделать cookies юзера более защищенными

«wordpress_».COOKIEHASH = USERNAME. «|». EXPIRY_TIME. «|». HMAC

COOKIEHASH md5 хеш от имени сайта
USERNAME Имя пользователя
EXPIRY_TIME Срок жизни cookies до того как они станут невалидными

HMAC представляет из себя хеш из USERNAME и EXPIRY_TIME, основанный на ключе, полученный путем преобразования USERNAME, EXPIRY_TIME и SALT, проще говоря формула такая

HMAC_KEY = HMAC md5(USERNAME.EXPIRY_TIME, SALT), HMAC = HMAC md5(USERNAME.EXPIRY_TIME, HMAC_KEY)
$hmackey = hash_hmac('md5', $user. $time, $salt);
$hmacpass = hash_hmac('md5', $user. $time, $hmackey);

Вроде бы все хорошо, но нет, разработчикам надо было и тут ошибиться :)

Ошибка состоит в том, что при высчитывании хэша не используется разделительных знаков, те зарегестрировавшись с именем, полностью повторяющим уже существующее, но с добавлением в конце имени цифры позволит нам почувствовать себя в шкуре другого юзера.То есть кроме имени юзера, которым нам надо стать и аккаунта в блоге нам ничего не надо.

Объясняю популярно — имеем пользователя admin1, после входа в блог получаем куки

[admin1]|{1897534539}|hash

Теперь просто переделываем cookies так, чтобы левая часть перед hash была идентична для юзера admin

[admin|1](единичка переходит сюда){897534539}|hash

В новом билде хватились и исправили, но такое не забывается :)

underwater Aug 30 2008 at 02:59

Три часа ночи, пока писал мог мысль потерять, если кто чего не понял могу разъяснить xD

Sannis Aug 30 2008 at 13:44

Да, смешная фича. Разработчики IPB при этом просто решили начать работать с HTTP-only куками и переложить заботу о безопасности на их защиту. По крайней мере при правильных настройках подмена куков у него не работает, да и получить их крайне сложно.

firstbyte Aug 30 2008 at 10:44

Ведь вполне спасает старая добрая конструкция

defined(«MY_SUPER_CMS») or die («Access denied»);

в начале подключаемых файлов.

Angerslave Aug 30 2008 at 23:11

Я бы даже сказал устаревшая:) Так писали во времена PHP3. Ну и PHP-Nuke так написан:)

f33l Sep 2 2008 at 06:14

угу, загляните в CodeIgniter ;]

firstbyte Sep 8 2008 at 16:31

Первый раз слышу, что устаревшая. Нормальная конструкция, просто как один из вариантов предосторожности.

den_rad Aug 31 2008 at 16:03

лучше записать в каталог с классами .htaccess с «Deny from all»

firstbyte Sep 8 2008 at 16:30

Оно понятно) Но вдруг htaccess не будет работать на целевом хостинге(да, вдруг мы пишем форум который и на бесплатных хостингах ставиться будет)? Не оставлять же пользователей незащищенными… Хотя, по сути, ничего не произойдёт при запуске подключаемого файла(если он .php). Переменные установятся, да и фиг с ними.

kost_bebix Aug 30 2008 at 02:04

имхо, нельзя вообще вбивать инфу об оптимизации людям, надо вбивать нормальное проектирование (а то будет оптимизация на ранних стадиях что есть зло)

а подобные заметки:
> не будет проблем при запуске на другом веб-сервере, а также для безопасности.
для криворуких недопрограммистов. Если человек не уверен в том, что происходит на сервере — нельзя его вообще к кодингу допускать. А если уверен — уж в состоянии настроить расширения файлов и связать их с обработчиками.

Или (туда же):
> т.к. другой веб-сервер не поддерживает .htaccess
Что значит не поддерживает? Не сумели настроить или что? Нет — идите книги читайте как настроить httpd (или что там еще).

Вот еще замечание:
> использовать полные пути при работе с файлами и хранить пути к папкам в конфиге
> т.к. статику обычно переносят на другой сервер

Нет, не поэтому. Потому что когда вы делаете include вы будете точно знать где файл ищется. На phpclub.ru где-то есть прекрасная статья об использовании полных путей.

И еще:
> Правило #6: при рендере страницы не должно быть лишних SQL-запросов вставляющих записи в таблицу
> статистику отдайте Google Analytics и логам веб-сервера

Снова таки, не в том дело. Не в том дело, что гугл аналитикс молодец. А в том, что делать статистику можно внешним js-файлом (да да, так же, как и гугл аналитикс). Это позволяет погрузить статистику (в будущем, если надо!) на другой сервак, + если тот сервак упадёт (или вообще статистику отключить) — ничего не случится с сайтом.

В общем (это сугубо моё личное мнение), статья ужасна. Предлагаю автору попробовать написать об общем проектировании (чтоб была расширяемость и возможность _дальнейшей_ оптимизации).

+13

underwater Aug 30 2008 at 02:08

Согласен с вами, статья сводится к следующему — «не используй php, на другом сервере его может не быть».

Пятый пункт, в котором говорится о кэширование в файл — тоже спорный момент, кэширование в файл очень плохо сказывается на сервер при большой нагрузке.

mishamx Aug 30 2008 at 02:37

на начальной стадии помогает, а потом на помощь приходит memcached

-2

nuit Aug 30 2008 at 09:15

во-первых, читаем что же такое файл
во-вторых, кэширование готовой хтмлки, которая хранится в памяти и отдаётся с помощью x-sendfile гораздо лучше чем какой-то геморрой с мемкэшд :)

kost_bebix Aug 30 2008 at 02:13

p.s.: иногда минусуют карму за обычные себе посты с выражением точки зрения, что кажется что снова боты на хабре :-)

chetzof Aug 30 2008 at 11:54

не боты а тролли. им плевать на содержание поста :(

-1

mishamx Aug 30 2008 at 02:20

Что значит не поддерживает? Не сумели настроить или что? Нет — идите книги читайте как настроить httpd (или что там еще).

кроме httpd в мире еще существуют сотни веб-серверов, а также способы запустить PHP

Нет, не поэтому. Потому что когда вы делаете include вы будете точно знать где файл ищется. На phpclub.ru где-то есть прекрасная статья об использовании полных путей.

имелось ввиду не скрипты, а статический контент (изображения, видео, архивы и т.д.) т.к. они действительно могут находиться физически на другом сервере (статику отделяют при масштабирование, одни из первых этапов отделить Frontend и Backend).

Снова таки, не в том дело. Не в том дело, что гугл аналитикс молодец. А в том, что делать статистику можно внешним js-файлом (да да, так же, как и гугл аналитикс). Это позволяет погрузить статистику (в будущем, если надо!) на другой сервак, + если тот сервак упадёт (или вообще статистику отключить) — ничего не случится с сайтом.

Здесь дело в том, что если статистика будет считаться средствами цмс, то это как минимум + 1 INSERT в БД, даже при небольшой нагрузке просто упадет сайт из-за таблицы статистики, но почему-то многие стараются запихнуть это в цмс (одна из распространенных ошибок)

-1

kost_bebix Aug 30 2008 at 02:39

> кроме httpd в мире еще существуют сотни веб-серверов, а также способы запустить PHP

Да. Именно поэтому я написал
1. httpd (или что там еще) — httpd либо другой веб-сервер
2. Не сумели настроить или что? Нет — идите книги читайте как настроить — о том, что нужно правильно настроить веб-сервер и всё, а не думать во время разработки о том, что ж там будет. + нормальные проекты (требующие расширения) могут позволить себе сервер «с нуля», где всё настраивается вами. Любимые версии любимых программ под любимую ОС.

> имелось ввиду не скрипты, а статический контент (изображения, видео, архивы и т.д.) т.к. они действительно могут находиться физически на другом сервере (статику отделяют при масштабирование, одни из первых этапов отделить Frontend и Backend).

Нууу… А бывает статику разносят на несколько серваком (когда нагруженный проект типа ютуб). Тогда уж полные пути для статики — полное зло. В общем, хэлперы для формирования ссылок — наше всё.

> но почему-то многие стараются запихнуть это в цмс (одна из распространенных ошибок)

Ну, здесь мои способности телепата отсутствуют, но я лично видел человека два за жизнь, которые статистику таки пихали в скрипты (кстати, иногда это таки надо). Возможно вы правы, стоит предупредить этих умельцев, рас уж их так много.

marazmiki Aug 30 2008 at 09:48

Или (туда же):
> т.к. другой веб-сервер не поддерживает .htaccess
Что значит не поддерживает? Не сумели настроить или что? Нет — идите книги читайте как настроить httpd (или что там еще).

Вы будете смеяться, но, к примеру, в nginx нет .htaccess. То есть вообще нет. Все изменения делаются на уровне конфигурации сервера. Да, там есть механизм перезаписи URL (я только про перезапись URL говорить буду, а не о различии в конфигах, которые всё-таки могут быть весьма и весьма существенными, как по синтаксису, так и по возможностям). Если для Вас переписывать полста правил из формата mod_rewrite апача в формат rewrite nginx'a — в порядке вещей, то я замолкаю: меня такие задачи очень удручают, но люди-то все разные, кто-то не чурается однообразного механического труда :)

Вот еще замечание:
> использовать полные пути при работе с файлами и хранить пути к папкам в конфиге
> т.к. статику обычно переносят на другой сервер

Нет, не поэтому. Потому что когда вы делаете include вы будете точно знать где файл ищется. На phpclub.ru где-то есть прекрасная статья об использовании полных путей.

Инклюды «как есть» лучше вообще не использовать. Автозагрузчики, вызывающие обёртку ,которая решает, каким образом подключать файл существенно увеличит гибкость программы. Это так, на тему «я зануда» :)

-1

Imenem Aug 30 2008 at 13:03

Вы будете смеяться, но, к примеру, в nginx нет .htaccess.

Стандартная архитектура вэб-сервера предполагает nginx как фронт-энд и Апач как бак-энд. Использовать nginx для реврайта- имхо изврат. Отдача статики, контролируемая загрузка, кэширование- это его задачи. Или вы к nginx будете привязывать сразу php?

marazmiki Aug 30 2008 at 14:26

Буду, почему же нет. Использую в качестве бэкенда FastCGI и вполне себе доволен жизнью. Подход с заворотом всех запросов несуществующих файлов на фронтконтроллер PHP-приложения считаю удачным решением и менять точку зрения не собираюсь :)

А от апача пришлось отказаться при повышении трафика. Дюже он прожорливым оказался на ресурсы (не надейтесь, вся статика отдавалась nginx'ом и физически находилась на другом сервере). После переезда на nginx+fastcgi жить стало много легче.

kost_bebix Aug 30 2008 at 13:08

> Если для Вас переписывать полста правил из формата mod_rewrite апача в формат rewrite nginx'a — в порядке вещей, то я замолкаю

Нет, но для меня проще изначально определиться чего я хочу и поставить любимый веб-сервер (если сайт написан с кучей мод_реврайтов апача кому в голову придет устанавливать на новом серваке не апач а нгикс??? Киньте в него камнем!)

> Инклюды «как есть» лучше вообще не использовать. Автозагрузчики, вызывающие обёртку, которая решает, каким образом подключать файл существенно увеличит гибкость программы. Это так, на тему «я зануда» :)

Автозагрузчики — зло, имхо. Тормозят и запутывают программу. А в чем гибкость увеличивается я не понял, если честно.

marazmiki Aug 30 2008 at 15:04

Нет, но для меня проще изначально определиться чего я хочу и поставить любимый веб-сервер (если сайт написан с кучей мод_реврайтов апача кому в голову придет устанавливать на новом серваке не апач а нгикс??? Киньте в него камнем!)

Одна из самых страшных ошибок в вебе — недооценка перспектив роста популярности. Я на этом уже обжигался :)

marazmiki Aug 30 2008 at 15:12

Чем увеличивается гибкость:

Вам не надо задумываться, какой класс подключить, чтобы тот или иной функционал стал доступен; с другой стороны не надо грузить всё подряд. Требуемый класс будет подключен по запросу.
Если структура файлов и папок поменяется, Вам не придётся судорожно искать все инклюды в коде проекта, а всего лишь поправить один метод или функцию, изменив логику вызовов.

Разве плохо? :)
А чем запутывают — не придумал. Может, приведёте пример?

Что касается тормозов: может, они и замедляют работу скрипта, но несущественно. Основная часть времени уходит не на определение загруженных классов, а на инклюд файла (работа с ФС вообще не самая быстрая штука). Не думаю, что работа одного вызова автозагрузчика будет сильно различаться по времени с работой явного инклюда.

kost_bebix Aug 30 2008 at 16:38

Запутанность? Очень просто. Вы читаете чей-то код и видите использование класса Foo. Хотите его найти. Придется читать (или дебажить) загрузчик.

Еще запутанность. У вас структура такова, что класс Zend_View_Abstract хранится в classes/Zend/View/Abstract.php, в то же время класс из другого фрэймворка, называющийся someFooBar хранится в classes/someframework/FooBar.php. Это усложняет загружчик. А еще и Smarty надо бы, а еще и PEAR, который где-то в include_path. А еще модели хранятся отдельно, интерфейсы отдельно, контроллеры отдельно, view отдельно.

marazmiki Aug 30 2008 at 16:47

Вы читаете чей-то код и видите использование класса Foo. Хотите его найти. Придется читать (или дебажить) загрузчик

В любом уважающем себя IDE (а так же в некоторых «умных» текстовых редакторах) есть возможность перейти на место декларации класса, функции или метода. Например, в Eclipse PDT это можно сделать, просто щёлкнув по функции\классу\свойству, удерживая CTRL.

Еще запутанность. У вас структура такова, что класс Zend_View_Abstract хранится в classes/Zend/View/Abstract.php, в то же время класс из другого фрэймворка, называющийся someFooBar хранится в classes/someframework/FooBar.php. Это усложняет загружчик. А еще и Smarty надо бы, а еще и PEAR, который где-то в include_path. А еще модели хранятся отдельно, интерфейсы отдельно, контроллеры отдельно, view отдельно.

А что мешает сделать несколько автозагрузчиков? Благо SPL такую возможность предоставляет. Для классов ZF используйте один лоадер (который, к примеру, будет оборачивать Zend_Loader), для Smarty второй, для PEAR третий, для моделей и прочего — тоже. В общем, на сколько фантазии хватит :)

kost_bebix Aug 30 2008 at 17:03

В общем, мне кажется что каждый раз нажимать на класс и идти в его декларацию чтоб просто понять где он — мозг загружает (и время отнимает). А если при написании кода человек не знает где лежит класс и лишь надеется на загрузчик — тоже плохо. А если знает где класс лежит и знает как загрузчик работает — тоже лишняя работа мозга (вспоминать как тот работает).

Несколько загрузчиков — да, отлично. Еще и о нескольких загрузчиках думать.

В общем, я так понял, мы дошли до черты где важно дело вкуса.

p.s.: так и не понял зачем они нужны вообще. «Изменение структуры папок» — и часто у вас такое бывает? А если отталкиваться от ROOT_CLASSES_DIR то вообще не пойму, как кроме перемещения всех классов куда-либо можно извратиться.

marazmiki Aug 30 2008 at 17:40

Гибкая разработка — это когда о загрузчиках думать не надо. Равно как и не надо думать о том, в каком файле лежит тот или иной класс. Надо всего лишь знать, что при обращении к нему он (класс) автоматом подключится, а при желании можно быстро ознакомиться с его (класса) интерфейсом. В этом опять же здорово помогут IDE.

Насчёт черты про дело вкуса — не согласен, но спорить не буду :)

kost_bebix Aug 30 2008 at 17:49

> Гибкая разработка — это когда о загрузчиках думать не надо.

Не понял при чем здесь первое ко второму (кстати, в include'ах о загрузчиках думать не надо :-)

> Равно как и не надо думать о том, в каком файле лежит тот или иной класс.

Правильно. Но знать это надо (используете вы ИДЕ или нет). А чтоб знать — надо думать о загрузчике (см. пункт выше :-)

marazmiki Aug 30 2008 at 18:57

Вопрос в лоб: а зачем знать, где лежит тот или иной файл?

kost_bebix Aug 30 2008 at 19:34

Всё ясно. Дальше спорить смысла не вижу.

-1

marazmiki Aug 30 2008 at 19:39

Оставить последнее слово за собой — мудрое решение. Но вы меня просто заинтересовали. Может, всё-таки аргументируете?

kost_bebix Aug 30 2008 at 19:41

ну ок. Ответите тогда на встречный вопрос? Зачем знать html если есть визуальные редакторы/IDE?

Если хотите — оставьте последнее слово за собой.

-1

marazmiki Aug 30 2008 at 20:04

Вопрос глупый, но отвечу: причин много. Например, зачастую WYSIWYG генерит избыточный код, из-за которого нарушается семантика и увеличивается вес страницы. Про SEO молчу, к делу не очень относится :)

Теперь моя очередь: зачем знать, где именно хранится класс (в отдельном файле, в подключаемом файле с кучей функций или вообще пятью строками выше), если я точно знаю, что этот класс к моменту создания инстанции гарантированно будет подключен, а при необходимости я с лёгкостью увижу его интерфейс, реализацию или даже отредактирую его.

-1

kost_bebix Aug 30 2008 at 20:11

Отвечаю. Потому же, почему WISIWIG плох для html.

Вы полностью зависите от IDE. И если она не найдёт ваш файл, содержащий класс — вы обречены. А вдруг IDE некорректно пропарсит файлы и покажет вам другой файл с классом с тем же именем? (когда тестировал вышеупомянутый pdt — не раз случалось, а иногда оно один и тот же файл два раза парсило, в общем — глюков много) Вообще прекрасно.

Зависить в разработке программы от IDE — всё равно что верстать в визивиге.

-1

marazmiki Aug 30 2008 at 20:27

А вдруг IDE некорректно пропарсит файлы и покажет вам другой файл с классом с тем же именем?

А вдруг завтра небо нам на головы упадёт? :) Кроме того, классов с одинаковым именем в пределах одного проекта не должно существовать…

Последнее сравнение надуманное и притянутое за уши.

-1

kost_bebix Aug 30 2008 at 20:37

Ваше сравнение с небом некорректное и надуманное.

Я же говорил что дальше смысла не вижу спорить, вы всё равно не поймёте зачем знать как всё работает если можно кнопочку нажать и всё.

-3

UFO just landed and posted this here

marazmiki Aug 30 2008 at 15:15

Делать одно и то же — удручает. Я вообще по жизни ленивый.
А ещё необъяснимым образом нравится словосочетание «низкая связанность» :)

brutto Aug 30 2008 at 02:32

а как быть с правилом №8
и с тем что индексы нужны полюбому иначе даже репликация не поможет
и что запись не обязательно лочит всю таблицу
и что скорость записи в сравнении с селектом не так критична
(если ваш проект не сервер сатистики конечно)? =)

mishamx Aug 30 2008 at 02:43

я не говорил, что нужно вообще избавиться от индексов
в некоторых БД есть решения по поводу блокировки таблицы при записи
а вот скорость все-таки критична, особенно при их изобилии

-6

silentroach Aug 30 2008 at 02:34

правило №8 действительно имеет место?
мне кажется, вставки в таблицы обычно происходят реже, чем чтение из них и выборка, в которой эти индексы активно участвуют.

Patrick Aug 30 2008 at 02:44

№11 — улыбнуло! раскажите мне в крадце, на каких веб серверах нету переменных $_POST или $_GET? ну и про сессии поподробней…

ashofthedream Aug 30 2008 at 04:31

Видимо на тех, где нету php :)

Нет, совет то конечно хроший, но представлен совсем невразумительно. Переделаем его так:
Не обращайтесь напрямую к серверным переменным, особенно к $_POST и $_GET, потому как там находится «сырые данные» пришедшие от пользователя, которому, как известно доверять нельзя. Луше потратиь 40 минут и написать небольшую облочку для них, реализовав в удобной для вас парадигме, которая позвоила бы легко отфильтровать различный мусор, и не боятся, что вас можно ломануть до боли знакомыми способами.

Мне к примеру нравится связка объектов Request и Response, через которые мы общаемся с пользователем и с десяток различных фильтров, которые мы можем настроить под себя как угодно.

-1

PingMe Aug 30 2008 at 10:19

Возможен ещё такой момент, что в будущих версиях изменят эти глобальные переменные PHP, как это было с переходом с 3-ки на 4-ку. Если они будут объявлены в одном месте, то можно будет и исправить легко и отфильтровать сразу что не нужно.

-1

LoneCat Aug 30 2008 at 14:13

Уж насколько я люблю распихать все по объектам — но здесь даже я логики не вижу, как раз таки главное отличие $HTTP_***_VARS от $_*** в том что последние — суперглобальные, и доступны в любой области видимости, оборачивать их в зависимые от области видимости объекты — минимум нелогично, да и использоваться они должны при грамотной архитектуре (мы-же о фреймворках говорим?) в специально отведенных для этого местах, и уж Зенд вдруг резко сойдет с ума и переименует эти массивы, безусловно не оставив обратной совместимости (которая по отношению к $HTTP_***_VARS кстати есть), а потом сойдут с ума все хостеры, обновив интерпритатор на эту, веселых расцветок, версию — то заменить пару-тройку переменных в нескольких файлах я думаю не составит такого огромного труда, в современных IDE это можно сделать одной операцией.
С такой позицией тогда уж и каждую используемую встроенную функцию нужно обернуть в пользовательскую или объект, и то, от безумных, с налитыми кровью глазами и кровавой пеной у рта, разработчиков Зенда, удаливших в новой версии интерпритатора все языковые конструкции, начиная от оператора присвоения, заканчивая условными операторами и циклами — это не спасет :)

marazmiki Aug 30 2008 at 14:45

Интересные у Вас проекты, если обращение к суперглобалам у Вас случается 2-3 раза в нескольких файлах. А я вот думаю, что обёртка суперглобалов — это правильно. Даже если взять в учёт тот маловероятный случай с «весёлых расцветок версией», изменение придётся делать в одном классе, что, согласитесь, лучше Вашего варианта :)

А что самое главное — благодаря обёрткам можно избавиться от необходимости выполнять

<code>if (array_key_exists('foo', $_GET)) { print $_GET['foo']; }</code>

и тому подобный ужас, тем самым сократив полезный код и сделав его более читабельным.

Sannis Aug 30 2008 at 14:52

Об этом и говорится. Разве что насчёт 2-3х автор погорячился, должно быть в одном конечно :)

marazmiki Aug 30 2008 at 15:17

Мм… Если честно, мне показалось, что LoneCat высказывается против врапперов. Я высказывался однозначно за. Чью точку зрения вы поддерживаете? :)

Sannis Aug 30 2008 at 21:30

Я за :) Да и LoneCat вроде тоже, просто очень путанно:

да и использоваться они должны при грамотной архитектуре (мы-же о фреймворках говорим?) в специально отведенных для этого местах

LoneCat Aug 30 2008 at 22:58

Вы говорите об обертках для массивов, а я о том что при разделении например модель-вид-контроллер (чем хвастают большинство фреймворков и цмс) — работать с этими массивами предстоит только контроллеру, и даже при отстутсвии этого разделения входные данные неплохо-бы обрабатывать централизовано, если код пестрит if($_GET['param']) { echo $_POST['param']; } то тогда конечно это осложнит замену в нем этих массивов в ручном режиме. Я почему-то считаю это правильным — сначала получить необходимые данные из суперглобальных массивов в переменные, привести к нужным типам, сделать необходимые проверки на правильность их содержимого и уже затем с этими переменными работать.

marazmiki Aug 31 2008 at 00:02

при разделении например модель-вид-контроллер (чем хвастают большинство фреймворков и цмс) — работать с этими массивами предстоит только контроллеру

Между прочим, не факт. Простейший пример — страница с результатами поиска, на которой необходимо написать что-то типа «вы искали: сиськи третьего размера»). Можно, конечно, передавать поисковый запрос из контроллера, не могу сказать, что это неправильно. Но с другой стороны — это, как ни крути, логика отображения. Если надпись захочется убрать, ничего не поломается. Тогда зачем передавать лишние данные? :)

Я бы в данном случае просто обратился к данным из GET прямо в шаблоне. К примеру, Smarty позволяет это делать (самое важное — не забыть про возможные XSS и кастануть фильтрами типа ESCAPE). Лично у меня используется объект httpRequest, из которого можно получить все данные о запросе. Вызывать этот объект можно и в контроллере, и в шаблонах (которые, кстати, могут быть как на основе Smarty, так и pure php).

Я считаю этот подход правильным, а единообразие интерфейса в шаблонах и контроллерах радует :)

Я почему-то считаю это правильным — сначала получить необходимые данные из суперглобальных массивов в переменные, привести к нужным типам, сделать необходимые проверки на правильность их содержимого и уже затем с этими переменными работать

Я когда-то, много лет назад, делал так же. Потом, когда переменных становилось всё больше, понял, что надо что-то менять… :)

Sannis Aug 31 2008 at 00:37

В общем-то, окончательно мою мысль договорил marazmiki, лучше бы использовать класс Request и его методы getPost, getGet и т.д. Тогда достаточно будет изменить имена массивов в этих методах, что и говорит о неприменимости этого пункта из топика.

DYPA Aug 30 2008 at 12:08

в php3 было
$HTTP_GET_VARS
$HTTP_POST_VARS

PingMe Aug 30 2008 at 12:30

Я об этом и говорю, было так, а стало $_GET и $_POST

Patrick Aug 30 2008 at 18:56

вы ище вспомните PHP/FI. Живите сегоднешнем днём… обратная совместимость будет всегда…

DYPA Aug 30 2008 at 22:06

>на каких веб серверах нету переменных $_POST или $_GET?
каков вопрос — таков ответ

-1

PingMe Aug 31 2008 at 11:46

Только не включена она по умолчанию.

Angerslave Aug 30 2008 at 23:15

Они и сейчас есть:) А вот скриптов с тех времён всё меньше и меньше:)

bazzzman Aug 30 2008 at 06:14

Может кому-нибудь пригодится такая простая проверка url'а в PHP 5 на наличие всякого мусора ^___^

// проверяем url на наличие опасных символов
function checkUrlOnXss(){
$u = urldecode(@$_SERVER['REQUEST_URI']);
if (!$u) return;
$str = 'javascript, document.write, <script, <iframe, src=, ../, ..\\';
$str = html_entity_decode($str); // переводим < => < чтобы регулярко всё кушала
$str = preg_quote($str, '/');
$str = str_replace(', ', '|', $str);
if (preg_match(«/({$str})/i», $u) > 0) simpleError('XSS detected');
}

Вот такая наивная защита от XSS.

-3

Sannis Aug 30 2008 at 13:48

Слишком наивная ;) IE(старый), к примеру, поймёт протокол javascript в href ссылки даже если будет написан в виде jav asc\tript. Аналогично с пробелом после < в <script и <iframe

bazzzman Sep 1 2008 at 02:34

Спасибо ^___^
Буду знать, пофиксю функцию.

UFO just landed and posted this here

bazzzman Sep 1 2008 at 02:14

> А от того, что на экране у юзера появится строчка кода на яваскрипте, никакой беды не
> случится — выполниться-то этот код не сможет…
Эээ… Правда? А если это html будет?

Ну и админу урл отдаём.

UFO just landed and posted this here

antage Aug 30 2008 at 08:28

и не забывайте, что во время записи лочится таблица

В MySQL есть тип таблиц InnoDB с per-row locking. Если используете какой то инструмент, то неплохо бы сначала изучить его, перед тем как давать советы другим.

lenar Aug 30 2008 at 10:06

надеялся прочитать какую-то интересную теорию, а оказался бред для малолетних программистов

nuit Aug 30 2008 at 10:11

Такое ощущение, что посты со словом пхп плюсуют, не читая что внутри.

-1

lenar Aug 30 2008 at 11:04

это все происки злобных анти-пхпшников :)

UFO just landed and posted this here

sfoid Aug 30 2008 at 10:30

Первое, почитайте про «денормализацию».

ecl Aug 30 2008 at 10:50

Не хочу никого обидеть, но все настолько примитивно, что статью нужно назвать не «Советы для разработчиков CMS и фреймворков на PHP», а «Если вы не знаете даже этого, то не вздумайте разрабатывать FW or CMS»
Ну и несогласия есть: mod_r.., htaccess, и тд.

AlienZzzz Aug 30 2008 at 11:17

«чем больше индексов, тем больше время записи и не забывайте, что во время записи лочится таблица» — за это яб поубивал нахрен
Это откуда такое, первый раз слышу, чтоб лочилась таблица при индексе, да не спорю, работа медленнее, но зато эффект колосальный.

Так как большинество приложений чаше делает все таки SELECT, чем INSERT, и если вы исключите индексы, то вы тогда при маштабировании, когда 100ккк записей не дождетесь ответа сервера, так как любой запрос будет вызывать Фул скан, так как индексов нет и база не знает как ей найти например товар с идентификатором 10000.

, вообще вы представили «как бы хотелось программировать», но не «Советы для разработчиков CMS и фреймворков на PHP»

где отделение представления от функциональности, где выделение отдельно классов по функционалльности, где выбор шаблонизатора, и редактора, это ИМХО советы как сделать хоме-паге), но не поллноценную CMS.

DYPA Aug 30 2008 at 11:58

Правило #11: PHP, все-таки, объектно-ориентированный язык, поэтому обращайтесь не напрямую к серверным переменным ($_SERVER, $_POST, $_GET, $_SESSION) — используйте объекты

1) переменные окружения настраиваются администратором вебсервера, если у вас чтото настроенно не верно — это проблемы администратора
2) если админ попался упертый — то вначале проекта делаем include «./hack.php»; в котором приводим переменный окружения данного сервера в гармонию с кодом
следствие: если админ упертый, то есть смысл сменить хостинг.

Правило #5: не бойтесь кэшировать контент в файлы, статическая html-ка отдается быстрее чем php-скрипт открывающий файл с кэшем на диске

замечания:
1) кешировать в файл не всегда удобно (memcached/sql)
2) кешировать нужно с умом, тк при большом количестве файлов в одной дирректории на некоторых фаловых системах могут возникать приличные тормоза

nuit Aug 30 2008 at 12:08

1) вам тоже стоит прочитать что такое файл
2) а в sql или этой примитивной хэш табличке с таймерами(мемкэшд) — это вызывает меньше проблем?

-2

DYPA Aug 30 2008 at 12:19

>1) вам тоже стоит прочитать что такое файл
тогда я вам рекомендую прочитать что такое файловая система и как происходит доступ к файлам
>2) а в sql или этой примитивной хэш табличке с таймерами(мемкэшд) — это вызывает меньше проблем?
иногда нужно рапределить кеш между несколькими серверами, а иногда удобно класть кеш в sqlite (например в симфонии есть такой вариант кеширования) вместо обычных файлов

nuit Aug 30 2008 at 12:29

>тогда я вам рекомендую прочитать что такое файловая система и как происходит доступ к файлам
Неужто забрать что-то из tmpfs будет сложнее чем из sqlite?: D

>иногда нужно рапределить кеш между несколькими серверами
для этого конечно придётся использовать большие базы данных или тот же мемкэшд: D

-1

DYPA Aug 30 2008 at 12:36

>Неужто забрать что-то из tmpfs будет сложнее чем из sqlite?: D
сложнее будет найти хостинг с tmpfs чем sqlite

nuit Aug 30 2008 at 12:45

>сложнее будет найти хостинг с tmpfs чем sqlite
Ну ладна :) Неужто забрать что-то с ext3 будет сложнее чем из sqlite? ))

-1

nuit Aug 30 2008 at 12:21

Интересно, а кто-нибудь из тех кто минусуют смогут аргументировать свои действия: D
Уже совсем в минуса загнали, а ведь они даже не догадываются о том что вместо того чтобы складывать готовый хтмл в мемкэш, будет лучше положить его на сетевом диске а из пхп говорить фронтенду о том чтобы он забрал этот файл и отправил клиенту.
А для тех кто критикует мифический файл, следовало бы ознакомиться с религией юниксов или сразу с plan9 :)

-2

DYPA Aug 30 2008 at 12:33

а вы не задумывались почему все используют memcached? а зря… самое важное здесь — скорость доступа к данным.
ознакомтесь с теорией файловых систем, не путайте представление файла в ОС и на уровне ФС

nuit Aug 30 2008 at 12:40

>а вы не задумывались почему все используют memcached? а зря… самое важное здесь — скорость доступа к данным.
Обещаю, что если вы сделаете то что я описал — скорость доступа к данным будет выше :) Вам даже не понадобится пропускать через php скрипт весь хтмльник из мемкэшеда… вы фронтенду скажите x-sendfile вон с того компьютера… а тот в свою очередь не будет через свои промежуточные буфферы копировать, а напрямую отсплайсит в сокет ;)

-1

DYPA Aug 30 2008 at 12:03

Правило #0: говнокод — это плохо. не забывайте что есть стиль оформления кода, комментарии и мануал.

Liferay Aug 30 2008 at 12:23

habrahabr.ru/blogs/webdev/15362/
www.danga.com/memcached/
www.mysqlperformanceblog.com/

Alexsib Aug 30 2008 at 12:24

не поленился прочитал все коменты
Статья в общем то дельная, я согласен с пунктами 1, 3, 4, 5, 6, 9, 10 и 11

На счёт многотабличных запросов и индексов не согласен полностью.
Если использовать InnoDB, то можно юзать такие вкусняшки, как внешние ключи, благодаря которым многотабличные запросы значительно ускоряются.
Что касается текстового поиска по другой таблице, согласен, но не по таблице надо искать, а воспользоваться например Sphinx. Полгода как прикрутил к своим проектам и нарадоваться не могу. А для построения индекса достаточно сделать представление, чтобы не дублировать данные. Один сложный запрос раз в сутки — не критично, а каждый раз добавлять записи в таблицу с FULLTEXT это эже проблема, тем более что в MySql это возможно только с MyISAM

UFO just landed and posted this here

maximw Aug 30 2008 at 12:29

Правило #1: все исполняемые скрипты должны иметь расширение .php и только .php, даже инклюды. не будет проблем при запуске на другом веб-сервере, а также для безопасности.

Отчасти правильно, отчасти нет. Во-первых более уверенная безопасность достигается вынесением инклюдов выше корня сайта. Во-вторых если инклюд имеет расширение, например, .module, то запрет на него делается в .htaccess. Бывает, что расширение отличное от .php промогает движку CMS узнать где его модули, а где какие-то другие скрипты, не имеющие отношения к CMS. Так например делает Друпал.

Правило #2: по минимуму использовать функции .htaccess и тем более никаких параметров типа:
RewriteRule ^(.+)$ index.php? path=$1
т.к. другой веб-сервер не поддерживает .htaccess, а в конфиге не всегда удастся настроить так же и отнимет больше времени

Ерунда, вплоть до наоборот. Если сервер не поддерживает .htaccess стоит задуматься о компетентности его администраторов и компетентности того, кто купил такой хостинг, если конечно речь про Apache. Отдача статики минуя index.php делается просто «пальцем об асфальт»
RewriteEngine on
RewriteBase /
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule (.*) index.php? path=$1
Таким образом CMS имеет одну точку входа. Я допускаю, что можно не использовать такую архитектуру, но это исключение, а не правило.

Правило #3: не злоупотреблять mod_rewrite-ом, не использовать виртуальных путей для статических файлов (jpg, gif, css, js и т.д.)
статика должна быть статикой

Далеко не всегда. Для элементов дизайна — да, однозначно. А если вы, например, раздаете mp3 за деньги, то совсем не так. То, что через mod_rewrite может спокойно отдавать статику есть в пункте выше.

Правило #4: использовать полные пути при работе с файлами и хранить пути к папкам в конфиге
т.к. статику обычно переносят на другой сервер

Слишком категорично. Полные пути, конечно, избавляют от многих проблем. Но структура папок может быть динамической (как в том же Друпале). Тут все зависит от архитектуры проектируемой CMS. А статику переносят на другой сервер достаточно нагруженные проекты. Особенно странно звучит это утверждение, в свете что вы закладываетесь на владельцев говнохостинга где нет .htaccess (опять же если речь идет про Apache).

Правило #5: не бойтесь кэшировать контент в файлы, статическая html-ка отдается быстрее чем php-скрипт открывающий файл с кэшем на диске.
не забывайте, можно кэшировать не только html но и xml и т.п.

И здесь все зависит от архитектуры. Кеширование вообще отдельная тема. Часто кешировать надо на уровне блоков.

Правило #6: при рендере страницы не должно быть лишних SQL-запросов вставляющих записи в таблицу
статистику отдайте Google Analytics и логам веб-сервера

Получается что любой модуль CMS, ведущий статистику – лишний? Google Analytics – хорошо, но лучше предоставить пользователю CMS выбирать что лишнее, а что нет.

Правило #7: чем проще SQL запрос, тем больше его скорость работы
сопоставление таблиц — это красиво, но не эффективно, особенно при больших объемах

Да, известно, что MySQL не очень любит join-ы (если вы про них), но тут совсем все не так однозначно. Бывает и join эффективнее, чем разбиение на несколько запросов. В любом случае есть EXPLAIN, и возможность тюнинговать запросы, если хочешь сделать быструю CMS.

Правило #8: использовать минимум индексов, избавиться по возможности от индексов в текстовых полях
чем больше индексов, тем больше время записи и не забывайте, что во время записи лочится таблица

Во-первых таблица лочится только в MyISAM, в InnoDB лочится строка (если речь идет про MySQL).
Во-вторых минимум индексов не есть оптимально. Индексы прекрасный инструмент ускорения выборки, но их надо тоже тонко проектировать в зависимости от того какие преимущественно запросы будут к таблице.

Правило #9: не использовать поля с полнотекстовым поиском в основных таблицах
для поиска используйте отдельную таблицу

Это все зависит от того, как реализовывать поиск. Возможно, если вы напишете статью, как эффективно организовать поиск, где будет показано что отдельная таблица эффективнее в очень широком круге применения, то тогда можно будет претендовать на однозначность.

Правило #11: PHP, все-таки, объектно-ориентированный язык, поэтому обращайтесь не напрямую к серверным переменным ($_SERVER, $_POST, $_GET, $_SESSION) — используйте объекты
Некоторые переменные в других веб-серверах имеют другие имена, а некоторых вовсе нет и их придется вычислять или придумывать (печально дело обстоит с сессиях)

Вообще первый раз об этом слышу. Либо я чего-то упустил в этой жизни, либо это ерунда. Приведите, пожалуйста пример версии PHP или хостинга, где переменные имеют другие названия. Например, $HTTP_GET_VARS – это не другое название, это устаревшее название.

+10

ivertex Aug 30 2008 at 13:17

Все тут упирается в вопрос, как вы масштабируетесь. Если вы покупаете вместо виртуального хостинга выделенный сервер, это одно (для этого половина ваших советов не принципиальна). Если к выделенному серверу покупаете еще один под базу, то почти все ваши советы (кроме оптимизации запросов и модреврайтов на статику) не принципиальны. Если вы масштабируете двух серверную архитектуру, то правила у вас уже будут другие)).
Про индексы, как уже высказывались, вы не правы. Тот же InnoDB спасает по вопросам лока.
А про кэш — это опять же говорили уже, отдельная и весьма объемная тема.

Вывод: давать такие советы нужно в контексте архитектуры, чтобы понятна была среда (сколько серверов, где мускуль, есть ли распределенная бд или фс, сколько даунлоадеров или все это просто один виртуальный хостинг).

nuit Aug 30 2008 at 13:30

Хуже то что это советы для разработчиков фреймворков :) А я то думал, что велосипеды начинают делать люди, которые переросли в своём видении окружающие фреймворки, но эти советы для тех у кого всё ещё даалекоо впереди.

j4ck Aug 30 2008 at 13:48

Статья для читательниц журнала Cosmopolitan.

ecl Aug 30 2008 at 14:44

дай почитать :)

-1

AlexKuk Aug 30 2008 at 14:45

Очередной бесполезный и ограниченный набор советов

zol Aug 30 2008 at 14:48

Ой-ё-моё
Всётаки сумели запутать!

TermiT Aug 30 2008 at 15:07

Перенесите в блог «Юмор на Хабре», пожалуйста :)

shvechikov Aug 30 2008 at 15:11

Для такого рода творчества, думаю, лучше подойдёт блог с названием «Я плакал!» :)

Ueasley Aug 30 2008 at 15:39

Поспорил бы со второй частью 7го правила

anycolor Aug 30 2008 at 17:26

Много спорных и ничем не обоснованных советов…

iliich Aug 30 2008 at 17:55

Да почему спорных ине обоснованных, я бы сказал ожидаемых.

goshi Aug 31 2008 at 21:52

Первая фраза статьи «Уже не раз сталкиваюсь с подобной проблемой, когда люди приходят и просят помочь в решении проблем распределения нагрузки при внезапном возрастании аудитории их сайтов»

При затачивании проекта и увеличение его производительности от оберток для БД отказываются, т.к. они занимают время на инициализацию и управление. Ну и вообще, многое можно покритиковать. Все как-то скопом и разрознено.

oRb Aug 30 2008 at 19:08

Весь текст про то как сделать лучше и в конце такой ляп — 11ое правило. Ну зачем городить огород и для доступа к суперглобальным массивам использовать ООП?

goshi Aug 31 2008 at 21:49

Ну наверное это для того случая, если имена массивов поменяют в следующей версии ПХП, а функции отменят для подчеркивания ООПшности ПХП.

З.Ы. Вообще-то использование методов объектов нораздо медленнее, чем использования функций. Не верите — проведите тесты.

ILYHA Aug 30 2008 at 20:15

>> (печально дело обстоит с сессиях)
исправьте на «в сессиях»

paladka Aug 31 2008 at 00:53

читал комментарии весь вечер. Много думал… :)

nuit Aug 31 2008 at 06:45

… о чём? :)

f33l Sep 2 2008 at 07:03

угу, что примечательно, многие повторяют друг за другом «советы чушь, пост ацтой», однако при этом в треде скопилось довольно много реально ценных, особенно для начинающих, комментов, и тред из ацтойного превратился в полезный.
и всем впустую фыркающим следует сесть и запостить свой развернутый список советов и опыта, вместо того, чтобы засорять ценные комменты

UFO just landed and posted this here

f33l Sep 2 2008 at 07:40

вот вы, написав этот и кучу дальнейших мусорных комментариев, как раз и поступили как хвастливый школьник-тролль, орущий в пустоту по стодесятому разу: «бред!1». раз не нравятся советы автора, возьмите и напишите нормальные. и нормальным языком, если вы в школе учили русский язык, ага.

-1

UFO just landed and posted this here

maxic Sep 1 2008 at 19:09

Я бы добавил под #12:
Сначала разрабатываем архитектуру проекта (контроллеры, вьюеры, бд, связи и т.п. ) — потом подбираем инструментарий (язык, fw и т.п.)
Чтобы потом не было ремонта двигателя через выxлопную систему.

UFO just landed and posted this here

mishamx Sep 9 2008 at 13:02

Походу мне намеренно заминусовали карму, теперь не могу постить, позже гдде-нибудь еще выложу как и обещал продолжение…