ionicman30 июл 2010 в 06:27

Очень интересный вариант защиты от SQL-инъекций и XSS

1 мин

6.3K

Информационная безопасность *

178

Комментарии 178

zaartix 30 июл 2010 в 06:30

при большом количестве простых запросов нагрузка на процессор возростет достаточно сильно

ionicman 30 июл 2010 в 06:32

Вот узнать бы насколько.
В принципе с моей точки зрения алгоритм на небольших по размеру данных не должен сильно нагружать проц. кроме того это ведь используется только при сабмите данных, а не в работе.

zaartix 30 июл 2010 в 06:40

ну смысл в том, что даже простейшие запросы из маленьких таблиц все-равно будут дополнительно нагружать процессор

но вцелом конечно-же это клевый способ

Traveler 30 июл 2010 в 08:10

При таком методе защиты отпадает необходимость дополнительной фильтрации входных данных, что в свою очередь снижает нагрузку.)))
Но конечно провести сравнительное тестирование обоих методов было бы интересно.

Traveler 30 июл 2010 в 08:17

Вообще-то данные нужно фильтровать не только для INSERT, UPDATE но и для SELECT, DELETE. Так что использовать этот метод нужно при любых обращениях к БД с использованием входящих данных.

Или я не правильно Вас понял?

ionicman 30 июл 2010 в 08:23

Использоватьнадо везде где есть входящие внешние данные, используемые внутри запроса, если их нет то тогда никчему

AmirL 30 июл 2010 в 10:11

А с сортировкой как быть?

НЛО прилетело и опубликовало эту надпись здесь

cblp 30 июл 2010 в 08:33

Думаете, base64 сильно медленнее экранирования?

mirrik 30 июл 2010 в 10:49

Кодирование — элементарное, по сути сдвиг битов в байтах, с чего это нагрузка на процессор должна сильно возрасти?

Еще во времена DOS на дохлом-дохлом 386/40MHz UUE кодирование для фидо не представляло НИКАКОЙ сложности, выполнялось почти мгновенно для файлов размером в сотни KB.

ZmiyGorinich 30 июл 2010 в 06:30

С id все хорошо, а вот с текстовыми данными в базе не очень. Поиск по текстовым данным сделать не получится

ionicman 30 июл 2010 в 06:32

Почему? в базе данных все хранится в нормальном виде же.

ZmiyGorinich 30 июл 2010 в 06:35

Точно. Протупил

maxout 30 июл 2010 в 06:34

В базе всё хранится в plain-виде, работа поиска никак не изменится.
Если берём строку для поиска от пользователя — кодируем её в base64, сервер БД раскодирует.

coolspot 30 июл 2010 в 06:33

Всё равно придётся менять код приложения, а тогда уж легче Mysqli::real_escape_string, который не будет кушать процессора сервера БД.

dmitriid 30 июл 2010 в 08:35

Будет, но не, скорее всего, так сильно, как раскодировка base64

Lopar 30 июл 2010 в 06:34

Согласен со Змием. У меня в некоторых базах лежат достаточно солидные хэши. Конвертить туда-сюда — эхто грустно.

ionicman 30 июл 2010 в 06:36

Это рпоисходит лишь только на уровне запроса. Единственное когда могут возрасти сильно нагрузки — это при кодировании больших объемов данных, но такое в томже вебе не сильно частое явление — обычно 255-1024 символа, по опыту личному

maximw 30 июл 2010 в 06:40

А по-моему метод интересный, и вполне может найти применение там где не требуется большая нагрузка, для чего-то не серьезного, чтоб сделать по-быстрому и безопасно. Для серьезных проектов придется делать по-старинке (читай по-нормальному).

Vegasq 30 июл 2010 в 06:42

Занимательное решение. При нынешних мощностях можно использовать не заморачиваясь.

rednaxi 30 июл 2010 в 09:08

Нынешние нагрузки вы не учитываете, только мощности?

Vegasq 30 июл 2010 в 09:10

Последние имеют специфику расти стабильно и расширяются без особых заморочек.

Nakilon 30 июл 2010 в 10:31

«Сейчас компьютеры такие быстрые, что это просто не важно» слышал я когда-то от горе-преподавателей и тех студентов, которые на это велись… К сожалению, такая логика будет существовать вечно, наряду с плохими дорогами.

kolesnevg 30 июл 2010 в 06:59

«защито» поправьте заголовок

ionicman 30 июл 2010 в 07:01

fixed, спс

НЛО прилетело и опубликовало эту надпись здесь

ionicman 30 июл 2010 в 07:24

спс )

skazkin 30 июл 2010 в 07:04

Самый интересный и простой вариант защиты от SQL-иньекций — читать мантру «Ёлопукки Ёлопукки, переставь мне с жопы руки». Если не помогает — тогда «парашютный спорт не для вас».

Если уж очень хочется, несмотря на то, что мантра не помогает — сжечь напалмом все способы, создающие нагрузки и авторов этих способов, затем перейти на плейсхолдеры.

ionicman 30 июл 2010 в 07:17

Существует масса программистов занятых «кодингом», и зачастую они просто забывают это делать, а за всеми не уследишь, этот же способ лишает их возможности сделать такую ошибку.

Кроме того такая ошибка может вкрасться элментарно по не внимательности, пусть даже одна в большом и качественном коде ( причем даже у такого Ёлопукки как Вы :) ) — этого уже хватит.

Надо чтобы код максимально избавлялся от человескеого фактора и ошибок с ним связанных. И это правильно.

Placeholders — выход, но при сложных запросах где надо писать упоминание на множество таблиц плейс превращает более-менне понятный запрос в кашу, причем ДАЖЕ ( и ОБЫЧНО ) если вы юзаете алиасы чтобы не писать кучу переменных в плейсах.

skazkin 30 июл 2010 в 07:26

«Существует масса программистов занятых «кодингом», и зачастую они просто забывают это делать, а за всеми не уследишь, этот же способ лишает их возможности сделать такую ошибку.»

Вот именно поэтому base64 и беспомощен — забудет ли кодер поставить плейс, или же забудет поставить base64 — никакой разницы, кроме нагрузки и беспомощности base нет

ionicman 30 июл 2010 в 07:43

если использовать враппер, как предлагает оригинальный автор — без бейза небудет работать

LoneCat 30 июл 2010 в 08:12

Если использовать обертку — то и экранирование спец.символов сделать не проблема.

EugeneBond 30 июл 2010 в 07:32

Почему это именно placeholders превращают сложный запрос в кашу?
В кашу запрос превращает именно человеческий фактор.
А плейсхолдеры помогут:
а) непозволить этому «человеческому фактору» забыть передать параметр (или передать его криво)
б) «скомпиллировать» запрос (применимо к полноценным БД/языкам программирования) и сэкономить на повторяющихся вызовах с изменением параметров

skazkin 30 июл 2010 в 07:34

Пункт Б кстати укладывает аргументацию base64 в абсолютный нокаут :)

kvieserc 30 июл 2010 в 15:29

Поддерживаю. Для СУБД, если не использовать плейсхолдеры, каждый запрос будет уникальным. Добавление плейсхолдеров парой может дать очень существенный прирост производительности.

ionicman 30 июл 2010 в 07:45

потому что в лейсах обычно запрос строится по принципу:

«select # from #2 where # and # and # order by #», #, #, #…

А теперь представим что он у нас сложно подчиненный, количество and во where меняется, как и кол-во order полей.

не сильно удобно

skazkin 30 июл 2010 в 07:54

А тут уже поможет простое понимание чистого кода при форматировании запроса

SELECT
    a.field,
    b.field,
    c.field
FROM table_a a
    INNER JOIN table_b b
        ON b.b_id = a.f_b_id
    LEFT JOIN table_c c
        ON c.c_id = b.f_c_id
WHERE
    (
        a.cond = ?          /* 1 */
        OR (
            b.cond = ?      /* 2 */
            AND c.cond = ?  /* 3 */
        )
    )
    AND c.list IN (?)       /* 4 */

Perl:

$dbh->do(
    $query,
    undef,
    $var1,      /* 1 */
    $var2,      /* 2 */
    $var3,      /* 3 */
    $listref4   /* 4 */
);

ionicman 30 июл 2010 в 07:58

эм… ну по мне так не сильно читаемый код получается, уж извините. Понятный и поддающийся разбору — да, но читаемость невысокая.

skazkin 30 июл 2010 в 08:01

зато комментарии помогают помимо всего прочего отслеживать запросы к базе!
Ну и тем более — чем же не читаемый? Вместо /*1*/ ничто не мешает поставить имя переменной

Тут парсер немного пробелы побил — но попробуйте написать в любимом редакторе и не успеете оглянуться как привыкнете)

DIDJER 30 июл 2010 в 08:59

Хороший код — это код который можно читать без комментариев. Если не согласны, тогда почему бы не писать переменные:

$k, $er, $kd, $n? а код пусть будет линейным, нах нам все эти удобства когда есть комментарии?

skazkin 30 июл 2010 в 09:23

Есть естественно исключения, — чтобы прочитать сложный SQL-запрос без комментариев, надо знать хотя бы структуру БД. Соответственно, вывод только один — что если проект имеет сложные SQL — комментарии там будут хорошим тоном минимум. И не только референсы на параметры, но и краткое описание того, что он выбирает, — даже если поля очевидные.

DIDJER 30 июл 2010 в 10:26

Очень сложные SQL запросы, причина по которой нужно пересмотреть текущую архитектуру.

Restorer 30 июл 2010 в 08:07

не знаю как в perl, но в .net и даже в php есть именованные плейсхолдеры.

kastigar 30 июл 2010 в 08:13

А теперь напишите этот же запрос вместе с base64. Неужели лучше?

EugeneBond 30 июл 2010 в 07:58

ИМХО для сложных полиморфных запросов используются своеобразные «билдеры» и задача билдера следить за тем, чтобы все было на месте.

Что-то типа:
sql = select('*')->from('table1')->join('table2')->on(...)->where('table1.fied', requestvar.table1.field)->and('table2.field', requestvar.table2.field)->…

Как такой билдер соберет запрос (с плейсхолдерами и последующей передачей значений или сразу все сам правильно заескейпит) — вопрос уже риторический.

В случае же набора статических запросов, плейсхолдеры показывают себя с лучшей стороны.

Colwin 3 авг 2010 в 03:04

А для таких случаев придумана инкапсуляция )
Поясню: если уж собираем SQL какой-то оберткой, ничто не мешает задавать параметры вместе с плейсхолдером. В итоге параметры будут правильно связано, даже если структура запроса зависит от некоторых условий.

kashey 30 июл 2010 в 08:19

MQ(«select ?»,$tableName," from ?",$othertable", where ?",$a," and ?",$b) и так далее.
потом идем по аргеументам и по простейшим правилам собираем нормальный SQL и нормальный массив холдеров.

вариант2

kashey 30 июл 2010 в 08:20

вариант2:
MQPa(«select #1 FROM #2 WHERE val=#3»,array(1=>'table',2=>'othertable',3=>'helloword');

FreeBSD 30 июл 2010 в 09:11

kastigar 30 июл 2010 в 07:16

А чем это лучше простого квотинга?

ionicman 30 июл 2010 в 07:18

эмм?
Что вы имеете ввиду под «простым квоттингом»?

aviaconstructor 30 июл 2010 в 07:44

Ничем не лучше, если грамотно применять квотинг. Но ошибки бывают — а то бы не было атак. Преимущество base64, что если оно такое пришло от клиента, а разбазить где-нибудь забыли — то сразу выплывет при самой элементарной отладке. А текст будет работать и с дырой.

kastigar 30 июл 2010 в 08:17

Так, вы навели меня на один вопрос. Как base64 encoded строка будет подставлятся в запрос?

zerkms 30 июл 2010 в 10:04

отлично! после этого коммента можно закрывать обсуждение. данные в base64_decode точно так же перед использованием нужно проэкранировать.

TiGR 30 июл 2010 в 15:13

Типа «select...where id=base64_decode('». base64_encode($_GET['id']). "')";

Прелесть, в общем.

SabMakc 30 июл 2010 в 07:39

А использовать prepared statements (подготовленные запросы)?
При условии, что вся работа с базой ведется из одного места (скажем, фреймворка), то довольно легко реализуемый метод.
Конечно, не все БД их поддерживают, но для MySQL вполне себе выход.

alexey_uzhva 30 июл 2010 в 08:38

Вот именно. Что только не придумают, лишь бы не использовать Prepared Statement!

xtender 30 июл 2010 в 07:42

Не ново, не серьезно, и в конце концов, если уж так делать то проще просто в HEX'е передавать — быстрее будет преобразовываться.

skazkin 30 июл 2010 в 07:49

А вот и не быстрее, как практика показала. На мелких — может быть и будет сомнительный выйгрыш, а на хайлоаде будет мясное мясо.

xtender 30 июл 2010 в 07:50

Пруф, пожалуйста. Очень сомневаюсь, что изменение типа(обычный каст) будет дольше чем кодирование. Хотя хз, что у вас за субда.

skazkin 30 июл 2010 в 07:56

Из личной практики на форковой нагруженной модели с xtraDB, пример не могу показать — СБ не дремлет, — но тюнили очень долго и от хекса отказались в итоге.

xtender 30 июл 2010 в 08:22

Ну, видимо, это проблема исключительно xtraDB.

skazkin 30 июл 2010 в 09:24

Врядли, — xtraDB — это мегаутюненный InnoDB

Хотя, может конечно и от задачи зависеть конкретной. Возможно, что на MyISAM и только на селектах работало бы чётче.

xtender 30 июл 2010 в 09:50

Как хранится тут не причем, это же функции. И вообще что-то я не нашел встроенной функции в MySQL для base64.
Проверил выполнение кодировки в hex и обратно:
«select test_hex(100000) from dual» выполнился за 2.3 секунды на слабеньком железе, где

CREATE FUNCTION `TEST_HEX`(i INTEGER(11))
    RETURNS int(11)
BEGIN
  DECLARE v TEXT;
  WHILE i > 0 DO
    SELECT UNHEX(HEX('a123')) into v from dual;
    SET i = i - 1;
  END WHILE;
  RETURN v;
END;

skazkin 30 июл 2010 в 09:53

Плохой пример
на мелкой табле конечно будет хорошо работать

А если БД на 500 гигов и таблицы по 10-200 гигов?:)

xtender 30 июл 2010 в 09:56

Как я уже говорил — размер базы и таблицы значения не имеет. Имеет значение лишь кол-во вызовов. И уж собственная хранимка для декодирования base64 однозначно будет выполняться медленнее встроенной функции преобразования.

skazkin 30 июл 2010 в 09:58

Как же не имеет когда имеет? А вставки? Да даже выборки по индексам — а если без индекса?
Я говорю сейчас только про MySQL, — но не думаю, что это игнорируется в том же постгре.

xtender 30 июл 2010 в 10:02

Да причем тут выборки/вставки? Сравниваем функции, причем встроенные функции и пользовательские, причем алгоритм base64 никак не быстрее простого изменения типа.
Чтобы отпали последние вопросы по поводу размеров: как и когда выполняются функции?

xtender 30 июл 2010 в 10:05

Функциям вообще насрать на индексы — вы вообще путаете совершенно разные вещи.

PS. и какой знаток баз данных еще и минусует?

xtender 30 июл 2010 в 07:46

А если хочется ну совсем уж извратиться «гениальностью», то можно вообще в базе все только в blob'aх хранить — совсем ничего не надо будет ничего «защищать».

ionicman 30 июл 2010 в 07:54

скорость? поиск? склеивание?

xtender 30 июл 2010 в 07:56

«гениальные»…

Min0r 30 июл 2010 в 07:47

С бэйсом, бред полный. И объясните теперь мне как он спасет от XSS? Пользователь будет читать текст в бэйсе? И чем он лучше обратных слэшей? А SQL-запросы мониторить как?

На счет Дена Каминский и его кореша Кевина Митника ничего хорошего сказать не могу. Эти герои при всем своем знании ИТ безопасности недавно сели в глубокую и грязную лужу.

Лог прилагается:
lists.grok.org.uk/pipermail/full-disclosure/2009-July/069965.html

ionicman 30 июл 2010 в 07:57

От XSS он спасет когда данные на клинета бегут в бейзе и там раскручиваются. таким образом
var a=«abc»;alert(5);b=«7»
превратится в a=«base64string»;
и не выполнится.
както так

skazkin 30 июл 2010 в 08:03

Ага, это в JS

Учитывая, что base так же как-то должен разбираться, логично что в коде страницы есть и соответствующие функции.

А потом xss формируется с base64_decode в адресной строке или в запросе или ещё где.

ionicman 30 июл 2010 в 08:04

Ну понятно что «универсального соладата» нельзя сделать :)

skazkin 30 июл 2010 в 08:06

Для JS — универсальный солдат это приведение типа и регулярки на проверки варчаров.
Для SQL — плейсхолдеры или тоже приведение типов или собственные проверки на корректность

ionicman 30 июл 2010 в 08:12

В таком случае считайте это «просто одним из вариантов» реализации плейсхолдеров :)

НЛО прилетело и опубликовало эту надпись здесь

lexun 30 июл 2010 в 08:13

в базе как раз данные храняться в нормальном виде, одного уже не внимательно читающего тут заминусовали)

НЛО прилетело и опубликовало эту надпись здесь

lexun 30 июл 2010 в 08:24

В общем я почти согласен, но способ имеет право на жизнь в каких-то конктерных случаях, сам я использую фреймворк, но не всегда его можно использовать, зачастую приходится возиться и со старым корявым кодом заказчика да много ситуаций. Что касается написания кучи лишнего кода, то тут тоже не согласен живем же в век ООП можно все упростить) Но опять же все применимо только к каким-то конкретным ситуациям…

НЛО прилетело и опубликовало эту надпись здесь

OlegMax 30 июл 2010 в 07:52

> Нет необходимости как-то экранировать или изменять входные данные. Достаточно закодировать их в base64 и передать в запросе.

Я завис.

ionicman 30 июл 2010 в 08:02

Поздравляю :-D

TiGR 30 июл 2010 в 15:19

Ну типа плейсхолдеры или экранирование хотя бы через addslashes — это муторно и не клёво, а писать id=base64_decode('" . base64_encode($input) . "'); — клёво и супер.

kai 30 июл 2010 в 08:01

Этот баян долетел и до хабра. В двух словах — они изобрели плейсхолдеры (с)

ionicman 30 июл 2010 в 08:10

Не совсем, плейсхолдер сам следит за недопустимыми значениями, так? экранирует их если есть необходимость, если нет — оставляет «as is», он же занимется сборкой — т.е. расставлением кавычек и т.д.
Например, если пх знает что в mysql в стринге не должно быть кавычек он их заэкранит, гипотетически возможно появление следуюещго — находят что какаято последовательность символов позволяет реализовать какую любо угрозу — если пх выпущен ДО этого — оно про это не знает и ничего не делает соовтетвенно.

Здесь же данные идут «в контейнере» — от такой ситуции ты застрахован.

meettya 30 июл 2010 в 08:22

хм… а я вот искренне считал, что плейсы работают как-то так.

SET @a = 'как-я то строка';
SELECT * FROM foo WHERE bar LIKE @a;

при этом оно НЕ и в страшном сне не должно заниматся экранированием и прочей хренью.
Или где-то в спеках есть обратная инфа?..

ionicman 30 июл 2010 в 08:25

а «как-я то строка» в виде чего у вас представляется? в виде пришедшего параметра? :)

xtender 30 июл 2010 в 08:34

Биндинги.

meettya 30 июл 2010 в 08:51

Пример не совсем удачен, вот тут www.w3.org/TR/webdatabase/ написано лучше.
4.2 Parsing and processing SQL statements

NOTE: Binding the ? placeholders is done at the literal level, not as string concatenations, so this provides a way to dynamically insert parameters into a statement without risk of a SQL injection attack.

lenar 30 июл 2010 в 08:01

Не понимаю, в чем преимущество? Что не забывать экранировать, что не забывать кодировать-декодировать. Первое даже проще.

nekoval 30 июл 2010 в 08:04

Феерический ужас. А что, везде декодировать base64 это действительно проще, чем починить код, подверженный SQL injection?

ionicman 30 июл 2010 в 08:10

Почему ВЕЗДЕ?

nekoval 30 июл 2010 в 08:24

потому что так написано:
> в подстановке в SQL-запросах всех данных в base64-представлении

Т.е. гениальность этого метода состоит в том, чтобы поменять все SQL запросы?

ionicman 30 июл 2010 в 08:27

ну простите, все разжовывать у меня времени нет. имеется ввиду «внешние данные», или если будет удобно «данные в которых может быть возможность угрозы», по моему это вполне понятно из статьи? нет?

nekoval 3 авг 2010 в 13:43

То есть старую схему «просмотреть все данные в которых может быть возможность угрозы» и заэкспейпить или переделать на PreparedStatement заменяем на совершенно новую «просмотреть все данные в которых может быть возможность угрозы и закодировать все входные параметры как base64»? Это, безусловно, прорыв.

Lisio 30 июл 2010 в 08:11

Снижение скорости работы, необходимость переписывать все поисковые алгоритмы, капитальное снижение скорости поиска, увеличение базы как минимум на 1/4. В топку такой метод.

ionicman 30 июл 2010 в 08:13

У меня складывается впечталение, что ВЫ, дорогие господа, дочитали только фразу про base64, ничего дальше не прочли, не поняли, но зато написали коммент :/

meettya 30 июл 2010 в 08:17

Ага, не вкурили господа, верняк.
Но все равно, типичный образчик хреносозидательства в чистом виде.
Я уж молчу (потому как не помню) про кеширование запросов (как оно там без плейса отработает — одному Аллаху ведомо).

Lisio 30 июл 2010 в 08:18

Избавляться от инъекций надо фильтрацией переменных, а не кодирование/хэширование/медитированием. Кодирование в base64 для того, чтобы база тут же раскодировала — откровенная глупость. Во-первых, это долго. Во-вторых, это не так функция, для которой создавался SQL.

ionicman 30 июл 2010 в 08:28

Это лишь один из вариантов, никто не писал «делайте именно так».
А когда есть варианты — это гораздо лучше, когда их нет, не так ли? :)

Lisio 30 июл 2010 в 08:35

Разве что этот вариант заведомо бредовый, т.к. снижает производительность, читабельность, создает проблемы с кешированием.

ionicman 30 июл 2010 в 08:39

Любая проверка входящих данных все это делает, с кэшированием не согласен — пофиг абсолютно что в качестве ключа для md5 (например) использовать.

Объем данных растет на 30% это да большой минус, согласен

Lisio 30 июл 2010 в 08:46

Проверка входящих данных:
1. работает, как правило, быстрее
2. дает возможность обрабатывать ошибки входных данных и информировать о них пользователя
3. читабельнее

Aux 30 июл 2010 в 08:11

Вы что, до сих пор все запросы руками вбиваете? У меня нет слов… base64… ААААААААаааааа!!!!11!!11

dmitriid 30 июл 2010 в 08:36

А при чем тут вбивание руками? Указанный способ — пример упрощения валидации входящих данных.

Aux 30 июл 2010 в 08:39

Это не упрощение валидации входных данных, тут валидации нет вообще в принципе. Валидацию делает ORM. Если ORM вам не подходит, то пользуйтесь плейсхолдерами — технологии обкатаны индустрией в течении десятков лет. Зачем такой идиотский велосипед с квадратными колёсами?

dmitriid 30 июл 2010 в 08:43

К сожалению, не все знают, что такое ORM, и не все пользуются placeholder'ами. PHP же :)

Aux 30 июл 2010 в 09:08

Значит надо на хабр написать статью про ORM, плейсхолдеры, препареды и обьяснить, почему использовать нужно именно их. А за этот base64 Дэну надо дать по голове.

dzlk 30 июл 2010 в 09:37

Ждем новых статей

dmitriid 30 июл 2010 в 10:26

Вот ха это я только всеми руками за.

Aux 30 июл 2010 в 21:08

Кармы нет, а так у меня в запасе есть парочка статей на тему HTML5 + CSS3 и на тему хардкорной оптимизации JS в случаях, когда это действительно нужно.

artch 30 июл 2010 в 08:45

А вы что, не оптимизируете вручную запросы в узких местах на хай-лоаде?

Aux 30 июл 2010 в 08:48

И как оптимизация влияет на использование prepared и placeholders? Там где нужен ORM во всей красе — там ORM, там где не нужен — placeholders или prepared, смотря что вам привычней. Вариантов много для любых нужд. base64 и hiload — это вы знатно пошутили.

artch 30 июл 2010 в 08:50

Это ответ на ваш бредовый комментарий про то, что якобы вбивать все запросы руками — это не по-джедайски.

Aux 30 июл 2010 в 08:55

Да, не по-джедайски. Ибо вы сначала находите узкое место в проекте и только тогда его оптимизируете. А не сразу начинаете всё долбить руками. И не всегда оптимизация — это вбить запрос руками. Иногда достаточно хорошо знать используемое вами решение для его оптимизации. Например, я использую ActiveRecord из Ruby On Rails, зачастую достаточно правильно настроить модели, чтобы они делали постройку запросов по другим правилам.

artch 30 июл 2010 в 09:05

А что, кто-то вообще использует активрекорд в хайлоаде? Я имею в виду реальный хайлоад, а не «сайт под ключ за месяц».

Aux 30 июл 2010 в 09:14

Используют, почему нет? А что ещё использовать? Ассемблер? :) Кому что удобнее, то и используют. Ну или взять Hibernate — там тоже есть что покрутить без лазанья в дебри SQL. Да, иногда приходится писать и руками. Но в любом случае только тогда, когда уже всё готово и работает.

artch 30 июл 2010 в 09:19

Часто писать руками не «удобнее», а это единственный приемлемый вариант.

SQL сам по себе достаточно высокоуровневый, чтобы его использование не создавало больших трудностей. А вот активрекорд при больших нагрузках создает гораздо больше проблем, чем решает.

Почему С++ уже на протяжении 20 лет остается основным языком во множестве отраслей, хотя есть миллион гораздо более гибких, удобных и мощных языков? Здесь та же ситуация.

НЛО прилетело и опубликовало эту надпись здесь

artch 30 июл 2010 в 09:31

Потому, что на нём написаны тонны кода, который и были бы рады выкинуть, да слишком дорого переписать.

Вовсе не поэтому. Попробуйте написать нормальный графический движок на чем угодно кроме С++ и поймете.

А актив рекорд(в нормальной реализации), в 95% решает поставленную задачу не хуже ручного написания запросов. При этом экономит время и безопаснее.

Смотря какая задача ставится. Если написать сайт заказчику за месяц — да. Если выдерживать несколько сотен запросов динамики в секунду при расчете на одну машину — вряд ли.

НЛО прилетело и опубликовало эту надпись здесь

artch 30 июл 2010 в 10:41

Графические движки на яве и питоне? Вы явно не владеете вопросом.

Возьмите к примеру андроид. Там изначально сделали только поддержку явы. После того как разработчики игр толпами стали испытывать жесточайший баттхерт при попытке начать что-то писать под эту платформу, там срочно допилили NDK с поддержкой С++, и только после этого стали появляться нормальные игры. Вы правильно сказали, других языков с такой широкой поддержкой платформами нет. Только вот теперь подумайте почему.

На С++ пишут из-за возможности непосредственной оптимизации, управления памятью и контролем над ресурсами, а не «ради портирования на консоли». В яве одна только невозможность прямого освобождения памяти и постоянных затыков с GC осложняет в десятки раз написание определенных вещей типа игр на ней. Я уж не говорю про постоянные оверхеды на вызов методов, ресолвинга объектов и т.д.

Ну расскажите же мне, каким образом вы обгоните ОРМ когда он генерирует код полностью аналогичный тому что вы бы написали руками? Или написаный руками код магическим образом ускоряет выборки по первичному ключу, например?

Разумеется, речь идет не про эффективность выполнения запроса, а про затраты на его генерацию и обслуживание объектной модели. Я думал, это самоочевидно.

НЛО прилетело и опубликовало эту надпись здесь

artch 30 июл 2010 в 11:06

Что значит «действительно считаю»? Мы что, о живописи тут говорим? Я это знаю, а не считаю, как бы не первый день в индустрии и исследовал множество тест-кейсов. Объектная модель жрет память в совершенно неприемлемом для нагруженных проектов количестве.

До тех пор пока решаемая вами задачи GPU-bound совершенно всё равно на чём написано приложение.

Ерунду написали. Видеочип решает лишь низкоуровневые задачи. Написание даже простейшего движка не сводится лишь к задаче рендеринга. Нужно хранить огромное количество структурированной информации и очень, очень быстро манипулировать ею. А в яве даже нельзя безболезненно сделать простейшую операцию вроде «создать N партиклов и через 500мс их прибить», обязательно проснется GC и будет убивать эти N объектов, тормозя весь тред и создавая лаги.

В общем, не вижу смысла продолжать далее этот спор, у вас явно не хватает широкой компетенции.

НЛО прилетело и опубликовало эту надпись здесь

Aux 30 июл 2010 в 21:19

Практически все современные игры содержат в себе только капельки C++, который служит не более, чем прямым доступом к ресурсам ОС. Сюрприз! Уже Quake первый был целиком скриптованный. Да и Duke Nukem был, правда не до такой степени. Глядите исходники кваки — они легко доступны. А ScummVM? Там, правда, не 3D, но сишки там тоже почти нет.

А MMO игр с явой внутри вообще навалом. Да, опять же всё обёрнуто в небольшой C++, но вся суть игры — ява.

artch 31 июл 2010 в 07:45

Не смешите меня. Ни один полноценный графический движок никогда не писался ни на чем, кроме С и С++

ru.wikipedia.org/wiki/Quake_engine
ru.wikipedia.org/wiki/Id_Tech_2
ru.wikipedia.org/wiki/Id_Tech_3
ru.wikipedia.org/wiki/Id_Tech_4

Aux 2 авг 2010 в 12:11

Да-да, именно так. C выступает низкоуровневой прослойкой. Вся логика первой кваки заскриптована на QuakeC en.wikipedia.org/wiki/QuakeC, да будет вам известно. Скриптовано абсолютно всё — физика, AI, поведение оружия и вся игровая логика. Если лень качать исходники, то читайте английскую Wiki — там больше информации.

artch 2 авг 2010 в 12:21

Причем тут логика игры? Мы говорим о графическом движке (о том, что вы почему-то называете «прослойкой»). Именно он является основной частью проекта при разработке игры. На логику тратится от силы 5% общих человекочасов.

Первостепенное достижение всех игр от id Software вообще и Джона Кармака в частности заключается именно в разработке движков. Скриптовый язык для логики может написать любой студент. Приводя аналогию в вебе, это все равно что сравнивать разработку API для сервиса и разработку самого сервиса.

Вы вообще хоть как-нибудь с геймдевом связаны? Есть ощущение, что я говорю о живописи с незрячим. Судя по всему, вы с вопросом знакомы лишь поверхностно, на уровне кастомизации игр и написании модов.

zvirusz 30 июл 2010 в 08:15

Хехе, community.livejournal.com/ru_mysql/165835.html:

Каков шанс sql-injection, если в запросе все текстовые поля передаются в 16-ричном виде?
например:
INSERT INTO news VALUES (NULL, '2007-05-03', 1, 0x74657374, 'ru')

как я был к этому близок 3 года назад :)

kastigar 30 июл 2010 в 08:29

«SELECT * from mytable where textfield=base64_decode('Q29vbEhhY2tlcnM=')»
Вы привели хороший пример, я даже скажу так — идеальный.
А покажите теперь как этот запрос будет строится для пришедших данных. Не важно на каком языке.

dmitriid 30 июл 2010 в 08:37

как простейший вариант:

$a = base64_encode($_GET['data'])
$sql = 'SELECT… '.$a.' ......';

cblp 30 июл 2010 в 08:44

нет, $sql = 'SELECT… base64_decode("$a") ...'
заметьте, что base64_decode() вписан внутри запроса и выполняется на стороне сервера

хотя автор предлагает более простой способ, что-то вроде
$sql = base64_wrap_sql('SELECT… ^^$_GET[data] ...')

dmitriid 30 июл 2010 в 08:46

Ээээ. Я просто не написал все. Я имел в виду

$a = base64_encode($_GET['data'])
$sql = 'SELECT… base64_decode('.$a.') ......';

Это как раз то, что предлагает автор :)

EugeneBond 30 июл 2010 в 08:43

1) пишется обычный запрос с плейсхолдерами
«SELECT * from mytable where textfield=?»
2) переписывается код проставления плейсхолдеров. тот код, где переменная эскейпилась (и при необходимости оборачивалась в кавычки), заменяется на код, который енкодит значение и возвращает такую конструкцию base64_decode(ЗАЕНКОДЕНОЕ_ЗНАЧЕНИЕ_В_КАВЫЧКАХ)

другого вменяемого варианта не представляю… смысла тоже

lair 30 июл 2010 в 08:29

Вот ведь люди. А то, что параметризованные запросы лучше кэшируются, заведомо защищены от инъекций и так далее — это им пофиг?

dmitriid 30 июл 2010 в 08:38

это надо же объяснить толпам горе-РНР-программистов, которые даже не знают, что такое параметризованные запросы (а РНР всеми силами старался и старается, чтобы они и не узнали)

lair 30 июл 2010 в 08:40

Ну понятно. Как всегда, кто-то борется со своей ущербностью.

ionicman 30 июл 2010 в 08:43

не надо устраивать тут холивары. тут все зависит от человека а не от языка

dmitriid 30 июл 2010 в 08:49

От языка тоже.

1. В РНР placeholder'ы и параметризованые запросы появились достаточно поздно
2. функции mysql_escape_string и mysql_real_escape_string своими названиями символизируют
3. В РНР на данный момент есть три, а на подходе — четвертый, способ подсоединения к MySQL. Из этих способов в одном работают параметризованые запросы, в другом нет. В одном работают именованные placeholder'ы, в другом — нет и т.п.

Бардак в средстве программирования разводит бардак и у программистов.

ionicman 30 июл 2010 в 08:58

Дисциплинирование и внутренний порядок а так-же понимание в какой ситуации надо употребить какой программный инструмент дают возможность делать отличные программы в независимости от среды.

А бардак обычно начинается изза человека а не изза языка.

dmitriid 30 июл 2010 в 10:29

> А бардак обычно начинается изза человека а не изза языка.

Если язык и среда не предлагают иных средств, кроме бардака, то увы.

Например из-за пункта 3 приходится или:
— использовать повсеместно генерацию запросов с банальной конкатенацией строк и mysql_real_escape_string
— или продавливать апгрейд РНР/компиляцию соответствующих расширений у клиента, а то и насиловать девелоперов переходом на другие ОСи (потому что mysqli, емнип, не работает под МакОСью).

Это ли не бардак?

При том реальных усилий по уменьшению бардака никто, на самом деле, не предпринимает. Потому что legacy, потому что у самих разработчиков РНР достаточно сильный бардак в головах и т.п.

kastigar 30 июл 2010 в 09:04

Ну не знаю, я PHP-программист, а все равно узнал про параметризованные запросы и успешно ими пользовался. Не увидел никаких сопротивлений со стороны PHP.
Если вы именно про «горе-РНР-программистов», то скажу что это скорее всего относится к горе-*-программистам…

dmitriid 30 июл 2010 в 10:31

Я не говорил, что РНР сопротивляется. Он способствует разведению бардака.

Вопрос на засыпку: зачем в РНР три способа подключения к MySQL с разными возможностями (пункт 3 из моего сообщения)? И что делать, если один из этих способов не работает на target системе?

bogus92 30 июл 2010 в 08:36

Пару лет назаз, когда я только начинал изучать PHP я предложил такой же метод защиты на форуме CMS 2z-project. Тогда с меня только посмеялись и сказали, что так нагрузка значительно возрастет. Наверное, не таким уже и дураком я тогда был :)

cblp 30 июл 2010 в 08:46

И здесь половина комментаторов смеётся над автором.

kastigar 30 июл 2010 в 09:08

> Наверное, не таким уже и дураком я тогда был :)

Вы хотите чтоб над вами опять посмеялись?

bogus92 31 июл 2010 в 05:38

Как я уже сказал, тогда я только начинал учить PHP. Сейчас я бы никогда не использовал такое в проекте, т.к. осознаю все минусы такого подхода, но то, что кто-то другой предложил подобное + еще кто-то поддержал говорит о том, что я по крайней мере не один такой.

kastigar 31 июл 2010 в 06:34

Все равно не понимаю ваших рассуждений. Если сейчас вы понимаете что это неэффективный подход, который, разве что, в рамку повесить на память, то тогда к чему «Наверное, не таким уже и дураком я тогда был». Вам трудно признать, что это была дурная идея? Я на своей практике столько глупостей делал и я этого не стесняюсь. От каких-то глупостей уходил сам, от каких-то глупостей помогали уйти.
А то что кому-то пришла такая же идея и ее кто-то поддержал, не значит что идея стоящая. Люди просто не знают что такое плейсхолдеры или не смогли с ними подружиться.

amgorb 30 июл 2010 в 08:38

костыль!

m17 30 июл 2010 в 08:44

~~Ой, у меня deja vu. По-моему теме уже месяца полтора.~~

Вообще, прежде чем комментировать или критиковать, обязательно посмотрите слайды Interpolique:
www.scribd.com/doc/33001026/Interpolique

Там всё рассматривается гораздо глубже, нежели описано в статье, например вопросы сессий в web, и в общем type safety в программировании.

lair 30 июл 2010 в 08:48

Тем не менее, приводимые самим автором примеры (особенно в части SQL-инжекта) — это зло само по себе, безо всякой безопасности.

lair 30 июл 2010 в 08:55

Посмотрел я слайды. Вот, где он ошибается:

«How do we communicate across all these languages? Strings»

PS Кстати, пусть он попробует так же защититься от инжекта в случае, когда надо собирать SQL-запрос (т.е., с самим языком, а не значениями; или хотя бы имя колонки передать). А что, универсальный же способ, нет?

m17 30 июл 2010 в 09:00

Да этот конкретный метод я вряд ли защищаю, но сам взгляд на вопрос с правильной стороны. Type safety между языками — вот то о чём стоит подумать.

А в чём ошибка утверждения о «Strings»?

lair 30 июл 2010 в 09:05

В том, что коммуникация между языками идет через формализованный интерфейс. Он может быть стринговым, а может быть и не быть таковым. Например, в .net код можно генерить текстовым шаблоном, а можно — объектным деревом.

То же и при взаимодействии с SQL — если какой-то дурак хочет потерять type safety, он конкатенирует стринги и напрямую собирает запрос. Но в реальности это не единственный способ, есть датапровайдеры, интерфейсы доступа и миллион других вещей, которые избавляют нас от прямой сборки строкового кода на другом языке.

m17 30 июл 2010 в 09:15

Тут вы безусловно правы, да.

Автор, мне кажется, имел ввиду в этом утверждении то что за границу языка, так или иначе, выходит String. На следующем слайде он формулирует задачу: «The challenge: Maintaining type safety across language boundaries», а затем, упоминает, к примеру, те же параметризованные запросы.

Просто решение что он предлагает, в определённом смысле, костыль. Действительно, зачем, если есть множество готовых безопасных интерфейсов коммуникации?

lair 30 июл 2010 в 09:19

Это очень спорный вопрос, на самом деле, что выходит за границу языка. Например, в случае с доступом в БД за границу вызывающего языка выходит отдельно команда (стринг), отдельно типизованные объекты значений (не важно, типизованы они средствами COM, или java, или .net).

То есть проблема сохранения типов есть. Но говорить при этом, что все передается стрингом — неверно.

m17 30 июл 2010 в 11:18

Спасибо за объяснение. Да, действительно весьма спорный вопрос. Теперь я смог взглянуть иначе.

lair 30 июл 2010 в 11:22

Камински просто уперся в то, что «программисты не хотят передавать параметры». Ну и дураки, что не хотят, учить надо. Можно, на крайний случай, предоставлять синтаксический сахар в языке, который будет автоматически распарсивать конструкцию на неизменную + параметры.

Но, как мы все понимаем, никакого отношения к защите это уже не имеет.

silentroach 30 июл 2010 в 08:45

Поиск и добавление ладно, а на выводе данных из базы экранировать-то таки как-то придется ;) А раз придется, то экономнее это сделать еще на инсерте.

m17 30 июл 2010 в 08:52

Да в любом случае и до и после надо обрабатывать. «filter input, escape output», ведь так?

НЛО прилетело и опубликовало эту надпись здесь

TravisBickle 30 июл 2010 в 08:58

=)))))))) Ппц жесть. А может лучше base64_encode заменить на escape_string??

TravisBickle 30 июл 2010 в 08:59

Перенесите в «Юмор».

alisey 30 июл 2010 в 09:10

Совершенно не оценил восторгов автора, поэтому пошел читать оригинал. Вроде, вот что они предлагают:

Было: «INSERT posts SET author = {$_POST['author'}»
Стало: eval(b(«INSERT posts SET author = {^^_POST['author']}»));

И это, якобы, лучше плейсхолдеров. Есть мнение, что просто кто-то перестарался с употреблением веществ</em.

BaBL 30 июл 2010 в 09:11

Или я прилетел из будущего, или вышел из комы, но по-моему этот древнейший боян уже давно на хабре был обсосан? Удалили чтоль? Помню обсуждали параллельно с лором www.linux.org.ru/forum/talks/5014295

KoppeKTop 30 июл 2010 в 09:25

Согласен, на ЛОРе это обсосали со всех сторон. Помню даже в Радио-Т обсуждали больше месяца назад (#192).

ibnteo 30 июл 2010 в 09:34

Вместо того чтобы учить программистов писать защищенный код, предлагается решение навроде Magic Quotes в PHP.

alexxz 30 июл 2010 в 11:11

Да, да. Один в один прям.

z123 30 июл 2010 в 09:34

>Очень интересный вариант защиты от SQL-инъекций и XSS

от XSS не поможет

afi 30 июл 2010 в 10:33

костыль какой-то

pento 30 июл 2010 в 11:27

Ну вы наши что вспомнить. Это во-первых, боян. А во вторых, костыль.

Ctacok 16 авг 2010 в 18:07

О каком base64 который встраивается в бд идёт речь, если та часть веб программистов для которых изобретенна данная вещь, неудостаиваються поставить mysql_real_escape_string и поставить ковычки, или intval()…

НЛО прилетело и опубликовало эту надпись здесь

Зарегистрируйтесь на Хабре, чтобы оставить комментарий