Pull to refresh

Экспортные ограничения на криптографию в США

Reading time 1 min
Views 4.7K
Information Security *
Пока sourceforge бьётся в истерике, давайте почитаем законы США на тему экспортных ограничений. Например ECCN 5D002, про который все слышали, но никто не читал.

США разрешает экспорт программного обеспечения без ограничений и ревью, если все следующие пункты выполнены:
  • Код регулируется экспортными ограничениями ECCN 5D002
  • Код публично доступен
  • Послано уведомление в U.S. Government's Bureau of Industry and Security (BIS)

Опенсорсные программы автоматически попадают под второй пункт. Но что такое пункт номер один? Сейчас попробуем разобраться.
Под его действие подпадает:
  • Программное обеспечение предназначенное для разработки, модификации или любого другого использования программного обеспечения из этого списка; или
  • Программное обеспечение с симметричным шифром длиной более 56 бит; или
  • Программное обеспечение с асиметричным шифром, использующее разложение целого числа на простые множители с длиной ключа более 512 бит (например, RSA); или программное обеспечение использующее вычисления дискретных логарифмов над конечным полем или другие операции над дискретными алгоритмами с длиной ключа более 112 бит (например, эллиптические кривые).
  • Программное обеспечение для криптоанализа.

Специально оговорено, что упаковка и кодирование не подпадают под этот акт.
3. «Cryptography» does not include «fixed» data compression or coding techniques.

Хэш-функции не являются криптографическими алгоритмами с симметричными/асимметричными ключами вообще, поэтому даже не рассматриваются.

Из общедоступного ПО, после такой фильтрации остаются американские браузеры, в которых эти ограничения всегда были и специальный софт типа TrueCrypt.
Больше можно почитать на apache.org.
Total votes 55: ↑51 and ↓4 +47
Comments 18

Как на самом деле работает «Покупон»

Reading time 1 min
Views 3.6K
Self Promo
Пару месяцев назад на Хабре пробовал рекламироваться некий украинский стартап «Покупон», посвященный скидкам. После чего была еще одна явно заказная статья, лившая трафик воду на ту же мельницу.

А вот теперь стало ясно, как на самом деле работает эта мышеловка.

Пример первый: 50% скидки на пиццу с доставкой от ресторана Uno Pizza.

image

Нам предлагают купить большую пиццу (стандартный заказ на 2-4 человек) стоимостью около 100 гривен со скидкой 50%. За скидочный талон просят 15 грн. Но! Если для обычного покупателя доставка такой пиццы будет бесплатной… то для купившего купон она будет стоить 30 грн. (что купивший талон клиент будет очень рад услышать от оператора пиццерии). Считаем. 100 грн. вы платите без Покупона. 50 + 15 + 30 = 95 грн. вы платите с Покупоном. Супер, фактически вы поработаете на увеличение BL-уровня кошелька этой компании, ничего не сэкономив.
Читать дальше →
Total votes 206: ↑157 and ↓49 +108
Comments 175

Вечный торт: интервью с Денисом Крючковым, основателем Хабрахабра

Reading time 9 min
Views 82K
Журнал Хакер corporate blog


Есть минимум две причины, по которым гордая редакция твоей любимой «айти-мурзилки» решила пообщаться с создателем Хабрахабра об истории этого уникального проекта. С одной стороны, конечно, это не имеющая прямых аналогов площадка, сформировавшая вокруг себя огромную аудиторию IT-профессионалов. А с другой — один из немногих успешных примеров того самого «издания нового поколения», которого все ждут с тех самых пор, как придумали слово «блог». Почему же гики смогли создать для себя медиа, которое не могут сделать обычные люди?
Читать целиком
Total votes 280: ↑256 and ↓24 +232
Comments 122

Буфер вывода в PHP

Reading time 8 min
Views 49K
VK corporate blog Website development *PHP *
Translation
В этой статье я хочу рассказать о том, как реализован слой «буферизации вывода» в PHP, как работает и как с ним взаимодействовать из PHP. В этом слое нет ничего сложного, но многие разработчики либо совсем не понимают, как с ним обращаться, либо не имеют полной ясности. Всё, о чём я буду писать, относится к PHP версии 5.4 и выше. Именно начиная с неё изменились многие вещи, связанные с буфером вывода (БВ). По сути, этот функционал был полностью переписан, поэтому совместимость с версией 5.3 сохранилась лишь частично.

Что такое буфер вывода?


Поток вывода в PHP содержит байты, обычно в виде текста, которые разработчику надо вывести на экран. Чаще всего для этого используется конструкция echo или printf(). Во-первых, нужно понимать, что любая функция, которая что-то выводит, будет использовать БВ из области PHP. Если говорить о расширениях для PHP, то можно получить доступ к функциям, пишущим в SAPI напрямую, в обход любого вышерасположенного БВ. API C задокументировано в lxr.php.net/xref/PHP_5_5/main/php_output.h, отсюда можно почерпнуть немало информации, например, о размере буфера по умолчанию.

Второй важный момент: слой БВ является не единственным слоем, в котором буферизуются выводимые данные.

И третье: в зависимости от SAPI, который вы используете (веб или cli), слой БВ может вести себя по-разному.

Ниже представлена схема, которая поможет понять всё вышесказанное:

Читать дальше →
Total votes 59: ↑52 and ↓7 +45
Comments 10

Разбор вызовов функций в PHP

Reading time 15 min
Views 39K
VK corporate blog High performance *Website development *PHP *Perfect code *
Translation
Этот пост посвящён оптимизации PHP с помощью профайлера Blackfire в PHP-скрипте. Нижеприведённый текст является подробным техническим объяснением статьи в блоге Blackfire.

Обычно применяется метод strlen:

if (strlen($name) > 49) {
...
}

Однако такой вариант примерно на 20% медленнее этого:

if (isset($name[49])) {
...
}

Выглядит неплохо. Наверняка вы уже собрались открыть ваши исходники и заменить все вызовы strlen() на isset(). Но если внимательно прочитать оригинальную статью, то можно заметить, что причина 20-процентной разницы в производительности — многократные вызовы strlen(), порядка 60-80 тысяч итераций.
Читать дальше →
Total votes 54: ↑52 and ↓2 +50
Comments 70

Подробно об объектах и классах в PHP

Reading time 25 min
Views 91K
VK corporate blog Website development *PHP *
Translation
Сегодня объекты используются очень активно, хотя это трудно было предположить после выхода PHP 5 в 2005 году. Тогда я ещё мало что знал о возможностях этого языка. Пятую версию PHP сравнивали с предыдущей, четвёртой, и главным преимуществом нового релиза стала новая, очень мощная объектная модель. И сегодня, десять лет спустя, около 90% всего PHP-кода содержит объекты, не изменившиеся со времени PHP 5.0. Это убедительно говорит о том, какую роль сыграло внедрение объектной модели, неоднократно улучшавшейся на протяжении последующих лет. В этом посте я хотел бы рассказать о том, как всё устроено «под капотом». Чтобы люди понимали суть процессов — почему сделано так, а не иначе — и лучше, полнее использовали возможности языка. Также я затрону тему использования памяти объектами, в том числе в сравнении с эквивалентными массивами (когда это возможно).

Я буду рассказывать на примере версии PHP 5.4, и описываемые мной вещи справедливы для 5.5 и 5.6, потому что устройство объектной модели там почти не претерпело изменений. Обратите внимание, что в версии 5.3 всё не так хорошо с точки зрения возможностей и общей производительности.

В PHP 7, который пока ещё активно разрабатывается, объектная модель переработана не сильно, были внесены лишь незначительные изменения. Просто потому что всё и так хорошо работает, а лучшее — враг хорошего. Были добавлены возможности, не затрагивающие ядро, но здесь об этом речи не пойдёт.
Читать дальше →
Total votes 58: ↑54 and ↓4 +50
Comments 15

Внутреннее представление значений в PHP7 (часть 1)

Reading time 13 min
Views 27K
VK corporate blog Website development *PHP *
Translation
В связи с большим объёмом материала, публикацию пришлось разбить на две части. В первой из них я расскажу о том, как менялись реализации zval (Zend value) начиная с пятой версии PHP. Также обсудим реализацию ссылок. Во второй части будет подробно рассмотрена реализация отдельных типов данных, таких как строки и объекты.

zval’ы в PHP 5


Структура zval в пятой версии выглядит так:

typedef struct _zval_struct {
    zvalue_value value;
    zend_uint refcount__gc;
    zend_uchar type;
    zend_uchar is_ref__gc;
} zval;

Как видите, конструкция включает в себя value, type и дополнительную информацию __gc, о чём я расскажу ниже. Value представляет собой объединение различных возможных значений, которые может хранить zval:
Читать дальше →
Total votes 37: ↑34 and ↓3 +31
Comments 3

Внутреннее представление значений в PHP 7 (часть 2)

Reading time 11 min
Views 20K
VK corporate blog Website development *PHP *Programming *System Analysis and Design *
Translation
image
Kore Nordmann

В первой части мы рассматривали высокоуровневые различия во внутреннем представлении значений между PHP 5 и PHP 7. Как вы помните, главное отличие заключается в том, что zval больше не выделяются отдельно и не хранят в себе refcount. Простые значения, вроде целочисленных или с плавающей точкой, могут храниться прямо в zval, в то время как сложные значения представляются с помощью указателя на отдельную структуру.
Читать дальше →
Total votes 50: ↑44 and ↓6 +38
Comments 3

«Под капотом» индексов Postgres

Reading time 7 min
Views 49K
VK corporate blog PostgreSQL *System Analysis and Design *SQL *Algorithms *
Translation

Капитан Немо у штурвала «Наутилуса»

Индексы — один из самых мощных инструментов в реляционных базах данных. Мы используем их, когда нужно быстро найти какие-то значения, когда объединяем базы данных, когда нужно ускорить работу SQL-операторов и т.д. Но что представляют собой индексы? И как они помогают ускорять поиск по БД? Для ответа на эти вопросы я изучил исходный код PostgreSQL, отследив, как происходит поиск индекса для простого строкового значения. Я ожидал найти сложные алгоритмы и эффективные структуры данных. И нашёл.

Здесь я расскажу о том, как устроены индексы и как они работают. Однако я не ожидал, что в их основе лежит информатика. В понимании подноготной индексов также помогли комментарии в коде, объясняющие не только как работает Postgres, но и почему он так работает.
Читать дальше →
Total votes 48: ↑44 and ↓4 +40
Comments 21

Использование больших страниц в памяти в PHP 7

Reading time 8 min
Views 17K
VK corporate blog Website development *PHP *Programming *
Translation
Разбивка на страницы — это способ управления памятью, выделяемой для пользовательских процессов. Все доступы процессов к памяти являются виртуальными, а преобразование их адресов в адреса физической памяти выполняют ОС и аппаратный MMU.

При разбивке на страницы память делится на блоки фиксированного размера. В Linux на x86/64-платформах размер страниц обычно составляет 4 Кб. Каждый процесс содержит в себе таблицу, в которой хранится информация о соответствии адресов страницы и физической памяти — элемент таблицы страниц (page table entry). Чтобы ОС не лезла в эту таблицу при каждом обращении к памяти (иначе для обработки каждого запроса на обращение к памяти потребуется обращаться к ней дважды), применяется небольшой кэш — буфер ассоциативной трансляции (Translationlookaside Buffer, TLB). Этот аппаратный компонент находится в MMU и работает чрезвычайно быстро и эффективно. Система сканирует TLB с целью поиска записи о соответствии адресов страницы и физической памяти. Если нужной записи там не оказывается, тогда ядру ОС приходится обращаться к памяти, искать нужное соответствие и обновлять информацию в TLB, чтобы получить из памяти нужные нам данные.

Если вы хотите больше узнать об управлении виртуальной памятью, то можете изучить эту публикацию. А пока давайте разберем, как в PHP 7 устроена работа с большими страницами (Huge Page).
Читать дальше →
Total votes 32: ↑30 and ↓2 +28
Comments 16

Мифы о /dev/urandom

Reading time 14 min
Views 48K
VK corporate blog Information Security *Cryptography *
Translation
image

Наверняка многие из вас неоднократно сталкивались с мифами о /dev/urandom и /dev/random. Может быть, в некоторые из них вы даже верите. В этом посте мы сорвём покровы со всех этих мифов и разберём настоящие сильные и слабые стороны этих генераторов случайных чисел.
Читать дальше →
Total votes 73: ↑61 and ↓12 +49
Comments 8

Объекты в PHP 7

Reading time 9 min
Views 30K
VK corporate blog Website development *PHP *
Translation
image

На сегодняшний день разработчики PHP ведут работу над API уровня С. И в этом посте я буду по большей части рассказывать о внутренней разработке PHP, хотя если по ходу повествования встретится что-то интересное с точки зрения пользовательского уровня, то я буду делать отступление и объяснять.
Читать дальше →
Total votes 39: ↑38 and ↓1 +37
Comments 2

Добавление оператора диапазона в PHP

Reading time 14 min
Views 17K
VK corporate blog Website development *PHP *
Translation
image
На картинке — Ancient Psychic Tandem War Elephant © Adventure Time

В этой статье будет рассмотрен процесс внедрения в PHP нового оператора. Для этого будут выполнены следующие шаги:

  • Обновление лексического анализатора: он будет знать о синтаксисе нового оператора, что позволит потом превратить его в токен.
  • Обновление парсера: система будет знать, где может использоваться этот оператор, а заодно какова его приоритетность и ассоциативность.
  • Обновление этапа компиляции: здесь происходит обработка (traverse) дерева абстрактного синтаксиса (AST) и извлечение из него кодов операции.
  • Обновление виртуальной машины Zend: во время выполнения скрипта она используется для обработки интерпретации нового кода операции для оператора.

В общем, в этой статье будут кратко рассмотрены несколько внутренних моментов PHP. Выражаю горячую благодарность Никите Попову за помощь в доработке этой статьи.
Читать дальше →
Total votes 38: ↑37 and ↓1 +36
Comments 25

Введение в компиляторы, интерпретаторы и JIT’ы

Reading time 13 min
Views 43K
VK corporate blog Website development *Programming *Compilers *
Translation
С рождением PHP 7 не прекращаются споры об абстрактных синтаксических деревьях, just-in-time компиляторах, статическом анализе и т. д. Но что означают все эти термины? Это какие-то волшебные свойства, делающие PHP гораздо производительнее? И если да, то как это всё работает? В этой статье мы рассмотрим основы работы языков программирования и разъясним для себя процесс, который должен выполняться до того, как компьютер запустит, например, ваш PHP-скрипт.
Читать дальше →
Total votes 37: ↑33 and ↓4 +29
Comments 15

Инкремент в PHP

Reading time 9 min
Views 29K
VK corporate blog Website development *PHP *Compilers *
Translation


Возьмите переменную и увеличьте её на 1. Звучит просто, верно? Ну… С точки зрения PHP-разработчика, наверное, да. Но так ли это на самом деле? Здесь могут возникнуть некоторые трудности. Существует несколько способов инкрементировать значения, они могут выглядеть равноценными, но под капотом PHP работают по-разному, что может привести к, так сказать, интересным результатам.
Читать дальше →
Total votes 53: ↑45 and ↓8 +37
Comments 27

Массивы в РНР 7: хэш-таблицы

Reading time 22 min
Views 33K
VK corporate blog Website development *PHP *Compilers *
Translation
Хэш-таблицы используются везде, в каждой серьёзной С-программе. По сути, они позволяют программисту хранить значения в «массиве», индексируя его с помощью строк, в то время как в языке С допускаются только целочисленные ключи массива. В хэш-таблице строчные ключи сначала хэшируются, а затем уменьшаются до размеров таблицы. Здесь могут возникать коллизии, поэтому нужен алгоритм их разрешения. Существует несколько подобных алгоритмов, и в РНР используется стратегия связных списков (linked list).

В Сети есть немало замечательных статей, подробно освещающих устройство хэш-таблиц и их реализации. Начать можно с http://preshing.com/. Но имейте в виду, вариантов структуры хэш-таблиц — несметное множество, и ни один из них не совершенен, в каждом есть компромиссы, несмотря на оптимизацию циклов процессора, использования памяти или хорошее масштабирование потокового окружения (threaded environment). Одни варианты лучше при добавлении данных, другие — при поиске и т. д. Выбирайте реализацию в зависимости от того, что для вас важнее.

Хэш-таблицы в РНР 5 подробно рассмотрены в материале phpinternalsbook, который я написал вместе с Nikic, автором хорошей статьи про хэш-таблицы в РНР 7. Возможно, её вы тоже сочтёте интересной. Правда, она писалась до релиза, поэтому некоторые вещи в ней слегка отличаются.

Здесь же мы подробно рассмотрим, как устроены хэш-таблицы в РНР 7, как с ними можно работать с точки зрения языка С и как ими управлять средствами РНР (используя структуры, называемые массивами). Исходный код в основном доступен в zend_hash.c. Не забывайте, что хэш-таблицы мы используем везде (обычно в роли словарей), следовательно, нужно проектировать их так, чтобы они быстро обрабатывались процессором и потребляли мало памяти. Эти структуры решающе влияют на общую производительность РНР, поскольку местные массивы не единственное место, где используются хэш-таблицы.
Читать дальше →
Total votes 58: ↑57 and ↓1 +56
Comments 14

Обзор расширения OPCache для PHP

Reading time 33 min
Views 114K
VK corporate blog Website development *PHP *Compilers *
Translation


PHP — это скриптовый язык, который по умолчанию компилирует те файлы, которые вам нужно запустить. Во время компилирования он извлекает опкоды, исполняет их, а затем немедленно уничтожает. PHP был так разработан: когда он переходит к выполнению запроса R, то «забывает» всё, что было выполнено в ходе запроса R-1.

Очень маловероятно, что на production-серверах PHP-код изменится между выполнением нескольких запросов. Так что можно считать, что при компилированиях всегда считывается один и тот же исходный код, а значит и опкод будет точно таким же. И если извлекать его для каждого скрипта, то получается бесполезная трата времени и ресурсов.
Читать дальше →
Total votes 56: ↑55 and ↓1 +54
Comments 25

Трамплин вызова магических функций в PHP 7

Reading time 12 min
Views 15K
VK corporate blog PHP *Compilers *
Translation


В этой статье мы подробно рассмотрим оптимизацию в виртуальной машинe в PHP 7 (виртуальной машине Zend). Сначала коснёмся теории трамплинов вызовов функций, а затем узнаем, как они работают в PHP 7. Если вы хотите полностью во всём разобраться, то лучше иметь хорошее представление о работе виртуальной машины Zend. Для начала можете почитать, как устроена ВМ в PHP 5, а здесь мы поговорим о ВМ PHP 7. Хотя она и была переработана, но действует практически так же, как и в PHP 7. Поэтому если вы разберётесь в ВМ PHP 5, то разобраться с ВМ PHP 7 не составит никакого труда.
Читать дальше →
Total votes 56: ↑55 and ↓1 +54
Comments 26