Comments / Profile of StraNNikk / Habr

How to become an author

Дмитрий @StraNNikk

Python / PHP / JavaScript developer

Profile Publications 8Comments 147Bookmarks 392

В Облака на Zeppelin: опыт создания облачного сервиса Mail.Ru Group

StraNNikk Feb 5 2014 at 14:10

А если не секрет, сколько человек у вас занимается разработкой этого проекта?
Самописную базу данных в open source не собираетесь выкладывать? или она узко специализирована?

0

«ZeroMQ».Глава 1: Приступая к работе

StraNNikk Oct 23 2013 at 01:13

Спасибо за перевод! Было бы здорово увидеть продолжение

+1

Инфраструктура и жизненный цикл разработки веб-проекта

StraNNikk Oct 3 2013 at 14:01

Спасибо за интересный пост.

мы используем virtualenv при разработке и развёртывании системы, поэтому для установки всех библиотек нужно всего лишь запустить команду

а не смотрели в сторону buildout?

Про графит — я правильно понимаю, что графит вы используете для реал-тайм статистики? А используется что-то для бизнес-аналитики (для всяких специфических метрик, завязанных на бизнес-логике)? Или такие метрики тоже посылаются в графит?
И ещё один вопрос про логи. Вы писали что используете Sentry для ошибок. А всякие логи уровня info собираете? И если да, то используете syslog и его вариации или что-то другое?

+2

Модульного тестирования недостаточно. Нужна статическая типизация!

StraNNikk Aug 31 2013 at 22:28

мне одному кажется, что по 4м случайным проектам нельзя делать такие поспешные выводы? o_O

+4

KPHP от ВКонтакте

StraNNikk Jul 20 2013 at 19:04

Это ВК и Фейсбуку деваться уже некуда, у них приличная часть всего написана на PHP, но мы то в сами сегодня располагаем более широким инструментарием, чем даже 5 лет назад, верно? Где нужно, применим Node, где оправдано — Erlang или, прости господи, Go, а всякую обвязку — на PHP. И не нужно говорить, что потом это все будет сложно поддерживать, поддерживать конкретную реализацию, заточенную под конкретную задачу куда эффективнее, чем мостырить PHP для всего-всего.

Я думаю, что при большом желании такие монстры как VK и FB могут себе позволить переписать все на Node / Erlang и т.п. И по времени это займет скорее всего меньше, чем писать свой компилятор для PHP. И кстати у VK по-моему довольно много сервисов работает на Node.js (по крайне мере Node.js они точно используют в качестве прослойки для реализации XMPP). Я думаю, что все они используют PHP более чем эффективно и как раз-таки по месту, где и надо. Другое дело что, как вы правильно заметили, с их масштабами все время приходится придумывать что-то новое и выкручиваться.
Плюс выбор PHP как языка (а не какого-нить Erlang-а или там чего-нить ещё) обусловлен ещё тем, что ребята просто хорошо умеют его готовить. А зачем использовать что-то новомодное, если ты хорошо справляешься и со старым?

+2

Так ли быстр ваш Framework или хватит тестировать производительность Нello World

StraNNikk Jul 11 2013 at 00:36

Вообще не понимаю синтетические тесты производительности фреймворков/языков программирования, когда в реальности в 99,9% все тормоза банально упираются банально в базу (и кривые руки которые пишут кривые запросы).
На самом деле скорость выполнения скриптов вообще 20ое дело. И если она так важна, то следовательно проект высоконагруженный и суперпосещаемый, а следовательно проще добавить дополнительный сервер, и за счет грамотной монетизации (клиентура то есть, иначе откуда взяться нагрузкам), проект быстро отобьет затраченные на сервер деньги.
На самом деле в случае гонки за скоростью обычно стоит выбирать — либо разрабатываем супергибкий движок, и он будет средним по скорости, либо же забиваем на гибкость, и пишем код так, чтобы все работло супер быстро. Вот кстати пример из реальной жизни — например используем мы супер крутяццкий ORM, извлекаем из БД 500 объектов, и в лучших традициях жанра ORM оборачивает каждый извлеченный элемент в объект. При большом количестве извлеченных объектов (200-300) задержка выполнения скрипта может варьироваться от 50 до 150 ms. И тут уже надо выбирать — либо гибкий ORM, либо выигрываем 50 ms в каких-то кейсах, но забивем на гибкость.

+2

Выиграй бесплатное участие в DEVCONF 2013, креатив открывает вам двери!

StraNNikk May 6 2013 at 23:24

SELECT php, perl,
       python, ruby,
       asp.net, js
  FROM DevConf

-1

Заметки для построения эффективных Django-ORM запросов в нагруженных проектах

StraNNikk Apr 7 2013 at 13:49

Один запрос с JOIN-ом на базе будет быстрее чем 2 запроса и JOIN на стороне питона как минимум из-за того что не надо 2 раза гонять данные.

Вот кстати совершенно не факт. Смотря что за БД используется. Если отталкиваться от MySQL, то есть ситуации когда вместо JOIN лучше сделать два запроса и склеить данные в коде

+2

Заметки для построения эффективных Django-ORM запросов в нагруженных проектах

StraNNikk Apr 7 2013 at 13:43

Вот FB говорит что юзает PHP, но их инженеры по секрету грят что это пиздежь полный и PHP там особой роли не играет

насколько мне известно, они используют hiphop, а это не совсем PHP в его типичном понимании. Да и даже если PHP, то ничего удивительно — такие проекты как Wikipedia или VK тоже крутятся на PHP и нормуль

0

Записи докладов с конференций по высоким нагрузкам HPC

StraNNikk Mar 19 2013 at 12:37

Ну это как бы unix-way: пусть каждая программа делает что-то одно, но хорошо. leveldb кстати тоже nosql, только менее попсовая чем mongo, cassandra и т.п.

0

CMS Koken для фотогалерей

StraNNikk Mar 19 2013 at 11:36

Я сам не фотограф, но друзья пользуются вот этими двумя плагинами для wordpress: Thumbnail Gallery и NextGEN Gallery. Сразу оговорюсь, что про качество этих плагинов ничего сказать не могу, т.к. сам их не пробовал.

+1

Записи докладов с конференций по высоким нагрузкам HPC

StraNNikk Mar 19 2013 at 01:20

Круто! Спасибо! А доклад от Мамбы точь в точь, как на highload++ 2012

0

CMS Koken для фотогалерей

StraNNikk Mar 19 2013 at 01:18

Интересное решение… Нашел их репозитории на github-е. Там лежат плагины, но вот кода самого ядра там нет. Вообще складывается впечатление, что авторы движка панически боятся палить исходники своей CMS-ки (на что ещё намекает тот факт, что инсталлятор содержит всего один скрипт, который грузит некий архив с удаленного сервера).
Видимо данное решение ориентировано на профессиональных фотографов (судя по наличию синхронизации с Lightroom), но вот чего я не пойму — чем данное решение отличается от многочисленных плагинов для wordpress-а, которые в принципе-то реализуют аналогичную функциональность для управления фотками из админки? в чем killer-фича-то?
Кстати, а может кто-нибудь вспомнить ещё парочку подобных CMSок, ориентированных на создание юзабельных фотосайтов?

+1

Лишние join в SQL запросах

StraNNikk Jan 16 2013 at 01:03

Точно! Совсем запамятовал про сигналы… теперь все встает на свои места.

0

Лишние join в SQL запросах

StraNNikk Jan 15 2013 at 22:34

Спасибо за заметку! От себя могу добавить ещё одну особенность — при удалении объектов через ORM когда мы пишем

SomeModel.objects.filter(...).delete()

Django почему-то сначала делает SELECT и выбирает все записи, которые соответствуют условию, указанному в filter, а уже потом только DELETE. То есть как RAW SQL это выглядит примерно как-то так:

SELECT "some_table"."id", ... FROM "some_table" WHERE ...
DELETE FROM "some_table" WHERE "some_table"."id" IN (...)

Причем в результатах выборки первого SELECT присутствуют все поля, а не только поле primary key.
Наверное, создатели движка хотели таким образом предусмотреть какую-то исключительную ситуацию, но вообще говоря в большинстве-то случаев первый SELECT казалось бы лишний.

0

Тестируем ОС в качестве веб-сервера

StraNNikk Jan 8 2013 at 23:13

Автору на заметку:

Затем в футер странички добавляется js-код, который по window.onload перезагружает страницу. Суть теста заключается в подсчете времени загрузок 50 страниц. Перезагрузка происходит 2 вариантами: location.href=’/’ и location.reload(true). Когда выставляем параметр forceGet в true, браузер перезагружает все ресурсы на страничке (картинки, стили, скрипты). Тест через file_get_contents: на ОС-хосте выполняется php-скрипт, который загружает 50 страниц с тестируемой машины посредством функции file_get_contents.

Вот это какой-то жжжутчайший велосипед. Существуют специализированные утилиты, например apache benchmark или же siege, которые используются для подобного рода тестов.

Была взята таблица wp_posts. Операции повторяются 5000 раз.

Зачем лепить сюда Wordpress если в коде скрипта для теста используется простой insert в цикле в отдельно взятую таблицу? Вообще говоря внутри Wordpress-а при создании поста помимо вставки записи в таблицу wp_posts присутствует масса других оверхедов. Почему была выбрана именно эта таблица? почему с таким же успехом не создать какую-то другую таблицу, в имени которой не фигурировал бы Wordpress?

Все же номинальных победителей определим: Запись CentOS, чтение OpenSUSE.

это классика… Сделать 1000 раз select равносильно тому чтобы проверить query cache например. Смысл в таком дико искусственном тесте?

Оказалось что на OpenSUSE и Ubuntu установлена MySQL 5.5.xx, а на всех остальных 5.1.xx.

Иии что? Как это связано с производительностью на отдельно взятом дистрибутиве? а вы пробовали ставить MySQL не из пакетов, а собирать вручную из сорцов? Уверен что в этом случае производительность во всех вышеприведенных тестах будет совершенно другая. И, кстати, что мешает самому на любой unix-like ОСи собрать последнюю версию MySQL из исходников?

все они работают на Debian. Но почему именно он? Не знаю, возможно, эта ось более популярна

Дело не в производительности. В 90% случаев дистрибутив выбирает админ, и выбор этот зависит по большей части от того, в какой ОС он больше всего прошарен. Debian — это в первую очередь стабильность (если ориентироваться на main-репозиторий), CentOS — аля RedHat, а тут уже куча своих плюшек. Зачем сюда лепить мифическую производительность — вообще непонятно.

+10

SQL — гибок или почему я боюсь NoSQL

StraNNikk Dec 30 2012 at 01:50

Отличная статья, но я бы добавил бы ещё один пункт — всё это многообразие NoSQL-решений появилось по большей части на волне массовой истерии крупных highload-стартапов. То тут, то там в блогах читаешь, что вот мол Facebook разработали Cassandra специально под свои нужды, начали использовать, и сразу все стало хорошо! Или же вот Foursquare — активно используют MongoDB, и тоже все у них круто, все масштабируется на 5+, одолели highload и т.п. Ну блин, ребята, вы же не Facebook и не Twitter. 90% проектов в сети прекрасно работают банально на одном сервере с использованием самой банальной РСУБД аля MySQL или PostgreSQL и даже в ус не дуют. Просто РСУБД — это проверенные временем средства, многие из которых активно разрабатываются и используются чуть ли не два десятилетия. В интернетах десятки обмусоленных тем по поводу различных подводных камней, кучи туториалов, миллионы утилит для разного рода диагностики и логирования, патчи от сторонних разработчиков и т.п. Где все это в NoSQL? РСУБД — это своего рода «швейцарский нож», при помощи которого можно сделать что угодно и как угодно. Про NoSQL же ИМХО имеет смысл задумываться, когда проект уже сформирован, прекрасно работает, и встает вопрос об оптимизации, и уж никак не заместо РСУБД, а вкупе с ними.
P.S. MongoDB, кстати, довольно неплохая штука, подводных камней конечно куча, и распиаренный шардинг с репликацией на деле получаются далеко не такими простыми, как в документации. Но, на мой взгляд, через пару лет MongoDB скорее всего займет свою определенную нишу

+15

Версионирование объектов в S3

StraNNikk Dec 21 2012 at 13:06

все ясно! спасибо :)

+1

Версионирование объектов в S3

StraNNikk Dec 21 2012 at 12:39

Это понятно. Я что имел ввиду, вот например я удалил объект из бакета, при помощи версионности я могу его вернуть обратно? просто без версионности объекты удаляются безвозратно.

+1

Версионирование объектов в S3

StraNNikk Dec 21 2012 at 12:07

Такой вопрос: а при удалении объекта, его версионность теряется? его (удаленный объект) уже более никак не восстановить?

+1

3