alexeimoisseev May 15 2014 at 17:50

Совместный эксперимент команд Яндекс.Почты и Nginx: действительно ли SPDY ускорит интернет?

7 min

66K

Яндекс corporate blogClient optimization*

+201

Comments 59

youROCK May 15 2014 at 18:03

У вас скорее всего пользователи все из России, и latency весьма небольшой, и доменов немного :). В таком случае, вероятно, действительно будет играть намного бОльшую роль ширина канала, чем что-то ещё.

+14

vsadm May 15 2014 at 18:08

Пользователи у нас из самых разных мест, но мы стараемся для всех них сохранять как можно меньший latency и развиваем CDN.

deadmoto May 17 2014 at 03:26

За быструю почту и новости — спасибо!
Надеюсь акселерация трафика Яндекс.Диск в Северной Америке входит в план развития CDN? :)
А то 20-50 кб\сек — как ножом по сердцу…

northbear May 16 2014 at 08:06

Население на большей части территории России получает интернет по спутниковым каналам, поэтому высокий latency и низкая пропускная способность всё еще значимые факторы в нашей стране…

ElleSolomina May 21 2014 at 03:41

Помимо этого так же не стоит забывать и о мобильном интернете :)

zuborg May 15 2014 at 18:24

Странный результат (отсутствие ускорения). Имхо, нужно смотреть waterfall диаграмму загрузки контента и сравнивать на разных версиях протокола.

AndryX May 16 2014 at 16:33

Я думаю у них и так все было очень хорошо оптимизированно, потому и прирост такой незначительный

UFO just landed and posted this here

doochik May 19 2014 at 11:02

Правильно, но кажется, что если все оптимизировать то spdy, то он даст видимый прирост, но быстрее, чем сейчас, не будет

Black_Shadow May 15 2014 at 18:27

>Однако в SPDY мы нашли для себя неожиданный профит. За счет того, что многие клиенты перестали создавать на каждый файл по соединению, этих соединений стало заметно меньше, а значит, наши процессоры стали меньше нагружаться. То есть какая-никакая, а экономия есть.

Вот это неожиданность! В протоколе для мультиплексирования нашли мультиплексирование!

+24

sch1z0phr3n1a May 15 2014 at 18:32

Это экономия не за счет мультиплексирования, а за счет меньшего количества файловых дескрипторов для той же нагрузки.

Black_Shadow May 15 2014 at 18:36

Не понял, а как SPDY может влиять на количество файловых дескрипторов?

-6

aleks_raiden May 15 2014 at 18:38

соединение > сокет > файловый дескриптор

sch1z0phr3n1a May 15 2014 at 18:39

Вместо четырех http соединений браузер открывает всего-навсего одно.
Неожиданно потому что у нас nginx использует epoll, а у него асимптотическая сложность O(1) от количества сокетов. Т.е. изменение количества соединений не должно было повлиять на скорость обработки epoll и утилизацию системы. Ан нет;-)

+14

Black_Shadow May 15 2014 at 18:44

Теперь понял

ragus May 16 2014 at 03:24

>Т.е. изменение количества соединений не должно было повлиять на скорость обработки epoll и утилизацию системы.

а с чего вы решили, что у вас будут потребляться ресурсы именно на epoll?

большее число fd => больше событий => больше сисколлов => больше контекстсвитчей.

sch1z0phr3n1a May 16 2014 at 08:26

Ну на самом деле в данном случае большее число fd не означает больше событий.
У нас как был определенный набор статических файлов, так и остался. Как была аудитория из N пользователей так и осталась. Если оценить нагрузку по пропускной способности, т.е. в запросах в секунду, то она какой была такой и осталось. Количество событий в единицу времени тоже должно было остаться тем же. Всем пользователям нужно запрашивать все те же файлы, только по другому протоколу, не по HTTP, а по SPDY, с той же интенсивностью.

Конечно, в spdy есть мультиплексирование и в сокет может прилететь сразу два запроса, а вычитать мы можем их за один read(). Насколько такая ситуация частая? Мне кажется что она довольно редкая, и такая схема не должна была сэкономить много ресурсов.

Можно еще сделать буфферизованную запись в spdy-соединение чтобы уменьшить количество вызовов write(), но это опять же очень спорный момент! Станет ли лучше из-за этого? Ведь теперь необходимо задерживать ответ накапливая хоть какой-то буффер.

Ну и сдается мне декодер/енкодер spdy-протокола несколько сложней аналогичного для http, и должен требовать больше ресурсов.

ragus May 16 2014 at 10:44

в принципе, на этот счёт меня сомнения и терзали.
на свежую голову пришёл более правдоподобный вариант: spdy — бинарный, а http — текстовый.

VBart May 16 2014 at 11:18

Все что вы описали, сущая мелочь на фоне того, что происходит в сети.

Не забывайте, что имея 6 соединений вместо 1, вы также получаете в 6 раз больший суммарный объем всех буферов, 6-ти кратный размер суммарного окна, а также на 6 соединениях потеря одного пакета имеет в 6 раз меньший эффект. А кроме того, в условиях конкуренции за ресурсы, причем как за пропускную способность, так и за события — как способ получения таймфрейма на обработку, 6 соединений получат в 6 раз больше ресурсов.

Экономия соединений интересна в целях снижания общей нагрузки на сетевую инфраструктуру. И я так понимаю, исключительно о данном контексте идет речь, а не о том, что это дает какое-то ускорение.

Основное ускорение в SPDY достигается приемущественно за счет экономии на последовательных TCP+TLS хэндшейках, но в случае Яндекса, это не было достигнуто из-за того, что имел место быть шардинг, и клиент вынужден был запрашивать страницу с одного сервера, а потом опять соединяться с другим уже для запроса статики.

Об этом и создатели протокола пишут:

Don’t shard hostnames — This is a hack used by web apps to work around browser parallelism limits. For all the reasons that we suggest using a single connection, hostname sharding is suboptimal when you can use SPDY instead. Furthermore, hostname sharding requires extra DNS queries and complicates web apps due to using multiple origins.

ilnarb May 16 2014 at 12:37

С точки зрения событий — возможно, но к каждому соединению как приложение, так и операционная система выделяет некоторым объем памяти.
Так же механизмы хранения коннекшенов, сокетов и отнесение пакета к определенному соединению становится затратнее с ростом числа соединений. Стандартная сборка ядра линукса начинает себя вести плохо начиная с определенного числа соединений, по причине линейного перебора списка в хештаблице.

max_posedon May 15 2014 at 18:44

У Yandex-а слишком хороший сайт, чтобы заметить разницу. На сайтах где не используются подходы с компрессией (склейкой) картинок, css-ок, js-ов и т.д. выйгрыш от внедрения SPDY может быть весьма значительным. И с другой стороны, когда есть возможность хранить мелкие файлы по отдельности, при выходе новых версий, гораздо меньше статического контента браузеру надо будет скачивать заново.

TDz May 15 2014 at 18:50

Оверхед TCP хендшейка при скачивании большого файла очень скромен, потому и нет экономии. SPDY даёт ощутимый профит только в ситуации когда страница состоит из массы отдельных файлов — когда CSS/JS не собраны в кучу, когда все графические элементы интерфейса не собраны в один файл, когда на странице 100500 картинок с одного хоста и браузер их ещё и не качает параллельно из-за ограничения 2 коннекта на хост итд итп. Для вылизанного сайта экономится только хендшейк, который в случае разных доменов у разных скачиваемых файлов, для всех файлов всё равно проходит параллельно. Сетевой стек тоже уже оттюнен на большое количество подключений, nginx тоже под это заточен — в общем неоткуда Яндексу ожидать профита собственно ))

А в среднем по больнице SPDY/HTTP2 даст и существенное ускорение и уменьшение количества коннектов. А там глядишь и TCP стек подтянут (стартовый размер окна и деградация при ретрансмите) и вообще будет всё летать ))))

+20

UFO just landed and posted this here

alexeimoisseev May 15 2014 at 20:01

Дело в том, что у нас не шесть файлов грузится с yandex.st, а несколько десятков. Поэтому рассчитывали сократить количество хендшейков.

UFO just landed and posted this here

ElleSolomina May 21 2014 at 03:48

Постойте, но ведь по SPDY эти несколько десятков файлов параллельно грузится будут, или я что то упустил?

UFO just landed and posted this here

ElleSolomina May 26 2014 at 07:16

Благодарю.

firehunt May 15 2014 at 19:20

А можно вопрос про Yandex CDN?
Почему для одинаковых объектов с разных узлов CDN выдается разных Etag?
Пример для файла /browser/update/prtnrs/yandex_s_1700_12508.exe
На узле download.cdn.yandex.net.cache-default05h.cdn.yandex.net Etag — 3737429142
А на узле download.cdn.yandex.net.cache-default03h.cdn.yandex.net Etag — 4275026038

firehunt May 15 2014 at 19:34

Разные Etag для одинаковых объектов с разных узлов CDN на одиночного клиента в рамках одиночной сессии конечно не влияют. Но, если оператор доступа в Интернет использует «прозрачные http кеши» то, если не исключать использование Etag в кеш-индексе, то образуются дубликаты объектов.

l0rda May 15 2014 at 19:31

Поправьте пожалуйста в статье ссылку на Navigation Timing API.

anton May 15 2014 at 19:35

Спасибо, поправили.

mwizard May 15 2014 at 19:34

Почему проприетарный SPDY, а не свободный HTTP2?

-9

isden May 15 2014 at 20:00

Почему проприетарный? Википедия говорит, что он «an open networking protocol». Более того, SPDY — это не конкурент HTTP 2.0, а его часть.

mwizard May 15 2014 at 20:05

С чего вы взяли, что SPDY — это часть HTTP2, если HTTP2 — это форк SPDY?

Когда группа HTTPbis решила начать работать над http2, SPDY уже был проверен как рабочая концепция. Он показал, что его возможно развернуть в Интернете, и были опубликованные цифры, которые показывали насколько он справлялся. Работа над http2 впоследствии началась с черновика SPDY/3, который по большому счёту стал черновиком http2 draft-00 после пары операций поиска с заменой.

Хабрапост по этому вопросу

-9

isden May 15 2014 at 20:12

> HTTP2 — это форк SPDY

По-моему, это как раз таки и означает, что SPDY — это часть HTTP 2.0 (т.е. его фичи включены в HTTP 2.0).

mwizard May 15 2014 at 20:14

Хм… LibreOffice — форк OpenOffice. Можно ли сказать, что OpenOffice входит в состав LibreOffice?

Или, например, LibreSSL — это сильно усеченный форк OpenSSL. Входит ли OpenSSL в состав LibreSSL, несмотря на то, что LibreSSL не имеет части функционала OpenSSL?

isden May 15 2014 at 20:19

Как там было про плохую аналогию и котенка? :)

Сами же пишете «Работа над http2 впоследствии началась с черновика SPDY/3, который по большому счёту стал черновиком http2 draft-00 после пары операций поиска с заменой.».

По вашей аналогии можно сказать так, я думаю — «ранние версии LibreOffice включали в себя части OpenOffice».

Terminal May 15 2014 at 20:14

очевидно, потому что он не поддерживается вроде бы нигде. Ну или почти нигде

OlegMax May 15 2014 at 22:57

experiment.yandex.st… meth.yandex.st

Хочется сказать Яндексу — бросайте вы эксперименты с метамфетаминами!

-3

lordofwinds May 16 2014 at 11:18

Пусть лучше продолжают: получается хорошо и интересно.

VBart May 15 2014 at 23:18

Если у вас много посетителей со старыми Операми (12.*) и используются POST-запросы, мы не рекомендуем вам включать SPDY.

Эти оперы не поддерживают SPDY/3.1 и будут работать c nginx 1.5.10+ только по HTTPS, где бага нет. SPDY/2 уже не актуален. А версии nginx до 1.6 на текущий момент уже не поддерживаются и не рекомендованы к использованию в принципе.

alexeimoisseev May 16 2014 at 11:34

Мы все эти эксперименты проводили еще когда еще 1.6 не была стабильной. Поэтому мы будем пробовать :)
В пост внес комментарий.

VBart May 16 2014 at 11:45

У нас с тех пор ещё блог-пост вышел специально для тех, кто боится ипользовать mainline в продакшене: habrahabr.ru/post/220807/ =)

mrjj May 15 2014 at 23:59

meth, cocaine, откуда вы только названия берете

BBSoD May 16 2014 at 01:19

Т-с-с-с, щас Роскомнадзор навлечёте!

mrjj May 16 2014 at 00:11

Методика не без белых пятен. Как у вас конкретно TLS кэшился и шейкался? Это сильно влияет на количество раундтрипов.

kyprizel May 16 2014 at 11:43

TLS терминировался nginx'ом. Насколько я знаю, использовались различные варианты — с кешированием, TLS тикетами и без.
Именно потому, что различные браузеры поддерживают различный функционал, использовались случайные выборки пользователей.

robert_ayrapetyan May 16 2014 at 07:52

гонщику специально колесо сдули?

Karbas May 16 2014 at 11:59

У гонщика вообще фэйспалм.

alexeimoisseev May 16 2014 at 14:19

Тонкий намёк на неоправданные надежды :)

eugenius_nsk May 17 2014 at 16:22

Посмотрел внимательнее на картинку — да это же спойлер результатов исследования! Сдутое колесо, передний спойлер скребёт по земле, у пилота фейспалм. А так всё хорошо выглядело на первый взгляд!

JDima May 16 2014 at 08:14

Но мы у себя внутри не могли полностью сэмулировать все особенности загрузки почты, все проблемы сети, packet loss и прочие TTL

А что так?
Я для тех случаев, когда в лабе надо контролируемо ухудшить характеристики сети, переключаю клиента в отдельный vrf, трафик из которого в остальной мир проходит через сервер с WANEM. Настроек — мама не горюй. Абсолютно никаких изменений на клиенте не требуется. Неужели Яндекс ничем подобным не пользуется?

Скрытый текст

Можно и через консоль крутить штатный линуксовый tc, но вебморда удобнее.

alexeimoisseev May 16 2014 at 11:22

Можно, конечно, искусственно зарезать канал и увеличивать RTT. И мы это, конечно же, делали. Но всё равно считали, что наших кейсов совсем недостаточно для покрытия всех вариантов. Мы не хотели сделать одним пользователям быстро, за счет того, что у других станет медленно.

JDima May 16 2014 at 12:00

Так спору нет, тестировать на ограниченной выборке боевых пользователей в любом случае надо. Но при этом надо организовать лабу так, чтобы она воспроизводила максимально возможное число проблем, тестировать сценарии «из десяти пакетов два приходят не в том порядке», «потери 5%», «джиттер 1000мс при задержке 2000мс, общей полосе 56к и потере 10%» и тому подобное. Это не покроет разве что кейсы «кеширующий прокси провайдера работает коряво на L7».

mrpsycho May 18 2014 at 02:34

интересный пост. спасибо.

однако, будет ли команда яндекса тестировать G-WAN? они пишут, что гван работает лучше нгинкса ;)

kyprizel May 18 2014 at 20:17

думаю, что не раньше, чем G-WAN станет opensource.

dronnix May 28 2014 at 10:58

Спасибо за публикацию интересных результатов! Пару вопросов:
1. Вы пробовали использовать технологию server push? Если нет, то интересно почему.
2. Проводили ли этот же эксперимент для мобильных сетей, где latency последней мили достаточно высокий?

alexeimoisseev May 28 2014 at 15:05

1) В nginx пока нет реализации server push (http://nginx.org/en/docs/http/ngx_http_spdy_module.html)
2) Мобильные сети мы отдельно не выделяли.