A/B очень чувствителен к подготовке выборки. Одно дело, когда результаты убедительны: 5, 10, 15%. Но 1% говорит о том, что у вас прям эталонное разделение, в котором вы обеспечили идеальную репрезентативность пользователей в обоих группах. Т.е. если бы повторяли снова А/Б тестирование, но уже в котором группа А и группа Б не отличаются технически, то вы получили бы разницу между группами менее 1%. Да возможно ли это вообще?))
Я вообще не хочу спорить с тем, что уменьшение времени загрузки увеличивает конверсию. Но приведённая цифра вызывает сомнение.
В начале статьи грубая маркетинговая ошибка: "Ethernet - 50 Мбит/с". Это даже не средняя скорость доступа, а вообще непонятно что. Зато у GPON - указан гигабит. Так-то обычный 4-х парный Ethernet тоже может на дешёвом оборудовании давать гигабит. Это черезвычайно живучее и неприятное заблуждение. Меня недавно менеджер ростелекома уверял, что гигабит по оптике это более прогрессивный и современный гигабит, чем гигабит по меди.
И ещё, разве RTT так сильно зависит от скорости среды и расстояния? Какжется всё-таки надо учитывать ещё количество транзитных переходов. Скорость на них всё-таки отличается от скорости среды заметно.
А как вы посчитали прирост просмотров в районе 1%? Для трафика соц сетей это должна быть какая-то статистическая погрешность. Особенно в последние 2 года, когда профиль трафика уже не определяется днём недели, временем года и временем суток, а зависит от эпидемиологической и геополитической ситуации в конкретных странах? Например отправили школьников на дистант в 15 областях из всей страны - вот вам и прирост. Вывели с дистанта - вот вам и убыль. Речь-то всего об 1% идёт. Мало ли там факторов может быть, кроме формата картинок.
Согласен. Я почему-то подумал про константы. Но для оценки сложности они, пожалуй, не подходят. И если брать голый ассемблер, то он и не будет оперировать десятичными числами. Про девятки он не знает. Тогда зависимость будет минимальной.\
Я по привычке про оптимизацию алгоритмов на ЯВУ подумал)
А как влияет культурный код на колмогоровскую сложность? Вот, например, программа для записи 999999999999 очевидна для нас, привыкших к десятеричной системе счисления. В двоичной системе сложность записи повышается. Помимо системы счисления наверняка есть и другие вещи, позволяющие оптимизировать запись в зависимости от багажа знаний записывающего. Древние люди, например, число e не знали. Только pi.
А почему для ведения логов использовался SMTPHandler , а здесь другая библиотека? Вроде и та и та отправляют письма по SMTP: не ясно, зачем автор использует разные библиотеки. Разница никак не прокомментирована.
Зачем наворачивать такой сложный токен с подписью, если можно было бы просто создать временную таблицу токенов, связанную с таблицей пользователей по id. Там токеня и ссылки были бы куда короче и красивее. 8 символов, живущих 10 минут было бы "достаточно всем"(С).
Там ещё одно гигантское замедление есть: сначала полностью выполняется запрос своих постов, потом полностью подписных, затем делается юнион и только потом выбираются страницы. А ведь размер первых двух таблиц может быть очень большим. Тогда как при нормально построенном запросе с одной таблицей без юнион поиск бы остановился сразу по достижении необходимого числа записей на странице.
Вместо простого запроса "SELECT COUNT(*) FROM folowers WHERE folower_id=? AND folowed_id=? LIMIT 1;" такой трэш и угар. Судя по всему в предложенной версии зачем-то сначала составляется список всех подписанных пользователей, и потом по нему прогоняется отдельный запрос для нужного юзера.
Да и в поиске постов можно было прекрасно обойтись без union. Сдаётся мне, что с таким конструированием запросов не только падает наглядность, но и растёт время их выполнения.
Протокол REP, конечно, хорош. Но утверждения типа «В случае со Spanning-Tree это действительно так. Этот протокол в кольцевой топологии может отрабатывать до 30 секунд, что часто неприемлемо для сетей, обслуживающих производственные процессы» — взят из древних-древних скрижалей. Кто ж STP-то в классической версии настраивать в 2021 году будет? Там и portfast, и uplinkfast, и RSTP и всякое такое. Это если сеть «из коробки» развернуть и не настраивать 30 секунд будет.
"Поменять основную метрику - пусть это будет не оценка от преподавателей, а сколько проект смог заработать. Мне кажется, что если ориентировать студентов на прибыльность их проекта, то они лучше разберутся в том как устроен ИТ рынок и научатся работать с реальными потребителями."
Это - не инженерная задача. Раньше был такой термин инженер-экономист. Видимо сейчас все такими должны быть в вашем представлении. Это не так. Представляю себе, как конструктор блока вертикальной ориентации ракеты думает как на нём заработать вместо того, чтобы думать о том, как его улучшить.
Слышали про НСДИ (Национальная система доменных имен)?
Это сейчас Роскомнадзор активно внедряет у операторов.
После завершения внедрения этой штуки следующим шагом может быть блокировка любых иностранных DNS по признаку протокола. С DoH уже не прокатит. А с DoT прокатит, там порт другой.
Я думаю, что скоро европейские DoH сервера будут продаваться как европейские прокси — пять рублей пучок. При определённом сценарии блокировок это будет даже удобнее прокси
Золотые слова. Как-то об этом совсем мало говориться. Просто гугл и клаудфлэр забирают у региональных провайдеров возможность обогащать свой цифровой отпечаток пользователя. Некоторые называют это приватностью, так как big-big brother это другое, более лучшее, нежели big brother.
Региональные провайдеры тоже могут внедрять DoH, но тогда возникает вопрос — «а от кого мы тогда скрываемся?» и целый ряд интересных ответов на него.
Небольшой совет: вы прошлись по всему спектру приложений и задавали вопросы, сопоставимые со смыслом бытия. Возможно, если бы вы не переключались между проблемами, а педалировали одно приложение, например «Караоке», то поддержке было бы гораздо сложнее выкручиваться и они могли бы выболтать больше лишнего.
А так вы им открыли поле для стандартной тактики, где ответа удостаивается самый простой вопрос из письма.
Причём это может происходить даже не по злому умыслу а из объективной особенности первой линии, не способной опознать вопрос за пределами FAQ.
В общем, ИМХО, лучше много маленьких конкретных тикетов, чем один «хватит за мной шпионить!»
Это ещё вопрос принципиальный: кто может этим управлять? Завтра в топы теслы по квоте пройдут ЛГБТ+БЛМ и машину можно будет открывать только политически верным пользователям. А за поездки в белые районы надо будет доплачивать добровольный взнос для угнетаемых.
Интересно, по железу это не родственник DCN?
A/B очень чувствителен к подготовке выборки. Одно дело, когда результаты убедительны: 5, 10, 15%. Но 1% говорит о том, что у вас прям эталонное разделение, в котором вы обеспечили идеальную репрезентативность пользователей в обоих группах. Т.е. если бы повторяли снова А/Б тестирование, но уже в котором группа А и группа Б не отличаются технически, то вы получили бы разницу между группами менее 1%. Да возможно ли это вообще?))
Я вообще не хочу спорить с тем, что уменьшение времени загрузки увеличивает конверсию. Но приведённая цифра вызывает сомнение.
В начале статьи грубая маркетинговая ошибка: "Ethernet - 50 Мбит/с". Это даже не средняя скорость доступа, а вообще непонятно что. Зато у GPON - указан гигабит. Так-то обычный 4-х парный Ethernet тоже может на дешёвом оборудовании давать гигабит. Это черезвычайно живучее и неприятное заблуждение. Меня недавно менеджер ростелекома уверял, что гигабит по оптике это более прогрессивный и современный гигабит, чем гигабит по меди.
И ещё, разве RTT так сильно зависит от скорости среды и расстояния? Какжется всё-таки надо учитывать ещё количество транзитных переходов. Скорость на них всё-таки отличается от скорости среды заметно.
А как вы посчитали прирост просмотров в районе 1%? Для трафика соц сетей это должна быть какая-то статистическая погрешность. Особенно в последние 2 года, когда профиль трафика уже не определяется днём недели, временем года и временем суток, а зависит от эпидемиологической и геополитической ситуации в конкретных странах? Например отправили школьников на дистант в 15 областях из всей страны - вот вам и прирост. Вывели с дистанта - вот вам и убыль. Речь-то всего об 1% идёт. Мало ли там факторов может быть, кроме формата картинок.
Согласен. Я почему-то подумал про константы. Но для оценки сложности они, пожалуй, не подходят. И если брать голый ассемблер, то он и не будет оперировать десятичными числами. Про девятки он не знает. Тогда зависимость будет минимальной.\
Я по привычке про оптимизацию алгоритмов на ЯВУ подумал)
А как влияет культурный код на колмогоровскую сложность? Вот, например, программа для записи 999999999999 очевидна для нас, привыкших к десятеричной системе счисления. В двоичной системе сложность записи повышается. Помимо системы счисления наверняка есть и другие вещи, позволяющие оптимизировать запись в зависимости от багажа знаний записывающего. Древние люди, например, число e не знали. Только pi.
А почему для ведения логов использовался SMTPHandler , а здесь другая библиотека? Вроде и та и та отправляют письма по SMTP: не ясно, зачем автор использует разные библиотеки. Разница никак не прокомментирована.
Зачем наворачивать такой сложный токен с подписью, если можно было бы просто создать временную таблицу токенов, связанную с таблицей пользователей по id. Там токеня и ссылки были бы куда короче и красивее. 8 символов, живущих 10 минут было бы "достаточно всем"(С).
Не нашли ответ?)
Там ещё одно гигантское замедление есть: сначала полностью выполняется запрос своих постов, потом полностью подписных, затем делается юнион и только потом выбираются страницы. А ведь размер первых двух таблиц может быть очень большим. Тогда как при нормально построенном запросе с одной таблицей без юнион поиск бы остановился сразу по достижении необходимого числа записей на странице.
Какой ужас этот ORM.
Вместо простого запроса "SELECT COUNT(*) FROM folowers WHERE folower_id=? AND folowed_id=? LIMIT 1;" такой трэш и угар. Судя по всему в предложенной версии зачем-то сначала составляется список всех подписанных пользователей, и потом по нему прогоняется отдельный запрос для нужного юзера.
Да и в поиске постов можно было прекрасно обойтись без union. Сдаётся мне, что с таким конструированием запросов не только падает наглядность, но и растёт время их выполнения.
Радиофак УПИ всегда готовил инженеров.
"Поменять основную метрику - пусть это будет не оценка от преподавателей, а сколько проект смог заработать. Мне кажется, что если ориентировать студентов на прибыльность их проекта, то они лучше разберутся в том как устроен ИТ рынок и научатся работать с реальными потребителями."
Это - не инженерная задача. Раньше был такой термин инженер-экономист. Видимо сейчас все такими должны быть в вашем представлении. Это не так. Представляю себе, как конструктор блока вертикальной ориентации ракеты думает как на нём заработать вместо того, чтобы думать о том, как его улучшить.
Это сейчас Роскомнадзор активно внедряет у операторов.
После завершения внедрения этой штуки следующим шагом может быть блокировка любых иностранных DNS по признаку протокола. С DoH уже не прокатит. А с DoT прокатит, там порт другой.
Региональные провайдеры тоже могут внедрять DoH, но тогда возникает вопрос — «а от кого мы тогда скрываемся?» и целый ряд интересных ответов на него.
А так вы им открыли поле для стандартной тактики, где ответа удостаивается самый простой вопрос из письма.
Причём это может происходить даже не по злому умыслу а из объективной особенности первой линии, не способной опознать вопрос за пределами FAQ.
В общем, ИМХО, лучше много маленьких конкретных тикетов, чем один «хватит за мной шпионить!»