Comments / Profile of ur001 / Habr

Денис@ur001

Пользователь

Subscribers

Почему протоколы шифрования не спасут интернет: корень проблемы глубже, чем ТСПУ

Да фиг знает… Не хочу показаться сторонником блокировок, в том числе и себе, но какую свободу дало нам последнее цифровое окно? В 12-м году я ходил на митинги, особенно против цензуры. Спустя 10 лет: думсколлинг, маркетплейсы, поисковики показывают лишь товары, особенно неленивые школьники просят решить д/з ЧатГПТ, остальные просто тупят в телефоне и дома и на уроках.

В общем, раньше у меня были серьёзные претензии к государству, будто оно не даёт людям нормально жить. Сейчас же у меня больше вопросов к самим людям. Кажется они очень слабы. Они не могут ни ответить силой государству на попытки лишить их слова, ни выдержать бесконтрольной свободы…

Что же в итоге? Я не знаю. Но, кажется, между полярностью кровавой диктатуры с полным запретом и вседозволенностью с мифическим демократическим самоуправлением должно быть что-то сложное, единственно рабочее в данный момент, какая-то золотая середина от которой мы очень далеко…

Как пополнить счёт Apple ID и оплатить App Store в России: все проверенные способы на 2026 год

ur001 Apr 4 at 21:12

Ну ладно, я хотя бы могу ей digitalocean оплатить :) И там она хотя бы принимается

Как пополнить счёт Apple ID и оплатить App Store в России: все проверенные способы на 2026 год

ur001 Apr 3 at 20:05

Эх… Спасибо, развели :( Выпущенная карта «Плати по миру» работает, только при смене региона на Испанию. Со сменой региона я бы и подарочной картой отделался.

Оплату Apple с мобильного счёта запретят в России, как оплатить App Store теперь и что будет дальше?

ur001 Apr 3 at 19:55

Сайдлоадинг и оффлоадинг: cоздание цифровых моделей личности с помощью сверхбольших промптов для LLM

ur001 Jan 20 at 16:15

что доказывает многократно пройденный различными LLM тест Тьюринга
Это не факт в пользу ллм, а камень в огород людей

Сайдлоадинг и оффлоадинг: cоздание цифровых моделей личности с помощью сверхбольших промптов для LLM

ur001 Jan 20 at 16:04

собрать такой корпус текстов и фактов, что уровень притворства станет запредельным

Если кто-то будет очень притворятся, что вас любит, так, что вы перестанете отличать ложь от настоящей любви, это вас устроит? Если переформулировать: качественная шлюха заменила бы вам мать, сестру, жену и любовницу, если бы реально хорошо притворялась?

Ускорение роутера в Django в 51 раз

ur001 Jun 18 2024 at 10:19

Наверно, по префиксам удобно сделать префиксное дерево, чтобы не проходиться по всем префиксам в цикле

Локализуем игру в слова с искусственным интеллектом

ur001 Dec 21 2022 at 17:01

Спасибо за статью!
Если интересно, могу предоставить эмбединги с sociation.org (не сочиите за рекламу, проект некоммерческий). Они получены не на корпусе текстов, а, наоборот, из ассоциаций пользователей. Слов меньше, только отмодерированные существительные и устойчивые словосочетания, но они намного качественнее. Я сравнивал с RuVectors тестами и эмпирически.

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 23:16

Ну хорошо :) Вы используете очередь. В очереди пересчитываете счётчик полностью, т.к. инкрементное обновление считаете ненадёжным. Благодаря «схлопыванию» удаётся снизить накладные расходы, т.к. «при реактивном изменении счетчика (100500 хомячков в секунду) расчет производится только 1 раз на over 9000 фактических изменений». Я правильно вас понял?

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 22:58

Откатывать транзакцию или нет — зависит от бизнес-требований. Можем ли мы совершить действие если обновлние сётчика не гарантировано? Можем ли мы позволить себе иметь задержку при рассчёте счётчика? Можем ли мы не менять значение счётчика, если было подряд +1 и -1, или, например нам важно получить рейтинг 100, а потом обратно 99, т.к. при достижении 100 срабатывает триггер и пост становится золотым. Очереди — это замечательно, очень удобно и, во многих случаях незаменимо. Они просто не имеют, ИМХО, прямого отношения к теме топика.

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 22:50

Логично что отправка письма в фоне с повтором при неудаче, т.к. уведомление тут вторично. Во всех проектах отправка email/sms/push и прочих уведомлений делается так. С утвердительным ответом от платёжной системы наоборот, т.к. оплата важнее. А к чему это вы?

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 22:00

Рейтинг пользователя на хабе скорее всего да, не вызовет большого перебора, немного ступил. Но одновременно с ним нужно пересчитывать ещё рейтинг хаба. Там будет перебор всех постов хаба. Но мне всё же странно, почему вы наставиваете на полном пересчёте вместо инкрементного обновления, когда оно намного производительнее. Вам не верится что инкрементное обновление может не сбиться? :) Думаете что 1+1+1 в какой-то момент может стать 2 или 4, если повторять эту операцию много раз?

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 21:22

Если схлопывать несколько обновлений в один, то готов с натяжкой согласиться. Тем не менее, два SELECT SUM() имеет сложность O(N1) + O(N2), где N1 и N2 число постов в старом и новом хабе (это при наличии индексов, при отсутствии это число всех постов на Хабре). Т.е. SQL, каким бы волшебным он не казался, честно пробежится по всем постам хаба и просуммирует рейтинг. Если схлопывания, про который вы писали, нет (а это иногда ограничение бизнес-требований), при большой соц. сети с кучей показателей, то полный пересчёт на производительности скажется драматически.

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 20:40

Ок. Нам в очередь пришёл id поста и мы посмотрели по changelog-у, или получили сразу в виде параметров помимо post_id следующие поля: old_hub_id, old_is_published, old_is_deleted, old_user_id, и из базы (которая к этому моменту кстати могла опять измениться) или как-то ещё вычислили актуальные на момент срабатывания счётчика hub_id, is_published, is_deleted, user_id. Да, может это звучит необычно, но на dirty реализована передача черновика другому пользователю, по этому предположим что автор тоже может измениться. Какой вы напишите обработчик для обновления вашего «кеша» рейтинга пользователя на хабе?

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 19:32

Увеличивает доступность сервиса, так как ресурсоемкие вычисления производятся последовательно, а не параллельно.
Увеличивается отзывчивость интерфейса, так как пользователь не ждет обновления счетчика.

Ну тут мы кажется сошлись во мнениях, я в комментарии написал то же самое.

В случае изменения рейтинга/удаления/отправки в черновик в очередь отправится id поста.

Ну допустим пользователь отредактировал пост сменив хаб и скрыв в черновики. Как мы узнаем что хаб был сменён (а значит нужно вычесть рейтинг поста из рейтинга в старом хабе) и что пост не был в черновиках до этого?

кешем будет таблице счётчиков [hub_id, user_id] --> rating с сортировкой по убыванию рейтинга.

Ну если я потом смогу по этому кешу сделать запрос

SELECT hub_id, rating
FROM user_hub_rating
ORDER BY rating DESC
LIMIT 10

То у нас просто разное понимание терминологии что считать кешом.

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 18:02

А чем очередь помогает? Считать в очереди или не нет это вопрос нужен ли вам синхронный счётчик или можно иметь значение с задержкой. В некоторых случаях при отказе в обновлении счётчика нужно откатить транзакцию оменить всё действие. Иногда это вопрос скорости отклика, если на какое-то действие (лайк, к примеру) обновляется слишком много счётчиков и это приведёт к ощутимой для пользователя задержке при синхронном обновлении, то нужно перенести часть рассчётов в очередь.

Допустим у вас в профиле список хабов, в которые вы внесли максимальный вклад. Это запрос по таблице счётчиков [hub_id, user_id] --> rating с сортировкой по убыванию рейтинга. Рейтинг на хабе это, к примеру, сумма рейтингов опубликованных и неудалённых постов пользователя на хабе. Что вы будете класть в очередь? Как на основе этого будете обновлять счётчик? Чем поможет в этом случае кеш?

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 13:04

Да, только ели счётчиков много полностью на триггерах их довольно тяжело поддерживать. Добавление новых, переименование или изменение условий на существующих счётчиках, миграция структуры бд и т.п. будет каждый раз головной болью.

Идея ловить тригерами изменения и отправлять на обработку в очередь на той же БД (PGQ) мне, в принципе понравилась. Этот подход позволял отлавливать только изменения, при этом писать логику их обработки на нормальном питоне. Но сама PGQ по сравнению с Celery отвратительна — это раз. Триггеры отлавливающие изменения приходилось обновлять вместе с миграцией БД, короче не слишком приятно выходило. Но потенциал в этом подходе есть.

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 09:28

А, понятно. Я сначала не понял, что вы про хранение счётчиков только в кеше. Я тут ответил.

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 09:23

Иногда такой подход оправдан. Но для некоторых вещей просто неприемлем. Например, из Трипстера: запись на экскурсию с ограниченным числом участников. После того, как максимальное число людей оплатило, регистрация на событие закрывается, неоплаченные заказы отменяются, всем участникам и гиду приходят уведомления.

Второй вариант — значения счётчиков вам постоянно нужны для выборок.

Как считать счётчики и не сбиться со счёта

ur001 Oct 1 2016 at 09:02

Да, я имел в виду именно это. И да, дело, по большей части, в дороговизне полного пересчёта на каждое изменение. Никакое кеширование, тут помочь не может — что именно вы будете кешировать? :)

2 3 ...

36 37

Information

Specialization