Comments / Profile of yegreS / Habr

How to become an author

User

Profile Publications Comments 48Bookmarks 1

Kafka Streams — непростая жизнь в production

yegreS Sep 20 2023 at 10:08

Все эти особенности легко обнаружить еще на стадии чтения документации. Самое интересное начинается при моделирование таблиц, агрегатов.
Немного моего опыта работы с ksql:

1) Написать запрос для создания агрегата действительно очень легко и быстро. Но сразу возникает вопрос, а как проинициализировать изначальные данные? Часто бывает, что топик-источник либо слишком огромный, чтобы его перечитывать, либо вообще нету данных старее X лет. И в таком случае приходится городить специальный инициализирующий топик агрегат и из-за этого монстра вся модель данных из простой и красивой превращается в что-то сложное и непонятное.
2) Изменения схемы агрегатов практически невозможно, так что если вам необходима будет дополнительная колонка, то скорее всего придется делать новый агрегат. И тут вы либо придете к якорной модели, либо придется выдумывать сложный механизм создания нового агрегата и миграции старых данных.

---

В целом текущее состояние развития технологий в стриминговой обработки пока очень плохо работает с агрегатами для которых необходимо хранить состояние. Если хочется легко и быстро, то пока это только агрегаты с маленьким окном в минуты/часы, максимум день, для которых не нужна история всех данных

0

Почему программистам нужно знать структуры данных и как я сэкономил компании $22 000 в год

yegreS May 3 2022 at 21:43

Проблема

Часто используемый скрин приложения отправлял impression аналитику при прокрутке экрана с дублированием. Например если вы видели на экране “XYZ” 10 раз прокрутив контент вверх вниз несколько раз, то аналитика отправлялась 10 раз. Хоть 1 раза было достаточно.

А с каких пор для аналитики это стала проблема? мне кажется это автор своим решением сделал проблему для аналитиков

+1

Яндекс выложил в опенсорс YDB

yegreS Apr 20 2022 at 11:53

Спасибо за ссылки.
Видимо я пока плохо разобрался, попробую перефразировать вопрос.

Точкой подключения для клиента (приложения) что является? какой-то конкретный мастер сервер? Или у вас умный клиент и он сам определяет куда подключится?

0

Яндекс выложил в опенсорс YDB

yegreS Apr 19 2022 at 17:45

А где можно почитать про общую архитектуру? из статьи и из оф. документации так до конца и не понял как она устроена.
В кластере один мастер и несколько slave? При этом все запросы идут через мастер и проксируются на рабочие ноды(Tablet), потом результат собирается на мастере и отдается клиенту?

и я так понял под капотам там key->value хранилище?

+3

yegreS Nov 24 2020 at 13:22

через 3 года у меня еще вопрос появился) Моете подсказать какую модель данных выбрали в tinkoff? 3nf, data vault, anchor, или просто витрины?

0

Когда у вас сберовские масштабы. Использование Ab Initio при работе с Hive и GreenPlum

yegreS Nov 24 2020 at 13:16

Немного не по теме, но все же, подскажите у вас в GP модели в каком виде хранятся? anchor? data vault? просто 3nf? или готовые витрины?

0

Платформа как сервис в Авито: как это устроено

yegreS Nov 19 2020 at 13:33

Очень крутая статья, спасибо!
Из стати не совсем понял в какой момент вы накатываете миграции БД? В момент деплоя или в момент старта приложения? И почему именно такой способ?
Есть ли у вас какой-то отдельный процесс ревью миграций (а то вдруг кто-то захочет добавить индекс на проде в не concurrently режиме)?

+2

Сжатие данных в Apache Ignite. Опыт Сбера

yegreS Oct 15 2020 at 18:01

Можете подсказать для каких целей у вас используется Apache Ignite и как он себя показывает?

Решили присмотреться к этой системе как к in-memory DISTRIBUTED SQL, но результаты пока совсем не впечатляют

0

yegreS Dec 7 2017 at 13:42

А есть какие-то рекомендации по кол-ву сегментов? Какое-то минимально кол-во сегментов, при которых исползование GreenPlum уже будет оправдано? Сейчас исползуем 6 сегментов на 3 серверах и результат не лучше, а временами даже хуже, чем на одном инстансе Postgress.

0

Генерируем псевдослучайные ID а-ля Youtube

yegreS Oct 10 2016 at 13:08

А чем не устроило использование GUID?

+1

DBGlass — Open-Source кросс-платформенный PostgreSQL GUI клиент

yegreS Oct 9 2016 at 00:07

советую взглянуть на DBeaver

+2

Gogs: легковесный git-сервис

yegreS Jul 11 2016 at 18:34

Прочитал, и так и не понял где codereview. Merge Request Approvals есть только в EE

-1

Gogs: легковесный git-сервис

yegreS Jul 11 2016 at 17:48

в GitLab «Ревью кода» кажется только в enterprise-версии есть

-1

В Псковской области могут построить завод по производству планшетов и смартфонов

yegreS Mar 16 2016 at 17:48

чтот цифры какие-то нереальные. Вложив 40 миллионов долларов, они хотят выпускать 4,5-18 млн устройств в год?
т.е. при цене устройства более 10$, инвестиции окупятся за год. И кому они собрались продавать столько устройств?

0

Готовая сборка новостного портала NewsModxBox

yegreS Sep 28 2015 at 16:07

так я и не понял, а на существующий сайт NewsModxBox можно установить?

0

SibirCTF 2015: как это было

yegreS Jul 24 2015 at 23:34

а не думали приглашать более-мение известные команды?

0

SibirCTF 2015: как это было

yegreS Jul 24 2015 at 15:20

а можно подробнее чем не понравилась система HackerDom? Я так понимаю команды только студенческие? Как происходил отбор команд?

0

SHARED.menu — поиск виртуального хостинга

yegreS Jul 22 2015 at 14:40

А кнопки «Сообщить о неточности» нет (я про VDS.menu )? мне кажется была бы очень полезна.

0

Yii 2.0.5 (исправление безопасности)

yegreS Jul 11 2015 at 10:28

Ссылка на коммит с исправлением: github.com/yiisoft/yii2/commit/aaf931a5e8a76cc25ae404eae657801c47508fe6

+3

Выбор текстового редактора или «хочу все в одном»

yegreS Jun 22 2015 at 16:10

разрабатываю на yii2, и могу сказать что netbeans гораздо лучше дружит с автокомплитом, чем Komodo Edit. Попробуйте

0

1