Pull to refresh
  • by relevance
  • by date
  • by rating

LogLog — находим число уникальных элементов

Algorithms *
Здравствуй, Хабр! Мы с тобой уже побаловались фильтрами Блума и MinHash. Сегодня разговор пойдёт о ещё одном вероятностном-рандомизированном алгоритме, который позволяет с минимальными затратами памяти определить примерное число уникальных элементов в больших объёмах данных.

Для начала, поставим себе задачу: предположим, что у нас имеется большой объём текстовых данных — скажем, плоды литературного творчества небезызвестного Шекспира, и нам необходимо подсчитать количество различных слов встречающихся в этом объёме. Типичное решение — счётчик с урезанной хеш-таблицей, где ключами будут слова без ассоциированных с ними значений.

Способ всем хорош, но требует относительно большой объём памяти для своей работы, ну а мы с вами, как известно, неугомонные гении эффективности. Зачем много, если можно мало — примерный размер словарного запаса упомянутого выше Шекспира, можно вычислить используя всего 128 байт памяти.

Кажется невозможным?
Total votes 81: ↑80 and ↓1 +79
Views 24K
Comments 30

«Умный дом» собственными руками v2

Java *
Добрый день, уважаемый %habrausername%!

Судя по предыдущим постам, многие из вас интересуются hand-made автоматизацей своего жилища. Я долго собирался с мыслями и идеями по итогам построения первого «умного дома» и теперь хочу поделиться своими наработками с вами.
Читать дальше →
Total votes 56: ↑53 and ↓3 +50
Views 89K
Comments 57

Игры серии X в распродаже Humble Weekly Sale

Game development *
Комания Humble Bundle продолжает радовать нас хорошими распродажами. В добавок к запущенной неделю назад девятой акции Humble Indie Bundle, сегодня стартовала распродажа игрушек серии X.

Под катом подробности, а также небольшой ликбез, для тех, кто уже запутался в этих акциях.


Читать дальше →
Total votes 23: ↑21 and ↓2 +19
Views 15K
Comments 23

Наш луна-парк с разговорчиками и картой (Meetweet)

Self Promo
Добрый день!

Некоторым из вас я знаком по статьям о моем любимом C++, но сегодня речь пойдет не о нем. Больше года назад я попробовал, потом подсел, а теперь уже окончательно переквалифицировался в разработчика под iOS. Вместе с Konovalove мы разработали концепцию геосоциального клиента Meetweet (и написали эту статью). Казалось бы, словосочетание «новая геосоциальная сеть» последние пару лет воспринимается уже, как анекдот. Все давно поняли, что попытка создать в этой нише что-то новое, пытаясь «выехать» за счет дорогого дизайна, огромного количества фич или невероятных маркетинговых бюджетов — утопия. Основная проблема социальных сетей, основанных на геопозиционировании — ТАМ НИКОГДА НИКОГО НЕТ, а от этого публиковать туда что-то у пользователя желание не возникает! Никак. Совсем. Никто не любит одиночество. А ниже мы дадим понять, в чем наше принципиальное отличие от «геосоциалочек» и какие pivot-ы происходили (а какие — произойдут) у нас в ходе работы над проектом.


Читать дальше →
Total votes 27: ↑8 and ↓19 -11
Views 2.7K
Comments 19

От дейтинга к городу

Self Promo
Привет, {{habrauser}}.



В данной заметке я расскажу о нашем проекте, о первоначальных планах, и о том, к чему мы пришли, процессе и видах на будущее.

Последние пару лет было модно делать гео-социальные дейтинги. Кто это начал я не помню, но в Рунете отметились «Елки» от Аркадия Морейниса. Сейчас же термин «гео-дейтинг» — это практически ругательство в рядах молодых интернет-предпринимателей.

Моя же история начинается погожим летним днем, когда я открыл RSS ленту от TechCrunch, кажется, и мне на глаза попалась статья о сервисе Tinder. Надо сказать, что по природе я крайне застенчивый. Думаю, даже позастенчивее Раджа из TBBT буду. Подойти к девушке и заговорить! Самому? Ни с того, ни с сего? Нет уж, увольте!
Подробности нашего плавания
Total votes 38: ↑25 and ↓13 +12
Views 4.8K
Comments 40

Ломаем и чиним Kubernetes

System administration **nix *DevOps *Microservices *Kubernetes *
✏️ Technotext 2021

Kubernetes отличная платформа как для оркестрации контейнеров так и для всего остального. За последнее время Kubernetes ушёл далеко вперёд как по части функциональности так и по вопросам безопасности и отказоустойчивости. Архитектура Kubernetes позволяет с лёгкостью переживать сбои различного характера и всегда оставаться на плаву.

Сегодня мы будем ломать кластер, удалять сертификаты, вживую реджойнить ноды и всё это, по возможности, без даунтайма для уже запущенных сервисов.

Поехали! (╯°□°)╯︵ ┻━┻
Total votes 28: ↑28 and ↓0 +28
Views 14K
Comments 20

Ломаем и чиним etcd-кластер

System administration **nix *DevOps *Microservices *Kubernetes *

etcd — это быстрая, надёжная и устойчивая к сбоям key-value база данных. Она лежит в основе Kubernetes и является неотъемлемой частью control-plane, именно поэтому критически важно уметь бэкапить и восстанавливать работоспособность как отдельных нод, так и всего etcd-кластера.

В предыдущей статье мы подробно рассмотрели перегенерацию SSL-сертификатов и static-манифестов для Kubernetes, а также вопросы связанные c восстановлением работоспособности Kubernetes-кластера. Эта статья будет посвящена целиком и полностью восстановлению etcd.

Поехали! ┬─┬ ノ( ゜-゜ノ)
Total votes 11: ↑11 and ↓0 +11
Views 12K
Comments 6