В статье рассказываем о том, кому стоит задуматься о внедрении DWH, как сократить вероятность ошибок на этапе разработки проекта, выбрать стек, методологию и сэкономить ИТ-бюджеты.
В погоне за заменой Redis
21 марта Redis Ltd. объявила, что, начиная с Redis 7.4, ее «in-memory data store» будет выпускаться под несвободными лицензиями с доступным (source-available) исходным кодом. Новость малоприятная, но вполне ожидаемая. Необычно в этой ситуации обилие альтернатив для тех, кто хочет остаться со свободным ПО: есть как минимум четыре варианта замены, включая уже существующий форк под названием KeyDB и недавно анонсированный проект Valkey от Linux Foundation. Вопрос теперь в том, что предпочтут пользователи, провайдеры и создатели дистрибутивов Linux.
Когда одного Postgres'a мало: сравнение производительности PostgreSQL и распределенных СУБД
Общеизвестно, что PostgreSQL - крайне эффективная СУБД с богатой функциональностью. При этом не секрет, что PostgreSQL масштабируется только вертикально и её производительность ограничена возможностями одного сервера.
Написано много хороших постов, в которых сравнивают архитектуру монолитных и распределенных СУБД. К сожалению, обычно авторы ограничиваются теоретическим сравнением и не приводят конкретные цифры. Данный пост же наоборот основан на эмпирическом исследовании с использованием бенчмарка TPC-C, который является промышленным стандартом для оценки производительности транзакционных СУБД (On-Line Transaction Processing, OLTP).
Мы расскажем, когда именно одного Postgres'a становится мало, и какие возможны компромиссы между производительностью и надежностью. Для тех, кто не готов к компромиссам, мы покажем, что могут предложить такие распределенные СУБД, как CockroachDB и YDB.
Шесть вредных советов по работе с Patroni на случай, если вы не хотите спать ночью
Привет, Хабр!
О том, как правильно готовить кластеризацию для PostgreSQL, написано уже достаточно. А потому сегодня вашему вниманию предлагается небольшой сборник рекомендаций, как администратору СУБД под управлением Patroni гарантированно проснуться в три часа ночи от звонка из отдела мониторинга.
PostgreSQL. Устройство карты свободного пространства
СУБД PostgreSQL способна бысто работать с огромными массивами данных благодаря множеству различных механизмов, таких как карта свободного пространства, позволяющая за короткий промежуток времени найти страницу из основного слоя с необходимым свободным пространством для вставки новых версий строк.
В этой статье мы разберемся в устройстве карты свободного пространства, а также познакомимся с алгоритмом получения страницы с необходимым свободным пространством.
Инженер на минималках: установка и настройка ClickHouse
Базы данных — один из важнейших инструментов в арсенале аналитика. А ClickHouse — это высокопроизводительная аналитическая СУБД, которая заточена на то, чтобы переваривать огромные массивы данных. Поэтому полезно будет разобраться, как самостоятельно установить ClickHouse в Yandex Cloud или на VDS-сервере, как создать пользователей и активировать веб-интерфейс и доступ по сети. Этим и займемся в статье.
Дом, милый дом: нюансы работы с ClickHouse. Часть 1
Всем привет, меня зовут Пётр, я инженер компании Nixys. На современных проектах используется огромное разнообразие баз данных: реляционные, ключ-значение, документоориентированные. Особое место среди них занимают колоночные базы данных, ярким представителем которых является ClickHouse. Это мощный инструмент, который способен обрабатывать миллиарды строк в секунду при минимальном времени ответа. Однако, для максимальной эффективности ClickHouse необходимо понимать ряд фундаментальных моментов для того, чтобы использовать его по назначению. В этой серии статей мы разберем особенности работы ClickHouse, которые помогут в выжимании максимума из этой базы. И сегодня начнём с фундаментальных теоретических моментов, чтобы составить максимально полное общее впечатление, которое поможет нам в дальнейшем.
Эффективные вложения в ИТ: Как посчитать ROI при внедрении ПО на примере системы маскирования данных
Всем привет! Меня зовут Али Гаджиев, я Директор по продукту в компании Crosstech Solutions Group. Мы с моими коллегами Продакт-менеджером Дмитрием Симаком и Руководителем отдела анализа данных и машинного обучения Владимиром Коршуновым решили поднять ту тему, которую, зачастую, технари игнорируют. Мы умеем создавать классные продукты, готовы интересно их заносить функциональным заказчикам, но как только доходим до людей, которые внутри заказчиков выделяют деньги, мы оказываемся (не часто, но бывает) в тупике, слыша вопрос «А зачем мне выделять деньги на автоматизацию, если руками делать дешевле?».
Поэтому, в данной статье мы немного поговорим о функционале нашего продукта Jay Data и много о деньгах.
Итак, в современном мире, где данные являются одним из самых ценных активов компаний, обеспечение их безопасности становится приоритетной задачей. Сложный экономический климат заставляет компании уделять первоочередное внимание инициативам по сокращению затрат и тщательно проверять рентабельность инвестиций (ROI) перед тем, как они будут сделаны.
В данной статье мы рассмотрим важность применения систем маскирования баз данных для защиты конфиденциальной информации и, самое главное, подчеркнем, что инвестиции в такие системы оказываются рентабельными и приносят прибыль за счет автоматизации ранее использованного ручного труда, повышения продуктивности в жизненном цикле разработки программного обеспечения, уменьшения рисков финансовых потерь и повышения эффективность работы компании и безопасности бизнеса.
Развитие баз данных
В 60-х годах прошлого века возникла потребность в надежной модели хранения и обработки данных, особенно важной для банков и финансовых организаций. В то время отсутствовали единые стандарты работы с данными и моделями, и вся работа сводилась к ручной упорядоченной организации информации. Банкам удавалось записывать информацию о транзакциях в виде файлов в заранее подготовленную структуру, причем у каждой организации было собственное представление о том, как это должно выглядеть и функционировать. Также отсутствовали понятия консистентности (согласованности данных) и целостности данных. В таких файлах часто встречались дубликаты клиентов и их транзакций, которые приходилось уточнять и приводить в порядок вручную.
Данная статья захватывает ключевые моменты в развитии систем управления базами данных, от первых иерархических моделей до современных реляционных, NoSQL и NewSQL систем.
Postgresso #3 (64)
Стартует уже совсем скоро: 8 апреля, а завершится 9-го. Можно просмотреть расписание и список докладов.
Первый доклад после открытия - директора нашего отдела образования Павла Лузанова - PostgreSQL 17:
В этом году даты проведения конференции совпадают с завершением релизного цикла 17 версии. 8 апреля в 15:00 MSK прием изменений завершится. А мы сможем обсудить, что ожидать в осеннем релизе. Здесь и инкрементальное резервное копирование, изменения в логической репликации, триггер на подключение и наверняка появится что-то любопытное в начале апреля.
Следующий доклад в конференц-зале - Про-Shardman, Алексей Борщев и П. Конотопов. То, что он идёт вторым после обзорного, показывает, какое значение придают этой новой СУБД в компании. Интерес к ней действительно огромный. Они расскажут о Шардмане с точки зрения SQL разработчиков и архитекторов БД:
что такое Шардман;
чем отличается от обычного Постгреса;
типы таблиц и их использование;
как адаптировать схему БД для работы на шардах.
Конечно, будет рассказано и о других новинках компании: доклад Pooler, load balancer, proxy. Что их объединяет? Артём Галонский, pgpro_rp (приоритизация ресурсов, доложит Александр Попов) и других.
Как хакеры ломают банки за 48 часов и что нужно для защиты
На последней кибербитве Standoff 12, которая проходила в ноябре 2023 года, впервые был представлен вымышленный финтех — Global Digital Bank, максимально автоматизированный, с облачными приложениями на основе микросервисов «под капотом». Задачей команд атаки (red team) было реализовать недопустимые события, в случае с финтехом — остановить работу банка, выкрасть базу данных клиентов, взломать новостной портал. Назначение PT Container Security — защитить контейнерные среды и помочь синим командам отследить действия атакующих. Что из этого получилось? Рассказываем!
Неопределенное поведение и реляционные СУБД: открытые лекции в ноябре
Computer Science Center приглашает на открытые лекции в ноябре. Опытные разработчики расскажут, как устроены реляционные СУБД и какие выгоды даёт неопределенное поведение языкам программирования.
Обе лекции можно посмотреть онлайн. Расписание и подробное описание внутри.
Запись вебинара по базам данных. Redis: как работать, где применять, какие ограничения
30 ноября мы проведем вебинар про NoSQL базы данных Redis.
Мы расскажем, как использовать Redis для кэширования, ведения игровых таблиц, хранения сессий, аналитики в режиме реального времени, обучения в machine learning и т.д.
Программа
1. Примеры использования Redis
2. Устройство и создание кластера
3. Подключение к кластеру
4. Ограничения кластера
5. Подключение приложения к Redis
6. Инструменты администрирования облачных баз данных
Вы узнаете, как Redis работает в связке с выделенными и облачными серверами, кластерами Kubernetes и облачными базами данных MySQL и PostgreSQL. А еще, почему Redis лучше не использовать как единственное хранилище данных.
Бонус
Участники получат бесплатный доступ к бета-тесту баз данных Redis от Selectel.
Вебинар «Интернет-магазин в облаке: c 0 до Aliexpress. Часть 2» 30 октября от Mail.ru Group
Сезонные всплески спроса, хорошая статья на хабре, «черная пятница» — интернет-магазину всегда нужно быть начеку, чтобы лавинообразная нагрузка не застала врасплох и поток заказов был быстро обработан. В первой части вебинара мы рассказали, как быстро запустить свой интернет-магазин «из коробки» или развернуть его на базе инфраструктурных сервисов (IaaS).
30 октября приглашаем вас принять участие в вебинаре «Интернет-магазин в облаке: с 0 до Aliexpress. Часть 2», где мы покажем, как с помощью платформенных сервисов (Kubernetes как сервис, управляемых баз данных, сервиса по работе с большими данными) обеспечить отказоустойчивость и масштабируемость, снизить нагрузку на основные OLTP базы данных ваших приложений, реализовать процесс change data capture, построить ETL/ELT пайплайны, а также реализовать платформу для работы ваших аналитиков. Присоединяйтесь!
Состоялся выпуск библиотеки встраиваемой СУБД libmdbx 0.9.3
На прошлой неделе разработчики отчитались о релизе новой версии высокопроизводительной встраиваемой СУБД libdbx v. 0.9.3. База данных относится к классу компактных БД "ключ-значение". Код libmdbx распространяется под лицензией OpenLDAP Public License.
C 2016 года проект финансируется компанией Positive Technologies, а c 2017 года активно используется в ее продуктах.
Курс «PostgreSQL: replication, backup and observability». Старт 6 апреля
Потеря данных или их недоступность — это всегда больно. А времени на поиск решений, анализ, тестирование идей по улучшению инфраструктуры не хватает, потому что надо поддерживать текущие процессы.
Мы собрали информацию и опыт в учебную программу, которая закроет три основных блока вопросов по работе с PostgreSQL.
Курс поможет сэкономить время на генерации идей, поиске информации. Рассмотрим архитектурные решения и вместе с преподавателем внедрим их в тестовой среде.
Вебинар «Всё для быстрого старта проекта на Managed-базах данных» 27 апреля
Часто уже на самом старте проекта важно определиться с правильным типом СУБД под задачи и учесть нюансы архитектуры решения, чтобы заложить надежную и мгновенно масштабируемую инфраструктурную основу для полной реализации растущего потенциала вашего приложения или сервиса.
27 апреля (вторник) присоединяйтесь к вебинару «Всё для быстрого старта проекта на Managed-базах данных», где мы сформируем базовые представления о работе с облачными базами данных и обсудим, как выбрать подходящий инструмент в зависимости от особенностей ИТ-инфраструктуры и специфики задач. Присоединяйтесь!
ClickHouse от Яндекса вошла в топ-50 самых популярных в мире СУБД
Распределенная система управления базами данных ClickHouse от Яндекса впервые оказалась в топ-50 самых популярных в мире СУБД по версии DB-Engines Ranking. ClickHouse расположилась на 49-й строчке рейтинга.
Mail.ru Cloud Solutions открывает доступ к Arenadata DB Cloud версии Enterprise
Облачная платформа Mail.ru Cloud Solutions (MCS) расширяет сотрудничество с компанией Arenadata, российским разработчиком платформы сбора и хранения данных. На платформе MCS стала доступной облачная аналитическая база данных Arenadata DB на базе Greenplum в версии Enterprise. Пользователи платформы смогут бесплатно протестировать новое решение в течение трех месяцев.
Приглашаем на трек Arenadata в онлайн-школу для разработчиков в Open Source
До 13 августа 2021 года идет набор в бесплатную онлайн-школу для желающих начать работу в Open Source — «Community of Open Source Newcomers» (COMMoN), организованную в рамках конференции Samsung Open Source Conference Russia 2021.
Проект направлен на то, чтобы помочь молодым разработчикам начать свой путь контрибьютора. Школа даёт уникальный опыт взаимодействия с сообществом разработчиков открытого ПО и шанс сделать свой первый коммит в серьёзный Open Source-проект.
Формат онлайн-школы включает лекции для общего потока и работу в рамках конкретного направления (трека). В каждый трек набирают группу до 20 человек.
Вместе с преподавателем участники пройдут путь с нуля до вклада в реальный проект. В финале студенты защищают выпускную работу, направленную на решение практически значимой задачи конкретного проекта с открытым кодом. Авторы лучших работ получат награды от компаний-партнеров треков.