Search results for «[nosql]» / Habr

Publications Hubs Companies Users Comments

akomiagin Mar 12 at 10:48

Квест по синхронизации аналитического и оперативного хранилищ в реальном времени без потерь на сотнях терабайт данных

Medium

12 min

2.1K

STM Labs corporate blogHigh performance*MongoDB*Data storage*

Case

Я работаю в компании STM Labs, где мы строим большие высоконагруженные системы класса Big Data. Эта статья написана по мотивам моего выступления на конференции Saint Highload 2023. Хочу рассказать вам увлекательную историю про то, как мы искали лучшее решение по синхронизации аналитического и оперативного хранилищ в реальном времени. Нам важно было сделать это без потерь, потому что на кону стояли сотни и более терабайт данных.

Сразу обозначу, чего в этой статье не будет:

• Я не буду подробно говорить о типах СУБД и их различиях.
• Я не буду делать обзор аналитических СУБД. Тут каждый выбирает сам.
• Я не буду подробно останавливаться на архитектуре, отказоустойчивости и масштабировании СУБД MongoDB.
• Я не буду делать обзор отличий OLAP и OLTP.
• Я не буду делать обзор и сравнение реализаций CDC в различных СУБД.

EugeneUshakov Mar 15 at 00:34

Использование Redis почти как SQL БД: Реализация чата с кешированием сообщений

Medium

10 min

8.5K

SQL*NoSQL*

From sandbox

Допустим, мы хотим создать чат и хранить сообщения для него. Вполне возможно, мы можем добавить для этого простую базу данных (БД), такую как MySQL или даже NoSQL БД.

Обычно многие используют Redis как key‑value (dictionary) хранилище. Тем не менее, Redis — это несколько большее, чем key‑value, как многие привыкли думать.

angeloffy Mar 27 at 13:15

Развитие баз данных

Easy

7 min

5.4K

SQL*Data storage*History of IT

From sandbox

В 60-х годах прошлого века возникла потребность в надежной модели хранения и обработки данных, особенно важной для банков и финансовых организаций. В то время отсутствовали единые стандарты работы с данными и моделями, и вся работа сводилась к ручной упорядоченной организации информации. Банкам удавалось записывать информацию о транзакциях в виде файлов в заранее подготовленную структуру, причем у каждой организации было собственное представление о том, как это должно выглядеть и функционировать. Также отсутствовали понятия консистентности (согласованности данных) и целостности данных. В таких файлах часто встречались дубликаты клиентов и их транзакций, которые приходилось уточнять и приводить в порядок вручную.

Данная статья захватывает ключевые моменты в развитии систем управления базами данных, от первых иерархических моделей до современных реляционных, NoSQL и NewSQL систем.

ITSumma Jul 1 2020 at 12:59

Создатель СУБД Redis уходит от сопровождения проекта

3 min

10K

ITSumma corporate blogOpen source*NoSQL*

Создатель опенсорсной системы управления базами данных Redis Сальваторе [antirez] Санфилиппо объявил, что прекращает единоличное сопровождение проекта и передаёт его сообществу.

«Когда я начал проект Redis более десяти лет назад, это был один из самых захватывающих моментов моей карьеры, — пишет Сальваторе. — Мой соучредитель и я успешно запустили два основных сервиса web 2.0 в итальянской сети. Чтобы сделать их масштабируемыми, нам пришлось изобрести много новых концепций, которые в большинстве случаев уже были известны в этой области, но мы не знали, да и не хотели проверять. Проблема? Давайте найдем решение. Мы хотели решать проблемы, но ещё больше — получать удовольствие. Это была игровая среда, в которой родился Redis».

Сейчас всё изменилось.

В наше время Redis больше не игрушка, а серьёзная технология, которая обеспечивает работу многих важных продуктов. В июне 2015 года для коммерциализации Redis была основана компания Redis Labs, куда перешёл Санфилиппо.

Читать дальше →

+31

Polina_Averina Feb 18 2021 at 15:01

Cassandra Day Russia 2021: онлайн-конференция 27 марта

1 min

1.7K

Слёрм corporate blogNoSQL*Database Administration*Apache*Big Data*

Что объединяет Apple, Netflix, Huawei и Instragram? Не только миллиарды запросов, петабайты данных и пользователи по всему миру. Все эти компании используют распределённую NoSQL базу данных Apache Cassandra.

Приглашаем на однодневную онлайн-конференцию Cassandra Day Russia 2021 в субботу 27 марта. Опытные NoSQL специалисты расскажут о возможностях одной из самых мощных баз данных современности и поделятся практическим опытом управления СУБД Cassandra.

Читать дальше →

+14

Verovir Sep 16 2021 at 13:12

Укротителям слонов: 30 сентября пройдёт PGConf.NN

1 min

521

PostgreSQL*SQL*Data storage*

30 сентября 2021 года в Нижнем Новгороде пройдёт PGConf.NN – техническая конференция по СУБД PostgreSQL, организованная компанией Postgres Professional при активной поддержке партнера соорганизатора – ассоциации IT-компаний iCluster.

Участие бесплатное.

А что там будет?

avtozavodetz Jun 22 2023 at 12:00

Как вывести миллиарды ключей из ScyllaDB

Medium

9 min

2.3K

STM Labs corporate blogHigh performance*Big Data*Data storage*Data storages*

Case

Мечтал ли я когда-либо ворочать миллиардами? Честно признаюсь, да. И нельзя сказать, что Вселенная меня не услышала. Вот только я никак не имел в виду миллиарды записей в базе данных...

Ранее я уже писал о нашем опыте использования ScyllaDB в качестве архивного хранилища. Разумеется, исследования и открытия, связанные с новой базой данных, для нас на этом не закончились... Создавая архив для данных, вероятность обращения к которым близка к нулю, мы, конечно, допускали, что время от времени клиенты будут просить вернуть данные обратно в оперативное хранилище. Но запрос на извлечение из архива сразу всех записей стал для нас неожиданностью. Хорошо ещё, что клиента интересовал только ключ записи, а не вся запись целиком. Тем не менее достать 10 млрд. ключей из ScyllaDB за приемлемое время звучало как челлендж. Ну надо так надо.

+15

incubos Jul 21 2023 at 10:13

Создание, тестирование и обслуживание распределённых веб-сервисов: новая магистерская программа VK Education и ИТМО

Easy

4 min

1.8K

VK corporate blogSystem Analysis and Design*Studying in ITIT career

Всем привет! Я Вадим, главный инженер технологической платформы VK и академический руководитель новой магистерской программы VK Education и ИТМО «Распределëнные веб‑сервисы».

В этой статье я хочу рассказать, почему мы открываем эту программу вместе с ИТМО.

+14

randall Jul 28 2023 at 12:40

Сто первое руководство по мониторингу метрик в Redis

Easy

7 min

3.5K

CloudMTS corporate blogМТС corporate blogNoSQL*Database Administration*Data storage*

Review

Translation

Жизненно важно отслеживать проблемы с производительностью Redis. Для этого инструмента характерна низкая задержка отклика при обслуживании многочисленных запросов. Есть определенные ключевые метрики, которые можно отслеживать для контроля за производительностью вашего экземпляра Redis. В этой статье мы пройдемся по этим метрикам и рассмотрим способы их сбора с помощью встроенных в Redis инструментов.

Читать дальше →

+13

qiwi_k Aug 1 2023 at 10:00

Отранжированные и смешные: создаем систему выстраивания пользовательской ленты

Medium

17 min

2.3K

Ozon Tech corporate blogProgramming*System Analysis and Design*NoSQL*Go*

Tutorial

Всех приветствую! Меня зовут Кирилл, я Go-разработчик в компании Ozon. Сейчас моим полем деятельности является разработка микросервисов в департаменте Fresh, однако я также успел принять участие в некоторых других интересных проектах.

Сегодня мне бы хотелось поговорить с вами о ранжировании информации для её последующей выдачи в пользовательскую ленту. Предлагаю поговорить о самом термине «ранжирование», а ещё об использовании этого процесса в современных информационных системах. Во время обсуждения я набросаю простую схему ранжирования внутри продукта, выбранного в качестве примера, а также поделюсь некоторыми примерами из опыта построения подобной системы.

Shyhartskoi Nov 2 2022 at 11:31

Как ускорить базу данных при помощи шардирования

14 min

23K

Timeweb Cloud corporate blogHigh performance*IT Infrastructure*Data storage*Data storages*

Translation

Шардирование было одним из первых механизмов, позволяющих распределять базы данных для повышения их производительности. Последние инновации превратили шардирование в один из лучших механизмов в своем роде.

Сегодня базам данных уделяется особое внимание, так как через них компания управляет своим самым ценным архивом: информацией. Всего 30 лет назад большинство данных хранилось на бумаге, магнитной ленте или каких-либо дисках. Поскольку мы производили и потребляли гораздо меньше данных на душу населения, даже на таких носителях нам удавалось эффективно хранить их, управлять ими и обращаться к ним.

Но сегодня с данными складывается совершенно иная ситуация. Смартфоны распространились повсеместно и превратились в необходимую вещь. Вместе со смартфонами увеличилось количество мобильных приложений, и сегодня через них производятся и потребляются такие объемы данных, какие были просто немыслимы 15 лет назад. В такой ситуации серьезно возрастает нагрузка на кластеры баз данных, поскольку им приходится обрабатывать все более серьезные объемы трафика. Некоторые из топовых веб-сайтов и веб-сервисов обрабатывают миллиарды посещений в неделю.

Как справиться с таким невероятным объемом трафика, поступающим в кластер базы данных?
Можно попробовать шардирование. Возможно, вы никогда и не слышали о таком подходе, либо по-быстрому отбраковывали его как старомодное решение, не отвечающее современным вызовам. Сам феномен «шардирования баз данных» едва ли сулит полный набор примочек, какими могли бы похвастаться другие решения, но этот подход определенно эффективен и практичен.

Читать дальше →

+16

mayo889 Nov 14 2022 at 00:00

Apache Cassandra: механизмы репликации и поддержания согласованности

5 min

5.9K

NoSQL*Distributed systems*

From sandbox

Apache Cassandra - это распределенная NoSQL база данных. В этой статье будут описаны основные механизмы передачи, репликации и поддержания согласованности данных внутри сети.

+12

devalio Nov 25 2022 at 17:01

CAP двенадцать лет спустя: как изменились «правила»

23 min

6.1K

Timeweb Cloud corporate blogHigh performance*Programming*System Analysis and Design*Distributed systems*

Translation

Эта статья впервые появилась в журнале Computer и подготовлена InfoQ & IEEE Computer Society.

Теорема CAP гласит, что любая сетевая система с общими данными может иметь только два из трех желаемых свойств. Однако, работая непосредственно с разделениями, разработчики могут оптимизировать согласованность и доступность, тем самым достигая некоторого компромисса между всеми тремя.

За десятилетие, прошедшее с появления теоремы, разработчики и исследователи использовали теорему CAP (а иногда и злоупотребляли ею) как повод для изучения широкого спектра новых распределенных систем. Движение NoSQL также использовало её в качестве аргумента против традиционных баз данных.

В теореме CAP говорится, что любая сетевая система с общими данными может иметь не более двух из трех желаемых свойств:

согласованность (С), эквивалентная наличию единственной актуальной копии данных;
высокая доступность (A) этих данных (для обновлений); и
устойчивость к сетевым разделениям (P).

Такое толкование CAP помогало разработчикам быть открытыми для более широкого диапазона систем и компромиссов; действительно, за последнее десятилетие возникло множество новых систем и много споров об относительных достоинствах согласованности и доступности. Формулировка «2 из 3» всегда вводила в заблуждение, поскольку имела тенденцию чрезмерно упрощать противоречия между свойствами. Но сейчас такие тонкости имеют значение. CAP запрещает лишь крошечную часть проектного пространства: идеальная доступность и согласованность при наличии разделений, которые встречаются редко.

Читать дальше →

+10

Pyrus Feb 14 2019 at 21:00

Масштабирование БД в высоконагруженных системах

9 min

32K

High performance*Programming*SQL*Cloud computing*NoSQL*

На прошлом внутреннем митапе Pyrus мы говорили о современных распределенных хранилищах, а Максим Нальский, CEO и основатель Pyrus, поделился первым впечатлением от FoundationDB. В этой статье рассказываем о технических нюансах, с которыми сталкиваешься при выборе технологии для масштабирования хранения структурированных данных.

Когда сервис недоступен пользователям какое-то время, это дико неприятно, но всё же не смертельно. А вот потерять данные клиента — абсолютно недопустимо. Поэтому любую технологию для хранения данных мы скрупулезно оцениваем по двум-трем десяткам параметров.

Читать дальше →

+17

Pyrus Feb 22 2019 at 20:05

Первый взгляд на FoundationDB, открытую Apple

9 min

18K

High performance*Programming*Cloud computing*NoSQL*Database Administration*

В прошлой статье мы рассматривали ограничения и препятствия, которые возникают, когда нужно горизонтально масштабировать данные и иметь гарантию ACID-свойств транзакций. В этой статье рассказываем о технологии FoundationDB и разбираемся, как она помогает преодолеть эти ограничения при разработке mission-critical приложений.

FoundationDB — это распределенная NoSQL база данных с ACID-транзакциями уровня Serializable, хранящая отсортированные пары ключ-значение (ordered key-value store). Ключами и значениями могут быть произвольные последовательности байт. У неё нет единой точки падения — все машины кластера равноправны. Она сама распределяет данные по серверам кластера и масштабируется на лету: когда в кластер нужно добавить ресурсов, ты просто добавляешь адрес новой машины на конфигурационных серверах и база сама подхватывает ее.

Читать дальше →

+34

m1rko Mar 31 2019 at 21:50

Была ли MongoDB вообще правильным выбором?

7 min

33K

MySQL*SQL*NoSQL*Data storages*

Translation

Недавно я узнал, что Red Hat удаляет поддержку MongoDB из Satellite (говорят, из-за изменений лицензии). Это заставило меня задуматься, что в последние несколько лет я видел кучу статей, как ужасна MongoDB и что никто никогда не должен её использовать. Но за это время MongoDB стала гораздо более зрелым продуктом. Что же случилось? Действительно ли вся ненависть объясняется ошибками в начале маркетинга новой СУБД? Или люди просто применяют MongoDB не там, где нужно?

Если вам вдруг кажется, что я защищаю MongoDB, пожалуйста, прочитайте дисклеймер в конце статьи.

Читать дальше →

+37

KraisLi Oct 31 2019 at 23:08

Редактор блок схем — о дружбе Vue.js и MxGraph

3 min

14K

Website development*JavaScript*NoSQL*Data visualization*VueJS*

From sandbox

С чего все началось?

Я фронтенд разработчик, но стремлюсь к развитию, решил написать fullstack приложение и ~~стать миллионером~~ получить бесценный опыт.

Так вот, начал планировать бэкенд, выбрал MongoDB для хранения данных, и был готов планировать структуру и связи полей.

Но столкнулся с отсутствием простого и достаточно функционального редактора схем без излишеств для NoSQL баз данных.

— Нет? Значит сделаю делов то, найти библиотеку и накидать интерфейс!
Fullstack идея была отодвинута на задний план и я начал проработку простейшего редактора схем БД.
— Наивный… – но это я понял немного позднее.

Читать дальше →

+22

sahsAGU Dec 3 2019 at 10:00

6 самых свежих курсов по Azure

4 min

18K

Microsoft corporate blogCloud computing*Microsoft Azure*Studying in ITCloud services*

Привет, Хабр! Ранее мы опубликовали уже 3 статьи из 5 в нашей серии подборок интересных учебных курсов от Microsoft. Сегодня – уже четвертая часть, и в ней мы расскажем про самые свежие курсы по облаку Azure.

Кстати!

Все курсы бесплатные (вы даже сможете попробовать платные продукты бесплатно);
5/6 на русском языке;
Начать обучение можно мгновенно;
По окончании вы получите бейдж об успешном прохождении обучения.

Присоединяйтесь, подробности под катом!

Новая серия статей

8 самых новых курсов Microsoft Learn

10 бесплатных курсов для начинающих специалистов

10 бесплатных курсов для продвинутых специалистов

Следующая серия статей, начало 2020 года

5 бесплатных курсов для ИИ-инженеров

6 бесплатных курсов для безопасников

7 бесплатных курсов для специалистов по работе с данными (Data-Science и Data-Engineering)

Эта серия статей, 2019 год

7 бесплатных курсов для разработчиков

5 бесплатных курсов для IT-Администраторов

7 бесплатных курсов для архитекторов решений

6 самых свежих курсов по Azure

10 самых популярных курсов Microsoft на русском

Читать дальше →

+18

andreios Feb 6 2020 at 11:25

KeyDB как [потенциальная] замена Redis

6 min

34K

Флант corporate blogOpen source*System administration*NoSQL*Database Administration*

На хабре не нашлось обзоров «более быстрой альтернативы Redis» — KeyDB. Получив достаточно свежий опыт его использования, хочется восполнить этот пробел.

Предыстория достаточно банальна: однажды с большим наплывом трафика была зафиксирована значительная деградация производительности приложения (а именно — времени ответа). На тот момент, к сожалению, не удалось провести нормальную диагностику происходящего, поэтому впоследствии запланировали ряд нагрузочных тестирований. После их проведения удалось обнаружить узкое место, коим стал кэш базы данных в Redis. Как это часто бывает, проблему нельзя было решить сию секунду и правильным путём — силами разработчиков (изменением логики работы). Поэтому включилось любопытство и желание побороть ситуацию обходным путём. Так и появилась эта статья.

Читать дальше →

+76

vmrm Feb 19 2020 at 13:35

Одна история с оператором Redis в K8s и мини-обзор утилит для анализа данных этой БД

17 min

14K

Флант corporate blogNoSQL*Database Administration*DevOps*Kubernetes*

Что будет, если использовать всем известное in-memory-хранилище ключей и значений в качестве персистентной базы данных, не используя TTL? А если оно запущено с помощью надёжного, казалось бы, оператора в Kubernetes? А если в процессе увеличения реплик Redis мы внесём ещё одно маленькое и безобидное изменение?.. Отвечая на эти вопросы в данной статье, мы попутно расскажем, какие утилиты помогут найти пути к оптимизации размеров большой БД в Redis.

Проблемный кейс

Redis у нас используется внутри кластера Kubernetes в разных проектах. Для удобства управления и применения единых практик в рамках компании мы остановились на операторе от Spotahome. По нашему опыту, это наиболее стабильный вариант, хотя и у него есть свои проблемы, некоторые из которых будут затронуты далее в статье.

Читать дальше →

+46

2 3 ...

20 21