NoSQL *

Не только SQL

СтатьиПостыНовостиАвторыКомпании

not_bad 21 июл 2021 в 10:20

Начало работы с MongoDB и Redis на Rust

13 мин

12K

MongoDB*NoSQL*Rust*Базы данных*

Туториал

В этой статье будет показано как создать Rust бэкэнд, который использует MongoDB, документо-ориентированную БД, для хранения данных и Redis для кэширования, ограничения количества HTTP запросов и нотификаций пользователя. Для большей наглядности созданное приложение также будет предоставлять REST API. В итоге будет получена следующая архитектура:

architecture

MongoDB является хранилищем, в то время как Redis используется для следующего:

кэш (включая изображения)
ограничение количества HTTP запросов
нотификации с использованием паттерна publish-subscribe

Читать дальше →

+12

genaev 2 июл 2021 в 05:30

Гибридное использование RDBMS и NoSQL подходов для обработки транскриптомных данных

15 мин

1.6K

PostgreSQL*SQL*NoSQL*Биотехнологии

Эксперимент по секвенированию транскриптома (RNA-seq) стал практически рутинной процедурой для изучения как модельных организмов, так и для сельскохозяйственных культур. В результате биоинформатической обработки таких экспериментов получаются объемные разнородные данные, представленные нуклеотидными последовательностями транскриптов, аминокислотными последовательностями и их структурно-функциональной аннотацией. Полученные данные важно представить широкому кругу исследователей в виде баз данных (БД). В публикации мы рассмотрим гибридный подход к созданию молекулярно-генетических баз данных, которые содержат информацию о последовательностях транскриптов и их структурнофункциональной аннотации. Сущность подхода в одновременном хранении в БД информации как структурированного типа, так и слабо структурированных данных. Технология использована для реализации БД транскриптомов сельскохозяйственных растений. В публикации рассматриваются особенности реализации такого подхода и примеры формирования как простых, так и сложных запросов к такой базе данных на языке SQL. Данная статья является укороченным пересказом нашей работы doi: 10.17537/2020.15.455 в которой я являюсь соавтором.

-1

kuderr 24 июн 2021 в 19:00

Знакомство с ArangoDB

4 мин

12K

NoSQL*Базы данных*Поисковые технологии*Программирование*

Из песочницы

ArangoDB – мультимодельная БД с возможностью хранения данных как графов, документов и ключ-значение.

MagisterLudi 15 июн 2021 в 11:29

А нужен ли Redis или хватит PostgreSQL

3 мин

20K

Блог компании Timeweb CloudБазы данных*PostgreSQL*Open source*NoSQL*

Перевод

Есть проверенная архитектура, которую я видел много раз для поддержки ваших веб-сервисов и приложений:

PostgreSQL для хранения данных
Redis для координации очередей фоновых заданий (и некоторых ограниченных атомарных операций)

Redis — это фантастика, но что, если бы я сказал вам, что его наиболее распространенные варианты использования этого стека на самом деле могут быть достигнуты с использованием только PostgreSQL?

Сценарий 1: очередь заданий

Пожалуй, наиболее частое использование Redis, которое я видел, — это координация отправки заданий из вашего веб-сервиса в пул фоновых воркеров. Идея состоит в том, что вы хотите записать желание выполнить какое-то фоновое задание (возможно, с некоторыми входными данными) и гарантировать, что только один из многих ваших фоновых воркеров выполнит его. Redis помогает в этом, поскольку предоставляет богатый набор атомарных операций для своих структур данных.

Читать дальше →

+23

Polina_Averina 21 мая 2021 в 09:40

Разработка производительной модели обработки данных для Cassandra

17 мин

6.7K

Блог компании СлёрмБазы данных*NoSQL*Big Data*Apache*

В DataStax работают над созданием производительной модели данных для Apache Cassandra. В чём заключается эта работа и как её делать правильно, на конференции Cassandra Day Russia 2021 рассказал Артём Чеботко, Solutions Architect в DataStax.

Речь пойдет о разработке производительной модели данных для Apache Cassandra. Над этой задачей я долгое время работаю в DataStax. Есть довольно большое количество проектов и use cases, в которых нужна была производительная модель данных. Мы поговорим о методологии и как это сделать правильно.
Начнем с более простых вещей. Обсудим, как Cassandra хранит данные, чтобы понимать, на что нужно особенно обращать внимание. Потом обсудим методологию. Здесь также есть 3 примера, о которых я хотел бы поговорить. Они разные, в них есть разные оптимизации, которые можно обсудить.

Читать дальше →

lartie 19 мая 2021 в 10:09

Как ухаживать за грядкой Redis'а и как сохранить урожай?

10 мин

16K

Блог компании СитимобилOpen source*NoSQL*Базы данных*

Технотекст 2021

Чуть более года назад мне посчастливилось погрузиться в углублённое изучение Redis. Всё, что я знал про него на тот момент, это две команды — get и set. Примерно в это же время у нас начался плавный переход со Standalone Redis на Redis Cluster.

Почитать про переход на кластер можно тут, а сегодня я хочу рассказать о том, что я узнал, о проблемах, которые могут возникнуть, как их отлавливать и что со всем этим делать.

+21

MaxRokatansky 18 мая 2021 в 13:49

Иерархия потребностей по Маслоу при разработке документации

8 мин

8.6K

Блог компании OTUSMongoDB*NoSQL*

Перевод

В 1943 году психолог Абрахам Маслоу опубликовал свою знаменитую работу, в которой выделил пять категорий потребностей, мотивирующих человека: физиологические потребности, потребность в безопасности, потребность в принадлежности и любви, потребность в уважении и потребность в самоактуализации.

Сегодня эта теория известна под названием «Иерархия потребностей» и, как правило, изображается в виде пирамиды. Основная идея заключается в том, что человек начинает испытывать потребности более высокого уровня только после удовлетворения потребностей нижних уровней.

exmachine 13 мая 2021 в 06:18

Ровняем шарды

12 мин

3.4K

NoSQL*MongoDB*Базы данных*Хранение данных*

"Размышления без практики приводят к заблуждению, практика без размышления приводит к затруднению."

Мы ведём войну с индивидуальностью у шардов в кластере MongoDB. Это продолжение статьи Шардинг от которого невозможно отказаться, а это значит, что наступила пора конкретики.

Как я и обещал, здесь мы рассмотрим подробнее:

настройку процесса выравнивания размера шардов
расчет поправок для коррекции границ
мониторинг распределения данных в коллекциях

Читать дальше →

+11

MaxRokatansky 12 мая 2021 в 16:54

Atlas как сервис

5 мин

3.3K

Блог компании OTUSNoSQL*MongoDB*

Перевод

Многие наши клиенты предоставляют своим командам разработчиков доступ к MongoDB как к сервису. Разработчики могут запросить экземпляр базы данных MongoDB и получить строку для подключения и учетные данные за считаные минуты. Переходя на использование MongoDB Atlas, наши клиенты заинтересованы и в том, чтобы дать своим разработчикам соответствующий уровень обслуживания.

В Atlas есть очень мощный уровень управления для предоставления кластеров. Однако в крупных организациях, где работают тысячи разработчиков, не всегда целесообразно предоставлять такому количеству людей прямой доступ к этому интерфейсу. Цель этой статьи — показать, как можно использовать API-интерфейсы Atlas для предоставления доступа к MongoDB как к сервису, когда MongoDB работает под управлением Atlas.

В частности, мы продемонстрируем способ создания интерфейса, предлагающего разработчикам набор вариантов для создания экземпляра базы данных MongoDB. Чтобы упростить себе задачу, рассмотрим, как предоставить разработчикам набор вариантов памяти и хранилища для настройки кластера. Прочие параметры, например выбор провайдера облачных услуг и региона, мы рассматривать не будем. Мы также расскажем о том, как добавлять метки к кластерам Atlas, так как эта функция не поддерживается в пользовательском интерфейсе Atlas. Для примера мы добавили метку для описания кластера.

Polina_Averina 7 мая 2021 в 06:50

Cassandra в Yelp

12 мин

3.3K

Блог компании СлёрмБазы данных*NoSQL*Big Data*Apache*

Yelp — это крупнейшее в США приложение для заказа еды и услуг. Оно установлено более чем на 30 млн. уникальных устройств, в нём зарегистрировано более 5 млн. компаний. Для хранения и доступа к данным в Yelp используют Cassandra. Как и для каких задач применяется эта база данных, на конференции Cassandra Day Russia 2021 рассказал Александр Широков, Database Reliability Engineer в Yelp.

Читать дальше →

+12

beneton2003 30 апр 2021 в 08:18

Clarion — Язык программирования, про который все забыли. А мне пришлось вспомнить

3 мин

16K

NoSQL*Компиляторы*Ненормальное программирование*Windows*

Из песочницы

В своем первом посте я хочу рассказать об одном из самых редких и старых языков программирования - Clarion. Я знаком со всей линейкой этих замечательных языков начиная с 2.1 далее 5.0, 6.0, 6.3, 8 и до 9.1 по текущий момент. Буду постепенно рассказывать общие детали данной технологии, мало кому может оказаться полезным, но крайне мало инфы об этой технологии в Рунете, поэтому хочу чтобы осталась память о данной технологии на просторах Сети.

Мое первое "соприкосновение" произошло примерно 13-14 лет (98-99), когда я, по воле случая, познакомился с программистом на работе у родителей. Это был бородатый дядька по имени Евгений Иванович. Меня сразу же завлекли его беседы про Базы данных, операторы, переменные, функции...

+13

exmachine 22 апр 2021 в 07:12

Шардинг, от которого невозможно отказаться

13 мин

24K

NoSQL*MongoDB*Базы данных*Хранение данных*

А не пора ли нам шардить коллекции?
Не-е-е:

у нас нет времени, мы пилим фичи!
CPU занят всего на 80% на 64 ядерной виртуалке!
данных всего 2Tb!
наш ежедневный бекап идет как раз 24 часа!

В принципе, для большинства проектов вcё оправдано. Это может быть еще прототип или круг пользователей ограничен… Да и не факт, что проект вообще выстрелит.
Откладывать можно сколько угодно, но если проект не просто жив, а еще и растет, то до шардинга он доберется. Одна беда, обычно, бизнес логика не готова к таким "внезапным" вызовам.
А вы закладывали возможность шардинга при проектировании коллекций?

Эта статья для продвинутых разработчиков.
Для тех, кто планирует шардинг своего кластера.
Для тех, кто уже шардировал кластер ранее, но админы все еще плачут.
Для тех, кто руками перемещал jumbo-чанки.

Сначала, мы будем учится жить со слонами.
Потом, мы их победим, но не сможем вернуться назад.

Читать дальше →

+18

michael-filonenko 1 апр 2021 в 14:04

Tarantool vs Redis: что умеют in-memory технологии

15 мин

40K

Блог компании VKNoSQL*Tarantool*Базы данных*

В этой статье я хочу сравнить Redis и Tarantool. У меня нет цели сделать громогласный вывод «Tarantool лучше!» или «Redis круче!». Я хочу понять их сходства и отличия, разобраться, для каких задач какую технологию выбрать. Потому что это очень близкие на первый взгляд вещи, и вопросы про их отличия я вижу часто.

Для этого мы посмотрим на технологии в трёх частях:

Вначале посмотрим глазами новичка. Что такое БД в памяти? Какие задачи они решают лучше дисковых БД?
Потом посмотрим архитектурно. Как обстоит вопрос с производительностью, надёжностью, масштабированием?
В третьей части лезем в технические вещи поглубже. Типы данных, итераторы, индексы, транзакции, ЯП, репликация, коннекторы.

Смело переходите сразу к наиболее интересной вам части. Или даже сразу к итоговой табличке сравнения, которую я прикладываю в заключении.

Поехали!

Читать дальше →

+65

pxeno 31 мар 2021 в 08:28

Эксплуатационный чек-лист для Redis в Kubernetes

7 мин

9.9K

Блог компании VKDevOps*Kubernetes*NoSQL*Базы данных*

Перевод

Команда Kubernetes as a Service в Mail.ru Cloud Solutions перевела контрольный список для запуска Redis внутри кластера Kubernetes. С ним стоит ознакомиться до того, как перейти к использованию Redis под рабочей нагрузкой.

Redis — популярное in-memory хранилище данных и кэш с открытым исходным кодом. Этот продукт стал важным компонентом построения масштабируемых микросервисных систем. Многие облачные провайдеры предлагают полностью управляемые сервисы Redis: Amazon ElastiCache, Azure Cache for Redis, GCP Memorystore (и на платформе MCS тоже есть такой управляемый сервис — прим. переводчика). Однако Redis также можно легко развернуть в Kubernetes, если вам нужно полнее контролировать его конфигурации. Прямо из коробки у него уже достойная производительность, но если вы собираетесь использовать Redis с рабочей нагрузкой, то сначала проверьте, выполняются ли все пункты этого чек-листа.

Читать дальше →

+29

GalsSoftware 15 мар 2021 в 17:12

Elasticsearch: сайзинг шардов как завещал Elastic + анонс вебинара + предложения по митапу

5 мин

18K

Блог компании Gals SoftwareСистемное администрирование*NoSQL*IT-инфраструктура*Big Data*

Каждый индекс Elasticsearch состоит из шардов. Шарды — это логическое и физическое разделение индекса. В этой статье мы расскажем о сайзинге шардов Elasticsearch — важной его части, серьёзно влияющей на производительность кластера. В высоконагруженных системах выбор правильной конфигурации архитектуры хранения позволит серьёзно сэкономить на железе. Бóльшая часть статьи основана на соответствующем разделе документации Elastic. Подробности под катом.

Читать дальше →

apapacy 14 мар 2021 в 23:25

ArangoDB в реальном проекте

5 мин

14K

NoSQL*Node.JS*Веб-разработка*

ArangoDB мультимодельная (документная и графовая) база данных. К ее положительным сторонам относятся:

мощный и удобный язык запросов AQL
JOIN (даже более мощный чем в реляционных базах данных)
репликация и шардинг
ACID (в кластере работает только в платной версии)

Из менее существенных, но не менее удобных возможностей:

нечеткий поиск
встроенный в базу данных движок микросервисов Foxx
работа в режиме подписки на изменения в базе данных

Справедливости ради отмечу и недостатки:

отсутствие ODM
низкая популярность (в сравнении например с MongoDB)

После анализа возможностей ArangoDB и, в особенности, после преодоления в последних версиях недостатков (таких как резкое падение производительности при превышении размера коллекции доступной оперативной памяти) и появлении новых возможностей (таких как нечеткий поиск) — пришло время испытаний в реальном приложении.

Читать дальше →

Cloudera 5 мар 2021 в 09:02

Тестирование производительности HBase с помощью YCSB

8 мин

1.1K

Блог компании ClouderaNoSQL*Базы данных*Apache*Хранение данных*

Перевод

Тестирование производительности HBase с помощью YCSB

При запуске любого теста производительности (инструмента по бенчмаркингу) на кластере критично всегда то, какой именно будет использоваться набор данных, и здесь мы покажем, почему при запуске теста производительности HBase на кластере важно выбрать «хорошо соответствующий по объему» набор данных.

Polina_Averina 4 мар 2021 в 06:02

Что будет, если изменить количество виртуальных нод в Apache Cassandra

31 мин

3.1K

Блог компании СлёрмБазы данных*NoSQL*Big Data*Apache*

Перевод

В Apache Cassandra 4.0 будет новое значение по умолчанию для num_tokens! Звучит как незначительное изменение в CHANGES.txt, но по факту это серьезно повлияет на работу кластера. Как новое значение num_tokens скажется на кластере и его поведении?

От редакции: 27 марта приглашаем на открытую онлайн-конференцию Cassandra Day Russia 2021. В программе доклады и воркшопы. Материалы конференции подойдут как начинающим, так и опытным специалистам.

Читать дальше →

GalsSoftware 26 фев 2021 в 07:47

Определение объёма кластера Elasticsearch и тестирование производительности в Rally

7 мин

8.7K

Блог компании Gals SoftwareСофтИнформационная безопасность*NoSQL*Big Data*

В этой статье мы разберёмся с основными подходами к сайзингу Elasticsearch, покажем сравнения бенчмарков кластера при загрузке логов и метрик. А разница там заметная. Надеемся, вам это поможет с определением объёма кластера Elasticsearch и расшифровкой того самого «it depends».

В некотором роде, эта статья является продолжением нашей статьи о сайзинге на Хабре. Но здесь появились примеры из реальной жизни, поэтому если есть потребность в некоей преемственности, начните с той статьи, а уж потом возвращайтесь сюда. Под катом все подробности.

Читать дальше →

Polina_Averina 20 фев 2021 в 10:55

Apache Cassandra 4.0: бенчмарки

8 мин

4.4K

Блог компании СлёрмApache*Big Data*NoSQL*Базы данных*

Перевод

Apache Cassandra 4.0 приближается к бете (прим. переводчика: на текущий момент уже доступна бета 4, выпущенная в конце декабря 2020), и это первая версия, которая будет поддерживать JDK 11 и более поздних версий. Пользователей Apache Cassandra, очевидно, волнует задержка, так что мы возлагаем большие надежды на ZGC — новый сборщик мусора с низкой задержкой, представленный в JDK 11.

В JDK 14 он был выпущен уже в GA-версии, и нам было очень интересно оценить, насколько он подходит для кластеров Apache Cassandra. Мы хотели сравнить производительность Apache Cassandra 3.11.6 и 4.0 и проверить, подходит ли Shenandoah, сборщик мусора от Red Hat, для продакшена. Спойлер: Cassandra 4.0 значительно лучше по производительности сама по себе, а с новыми сборщиками мусора (ZGC и особенно Shenandoah) будет совсем хорошо.

Читать дальше →

1 2 3 4 5

7 8 ...

26 27

NoSQL *

Начало работы с MongoDB и Redis на Rust

Гибридное использование RDBMS и NoSQL подходов для обработки транскриптомных данных

Знакомство с ArangoDB

А нужен ли Redis или хватит PostgreSQL

Сценарий 1: очередь заданий

Разработка производительной модели обработки данных для Cassandra

Как ухаживать за грядкой Redis'а и как сохранить урожай?

Иерархия потребностей по Маслоу при разработке документации

Ровняем шарды

Atlas как сервис

Cassandra в Yelp

Clarion — Язык программирования, про который все забыли. А мне пришлось вспомнить

Шардинг, от которого невозможно отказаться

Tarantool vs Redis: что умеют in-memory технологии

Ближайшие события

Эксплуатационный чек-лист для Redis в Kubernetes

Elasticsearch: сайзинг шардов как завещал Elastic + анонс вебинара + предложения по митапу

ArangoDB в реальном проекте

Тестирование производительности HBase с помощью YCSB

Что будет, если изменить количество виртуальных нод в Apache Cassandra

Определение объёма кластера Elasticsearch и тестирование производительности в Rally

Apache Cassandra 4.0: бенчмарки

Вклад авторов