NoSQL *

Не только SQL

Статьи Посты Новости Авторы Компании

kubelet 3 апр в 11:06

В погоне за заменой Redis

11 мин

18K

Блог компании ФлантOpen source*NoSQL*Администрирование баз данных*Бизнес-модели*

Мнение

Перевод

21 марта Redis Ltd. объявила, что, начиная с Redis 7.4, ее «in-memory data store» будет выпускаться под несвободными лицензиями с доступным (source-available) исходным кодом. Новость малоприятная, но вполне ожидаемая. Необычно в этой ситуации обилие альтернатив для тех, кто хочет остаться со свободным ПО: есть как минимум четыре варианта замены, включая уже существующий форк под названием KeyDB и недавно анонсированный проект Valkey от Linux Foundation. Вопрос теперь в том, что предпочтут пользователи, провайдеры и создатели дистрибутивов Linux.

+35

RukInDaHouse 20 мар в 09:30

Дом, милый дом: нюансы работы с ClickHouse. Часть 1

Средний

12 мин

Блог компании NixysSQL*NoSQL*Администрирование баз данных*Сжатие данных*

Обзор

Всем привет, меня зовут Пётр, я инженер компании Nixys. На современных проектах используется огромное разнообразие баз данных: реляционные, ключ-значение, документоориентированные. Особое место среди них занимают колоночные базы данных, ярким представителем которых является ClickHouse. Это мощный инструмент, который способен обрабатывать миллиарды строк в секунду при минимальном времени ответа. Однако, для максимальной эффективности ClickHouse необходимо понимать ряд фундаментальных моментов для того, чтобы использовать его по назначению. В этой серии статей мы разберем особенности работы ClickHouse, которые помогут в выжимании максимума из этой базы. И сегодня начнём с фундаментальных теоретических моментов, чтобы составить максимально полное общее впечатление, которое поможет нам в дальнейшем.

+11

RukInDaHouse 2 ноя 2023 в 14:56

Это база: нюансы работы с Redis. Часть 1

Средний

15 мин

33K

Блог компании NixysСистемное администрирование*NoSQL*Администрирование баз данных*DevOps*

Обзор

Привет! Меня зовут Петр и мы в компании Nixys очень любим Redis. Эта база используется, если не на каждом нашем проекте, то на подавляющем большинстве. Мы работали как с разными инсталляциями Redis, так и с разными версиями, вплоть до самых дремучих, вроде 2.2. Несмотря на то, что в Интернете очень много статей и докладов по этой БД, мы в своей практике достаточно часто встречаемся с непониманием некоторых основных концепций Redis и со стороны разработчиков, и со стороны системных администраторов.

В серии статей я попытаюсь осветить неочевидные нюансы при работе с Redis и сегодня начну с основных концепций и понятий. А еще в конце статьи приведу небольшой чек-лист, который может помочь вам в оптимизации этого NoSQL решения.

+79

IrlkKvch 11 окт 2023 в 11:30

Используем Elasticsearch вместе со Spring Boot

Простой

20 мин

12K

Java*NoSQL*

Туториал

Из песочницы

Всем привет! Это моя первая статья на Хабре и в ней я хочу рассказать о том, как мы можем интегрировать Elasticsearch в наше Spring Boot приложение. Этот проект предназначен для ознакомления с технологиями и служит скорее шпаргалкой/пособием или же фундаментом для дальнейшего погружения в тему.

+10

gtkek 28 сен 2023 в 15:48

Основы полнотекстового поиска в ElasticSearch. Часть третья

Средний

4 мин

4.9K

Блог компании Sportmaster LabПоисковые технологии*IT-инфраструктура*NoSQL*

FAQ

Это третья и заключительная статья из цикла, в которой рассмотрим стандартную модель ранжирования документов в Elasticsearch.

После того как определено множество документов, которые удовлетворяют параметрам полнотекстового запроса, Elasticsearch рассчитывает метрику релевантности для каждого найденного документа. По значению метрики набор документов сортируется и отдается потребителю.

В Elasticsearch существует несколько моделей ранжирования документов. По умолчанию используется Okapi BM25.

+16

mrananyan 11 сен 2023 в 15:58

7 аргументов почему UUID лучше, чем автоинкрементные идентификаторы

Средний

3 мин

24K

Веб-разработка*SQL*NoSQL*API*Data Engineering*

Из песочницы

В мире баз данных идентификаторы имеют решающее значение для уникальной идентификации записей. Традиционно многие разработчики предпочитали автоматически увеличивающиеся целочисленные идентификаторы. Однако есть еще один вариант, который набирает популярность: универсально уникальные идентификаторы (UUID). В этой статье мы рассмотрим, почему UUID часто являются лучшим выбором по сравнению с автоматически увеличивающимися идентификаторами.

+10

sahsAGU 4 сен 2023 в 19:19

Как работает миграция между базами данных в реальном мире

Простой

7 мин

14K

SQL*NoSQL*Администрирование баз данных*Хранение данных*

Туториал

Перевод

Недавно по основной работе у меня появилась задача по изучению процесса миграции данных между базами. Решил поделиться с сообществом своими исследованиями в сфере миграции, полученными в рамках этой задачи.

В статье я рассмотрю: с чего начать миграцию, зачем нужна миграция, подход PoC и парадигмы баз данных, тестирование и стратегии миграции.

Подробнее о миграции

+18

gtkek 31 авг 2023 в 14:20

Основы полнотекстового поиска в ElasticSearch. Часть вторая

Средний

9 мин

12K

Блог компании Sportmaster LabПоисковые технологии*IT-инфраструктура*NoSQL*

FAQ

✏️ Технотекст 2023

Это вторая статья из цикла. В первой части я рассказывал про самые базовые понятия Elasticsearch. В этом же посте разберем устройство анализа текста и немного пощупаем полнотекстовый поиск.

Несколько слов про анализ текста

Анализ текста — процесс преобразования оригинального текста в структурированный формат, оптимизированный под эффективное хранение и быстрый поиск.

Мы уже познакомились с некоторыми типами Elasticsearch, но в этом разделе будем рассматривать только два — keyword и text. Тип text анализируется для полнотекстового поиска. Тип keyword преимущественно остается без изменений для точного поиска, сортировки и агрегации.

+26

gtkek 24 авг 2023 в 14:32

Основы полнотекстового поиска в ElasticSearch. Часть первая

Средний

5 мин

15K

Блог компании Sportmaster LabПоисковые технологии*IT-инфраструктура*NoSQL*Поисковая оптимизация*

FAQ

Привет! Меня зовут Глеб, я разработчик команды продукта «Сервис персонализации» в SM Lab. В цикле из трех постов я расскажу про основы полнотекстового поиска в Elasticsearch.

Данный цикл статей предназначен для всех, но будет особенно актуальным для тех читателей, кто только начинает свое знакомство с Elasticsearch. Я надеюсь, каждый из вас найдет что-то полезное для себя.

В первой части обсудим самые базовые понятия Elasticsearch. Во второй части разберем механизмы анализа текста и полнотекстового поиска. В заключительной части взглянем на стандартную модель ранжирования документов в Elasticsearch.

Итак, начнём с самых базовых понятий.

+21

randall 28 июл 2023 в 12:40

Сто первое руководство по мониторингу метрик в Redis

Простой

7 мин

3.5K

Блог компании CloudMTSБлог компании МТСNoSQL*Администрирование баз данных*Хранение данных*

Обзор

Перевод

Жизненно важно отслеживать проблемы с производительностью Redis. Для этого инструмента характерна низкая задержка отклика при обслуживании многочисленных запросов. Есть определенные ключевые метрики, которые можно отслеживать для контроля за производительностью вашего экземпляра Redis. В этой статье мы пройдемся по этим метрикам и рассмотрим способы их сбора с помощью встроенных в Redis инструментов.

Читать дальше →

+13

trublast 21 июл 2023 в 11:24

KeyDB и Redis: в поисках серебряной пули — in-memory replicated DB (Replicated IMDB)

Средний

19 мин

10K

Блог компании ФлантNoSQL*Администрирование баз данных*DevOps*Kubernetes*

Кейс

✏️ Технотекст 2023

На кластерах клиентов, которые мы обслуживаем, есть как «одноголовые» инсталляции Redis (обычно для кэшей, которые не страшно потерять), так и более отказоустойчивые решения — Redis Sentinel или Redis Cluster. По нашему опыту, во всех трех вариантах можно безболезненно переключиться с Redis на KeyDB и получить прирост производительности. Точнее, избавиться от бутылочного горлышка Redis в одно ядро. Хотя в новых версиях Redis(r) появилась обработка I/O в отдельных тредах, иногда этого бывает недостаточно.

В то же время, если мы хотим использовать отказоустойчивые решениями вроде Sentinel и Cluster, нам понадобится поддержка этих технологий на уровне библиотеки, которую приложение использует для подключения в Redis. Причем лишь немногие библиотеки умеют читать из реплик Redis — в обоих вариантах (Sentinel и Cluster) чтение, как правило, происходит с мастеров. И запись, естественно, тоже происходит в мастеры.

В итоге у нас есть несколько реплик довольно дорогого in-memory-хранилища, а в рабочем процессе используется только часть из них. Остальные — на подхвате. Хотя в большинстве кейсов операции с in-memory NoSQL DB — это именно операции чтения.

Однако если посмотреть в сторону KeyDB, то можно увидеть, что там есть киллер-фича — и даже две: я говорю о режимах Active Replica и Multi-Master. Использование этих режимов позволяет получить распределенный отказоустойчивый KeyDB, совместимый с Redis, писать в любую ноду, читать из любой ноды. И все это с точки зрения приложения выглядит как один экземпляр Redis без всяких Sentinel — то есть в коде приложения ничего менять не придется.

Звучит как фантастика?

+40

ebogdanov 29 июн 2023 в 11:08

Неудачное внедрение Redis Cluster в монолит на PHP 7.2.X

Средний

16 мин

7.7K

Высокая производительность*Веб-разработка*PHP*Серверная оптимизация*NoSQL*

Кейс

Исповедь о том как принес в проект проблему, которую так и не устранил в течение долгого времени.

Осторожно! Статья может вызвать обострение профессиональных заболеваний вплоть до боли ниже поясницы.

+28

Digital_League 31 мая 2023 в 15:15

Невредные советы по Cassandra — как избежать ошибок?

11 мин

2.3K

Блог компании Лига Цифровой ЭкономикиNoSQL*Администрирование баз данных*Распределённые системы*IT-компании

Привет, Хабр! Меня зовут Евгений Абрамкин, я руководитель поддержки третьего уровня в направлении омниканальных решений Лиги Цифровой Экономики. Моя команда — последняя «инстанция» во флоу по решению инцидентов. Мы пишем доработки и фиксы, чтобы победить проблему клиента, а также можем предоставить оптимальную конфигурацию для системы, которая передана на эксплуатацию или требует масштабирования. Это может быть кластер Elasticsearch, балансировщики nginx или что поинтереснее — распределенная NoSQL СУБД Apache Cassandra.

В материале я расскажу именно об Apache Cassandra: какие ошибки можно совершить при ее использовании, на что стоит обратить внимание и чем лучше не пренебрегать.

+12

softError 30 мая 2023 в 11:54

Сassandra для бедных — пускаем в ход HDD

Средний

5 мин

4.9K

NoSQL*Big Data*

Кейс

Cезон big data

Cost reduction - весьма популярное направление, особенно в дни кризиса IT. Вполне естественным является желание оптимизации расходов на “железо” с минимальной потерей производительности, ведь чем больше данных хранится, тем больше может оказаться профит. В данной статье описан кейс эксплуатации Cassandra на HDD дисках как один из способов оптимизации, имеющей смысл при достаточно большом объеме данных.

+13

badcasedaily1 20 апр 2023 в 17:00

Сравнение SQL- и NoSQL-баз данных

Простой

11 мин

37K

Блог компании RUVDS.comSQL*NoSQL*Администрирование баз данных*

Обзор

SQL и NoSQL — две популярные модели баз данных, которые используют для решения различных задач. Чтобы понять, какая из них подойдёт в вашем случае, необходимо разобраться в их различиях, преимуществах и недостатках.

В этой статье я рассмотрю основные характеристики SQL- и NoSQL-баз данных и сравню их, чтобы помочь выбрать лучший вариант для вашего проекта.

Читать дальше →

+28

yrepear 24 мар 2023 в 11:37

Согласованность данных: что это на самом деле такое и почему с ней все так сложно

10 мин

12K

Блог компании VKNoSQL*Администрирование баз данных*Хранение данных*

Перевод

Понятие согласованности данных сложное, неоднозначное и включает в себя широкий спектр определений, лишь частично совпадающих друг с другом. Команда VK Cloud перевела статью, в которой автор определяет термин «согласованность» в области распределенных БД и рассуждает на тему этой самой согласованности.

Читать дальше →

+32

DumchevEvgeniy 17 мар 2023 в 12:47

Как подключить платежный шлюз на примере Сбера

Средний

12 мин

20K

Платежные системы*NoSQL*API*C#*Разработка под e-commerce*

Из песочницы

Привет, меня зовут Евгений Думчев, я разработчик в DD Planet. Сегодня хочу поделиться опытом подключения платежного шлюза Сбера, чем мы занимались в рамках одного из проектов. Кажется, это будет полезная история, ведь в нынешние непростые времена многие из нас задумываются о том, чтобы открыть свой «маленький свечной заводик» – какой-нибудь небольшой бизнес на черный день. Тортики там печь, платы паять, в общем, что-нибудь, что бы обеспечило дополнительный доход. Раньше для коммерции подобных сайд-проектов не требовалось ничего, кроме условного Пейпала (к тому же он расширял географию продаж). А теперь волей-неволей приходится задумываться об отечественных решениях для проведения оплат.

Платежный шлюз – как раз такое решение. И оно на самом деле очень простое, любой посетитель Хабра, скорее всего, сможет его развернуть, достаточно хотя бы примерно представлять устройство REST API. В этой статье я расскажу, как подключить и настроить шлюз от Сбера – но в принципе эта инструкция пригодится со шлюзом от любого банка.

+15

dmitriizolotov 2 мар 2023 в 15:03

KMongo и неструктурированные данные

5 мин

1.4K

Блог компании OTUSNoSQL*MongoDB*Kotlin*

Туториал

Несмотря на то, что MongoDB начало движение в сторону строгости реляционной модели, она по прежнему остается документной БД и предполагает возможность сохранения документов произвольной структуры. И при использовании MongoDB в языках с динамической типизацией (JavaScript, Python) сохранение или генерация объектов не вызывает сложностей, поскольку заранее не требуется определить структуру извлекаемого или сохраняемого объекта. Но как действовать в случае использования драйверов для MongoDB для языков со строгой типизацией?

В этой статье мы разберем приемы для работы с неструктурированными данными, которые позволят сохранить преимущества использования сериализации с механизмами рефлексии для извлечения произвольных документов.

+10

Bright_Translate 3 фев 2023 в 16:00

Распределенный SQL: альтернатива шардированию баз данных

Сложный

7 мин

14K

Блог компании RUVDS.comSQL*NoSQL*Хранение данных*Распределённые системы*

Перевод

Шардирование баз данных – это процесс разделения данных на меньшие части, называемые «шарды». Эта техника обычно используется, когда возникает потребность в масштабировании записей. В течение жизненного цикла успешного приложения способность сервера его базы обрабатывать операции записи рано или поздно достигает своего предела. Деление данных на несколько шардов – с размещением каждого на собственном сервере БД – уменьшает нагрузку на отдельные узлы, по сути, повышая записывающую способность базы данных в целом. Этот процесс и является шардингом.

Распределённый SQL представляет новый способ масштабирования реляционных баз данных с помощью полностью автоматизированной и прозрачной для приложений стратегии, подобной шардингу. Распределённые БД SQL изначально спроектированы под практически линейное масштабирование. В текущей статье вы познакомитесь с основами распределённого SQL и узнаете, как начать работу с этими базами данных.

Читать дальше →

+37

dim-ev 30 янв 2023 в 18:07

Как жили наши предки 400 лет назад? Создание базы данных населения XVII века по южным уездам России

6 мин

8.3K

PostgreSQL*Data Mining*NoSQL*Научно-популярноеData Engineering*

Из песочницы

Можно ли найти конкретного человека, жившего в XVII веке? Выражаясь современным языком «пробить по базам». Оказывается, архивные документы хранят массу информации об обычных людях того периода. Однако существует ряд сложностей, не позволяющих обычному исследователю добраться до этой информации. Во-первых, нужно пройти определённую процедуру по получению доступа в архив. Во-вторых, не всегда можно выйти на нужный документ, используя так называемый научно-справочный аппарат – различные описи и реестры документов, имеющиеся в архиве. Наконец, не имея навыков чтения документов XVII века, которые написаны скорописью, почти нереально ознакомиться с его содержанием.

Данные проблемы предполагается решить с помощью создания базы данных служилых людей XVII века. Об этом небольшая история.

Как всё начиналось.

Привет! Меня зовут Дмитрий и вот уже более 10 лет я изучаю историю южных уездов России XVII века. Территориально – это современные Белгородская, а также соседние Воронежская, Курская, Липецкая и другие области. Населены они были тогда так называемыми служилыми людьми – они получали здесь в качестве служебного жалования земельные наделы, которые сами и обрабатывали. В XVIII веке их потомки стали однодворцами, а затем государственными крестьянами. Большая часть населения Курской, Воронежской и соседних губерний XIX века происходят из тех самых служилых людей XVI–XVII веков.

Продолжим?

+56

2 3 ...

17 18

NoSQL *

В погоне за заменой Redis

Новости

Дом, милый дом: нюансы работы с ClickHouse. Часть 1

Это база: нюансы работы с Redis. Часть 1

Используем Elasticsearch вместе со Spring Boot

Истории

Основы полнотекстового поиска в ElasticSearch. Часть третья

7 аргументов почему UUID лучше, чем автоинкрементные идентификаторы

Как работает миграция между базами данных в реальном мире

Основы полнотекстового поиска в ElasticSearch. Часть вторая

Основы полнотекстового поиска в ElasticSearch. Часть первая

Сто первое руководство по мониторингу метрик в Redis

KeyDB и Redis: в поисках серебряной пули — in-memory replicated DB (Replicated IMDB)

Неудачное внедрение Redis Cluster в монолит на PHP 7.2.X

Невредные советы по Cassandra — как избежать ошибок?

Ближайшие события

Сassandra для бедных — пускаем в ход HDD

Сравнение SQL- и NoSQL-баз данных

Согласованность данных: что это на самом деле такое и почему с ней все так сложно

Как подключить платежный шлюз на примере Сбера

KMongo и неструктурированные данные

Распределенный SQL: альтернатива шардированию баз данных

Как жили наши предки 400 лет назад? Создание базы данных населения XVII века по южным уездам России

Вклад авторов