NoSQL *

Не только SQL

СтатьиПостыНовостиАвторыКомпании

ebogdanov 29 июн 2023 в 08:08

Неудачное внедрение Redis Cluster в монолит на PHP 7.2.X

Средний

16 мин

9.5K

Высоконагруженные системы * Веб-разработка * PHP * Серверная оптимизация * NoSQL *

Кейс

Исповедь о том как принес в проект проблему, которую так и не устранил в течение долгого времени.

Осторожно! Статья может вызвать обострение профессиональных заболеваний вплоть до боли ниже поясницы.

+28

Digital_League 31 мая 2023 в 12:15

Невредные советы по Cassandra — как избежать ошибок?

11 мин

4.4K

Блог компании Лига Цифровой ЭкономикиNoSQL * Базы данных * Распределённые системы * IT-компании

Привет, Хабр! Меня зовут Евгений Абрамкин, я руководитель поддержки третьего уровня в направлении омниканальных решений Лиги Цифровой Экономики. Моя команда — последняя «инстанция» во флоу по решению инцидентов. Мы пишем доработки и фиксы, чтобы победить проблему клиента, а также можем предоставить оптимальную конфигурацию для системы, которая передана на эксплуатацию или требует масштабирования. Это может быть кластер Elasticsearch, балансировщики nginx или что поинтереснее — распределенная NoSQL СУБД Apache Cassandra.

В материале я расскажу именно об Apache Cassandra: какие ошибки можно совершить при ее использовании, на что стоит обратить внимание и чем лучше не пренебрегать.

+12

softError 30 мая 2023 в 08:54

Сassandra для бедных — пускаем в ход HDD

Средний

5 мин

5.4K

NoSQL * Big Data *

Кейс

Cезон big data

Cost reduction - весьма популярное направление, особенно в дни кризиса IT. Вполне естественным является желание оптимизации расходов на “железо” с минимальной потерей производительности, ведь чем больше данных хранится, тем больше может оказаться профит. В данной статье описан кейс эксплуатации Cassandra на HDD дисках как один из способов оптимизации, имеющей смысл при достаточно большом объеме данных.

+13

GalsSoftware 20 мая 2023 в 03:19

Репликация сегментов в OpenSearch

Средний

4 мин

2.9K

NoSQL * Open source * Базы данных * Поисковая оптимизация * Поисковые технологии *

Обзор

Многие наши коллеги всё больше смотрят в сторону OpenSearch, который постепенно обрастает всё новыми и новыми функциями. В телеграм-канале мы уже публиковали пост с описанием обновлений в версии 2.7, среди которых есть репликация сегментов (есть ещё и поиск по снэпшотам, но о нём как-нибудь в другой раз). Репликация сегментов — это альтернатива репликации документов. При репликации документов все ноды-реплики выполняют ту же операцию индексирования, что и основная нода. При репликации сегментов только основная нода выполняет операцию индексирования, создавая файлы сегментов, которые далее копируются на каждую ноду-реплику. При такой схеме репликации нагрузка по индексированию ложится только на основную ноду, освобождая ресурсы на репликах для использования под другие операции. В этом посте мы расскажем о концепции репликации сегментов, преимуществах и недостатках по сравнению с репликацией документов. Велком ту подкат.

Читать дальше →

artfultom 1 мая 2023 в 06:06

Как, почему и когда следует использовать одно-табличный дизайн в DynamoDB

12 мин

9.4K

NoSQL * Amazon Web Services *

Перевод

Я стал большим сторонником DynamoDB за последние несколько лет. Эта база данных имеет много сильных сторон, которых нет у конкурентов, таких как гибкая ценовая модель, соединение без состояния (stateless), которое прекрасно работает для беcсерверных (serverless) вычислений, и постоянное время ответа, даже когда ваша база данных масштабируется до огромных размеров.

Однако разработка структуры данных с помощью DynamoDB вызывает трудности у тех, кто привык к реляционным базам данных, которые доминировали в течение последних нескольких десятилетий. Существует несколько особенностей в создании структуры данных с помощью DynamoDB, но самая значимая - это рекомендация от AWS использовать одну таблицу для всех ваших записей.

badcasedaily1 20 апр 2023 в 14:00

Сравнение SQL- и NoSQL-баз данных

Простой

11 мин

64K

Блог компании RUVDS.comNoSQL * SQL * Базы данных *

Обзор

SQL и NoSQL — две популярные модели баз данных, которые используют для решения различных задач. Чтобы понять, какая из них подойдёт в вашем случае, необходимо разобраться в их различиях, преимуществах и недостатках.

В этой статье я рассмотрю основные характеристики SQL- и NoSQL-баз данных и сравню их, чтобы помочь выбрать лучший вариант для вашего проекта.

Читать дальше →

+28

Digital_League 20 апр 2023 в 11:45

Snapshots в Cassandra — как пользоваться и восстанавливать данные?

9 мин

4.4K

Блог компании Лига Цифровой ЭкономикиIT-компанииРаспределённые системы * Восстановление данных * NoSQL *

Привет, Хабр! Меня зовут Евгений Абрамкин, я руководитель поддержки третьего уровня в направлении омниканальных решений Лиги Цифровой Экономики. Моя команда — последняя «инстанция» во флоу по решению инцидентов. Мы пишем доработки и фиксы, чтобы победить проблему клиента, а еще предоставляем оптимальную конфигурацию для системы, которая передана в эксплуатацию или требует масштабирования. Это может быть кластер Elasticsearch, балансировщики nginx или что поинтереснее — распределенная NoSQL СУБД Apache Cassandra.

yrepear 24 мар 2023 в 08:37

Согласованность данных: что это на самом деле такое и почему с ней все так сложно

10 мин

22K

Блог компании VKNoSQL * Базы данных * Хранение данных *

Перевод

Понятие согласованности данных сложное, неоднозначное и включает в себя широкий спектр определений, лишь частично совпадающих друг с другом. Команда VK Cloud перевела статью, в которой автор определяет термин «согласованность» в области распределенных БД и рассуждает на тему этой самой согласованности.

Читать дальше →

+32

DumchevEvgeniy 17 мар 2023 в 09:47

Как подключить платежный шлюз на примере Сбера

Средний

12 мин

34K

Платежные системы * NoSQL * Проектирование API * C# * Разработка под e-commerce *

Из песочницы

Привет, меня зовут Евгений Думчев, я разработчик в DD Planet. Сегодня хочу поделиться опытом подключения платежного шлюза Сбера, чем мы занимались в рамках одного из проектов. Кажется, это будет полезная история, ведь в нынешние непростые времена многие из нас задумываются о том, чтобы открыть свой «маленький свечной заводик» – какой-нибудь небольшой бизнес на черный день. Тортики там печь, платы паять, в общем, что-нибудь, что бы обеспечило дополнительный доход. Раньше для коммерции подобных сайд-проектов не требовалось ничего, кроме условного Пейпала (к тому же он расширял географию продаж). А теперь волей-неволей приходится задумываться об отечественных решениях для проведения оплат.

Платежный шлюз – как раз такое решение. И оно на самом деле очень простое, любой посетитель Хабра, скорее всего, сможет его развернуть, достаточно хотя бы примерно представлять устройство REST API. В этой статье я расскажу, как подключить и настроить шлюз от Сбера – но в принципе эта инструкция пригодится со шлюзом от любого банка.

+15

MaxRokatansky 14 мар 2023 в 12:02

Роль данных реального времени в развитии индийского бизнеса и их значение для будущего успеха бизнеса

Простой

5 мин

628

Блог компании OTUSNoSQL *

Интервью

Перевод

Современные технологии позволяют диджитал-потребителям быстро получать доступ к информации, продуктам и услугам. Поэтому компании нуждаются в технологиях обработки данных в режиме реального времени, чтобы оставаться конкурентоспособными и не отставать от своих клиентов.

dmitriizolotov 2 мар 2023 в 12:03

KMongo и неструктурированные данные

5 мин

1.8K

Блог компании OTUSKotlin * MongoDB * NoSQL *

Туториал

Несмотря на то, что MongoDB начало движение в сторону строгости реляционной модели, она по прежнему остается документной БД и предполагает возможность сохранения документов произвольной структуры. И при использовании MongoDB в языках с динамической типизацией (JavaScript, Python) сохранение или генерация объектов не вызывает сложностей, поскольку заранее не требуется определить структуру извлекаемого или сохраняемого объекта. Но как действовать в случае использования драйверов для MongoDB для языков со строгой типизацией?

В этой статье мы разберем приемы для работы с неструктурированными данными, которые позволят сохранить преимущества использования сериализации с механизмами рефлексии для извлечения произвольных документов.

+10

Bright_Translate 3 фев 2023 в 13:00

Распределенный SQL: альтернатива шардированию баз данных

Сложный

7 мин

21K

Блог компании RUVDS.comNoSQL * SQL * Распределённые системы * Хранение данных *

Перевод

Шардирование баз данных – это процесс разделения данных на меньшие части, называемые «шарды». Эта техника обычно используется, когда возникает потребность в масштабировании записей. В течение жизненного цикла успешного приложения способность сервера его базы обрабатывать операции записи рано или поздно достигает своего предела. Деление данных на несколько шардов – с размещением каждого на собственном сервере БД – уменьшает нагрузку на отдельные узлы, по сути, повышая записывающую способность базы данных в целом. Этот процесс и является шардингом.

Распределённый SQL представляет новый способ масштабирования реляционных баз данных с помощью полностью автоматизированной и прозрачной для приложений стратегии, подобной шардингу. Распределённые БД SQL изначально спроектированы под практически линейное масштабирование. В текущей статье вы познакомитесь с основами распределённого SQL и узнаете, как начать работу с этими базами данных.

Читать дальше →

+37

dim-ev 30 янв 2023 в 15:07

Как жили наши предки 400 лет назад? Создание базы данных населения XVII века по южным уездам России

6 мин

8.8K

PostgreSQL * Data Mining * NoSQL * Научно-популярноеData Engineering *

Из песочницы

Можно ли найти конкретного человека, жившего в XVII веке? Выражаясь современным языком «пробить по базам». Оказывается, архивные документы хранят массу информации об обычных людях того периода. Однако существует ряд сложностей, не позволяющих обычному исследователю добраться до этой информации. Во-первых, нужно пройти определённую процедуру по получению доступа в архив. Во-вторых, не всегда можно выйти на нужный документ, используя так называемый научно-справочный аппарат – различные описи и реестры документов, имеющиеся в архиве. Наконец, не имея навыков чтения документов XVII века, которые написаны скорописью, почти нереально ознакомиться с его содержанием.

Данные проблемы предполагается решить с помощью создания базы данных служилых людей XVII века. Об этом небольшая история.

Как всё начиналось.

Привет! Меня зовут Дмитрий и вот уже более 10 лет я изучаю историю южных уездов России XVII века. Территориально – это современные Белгородская, а также соседние Воронежская, Курская, Липецкая и другие области. Населены они были тогда так называемыми служилыми людьми – они получали здесь в качестве служебного жалования земельные наделы, которые сами и обрабатывали. В XVIII веке их потомки стали однодворцами, а затем государственными крестьянами. Большая часть населения Курской, Воронежской и соседних губерний XIX века происходят из тех самых служилых людей XVI–XVII веков.

Продолжим?

+53

lena_pot 19 янв 2023 в 14:05

Neo4j. Вместо тысячи join-ов…

8 мин

17K

NoSQL * Хранение данных *

Из песочницы

Если вы столкнулись с задачей хранения сильно связанных данных, то отличным вариантом будет использовать графовую модель данных. Мы в Текфорс сделали именно так. Почему - разберем в этой статье.

+16

temabeloglinskiy 26 дек 2022 в 16:19

Об инновациях. Или Neo4J на страже Telco

5 мин

2.1K

NoSQL * Сетевые технологии * Визуализация данных *

Всем добрый день.

В своей предыдущей статье я уже упомянул о разрабатываемой нами системе, которая решает, казалось бы, не решаемую задачу - а именно автодискавери сетевых элементов в сетях телеком операторов, построение топологий, поиск путей прохождения трафика на основе информации, полученной из самих сетевых элементов. При этом стоит уточнить, что система не нуждается в интеграции со сторонними системами управления, такими как NCE (бывший Huawei u2000 TN), SoEM (СУ Ericsson), Aviat Provision, NFM-P (Nokia), и любыми другими. Т.е. система самодостаточна и способна работать в полностью автономном режиме.

Начну с той проблемы, которая возникла много десятилетий тому назад - и название этой проблемы - актуальная информация о состоянии сетей в режиме он-лайн. Дело в том, что мультисервисные сети давно стали мультивендорными - т.е. в каком-то филиале N любого провайдера связи, с течением времени скопилось множество разновендорного оборудования - сети MEN построены на Cisco, Huawei, Nokia. РРЛ - NEC, Huawei, Nokia и т.д. до бесконечности и в разных последовательностях. И т.к. каждый вендор не стремится создать универсальную СУ, которая могла хотя бы нарисовать топологию мультивендорной сети, приходится изобретать велосипед раз за разом.

Чаще всего велосипеды получались не далеко едущими, одноколесными, неудобными, без сидения или колес. Даже в системах управления крупных вендоров, функциональность не блистала. Более менее вменяемое я увидел в СУ Huawei - NCE. Но опять таки - каждый домен типов оборудования на своих вкладках, и единую топологию не получить - т.е. нельзя отобразить единовременно и на одной подложке сеть MBH (MEN+RRL). Не говоря уже о единовременном отображении специфических проблем, за которыми следят операторы связи - высокая утилизация интерфейсов, BBE/ES/SES/UAS, FCS, RSL Low, QoS Drop по очередям и пр.

kuza2000 18 дек 2022 в 00:01

Миллион записей для змеи

14 мин

КриптовалютыBig Data * NoSQL * SQL * Python *

Технотекст 2022

Загрузить миллион записей в питон за секунду?
Нет. Получилось еще быстрее!

У меня есть небольшое хобби - я экспериментирую с машинным обучением применительно к торговле на бирже, в частности, с криптовалютами. После различных наколенных экспериментов я захотел создать удобный инструмент - базу торговых котировок. В процессе работы необходима быстрая загрузка достаточно большого количества данных. Это необходимо для расчетов, генерации данных для обучения, бэк-тестинга и других задач. Количество записей, которые нужно загрузить в питон довольно велико - речь может идти о миллионах и более записей.

+14

bdrgn 16 дек 2022 в 14:34

Автоматизируем Telegram-канал с AWS Lambda и DynamoDB

7 мин

8.4K

Python * Облачные вычисления * NoSQL * Amazon Web Services * Облачные сервисы *

Туториал

В этом материале вы узнаете, как создать Telegram-канал, который будет сам обновляться, получая данные из открытых источников. Используем Python, AWS Lambda, DynamoDB и BeautifulSoup.

+10

mayo889 13 ноя 2022 в 21:00

Apache Cassandra: механизмы репликации и поддержания согласованности

5 мин

8.1K

NoSQL * Распределённые системы *

Из песочницы

Apache Cassandra - это распределенная NoSQL база данных. В этой статье будут описаны основные механизмы передачи, репликации и поддержания согласованности данных внутри сети.

+12

MaxRokatansky 12 окт 2022 в 10:04

Машинное обучение с Apache Cassandra и Apache Spark

7 мин

Блог компании OTUSNoSQL * Apache * Машинное обучение *

Перевод

В первой статье из серии об использовании Apache Cassandra в машинном обучении мы обсудили цели и задачи машинного обучения, и поговорили почему Cassandra — превосходный инструмент для обработки больших наборов данных. Также рассмотрели технологический стек, используемый Uber, Facebook и Netflix. Обе статьи основаны на воркшопе Machine Learning with Apache Cassandra and Apache Spark (Машинное обучение с помощью Apache Cassandra и Apache Spark).

В этой статье мы рассмотрим интеграцию Apache Spark с Cassandra и построение эффективных алгоритмов и решений. Мы также обсудим обучение с учителем, без учителя и метрики машинного обучения. Примеры и упражнения доступны на GitHub.

mr-pickles 3 окт 2022 в 09:52

SQL и NoSQL. Правда ли одно лучше другого?

13 мин

34K

Блог компании Wunder FundSQL * NoSQL * Базы данных *

Перевод

Базы данных (БД) существуют с первых дней программирования, а появились они ещё раньше. Это — неотъемлемые части любых приложений. Хорошо спроектированная БД — это один из важнейших компонентов, влияющих на производительность программных проектов. Из-за этого множество архитекторов программных решений исследовали массу подходов к управлению данными, пытаясь выяснить то, какие из этих подходов работоспособны в определённых сценариях, а какие — нет. Выбор подходящей архитектуры БД обычно сводится к выбору между SQL и NoSQL, между реляционными и нереляционными базами данных. А иногда в одном проекте используют и то, и другое.

В этой статье мы сделаем краткий обзор баз данных, поговорим об их истории, постараемся разобраться с тем, что собой представляют базы данных SQL и NoSQL, выясним ключевые различия между ними.

+15

1 2 3

5 6 ...

27 28

NoSQL *

Неудачное внедрение Redis Cluster в монолит на PHP 7.2.X

Невредные советы по Cassandra — как избежать ошибок?

Сassandra для бедных — пускаем в ход HDD

Репликация сегментов в OpenSearch

Как, почему и когда следует использовать одно-табличный дизайн в DynamoDB

Сравнение SQL- и NoSQL-баз данных

Snapshots в Cassandra — как пользоваться и восстанавливать данные?

Согласованность данных: что это на самом деле такое и почему с ней все так сложно

Как подключить платежный шлюз на примере Сбера

Роль данных реального времени в развитии индийского бизнеса и их значение для будущего успеха бизнеса

KMongo и неструктурированные данные

Распределенный SQL: альтернатива шардированию баз данных

Как жили наши предки 400 лет назад? Создание базы данных населения XVII века по южным уездам России

Ближайшие события

Neo4j. Вместо тысячи join-ов…

Об инновациях. Или Neo4J на страже Telco

Миллион записей для змеи

Автоматизируем Telegram-канал с AWS Lambda и DynamoDB

Apache Cassandra: механизмы репликации и поддержания согласованности

Машинное обучение с Apache Cassandra и Apache Spark

SQL и NoSQL. Правда ли одно лучше другого?

Вклад авторов