MySQL *

Свободная реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

Andrey_Biryukov 6 фев 2023 в 13:43

Разворачиваем MySQL: репликации и секционирование

Сложный

6 мин

Блог компании OTUSMySQL *

Туториал

В этой статье сначала настроим репликацию данных на второй сервер, а затем рассмотрим различные варианты секционирования.

Demin_Konstantin 30 янв 2023 в 14:40

Как мы исправили древний сервис и ускорили вдвое поставку обновлений

7 мин

1.7K

Блог компании SmartupEmail-маркетинг * MySQL *

Кейс

Недавно нам довелось перевести на актуальные рельсы устаревший сервис. На этой махине у заказчика завязано много процессов — от таргетированной рекламы фармпрепаратов до доставки пробных образцов на реальный адрес. Но она не обновлялась 8 лет, и работала на древнем фреймворке Yii 1, который не поддерживается с 2015 года. Даже незначительные изменения нужно было вносить 3 недели.

Меня зовут Никита Швыряев, я руководитель отдела разработки компании «СмартАп Технолоджи». Этот проект мы перепиливали 4 месяца. Расскажу подробно, как это было, и что получилось.

SaZha 10 янв 2023 в 12:37

Магия оптимизации SQL запросов

7 мин

83K

MySQL * PostgreSQL * SQL * Базы данных *

Из песочницы

Даже самый простой SQL запрос можно выполнить по-разному. Но из всех вариантов СУБД нужно выбрать оптимальный, как же это сделать? Неужели придётся перебрать все возможные варианты? Давайте разбираться.

+24

selenzorn 29 дек 2022 в 11:58

Не все типы репликации одинаково полезны, или почему две MySQL лучше одной

5 мин

8.6K

Блог компании SelectelMySQL * Базы данных *

В это сложно поверить, но MySQL как продукт появился еще в 1995 году. Со временем название СУБД стало таким же нарицательным, как Xerox. Сегодня под этим термином могут понимать самые разные связки: от MySQL Native от компании Oracle до Percona XtraDB Cluster, а ведь есть еще MariaDB, Galera, Percona Server.

О том, как устроено генеалогическое древо MySQL можно снимать сериал с драконами, поэтому в материале мы сконцентрируемся на особенностях и ограничениях работы СУБД с разным типом репликации: MySQL sync и MySQL Semi-sync.

Читать дальше →

+38

kmoseenk 6 дек 2022 в 10:21

Почему стоит обратить внимание на PlanetScale

3 мин

1.8K

Блог компании OTUSMySQL *

Перевод

Ваша база данных — это первоисточник информации для бизнеса, и при принятии решений на ее основе рисковать не желательно. Хотя многие организации могут менять свою платформу несколько раз за период эксплуатации продукта, однако причиной вашей неуверенности становится то, что характер данных или то, как вы их используете, также может естественным образом эволюционировать с течением времени.

Если ваши данные неструктурированы или недостаточно хорошо структурированы, то преимущество варианта NOSQL очевидно, но если вы работаете со структурированными данными и/или будете выполнять много запросов, то вам лучше использовать SQL для обеспечения производительности, надежности и, возможно, соответствия нормативным требованиям.

Shyhartskoi 5 дек 2022 в 13:01

StatefulSet в Kubernetes – примеры и наилучшие практики

10 мин

60K

Блог компании Timeweb CloudMySQL * DevOps * Kubernetes * Хранение данных *

Перевод

Собираетесь ли вы развертывать базу данных в кластере Kubernetes? Если так – то это отличный выбор. Kubernetes – это инструмент оркестрации контейнеров, который при помощи множества инструментов координирует эксплуатацию приложений в контейнерах (подах). Один из этих контроллеров называется StatefulSet и используется для эксплуатации приложений, сохраняющих состояние.

Читать дальше →

+15

lexspeedkb 17 ноя 2022 в 09:43

PHP трюк для быстрого DELETE на большой таблице MySQL

2 мин

MySQL * PHP *

Из песочницы

Приветствую! У каждого разработчика рано или поздно наступает момент, когда появляется необходимость работать с большими базами данных. В мире таблиц весом более 5 гигабайт действуют немного иные законы "физики", нежели в маленьких табличках: приходится заботиться о тех вещах, о которых раньше даже и не задумывался. Сегодня я поделюсь трюком, который поможет быстро удалить много данных с таблицы MySQL с движком InnoDB.

Просветиться

-4

ostinru 15 ноя 2022 в 06:00

Разбираемся что MySQL пишет на диск и зачем [часть 2]

Сложный

9 мин

7.8K

MySQL *

Это вторая часть моих копаний во внутренностях MySQL. В первой части [habr] были затронуты запись страниц данных на диск (с промежуточной записью в DoubleWrite buffer) и запись бинлогов (с батчингом в виде group commit). В этой части я расскажу про redo log и как все части MySQL координируются для достижения надежной работы.

+12

dmitriizolotov 14 ноя 2022 в 16:04

Аналитические панели в реальном времени. В поисках (Apache) Doris

5 мин

4.9K

Блог компании OTUSБазы данных * MySQL *

Можно было бы назвать эту статью "Yet another analytical database", если бы не тот факт, что Apache Doris построен на архитектуре MPP, которая изначально ориентирована на параллельные вычисления и использование распределенного хранения и обработки данных на кластерах. Изначально проект Baidu, инструмент позволяет подготавливать аналитические панели с обновлением в реальном времени, при этом источниками данных могут быть как потоки из внешних источников (логи событий, time series-данные), так и источники из Data Lake (например, Apache Iceberg или Hive). В этой статье мы рассмотрим основные моменты использования Apache Doris на простом примере хранения и простой обработки данных о погоде.

Robgnokfar 29 окт 2022 в 22:02

Программа для ведения архива медиафайлов в полевых условиях

10 мин

8.5K

Visual Basic for Applications * DIY или Сделай самСофтХранение данных * MySQL *

Почему для фольклорных экспедиций нужно писать программы?

Как быть со множеством фотографий, видео и аудио, которые необходимо каталогизировать, описать и поделиться с коллегами?

Рассказываю, как мы описываем примерно 200 часов интервью за 10 дней экспедиции.

+14

honyaki 12 окт 2022 в 20:44

Индексирование JSON в MySQL

8 мин

12K

Блог компании SkillfactoryБазы данных * SQL * MySQL *

Перевод

В середине 2015 года, в MySQL 5.7.8 появился тип данных JSON. С тех пор он применяется, чтобы избегать жёстких определений столбцов и сохранять документы JSON всех форм и размеров: логи аудита, параметры конфигурации, сторонние полезные нагрузки, пользовательские поля и др. Подробности — к старту нашего курса по анализу данных.

Читать дальше →

+15

KravetsV 6 окт 2022 в 10:22

Перестаньте использовать SQLite в Unit-тестах

9 мин

11K

PHP * MySQL * SQLite * Laravel * Тестирование веб-сервисов *

Из песочницы

Перевод

TLDR; Использование Sqlite в Laravel (или любых других PHP приложениях) для Unit-тестирования может привести к false positive результатам тестов. Тот код который пройдет тесты, не заработает после переезда в production и использования других БД, например, MySQL. Вместо этого разверните тестовую БД с использованием той же технологии и движка, которые будут использоваться вашим приложением в production.

Во-первых, позвольте мне начать с того, что я очень рад видеть, что вы проводите Unit-тестирование — вы на верном пути! Laravel познакомил многих разработчиков с миром Unit-тестирования, сделав утилиты для тестирования первоклассной частью фреймворка. Это круто! Но нам нужно убедиться, что наше чувство безопасности, которое мы получаем от наших Unit-тестов, верно.

Один из механизмов, которые Laravel предлагает для Unit-тестов, основан на использовании базы данных SQLite . Для ускорения выполнения тестов, база данных запускается непосредственно в оперативной памяти. Такое решение работает в 95% случаев. Но, дьявол кроется в деталях, в этих 5%.

Поговорим о причинах, почему это не лучший выбор.

Tolsedum 4 окт 2022 в 09:00

MySQL. Оптимизация псевдо-больших данных

7 мин

8.2K

Блог компании RUVDS.comMySQL * SQL * Базы данных * Высоконагруженные системы *

Работая над различными интересными задачами, мне только и приходилось слышать о существовании программ, которые работают с большими данными (в области действия одного сервера). И вот настал тот день, когда к нам обратился клиент, у которого сайт грузился очень долго. Задание для решения этой проблемы выдали моего коллеги. Немного прошло времени, до того как он подозвал меня к себе, с целью показать, столь диковинное для меня зрелище, связанное с объёмом таблиц, в которых находились данные после импорта категорий, характеристик, брендов товаров.

22 миллиона варианта категорий для нас показалось более чем приличным объёмом, тем более — вес таблицы с категориями получился чуть больше 1,6 Гиб. С такими размерами страницы начали грузиться дольше, чем хотелось бы. Ввиду того что, сроки на решение проблемы маленькие (чем быстрей тем лучше), руководство решило выделить на эту задачу, две единицы программистов, меня и моего коллегу. Разделив модуль на двоих, мне достались по объёму не самые сливки, но не менее ответственный участок, поскольку в нём — на загрузку данных, уходило значительное время.

Читать дальше →

+31

ostinru 25 авг 2022 в 05:00

Разбираемся что MySQL пишет на диск и зачем [часть 1]

Сложный

8 мин

28K

MySQL *

Разработчики предъявляют высокие требования к базам данных: максимальная надежность (ничего из того, что было записано не должно быть утеряно ни при каких обстоятельствах), и, одновременно, максимальная производительность при различных видах нагрузки (Запись/Чтение или OLTP/OLAP). Достичь этих требований может быть не просто. Давайте попробуем разобраться, как это делает MySQL.

Размышляя о базе данных, легко представить таблицу базы данных как HashMap/BinaryTree, отображающие первичный ключ (primary key) в структурированные записи с данными. Такое хранилище может работать in memory. Но, как только мы захотим записать данные на диск, придется использовать какие-то алгоритмы во внешней памяти. Просто положить наш HashMap на диск не получится, потому что память и диски слишком разные: чтение/запись диска производится блоками, latency диска больше чем у RAM, а еще нельзя будет воспользоваться обычными указателями и аллокаторами памяти - все это придется заменить самостоятельно.

+12

neoflex 15 авг 2022 в 13:51

Grafana как инструмент визуализации потока данных в Kafka

15 мин

12K

Блог компании NeoflexMySQL * Big Data *

Сегодня, в эпоху больших данных, когда компании тонут в информации из самых различных локальных и облачных источников, сотрудникам трудно увидеть общую картину. Анализ информации для отделения зерен от плевел требует все больше усилий. Визуализация данных помогает превратить все данные в понятную, визуально привлекательную и полезную информацию. Хорошо продуманная визуализация данных имеет критическое значение для принятия решений на их основе. Визуализация позволяет не только замечать и интерпретировать связи и взаимоотношения, но и выявлять развивающиеся тенденции, которые не привлекли бы внимания в виде необработанных данных. Большинство средств визуализации данных могут подключаться к источникам данных и таким образом использовать их для анализа. Пользователи могут выбрать наиболее подходящий способ представления данных из нескольких вариантов. В результате информация может быть представлена в графической форме, например, в виде круговой диаграммы, графика или визуального представления другого типа.

Большинство средств визуализации предлагает широкий выбор вариантов отображения данных, от обычных линейных графиков и столбчатых диаграмм до временных шкал, карт, зависимостей, гистограмм и настраиваемых представлений. Для решения задачи визуализации принципиальное значение имеет тип источника данных. И хотя современные средства визуализации проделали в этом вопросе большой путь, и предлагают на сегодняшний день весьма большой выбор, задача визуализации не решена в полной мере. Если для баз данных и целого ряда web сервисов задача визуализации не представляет принципиальной проблемы, то понять, что происходит с информационными потоками внутри некоторых программных продуктов из мира больших данных, не так просто.

Инструмент, на котором хотелось бы остановиться более подробно – Kafka.

itresume 27 июл 2022 в 15:40

Разбор тестового задания в Тиньков [SQL]

3 мин

43K

SQL * PostgreSQL * MySQL * Data Mining * Microsoft SQL Server *

Недавно нам прилетело большое тестовое задание от Тиньков-Банка на должность аналитика данных. Там очень много задач, но сегодня мы разберем несколько — остановимся на мелочах и обратим внимание на тонкие моменты.

И, конечно, попишем SQL-запросы!

Rasteniy 26 июл 2022 в 11:11

Как сменить базу данных, если у вас Entity Framework

9 мин

7.5K

Блог компании Dodo EngineeringMySQL * .NET * Microsoft SQL Server * Базы данных *

Туториал

Entity Framework — это удобный фреймворк для работы .NET-приложения с базой данных. По сути, это такая удобная абстракция над БД, которая сама пишет за разработчика оптимальные (ну, почти) SQL-запросы прямо из высокоуровневых LINQ-конструкций. Одной из киллер-фич фреймворка является возможность относительно легко сменить СУБД приложения на какую-нибудь другую. Предположим, разочаровались вы в MySQL или, наоборот, хотите сменить MSSQL на что-то менее дорогое — пожалуйста, EF как абстракция над СУБД в теории может это предоставить, так сказать, by design.

Проблема в том, что в мире бизнес-разработки СУБД меняют лишь по очень большой нужде, а потому редко кто уже сталкивался с данной фичей EF на практике, но вот мне такая возможность выпала. Поэтому я решил написать небольшой гайд, как это выглядит в реальности, чтобы у вас была возможность оценить применимость данной фичи, если вдруг это понадобится.

+20

Epsiloncool 13 июл 2022 в 15:32

Как работает быстрый текстовый поиск для WordPress

7 мин

8.9K

MySQL * PHP * Open source * Поисковые технологии * WordPress *

Много лет мы (команда Epsilon Web Manufactory) занимались разработкой сайтов и разных приложений на заказ, в основном это были проекты на базе популярного движка WordPress. И как правило самой сложной и интересной задачей всегда был полнотекстовый поиск. Если на сайте были только статьи и какие-то кастомные типы записей, содержащие заголовок и основной текст, то достаточно было использовать встроенный класс WP_Query, который с небольшой подстройкой входных параметров отлично справлялся с задачей. Но это было лет 10-12 назад.

+15

darviarush 3 июл 2022 в 13:18

Пейджинг страниц в соцсетях

4 мин

8.8K

Perl * MySQL * SQL *

Для пагинации страниц используют смещение (OFFSET) и курсорную пагинацию (по ID), как более быструю. Тем не менее есть ещё один малоизвестный вид пагинации по меткам страниц (MARKS). Она является разновидностью курсорной пагинации, но использует не идентификатор, а ряд полей перечисленных в ORDER BY SQL-запроса.

-3

SergeiKitaev 25 июн 2022 в 14:19

Технология SQL-файл, препроцессор для T-SQL, “бок-о-бок” файлы и др

20 мин

5.8K

MySQL * PostgreSQL * SQL * Microsoft SQL Server * Базы данных *

Завершив в недавнем прошлом очередную доработку своей легковесной технологии SQL-файл, применяемой для эффективной трансляции файлового SQL-кода в базу данных, автор данной статьи решил в очередной раз представить (в этой заметке теперь, на популярном ресурсе) свои реализованные, хотя бы отчасти, идеи касательно программирования MSSQL, а также некоторые соображения относительно применения SQL вообще. Автор полагает, что несмотря на форму предлагаемой им частной реализации SQL-файл (для MSSQL), лежащая в основе подхода концепция имеет определённую силу и смысл.

Выше на картинке: SQL-трансляция исходных файлов из нескольких директорий (скрипты *.sql), запуск fill_with_data.cmd

1 2 ...

5 6

8 9 ...

36 37

MySQL *

Разворачиваем MySQL: репликации и секционирование

Как мы исправили древний сервис и ускорили вдвое поставку обновлений

Магия оптимизации SQL запросов

Не все типы репликации одинаково полезны, или почему две MySQL лучше одной

Почему стоит обратить внимание на PlanetScale

StatefulSet в Kubernetes – примеры и наилучшие практики

PHP трюк для быстрого DELETE на большой таблице MySQL

Разбираемся что MySQL пишет на диск и зачем [часть 2]

Аналитические панели в реальном времени. В поисках (Apache) Doris

Программа для ведения архива медиафайлов в полевых условиях

Индексирование JSON в MySQL

Перестаньте использовать SQLite в Unit-тестах

MySQL. Оптимизация псевдо-больших данных

Ближайшие события

Разбираемся что MySQL пишет на диск и зачем [часть 1]

Grafana как инструмент визуализации потока данных в Kafka

Разбор тестового задания в Тиньков [SQL]

Как сменить базу данных, если у вас Entity Framework

Как работает быстрый текстовый поиск для WordPress

Пейджинг страниц в соцсетях

Технология SQL-файл, препроцессор для T-SQL, “бок-о-бок” файлы и др

Вклад авторов