SQL *

Формальный непроцедурный язык программирования

СтатьиПостыНовостиАвторыКомпании

miptgirl 25 июн 2023 в 15:57

ClickHouse: полезные лайфхаки

Средний

12 мин

39K

Open source*SQL*IT-инфраструктура*Big Data*Data Engineering*

Туториал

Я начала пользоваться ClickHouse до того, как это стало мэйнстримом: первый раз я столкнулась c этой базой данных лет 8 назад. C тех пор я уверена, что это лучшая DB для аналитики. Большинство аналитиков, которых я знаю, в восторге от ClickHouse (иногда чтобы проникнуться, требуется немного времени: разобраться и привыкнуть к синтаксису).

В этой статье я расскажу что такое ClickHouse и почему я считаю его идеально подходящим мощным инструментом для аналитики. А также поделюсь tips & tricks из моего опыта. Поехали.

Поехали

+46

Nuxi 1 июн 2023 в 12:03

Разработчики — налево, методологи — направо: четыре шага к оптимизации работы BI-аналитиков

12 мин

9.4K

Блог компании SelectelBig Data*SQL*Анализ и проектирование систем*Визуализация данных*

✏️ Технотекст 2023

Привет! Меня зовут Наташа Базанова, я старший аналитик Selectel. В компании я работаю три года: за это время команда аналитиков сильно расширилась, число задач и их амбициозность выросли. Как и любая другая команда, мы столкнулись с проблемами, связанными с несовершенством бизнес-процессов.

В этом тексте расскажу, что мы предприняли, чтобы работать эффективнее и слаженнее. Спойлер: для этого нам пришлось разделиться на две команды, но это тот случай, когда расставание пошло на пользу. Надеюсь, кому-то наш опыт и рекомендации пойдут на пользу — сэкономят время, деньги и нервы. А если вы проходили подобный путь, делитесь своей историей в комментариях!

Читать дальше →

+37

badcasedaily1 20 апр 2023 в 14:00

Сравнение SQL- и NoSQL-баз данных

Простой

11 мин

59K

Блог компании RUVDS.comNoSQL*SQL*Базы данных*

Обзор

SQL и NoSQL — две популярные модели баз данных, которые используют для решения различных задач. Чтобы понять, какая из них подойдёт в вашем случае, необходимо разобраться в их различиях, преимуществах и недостатках.

В этой статье я рассмотрю основные характеристики SQL- и NoSQL-баз данных и сравню их, чтобы помочь выбрать лучший вариант для вашего проекта.

Читать дальше →

+28

badcasedaily1 27 мар 2023 в 21:18

Как изучать SQL в 2023 году

Простой

7 мин

131K

SQL*

Из песочницы

В 2023 году SQL (Structured Query Language) остается одним из самых популярных языков программирования, используемых в области баз данных и аналитики данных. Изучение SQL может быть полезным как для тех, кто только начинает свой путь в IT, так и для опытных профессионалов, которые хотят расширить свои знания и навыки. В этой статье мы рассмотрим несколько советов и ресурсов, которые помогут вам изучать SQL в 2023 году, и оставаться в курсе последних тенденций и изменений в этой области.

Согласно данным сайта Indeed.com, в 2023 году требования к кандидатам в вакансиях, связанных с базами данных и анализом данных, включают знание SQL в качестве обязательного навыка. Некоторые из таких популярных вакансий включают в себя SQL Developer, Data Analyst, Database Administrator, Business Intelligence Analyst и другие. Согласно данным сайта Glassdoor, зарплата специалистов, владеющих навыками работы с SQL, может составлять от $50 000 до $100 000 в год в зависимости от региона и уровня опыта. В связи с этим, изучение SQL может быть полезным для тех, кто хочет улучшить свои шансы на рынке труда и получать высокую заработную плату в IT-сфере.

+32

servarius 14 фев 2023 в 07:03

Делаем ТруЪ-DevOps в мире хранилищ данных

Средний

16 мин

Блог компании ПочтатехБлог компании JUG Ru GroupDevOps*IT-стандарты*SQL*

Мнение

Меня зовут Василий, и уже больше пяти лет я причиняю DevOps в хранилищах. Последние полтора года руковожу группой автоматизации хранилищ данных в Почтатехе.

В нашем data warehouse 6,5 петабайт активных данных. Вы и сами можете представить масштабы, когда речь идет о Почте России: работа сайта и приложения, логистика, трейсинг посылок и даже строительство сортировочных центров основываются на данных нашего хранилища.

Я расскажу, как мы применяем DevOps-практики на таких объемах DWH и как внедрить подобное у себя.

+26

ultramarie 7 фев 2023 в 14:35

8 книг по PostgreSQL: от баз данных с «нуля» для самоучек до руководства про БД в облаках

Простой

7 мин

77K

Блог компании SelectelPostgreSQL*SQL*Базы данных*Профессиональная литература*

В целом, эта объектно-реляционная СУБД в дополнительном представлении не нуждается. Разработанная более 20 лет назад, она предназначена для создания и поддержки баз данных серверных приложений, в том числе ресурсоемких аналитических БД. Одна из особенностей PostgreSQL — открытый исходный код. Мы любим ее за развитое комьюнити и возможность развернуть «постгрю» самостоятельно и бесплатно.

Подготовили подборку полезных книг для тех, кто только начал или собирается работать с PostgreSQL. В нее вошли актуальные руководства на русском и английском языках. Если знаете еще одну-две отличных книги, смело рекомендуйте в комментариях.

Читать дальше →

+59

Bright_Translate 3 фев 2023 в 13:00

Распределенный SQL: альтернатива шардированию баз данных

Сложный

7 мин

20K

Блог компании RUVDS.comNoSQL*SQL*Распределённые системы*Хранение данных*

Перевод

Шардирование баз данных – это процесс разделения данных на меньшие части, называемые «шарды». Эта техника обычно используется, когда возникает потребность в масштабировании записей. В течение жизненного цикла успешного приложения способность сервера его базы обрабатывать операции записи рано или поздно достигает своего предела. Деление данных на несколько шардов – с размещением каждого на собственном сервере БД – уменьшает нагрузку на отдельные узлы, по сути, повышая записывающую способность базы данных в целом. Этот процесс и является шардингом.

Распределённый SQL представляет новый способ масштабирования реляционных баз данных с помощью полностью автоматизированной и прозрачной для приложений стратегии, подобной шардингу. Распределённые БД SQL изначально спроектированы под практически линейное масштабирование. В текущей статье вы познакомитесь с основами распределённого SQL и узнаете, как начать работу с этими базами данных.

Читать дальше →

+37

ru_vds 31 янв 2023 в 13:00

Пять факторов, которые влияют на выбор базы данных

Средний

10 мин

10K

Блог компании RUVDS.comSQL*Базы данных*Хранение данных*

Перевод

При выборе баз данных для текущего проекта (или при замене тех, которые не отвечают вашим текущим потребностям) количество возможных вариантов очень велико. Это и хорошо, и плохо, ведь нужны какие-то критерии фильтрации.

Сегодня есть гораздо больше баз данных, чем когда-либо. В декабре 2012 года, когда DB-Engines.com впервые начал ранжировать базы данных, у него получился список из 73 систем (существенный рост по сравнению с самым первым списком из 18 систем). Спустя десять лет, на декабрь 2022 года в списке было уже почти четыреста систем. За последнее десятилетие произошёл настоящий кембрийский взрыв технологий баз данных. Нужно ориентироваться в обширном пространстве вариантов: SQL, NoSQL, множество «многомодельных» баз данных, которые могут быть сочетанием SQL и NoSQL, или множественные модели данных NoSQL (сочетающие две или более опций: документы, ключи-значения, широкие столбцы, графы и так далее).

Кроме того, пользователи не должны путать популярность с применимостью для них. Хотя сетевой эффект имеет свои преимущества («Все пользуются X, поэтому не ошибусь, если выберу её»), он также может привести к групповому мышлению, торможению инноваций и конкуренции.

Мы с моим коллегой Артуром Песа недавно рассмотрели пять факторов, которые пользователи должны учитывать в первую очередь при выборе и сравнении баз данных.

Читать дальше →

+29

kalmagaev 25 янв 2023 в 12:23

Книги по SQL: что почитать новичкам и специалистам

5 мин

85K

Блог компании SelectelSQL*Изучение языковКарьера в IT-индустрии

Обзор

✏️ Технотекст 2023

SQL — декларативный язык программирования, который используют для описания, изменения и извлечения информации в реляционных базах данных. Язык структурированных запросов популярен у программистов, разработчиков и администраторов баз данных. В этом обзоре собрали 6 книг, которые помогут на старте изучения SQL и при углублении в тему.

Читали ли вы какие-нибудь из них? Или, может, вы можете дополнить этот список? Делитесь в комментариях!

Читать дальше →

+37

sepetov 6 янв 2023 в 10:22

Парсинг HTML с помощью PHP и SQL. Немного провокационный пример с анализом пользователей Хабра

11 мин

11K

HTML*SQL*PHP*

Туториал

Выковыривание информации из html — это скучно. Очень. Между тем, эта потребность выстреливает редко, но метко (© Суворов). Из-за этого есть спрос на готовые и короткие инструкции о том, как это сделать, чтобы не тратить время на изучение. Перед вами как раз такая.

Чтобы добавить хоть какой-то интерес скучнейшему занятию мы для примера будем парсить пользователей Хабра. А чтобы не мелочиться — ещё и реанимируем для этого экспериментальную библиотеку 11-летней давности.

Есть такой проект — htmlSQL. Старая библиотека времён Очаковских и покоренья Крыма (© Грибоедов). Она позволяет делать выборку из HTML в стиле SQL-запросов как на КДПВ, чем она мне когда-то и полюбилась.

Воскресим старую любовь?

+37

sicikh 6 янв 2023 в 03:47

Как создать свою СУБД с нуля и не сойти с ума. Практическое пособие начинающему некроманту. Часть первая

43 мин

37K

Ненормальное программирование*SQL*Системное программирование*DIY или Сделай самХранение данных*

Туториал

Технотекст 2022

Из песочницы

Наступил Апокалипсис.

Нет, не стоит бежать запасаться банками с консервами и крышками отечественной бай-колы! Апокалипсис произошёл только в нашей фантазии и с определённой целью — чтобы проверить, а может ли человек, обладающий только книгами по теме и стандартной библиотекой языка, воссоздать инструмент, который будет служить ему верой и правдой?

Так родился учебный проект SicQL, реляционная СУБД, чей символ — сова — это олицетворение силы знаний и мудрости. Олицетворение тех знаний и той мудрости, которые мы получим, создав с нуля то, чем мы пользуемся каждый день, может, не осознавая всей сложности таких инструментов.

Приглашаю присоединиться к увлекательному путешествию!

Принять приглашение на борт

+65

PeterBobrov 27 дек 2022 в 11:09

Как выбрать NewSQL-СУБД для вашей компании

7 мин

8.1K

Блог компании QIWIРаспределённые системы*Хранение данных*SQL*

Привет! Меня зовут Пётр, я менеджер по отказоустойчивости в QIWI. В этом посте мы поговорим про выбор новых классов продуктов. Как-то раз мы с одним разработчиком из другой компании стали обсуждать, почему бы не выбрать для работы какую-то распределенную СУБД, поддерживающую SQL? Из этой дискуссии родился мой доклад для нашей QIWI Server Party. Представляю вам его текстовую версию.

+31

jobgemws 21 дек 2022 в 07:01

Оптимизация поиска по большому полю

10 мин

6.3K

Блог компании «Лаборатория Касперского»Microsoft SQL Server*SQL*Базы данных*Программирование*

Туториал

Технотекст 2022

Вновь привет, уважаемые читатели Хабра! Работая с одной из систем хранения метаданных о файлах в «Лаборатории Касперского» вспомнил, что давно хотел написать об оптимизации поиска по большому полю в базах данных. О чем далее и расскажу более подробно.

В данной публикации будет рассмотрена оптимизация поиска по полю бинарного массива и, в частности, по равномерно распределенным данным, а также сравнение между собой выявленных способов.

Итак, представьте: у вас есть таблица в базе данных MS SQL, в которой десятки миллиардов строк данных. И в эту таблицу вставляются и удаляются суммарно десятки и сотни тысяч строк в секунду. Назовем эту таблицу dbo.metadata.

Замечание. Для проведенного анализа ниже была создана новая база данных TEST, в которой были созданы две таблицы dbo.metadata и dbo.sha256_checksum (о второй таблице будет написано ниже) и сгенерированы синтетические данные на 1+ млрд строк в каждую. После каждого вызова запроса проводился полный сброс кэша планов для базы данных TEST (DBCC FREEPROCCACHE), чтобы план для запроса каждый раз строился заново, а не брался уже готовый.

Таблица dbo.metadata упрощенно выглядит так:

Определение таблицы dbo.metadata

Читать дальше →

+42

maxim_ge 19 дек 2022 в 21:31

От Isolation к Consistency — дорога длиной в 30 лет

17 мин

9.1K

SQL*Анализ и проектирование систем*Высоконагруженные системы*

Технотекст 2022

Участвую в стартапе, в котором разрабатывается СУБД нового типа (работает поверх некоторых kv-движков, кардинально расширяя их возможности, про это немного можно прочитать здесь). Для того, чтобы сравнить то, что понемногу получается, с тем, что имеется в индустрии, пришлось на глубоком уровне проработать первоисточники по темам Isolation и Consistency (уточню, что имеется ввиду не та Consistency, что в ACID). Обнаружил интересные нюансы, которые и излагаю в этой статье.

Тезисно:

Термин Phantom Read является продуктом испорченного телефона
Смысл понятий Lost Update, Write Skew и Read Skew для разделения уровней изоляций неочевиден и относителен
Движок, который обеспечивает уровень изоляции Serializable, в распределённом мире может вести себя весьма причудливо, например, всегда возвращать пустой результат для read-only транзакций — и ему за это по стандарту "ничего не будет"
Strong consistency в Cosmos DB — предел мечтаний? (спойлер: нет)

Ну, и ещё кое-что по мелочи. В конце рассмотрим вот такой венец творения человеческого разума:

Читать дальше →

+27

Kilor 1 дек 2022 в 13:16

PostgreSQL Antipatterns: простой(?) INSERT… VALUES

3 мин

18K

Блог компании ТензорВысоконагруженные системы*PostgreSQL*SQL*Базы данных*

Представим, что у вас есть некоторая табличка статистики, куда вы периодически скидываете таймстамп последнего "текущего" состояния в паре координат - например, (ID организации, ID сотрудника).

Как больно наступить на грабли в совсем простом, казалось бы, запросе?

+35

selenzorn 25 ноя 2022 в 11:04

Как избежать распространенных ошибок при работе с СУБД

8 мин

14K

Блог компании SelectelIT-инфраструктура*SQL*Базы данных*

В этом материале мы поговорим о практиках и ошибках при работе с разными СУБД, а также поделимся чек-листом от менеджера PaaS-продуктов Selectel Андрея Андронова.

Мы начнем с планов на проект и серверных комплектующих, пройдем через правила проектирования баз данных и доберемся до уровня доступности.

Читать дальше →

+43

aborschev 9 ноя 2022 в 14:17

NULL-значения в PostgreSQL: правила и исключения

8 мин

62K

Блог компании Postgres ProfessionalSQL*PostgreSQL*

Навскидку многим кажется, что они знакомы с поведением NULL-значений в PostgreSQL, однако иногда неопределённые значения преподносят сюрпризы. Предлагаем вашему вниманию расшифровку доклада Алексея Борщева с PGConf.Russia 2022 — он был полностью посвящён особенностям NULL-значений в Postgres.

NULL простыми словами

Что такое SQL база данных? Согласно одному из определений, это просто набор взаимосвязанных таблиц. А что такое NULL? Обратимся к простому бытовому примеру: все мы задаём друг другу дежурный вопрос: «Как дела?». Часто мы получаем в ответ: «Да ничего...» Вот это «ничего» нам и нужно положить в базу данных — NULL, неопределённое, некорректное или неизвестное значение.

+33

alekskram 30 окт 2022 в 15:08

Топ полезных SQL-запросов для PostgreSQL

7 мин

113K

PostgreSQL*SQL*Базы данных*Хранение данных*

Технотекст 2022

Статей о работе с PostgreSQL и её преимуществах достаточно много, но не всегда из них понятно, как следить за состоянием базы и метриками, влияющими на её оптимальную работу. В статье подробно рассмотрим SQL-запросы, которые помогут вам отслеживать эти показатели и просто могут быть полезны как пользователю.

+78

guryanov 12 окт 2022 в 11:09

Как запускать SQL в Go с максимальным комфортом

5 мин

20K

Блог компании VKPostgreSQL*SQL*Go*

Туториал

Писать SQL руками или использовать ORM — тема очень спорная, и я опишу, как использовать первый подход максимально эффективно. А какой из подходов выбрать, думаю, каждый сам для себя уже решил.

+43

ru_vds 10 окт 2022 в 13:00

Управление данными с помощью CI/CD

9 мин

6.8K

Блог компании RUVDS.comDevOps*SQL*Базы данных*

Перевод

Я вспоминаю свой первый день разработчиком-джуном, он свеж в моей памяти, как будто это было вчера. Я ужасно нервничал и понятия не имел, что делаю. Наверно, мой стресс был заметен, потому что одна добрая душа решила взять меня под свою защиту. В тот день я научился писать SQL в коде на PHP, чтобы делать интересные вещи с базой данных.

Однако прежде чем начать, я должен был попросить администратора базы данных (database administrator, DBA) создать несколько таблиц. Я быстро понял, что для того, чтобы сделать любое действие, нужно сразу обращаться к DBA. Нужен новый столбец? Свяжись с DBA. Необходимо отредактировать хранимую процедуру? Это работа для DBA. Я смотрел на него снизу вверх, он был такой суперзвездой, что в итоге позже я сам стал администратором.

Разумеется, я понимаю, что зависимость от кого-либо неизбежно создаёт ограничения. Это безрассудно, трудно и, что хуже всего, впустую тратит навыки DBA.

Читать дальше →

+28

1 2 3

5 6 ...

18 19

SQL *

ClickHouse: полезные лайфхаки

Разработчики — налево, методологи — направо: четыре шага к оптимизации работы BI-аналитиков

Сравнение SQL- и NoSQL-баз данных

Как изучать SQL в 2023 году

Делаем ТруЪ-DevOps в мире хранилищ данных

8 книг по PostgreSQL: от баз данных с «нуля» для самоучек до руководства про БД в облаках

Распределенный SQL: альтернатива шардированию баз данных

Пять факторов, которые влияют на выбор базы данных

Книги по SQL: что почитать новичкам и специалистам

Парсинг HTML с помощью PHP и SQL. Немного провокационный пример с анализом пользователей Хабра

Как создать свою СУБД с нуля и не сойти с ума. Практическое пособие начинающему некроманту. Часть первая

Как выбрать NewSQL-СУБД для вашей компании

Оптимизация поиска по большому полю

Ближайшие события

От Isolation к Consistency — дорога длиной в 30 лет

PostgreSQL Antipatterns: простой(?) INSERT… VALUES

Как избежать распространенных ошибок при работе с СУБД

NULL-значения в PostgreSQL: правила и исключения

Топ полезных SQL-запросов для PostgreSQL

Как запускать SQL в Go с максимальным комфортом

Управление данными с помощью CI/CD

Вклад авторов