SQL *

Формальный непроцедурный язык программирования

СтатьиПостыНовостиАвторыКомпании

Andrey_Biryukov 10 мар 2023 в 09:28

Безопасная разработка в Java

Простой

9 мин

10K

Блог компании OTUSИнформационная безопасность * Java * SQL *

Язык программирования Java является одним из самых распространенных языков программирования. На нем написано множество сложных приложений как под Linux, так и под Windows. Однако, как и у любого другого языка программирования, у Java есть свои уязвимости.

Цель этой статьи познакомиться с уязвимостями, типичными для языка программирования Java, а также разобрать практики безопасного кодирования.

Aleksandra-Belova 2 мар 2023 в 18:21

Sore query language, или 5 ошибок при первом изучении SQL

Простой

8 мин

7.2K

PostgreSQL * SQL *

Эта статья о том, как аналитик изучает основы SQL, какие допускает ошибки и как старается их исправить. В статье будет то, что помогает погрузиться в SQL впервые: схемы и примеры кода, понятия и определения, проблемы и решения. Статья рассчитана на аналитиков-новичков.

Предыстория: аналитик создает отчёты в BI для директора компании «ABC». Аналитик не умеет программировать и подключается к данным по инструкции. Директор требует срочно добавить в отчёт данные из 3 источников: SAP – объем выручки от продаж; HRLink – затраты на персонал; Битрикс – время обработки заявок.

Аналитик ставит задачу data инженеру на добавление новых данных в BI. Data инженер – единственный специалист по работе с данными в офисе из 400 человек. Он критически оценивает сроки выполнения задачи и объявляет: «Минимум – 2 недели». Такой срок директора не устраивает. Инженер предлагает аналитику альтернативное решение...

И вот какое...

Vogal 28 фев 2023 в 09:16

Как выбрать для своего конвейера данных максимально эффективную архитектуру

Средний

9 мин

7.2K

Блог компании билайнВысоконагруженные системы * SQL * Базы данных * Хранение данных *

Туториал

Привет! Меня зовут Михаил Благов, я руководитель департамента «Чаптер инженеров данных и разработчиков» в beeline tech. В этом посте я хочу поделиться способом, с помощью которого можно выбрать подходящую архитектуру для конвейера данных в зависимости от требований к нему. В частности, обсудим паттерн CDC (change data capture, aka «захват изменений»), основная идея которого — быстрая репликация какого-то источника в аналитическое хранилище.

Под катом мы:

- познакомимся с вариантами архитектуры конвейеров данных: из каких компонентов и как его можно собирать,

- рассмотрим и сравним четыре разные архитектуры конвейеров.

Disclaimer: серебряной пули не будет, в этой статье я поделюсь опытом выбора архитектуры для решения конкретной задачи. Аналогичный выбор для других случаев потребует дополнительных исследований и замеров производительности.

Начнем с матчасти

+18

Kilor 21 фев 2023 в 05:35

SQL HowTo: крупицы золота в реестре

Сложный

7 мин

403

Блог компании ТензорАлгоритмы * SQL * PostgreSQL * Высоконагруженные системы *

Туториал

В большинстве учетных систем, типа нашего СБИС, рано или поздно возникает проблема быстрого отображения реестра, в который по просьбам бизнес‑пользователей накручено несколько комбинируемых фильтров с очень редкой выборкой, ну никак не ложащихся в вашу красивую структуру базы данных и индексов базовой таблицы реестра — что‑нибудь типа "список продаж покупателям, чей день рождения выпадает на 29 февраля".

Универсального способа сделать «хорошо» тут нет, но я расскажу про модель запроса, которая позволит вам дать пользователю быстрый отклик, но при этом весьма эффективно с точки зрения PostgreSQL.

+18

pluzanov 20 фев 2023 в 13:35

PostgreSQL 16: Часть 4 или Коммитфест 2023-01

17 мин

6.3K

Блог компании Postgres ProfessionalPostgreSQL * SQL *

Продолжаем следить за новинками 16-й версии. В начале февраля завершился четвертый коммитфест. Что нового нас ждет впереди?

Напомню, что самое интересное из первых трех коммитфестов можно прочитать в предыдущих статьях серии: 2022-07, 2022-09, 2022-11.

Читать дальше →

servarius 14 фев 2023 в 07:03

Делаем ТруЪ-DevOps в мире хранилищ данных

Средний

16 мин

6.9K

Блог компании ПочтатехБлог компании JUG Ru GroupDevOps * IT-стандарты * SQL *

Мнение

Меня зовут Василий, и уже больше пяти лет я причиняю DevOps в хранилищах. Последние полтора года руковожу группой автоматизации хранилищ данных в Почтатехе.

В нашем data warehouse 6,5 петабайт активных данных. Вы и сами можете представить масштабы, когда речь идет о Почте России: работа сайта и приложения, логистика, трейсинг посылок и даже строительство сортировочных центров основываются на данных нашего хранилища.

Я расскажу, как мы применяем DevOps-практики на таких объемах DWH и как внедрить подобное у себя.

+26

yumata 14 фев 2023 в 03:51

Наследование данных или иерархический справочник неограниченной глубины, который всегда возвращает значение…

3 мин

2.7K

SQL *

Без справочников не обходится ни одна информационная система. Как правило, такие справочники представлены в виде одной либо нескольких таблиц, иногда связанных между собой. Одной из проблем является "неполнота" данных, когда справочник не заполнен по определенным позициям.

Необходимо разработать структуру справочника, который выдает значение "всегда", если нет значения в запрашиваемом узле справочника - должно быть выдано значение из вышестоящего уровня иерархии.

-6

completoru 9 фев 2023 в 16:25

Автоматизация маркетинга и продаж: 900+ заявок ежемесячно

5 мин

3.9K

Email-маркетинг * SQL * Интернет-маркетинг * Управление продажами *

Из песочницы

После всем известных событий некоторые каналы привлечения платного трафика стали недоступны или существенно снизилась их отдача.

Мы в Completo более активно стали привлекать клиентов с помощью других инструментов. Это позволило не просесть по лидам. В результате мы получаем от 900 до 1200 MQL ежемесячно, в том числе благодаря автоматизации процессов. В этом материале делимся опытом и рассказываем, как работает автоматизация у нас.

-3

ultramarie 7 фев 2023 в 14:35

8 книг по PostgreSQL: от баз данных с «нуля» для самоучек до руководства про БД в облаках

Простой

7 мин

108K

Блог компании SelectelPostgreSQL * SQL * Базы данных * Профессиональная литература *

В целом, эта объектно-реляционная СУБД в дополнительном представлении не нуждается. Разработанная более 20 лет назад, она предназначена для создания и поддержки баз данных серверных приложений, в том числе ресурсоемких аналитических БД. Одна из особенностей PostgreSQL — открытый исходный код. Мы любим ее за развитое комьюнити и возможность развернуть «постгрю» самостоятельно и бесплатно.

Подготовили подборку полезных книг для тех, кто только начал или собирается работать с PostgreSQL. В нее вошли актуальные руководства на русском и английском языках. Если знаете еще одну-две отличных книги, смело рекомендуйте в комментариях.

Читать дальше →

+59

Bright_Translate 3 фев 2023 в 13:00

Распределенный SQL: альтернатива шардированию баз данных

Сложный

7 мин

25K

Блог компании RUVDS.comNoSQL * SQL * Распределённые системы * Хранение данных *

Перевод

Шардирование баз данных – это процесс разделения данных на меньшие части, называемые «шарды». Эта техника обычно используется, когда возникает потребность в масштабировании записей. В течение жизненного цикла успешного приложения способность сервера его базы обрабатывать операции записи рано или поздно достигает своего предела. Деление данных на несколько шардов – с размещением каждого на собственном сервере БД – уменьшает нагрузку на отдельные узлы, по сути, повышая записывающую способность базы данных в целом. Этот процесс и является шардингом.

Распределённый SQL представляет новый способ масштабирования реляционных баз данных с помощью полностью автоматизированной и прозрачной для приложений стратегии, подобной шардингу. Распределённые БД SQL изначально спроектированы под практически линейное масштабирование. В текущей статье вы познакомитесь с основами распределённого SQL и узнаете, как начать работу с этими базами данных.

Читать дальше →

+36

MiSta1984 3 фев 2023 в 12:47

Проблема N+1 и как её решить с помощью EntityGraph

6 мин

55K

Java * SQL *

Обзор

Всем привет! В данной статье попробуем разобраться с проблемой N+1 (или может правильнее 1+N?) и как ее решить с помощью использования EntityGraph.

Проблема N+1 возникает, когда мы генерируем запрос на получение одной сущности из базы данных, но у данной сущности есть свои связанные сущности, которые мы тоже хотим получить и hibernate генерирует вначале один (1) запрос к базе данных, чтобы получить интересующую нас сущность, а потом N запросов, чтобы достать из базы данных связанные сущности. Данная проблема отражается отрицательно на производительности работы базы данных из-за большого числа обращений к ней.

Создадим проект и подключим следующие зависимости:

BISalavat 31 янв 2023 в 16:37

Как я создавал свой первый дашборд на Visiology 3 и почему второй буду делать немного позже

5 мин

6.2K

Блог компании VisiologySQL * Big Data * Визуализация данных * Хранение данных *

Кейс

Привет, Хабр! Меня зовут Салават Сафиуллин, и сегодня я хочу поделиться с вами своим первым опытом создания дашборда на Visiology 3. Это новая версия платформы, которой мы пользуемся уже несколько лет, но она кардинально отличается как архитектурой, так и принципами работы. Дашборды на версии нужно создавать заново и по-другому. Поэтому мне было особенно интересно сделать пробу и подготовить дашборд на базе демонстрационной Visiology 3.0. Под катом — подробный рассказ о моем "пилоте" и некоторые мысли о работе с новой версией Visiology.

+17

ru_vds 31 янв 2023 в 13:00

Пять факторов, которые влияют на выбор базы данных

Средний

10 мин

11K

Блог компании RUVDS.comSQL * Базы данных * Хранение данных *

Перевод

При выборе баз данных для текущего проекта (или при замене тех, которые не отвечают вашим текущим потребностям) количество возможных вариантов очень велико. Это и хорошо, и плохо, ведь нужны какие-то критерии фильтрации.

Сегодня есть гораздо больше баз данных, чем когда-либо. В декабре 2012 года, когда DB-Engines.com впервые начал ранжировать базы данных, у него получился список из 73 систем (существенный рост по сравнению с самым первым списком из 18 систем). Спустя десять лет, на декабрь 2022 года в списке было уже почти четыреста систем. За последнее десятилетие произошёл настоящий кембрийский взрыв технологий баз данных. Нужно ориентироваться в обширном пространстве вариантов: SQL, NoSQL, множество «многомодельных» баз данных, которые могут быть сочетанием SQL и NoSQL, или множественные модели данных NoSQL (сочетающие две или более опций: документы, ключи-значения, широкие столбцы, графы и так далее).

Кроме того, пользователи не должны путать популярность с применимостью для них. Хотя сетевой эффект имеет свои преимущества («Все пользуются X, поэтому не ошибусь, если выберу её»), он также может привести к групповому мышлению, торможению инноваций и конкуренции.

Мы с моим коллегой Артуром Песа недавно рассмотрели пять факторов, которые пользователи должны учитывать в первую очередь при выборе и сравнении баз данных.

Читать дальше →

+29

Usetech 30 янв 2023 в 08:14

Tarantool Data Grid + Java = …

6 мин

4.6K

Блог компании UsetechJava * SQL * Tarantool *

Туториал

В последнее время всё большую популярность набирает Tarantool — платформа in-memory вычислений с гибкой схемой данных, включающая в себя NoSQL-базу данных и сервер приложений. В этой статье я хочу рассказать об одной из его реализаций — Tarantool Data Grid (TDG).

Andrey_Biryukov 26 янв 2023 в 11:37

Разворачиваем MySQL: установка и настройка

6 мин

67K

Блог компании OTUSSQL * Базы данных *

MySQL на сегодняшний день является одной из наиболее распространенных в мире. Достаточно сказать, что по рейтингам 2021 года данная СУБД лишь немного уступала Oracle.

kalmagaev 25 янв 2023 в 12:23

Книги по SQL: что почитать новичкам и специалистам

5 мин

123K

Блог компании SelectelSQL * Изучение языковКарьера в IT-индустрии

Обзор

✏️ Технотекст 2023

SQL — декларативный язык программирования, который используют для описания, изменения и извлечения информации в реляционных базах данных. Язык структурированных запросов популярен у программистов, разработчиков и администраторов баз данных. В этом обзоре собрали 6 книг, которые помогут на старте изучения SQL и при углублении в тему.

Читали ли вы какие-нибудь из них? Или, может, вы можете дополнить этот список? Делитесь в комментариях!

Читать дальше →

+37

fedortyurin 23 янв 2023 в 09:21

Как в Учи.ру построили платформу для анализа A/B-тестов на ClickHouse

6 мин

3.4K

Блог компании Учи.ру teamSQL * IT-инфраструктура * Big Data *

Кейс

Привет, Хабр! Меня зовут Федор Тюрин, я руководитель команды продуктовой аналитики в Учи.ру. Мы проводим очень много А/Б-тестов (десятки запусков в неделю и сотни в течение года). В таких условиях очень важна автоматизация процесса анализа и подведения итогов теста.

Kilor 13 янв 2023 в 12:40

PostgreSQL Antipatterns: Индиана Джонс и максимальное значение ключа, или В поисках «последних» записей

2 мин

506

Блог компании ТензорВысоконагруженные системы * PostgreSQL * SQL * Базы данных *

Туториал

Сегодняшняя задача вполне традиционна для любых учетных систем - поиск записей, содержащих максимальное значение по каждому из ключей. Что-то вроде "покажи мне последний заказ по каждому из клиентов", если переводить в прикладную область.

Кажется, что тут и споткнуться-то негде в реализации - но все оказывается совсем не тривиально.

+20

SaZha 10 янв 2023 в 12:37

Магия оптимизации SQL запросов

7 мин

83K

Базы данных * SQL * PostgreSQL * MySQL *

Из песочницы

Даже самый простой SQL запрос можно выполнить по-разному. Но из всех вариантов СУБД нужно выбрать оптимальный, как же это сделать? Неужели придётся перебрать все возможные варианты? Давайте разбираться.

+24

sepetov 6 янв 2023 в 10:22

Парсинг HTML с помощью PHP и SQL. Немного провокационный пример с анализом пользователей Хабра

11 мин

13K

PHP * SQL * HTML *

Туториал

Выковыривание информации из html — это скучно. Очень. Между тем, эта потребность выстреливает редко, но метко (© Суворов). Из-за этого есть спрос на готовые и короткие инструкции о том, как это сделать, чтобы не тратить время на изучение. Перед вами как раз такая.

Чтобы добавить хоть какой-то интерес скучнейшему занятию мы для примера будем парсить пользователей Хабра. А чтобы не мелочиться — ещё и реанимируем для этого экспериментальную библиотеку 11-летней давности.

Есть такой проект — htmlSQL. Старая библиотека времён Очаковских и покоренья Крыма (© Грибоедов). Она позволяет делать выборку из HTML в стиле SQL-запросов как на КДПВ, чем она мне когда-то и полюбилась.

Воскресим старую любовь?

+37

1 2 ...

39 40

42 43 ...

108 109