SQL *

Формальный непроцедурный язык программирования

СтатьиПостыНовостиАвторыКомпании

kkmspb 11 ноя 2023 в 14:26

Пишем свой QTableView (продолжение: кастомные стили)

Сложный

1 мин

4.1K

C++*SQL*Qt*

Туториал

Создаем свой кастомный стиль для QTableView без css стилей и переопределения ролей модели данных. Занимаемся отрисовкой напрямую.

yooteam 1 сен 2023 в 08:33

Какой парсер для автоматизации ревью кода лучше — DacFx или ANTLR

Средний

4 мин

Блог компании ЮMoneySQL*Microsoft SQL Server*

Обзор

Привет, меня зовут Артём Коршунов, я программист в ЮMoney. В нашей команде много разработчиков, и все они пишут огромное количество кода. Его нужно проверять, но встроенных валидаций для проверки не всегда хватает, из-за чего могут возникать проблемы. Рассказываю, с какими сталкивались мы, пока не попробовали DacFx с объектной моделью и не автоматизировали валидацию.

Mi_Potapov 21 авг 2023 в 08:30

Проектирование базы данных в SAP PowerDesigner

Средний

10 мин

11K

Базы данных*SQL*Oracle*

Туториал

Привет!

Проектирование базы данных - это один из важнейших этапов создания информационной системы. Оно включает в себя определение сущностей, их атрибутов и связей между ними, а также выбор наиболее подходящих типов данных и ограничений целостности.

В данной статье мы рассмотрим процесс проектирования базы данных с нуля (в качестве примера возьмем только один слой БД - витринный, он же Data Mart) с использованием ПО SAP PowerDesigner. В качестве СУБД мы будем использовать Oracle 19c, но вы можете выбрать любую другую, по вашим потребностям (как - об этом чуть ниже).

Рассмотренный в статье инструмент будет интересен системным аналитикам, архитекторам, разработчикам БД и даже бизнес-аналитикам, поскольку помимо создания физических и логических моделей в нем можно рисовать ER-диаграммы, BPMN-модели и многое другое.

SirBes 18 авг 2023 в 08:39

PDM и почему он вечно тормозит

Средний

4 мин

1.9K

IT-инфраструктура*SQL*ERP-системы*Инженерные системы*

Из песочницы

Чем вызваны тормоза в PDM, PDM, ERP?

Вообще тормоза в большинстве современных систем мало связаны с тем, что программа может быть еще в разработке или что там может быть что-то не совсем оптимально сделано, хотя и не без этого.

Тут сам по себе важен принцип баз, на которых построены эти программы.

Большинство современных систем построено на MSSQL и его аналогах; впрочем некоторые из них в какой-то мере могут работать лучше, а в чем-то могут быть и хуже, да и развитие самой MSSQL не стоит на месте: что-то улучшается, что-то «оптимизируется». Некоторые пользователи уже давно считают, что имеет место заговор IT-гигантов с производителями электроники, и некоторые «оптимизации» сделаны специально для замедления работы. Впрочем, такие заговоры уже не раз вскрывались, и никто с этим так ничего и не сделал, а все подобные дела просто спускались на тормозах.

Рассмотрим принцип работы баз на основе PDM.

koloskovv 11 июл 2023 в 12:39

Мониторинг PostgreSQL. Новые возможности анализа производительности 1С и других систем. Часть 1: счётчики

Простой

10 мин

16K

Блог компании SOFTPOINTPostgreSQL*SQL*Microsoft SQL Server*1С*

Обзор

В данной статье хочу поднять тему, которая представляет собой одну большую боль для администраторов, разработчиков и тестировщиков высоконагруженных (и не очень) систем под управлением PostgreSQL. Даже не «боль», а «БОЛЬ»!

Удивительно, что за почти 30 лет существования PostgreSQL не появилось нормальных инструментов для получения вменяемых счетчиков и трассировок. Все, кто работают с MS SQL Server используют профайлер. Это обязательный и привычный инструмент, который позволяет вылавливать запросы, интересные нам в рамках исследования. Вылавливать как все запросы без разбора, так и какие-то единичные запросы, которые удовлетворяют правилам отбора. Кроме того, можно настроить не одну трассу, а столько сколько нужно, с разными фильтрами. Эти трассы содержат очень богатый набор измерений для анализа: – Reads физические и логические; Writes; SPID, Процессорное время; план запроса (хэш плана), количество строк и т.д.

Многие компании стали всерьез рассматривать СУБД PostgreSQL как замену MSSQL и сталкиваются с тем, что возможностей для ее мониторинга просто нет – она как черный ящик, в котором наощупь вылавливаешь какую-ту информацию и пытаешься систематизировать ее хоть как-то.

NortherSnake 24 июн 2023 в 07:18

Практика по JOIN в SQL: упрощаем ежедневные задачи и решаем тестовое

Средний

5 мин

30K

Блог компании Яндекс ПрактикумSQL*Учебный процесс в IT

Туториал

Привет, Хабр! Меня зовут Александр Сушков, я аналитик данных, эксперт по SQL, автор, преподаватель и наставник курсов «SQL для работы с данными и аналитики» и «Аналитик данных».

Один из самых распространённых операторов в SQL — это JOIN. В статье расскажу об особенностях этого оператора: как использовать другие операторы в JOIN после ON, кроме «равно», и зачем это может быть нужно.

yooteam 21 апр 2023 в 11:01

Как ЮMoney работает с данными в DWH на Microsoft SQL Server — ежегодный митап High SQL

1 мин

894

Блог компании ЮMoneyIT-компанииКонференцииIT-инфраструктура*SQL*

Как ЮMoney работает с данными в DWH на Microsoft SQL Server — ежегодный митап High SQL

ИТ-специалисты, вы тут? Начинаем наши митапы, и первый на очереди — High SQL.

Встречаемся 27 апреля в 18:00 по Москве.

Aleksandra-Belova 2 мар 2023 в 18:21

Sore query language, или 5 ошибок при первом изучении SQL

Простой

8 мин

6.5K

PostgreSQL*SQL*

Эта статья о том, как аналитик изучает основы SQL, какие допускает ошибки и как старается их исправить. В статье будет то, что помогает погрузиться в SQL впервые: схемы и примеры кода, понятия и определения, проблемы и решения. Статья рассчитана на аналитиков-новичков.

Предыстория: аналитик создает отчёты в BI для директора компании «ABC». Аналитик не умеет программировать и подключается к данным по инструкции. Директор требует срочно добавить в отчёт данные из 3 источников: SAP – объем выручки от продаж; HRLink – затраты на персонал; Битрикс – время обработки заявок.

Аналитик ставит задачу data инженеру на добавление новых данных в BI. Data инженер – единственный специалист по работе с данными в офисе из 400 человек. Он критически оценивает сроки выполнения задачи и объявляет: «Минимум – 2 недели». Такой срок директора не устраивает. Инженер предлагает аналитику альтернативное решение...

И вот какое...

fedortyurin 23 янв 2023 в 09:21

Как в Учи.ру построили платформу для анализа A/B-тестов на ClickHouse

6 мин

2.8K

Блог компании Учи.ру teamSQL*IT-инфраструктура*Big Data*

Кейс

Привет, Хабр! Меня зовут Федор Тюрин, я руководитель команды продуктовой аналитики в Учи.ру. Мы проводим очень много А/Б-тестов (десятки запусков в неделю и сотни в течение года). В таких условиях очень важна автоматизация процесса анализа и подведения итогов теста.

mochila007 30 сен 2022 в 09:56

15 нейросетей в один Telegram-бот: история успеха и реализация помощника для создателей контента

3 мин

44K

Natural Language Processing*Python*SQL*Машинное обучение*

Из песочницы

Всем привет! Я занимаюсь NLP в сфере Data Science и хочу поделиться результатами разработки Telegram-бота, у которого под капотом уже 15 нейросетей. Речь идёт о TurboText_bot. Он будет полезен всем, кто причастен к созданию контента. К таким можно отнести блогеров, журналистов, копирайтеров и многих других специалистов.. Даже бабушек у подъезда, ведь бот способен генерировать и обрабатывать новости.

Что удалось реализовать?

Depact 4 сен 2022 в 08:38

Поваренная книга миграции данных между БД или как перенести данные из одной БД в другую с минимальной болью V1.1

12 мин

28K

PostgreSQL*.NET*SQL*C#*

Из песочницы

Одно я могу сказать точно: миграция данных между двумя БД - это одна из, если не самая сложная часть при смене СУБД или схемы базы данных. И что-то мне подсказывает, что Вы не фанат громоздких, чрезвычайно трудно отлаживаемых, SQL конструкций.

yurikgl 24 июл 2022 в 12:01

Быстрая выгрузка результатов опроса из 1С-Битрикс и как передать в Excel произвольное количество столбцов SQL-запросом

7 мин

3.4K

SQL*1С-Битрикс*

Статья направлена на решение проблемы "зависания" выгрузки результатов опросов при использовании модуля Vote 1С-Битрикс в случае, если в опросе много вопросов или ответов. Так-же в статье реализована выгрузка в Excel SQL-запроса при заранее неизвестном количестве полей, т.е. каждое поле формируется динамически.

p0mami 16 июн 2022 в 16:27

DataVault на Greenplum с помощью DBT

12 мин

12K

Big Data*SQL*

Туториал

Привет, Хабр!

Меня зовут Марк Порошин, я занимаюсь DataScience в DV Group. Недавно я уже рассказывал про то, как начать трансформировать данные с помощью dbt. Сегодня я решил поделиться, как мы в DV Group поженили dbt, Greenplum и DataVault, собрали все грабли, что могли; немного поконтрибьютили в open-source, но по итогу остались очень довольны результатом.

Расскажу сначала пару слов о том, что такое DataVault. DataVault - методология построения хранилища, предполагающая высокую нормализацию данных (3ая нормальная форма). Основными ее компонентами являются:

kirillverenih 12 мая 2022 в 09:01

Геймификация обучения в IT

2 мин

11K

CSS*SQL*Git*

Геймификация — это процесс использования игровых элементов в неигровом контексте. Он имеет много преимуществ по сравнению с традиционными подходами к обучению, в том числе:

KiraD 30 мар 2022 в 08:48

Импорт и экспорт данных в PostgreSQL, гайд для начинающих

3 мин

181K

PostgreSQL*SQL*

Из песочницы

В процессе обучения аналитике данных у человека неизбежно возникает вопрос о миграции данных из одной среды в другую. Поскольку одним из необходимых навыков для аналитика данных является знание SQL, а одной из наиболее популярных СУБД является PostgreSQL, предлагаю рассмотреть импорт и экспорт данных на примере этой СУБД.

В своё время, столкнувшись с импортом и экспортом данных, обнаружилось, что какой-то более-менее структурированной инфы мало: этот момент обходят на всяких там курсах по аналитике, подразумевая, что это очень простые моменты, которым не следует уделять внимание.

В данной статье приведены примеры импорта в PostgreSQL непосредственно самой базы данных в формате sql, а также импорта и экспорта данных в наиболее простом и распространенном формате .csv, в котором в настоящее время хранятся множество существующих датасетов. Формат .json хоть и является также очень распространенным, рассмотрен не будет, поскольку, по моему скромному мнению, с ним все-таки лучше работать на Python, чем в SQL.

X5Tech 26 фев 2022 в 12:38

Школа аналитиков данных

1 мин

7.2K

Блог компании X5 TechBig Data*Машинное обучение*IT-компанииSQL*

X5 Tech приглашает студентов и выпускников вузов пройти бесплатное обучение по профессии Data Analyst. Уже через три месяца обучения можно будет пройти оплачиваемую стажировку в Х5 Group.

Tzimie 20 янв 2022 в 14:11

С чем кушать Irregular Selectivity в MSSQL и не только

5 мин

7.2K

Microsoft SQL Server*SQL*PostgreSQL*MySQL*

Недавно мне пришлось объяснять это нашим братьям меньшим на работе, и я решил написать текст, который может пригодиться. В конце вы найдете ссылку на полезный скрипт для MSSQL, а также Postgres и MySQL.

В идеальном мире, если в таблице миллион записей, а разных значений например всего 100K, то на каждое значение приходится по 10 записей. Но что делать, если в список ваших значений затесалось особое значение, например, NULL, пробел или 'n/a'? Для SQL optimizier это головная боль. Для вас тоже.

Картинка иллюстрирует людей со значением 'n/a' в поле SSN

SbWereWolf 7 янв 2022 в 01:12

Идеальный каталог, замеры производительности

5 мин

2.7K

PostgreSQL*Хранение данных*SQL*PHP*

Всем привет.

Я разрабатываю библиотеку для работы с Entity Attribute Value (репозиторий), сокращенно EAV (модель базы данных для хранения произвольных данных). В конце прошлой статьи я спросил у вас о чём мне ещё надо написать, вы попросили показать пример использования и сделать замеры быстродействия.

Что для нас важно при работе с данными ? Скорость записи (добавления или обновления) и скорость чтения (конкретно - фильтрации по моделям одной сущности). При чём скорость поиска в приоритете, потому что записываем мы один раз в цать дней, а читаем каждую минуту/секунду и даже не один раз, а может быть и не одну сотню раз.

Фишка библиотеки в том что бы работать не с представлением построенном на базовых таблицах EAV, а работать с небольшой частью этих данных записанных в отдельное материализованное представление или в отдельную таблицу.

В Новогодние каникулы я сделал замеры производительности и хочу с вами поделиться результатами

Что будем измерять ?

Чтение:

Время вычитывания всех позиций категории

Время формирования параметров фильтрации

Время фильтрации

Запись:

Время добавления новой характеристики (атрибута)

Время добавления новой товарной позиции (модели)

Время обновления товарной позиции

honyaki 10 дек 2021 в 19:43

Как очищать данные при помощи SQL

11 мин

19K

Блог компании SkillfactorySQL*Программирование*PostgreSQL*Python*

Туториал

Перевод

За время работы автору довелось использовать многие инструменты анализа, включая Excel, R и Python. Попробовав PostgreSQL и TimescaleDB, автор поняла, насколько простыми могут быть задачи очистки. Делимся подробностями сравнения PostgreSQL и Python из блога TimescaleDB, пока у нас начинается курс по аналитике данных.

Читать далеее

neoflex 26 ноя 2021 в 10:21

Визуализация данных с помощью Oracle Apex

6 мин

5.1K

Блог компании NeoflexOracle*SQL*Визуализация данных*Графический дизайн*

Oracle Apex – компонент для разработки конечных приложений, входящий в состав поставки СУБД Oracle, позволяющий быстро «доставать» данные из базы и доставлять их через веб-интерфейс конечному пользователю. Как правило, данные для просмотра и редактирования выдаются в табличном виде и Apex предоставляет богатые возможности для настраивания отчета: можно накладывать фильтры, делать сортировку и группировку, скрывать имеющиеся столбцы и добавлять расчетные новые, делать сводные отчеты, выгружать данные в формате csv, pdf и даже Excel. Каждый пользователь может сохранить предпочитаемые им настройки каждого отчета как индивидуально, так и для совместного использования. В таком формате Apex функционирует у большинства наших заказчиков.

Однако мало кто использует довольно широкие возможности Apex’а для построения графиков. Эта тема, на наш взгляд, довольно интересна и мало освещена в интернете.

В этой статье будем предполагать, что читатель имеет представление о разработке приложений с помощью Oracle Apex.

1 2 ...

83 84

86 87 88 89 90

SQL *

Пишем свой QTableView (продолжение: кастомные стили)

Какой парсер для автоматизации ревью кода лучше — DacFx или ANTLR

Проектирование базы данных в SAP PowerDesigner

PDM и почему он вечно тормозит

Мониторинг PostgreSQL. Новые возможности анализа производительности 1С и других систем. Часть 1: счётчики

Практика по JOIN в SQL: упрощаем ежедневные задачи и решаем тестовое

Как ЮMoney работает с данными в DWH на Microsoft SQL Server — ежегодный митап High SQL

Sore query language, или 5 ошибок при первом изучении SQL

Как в Учи.ру построили платформу для анализа A/B-тестов на ClickHouse

15 нейросетей в один Telegram-бот: история успеха и реализация помощника для создателей контента

Поваренная книга миграции данных между БД или как перенести данные из одной БД в другую с минимальной болью V1.1

Быстрая выгрузка результатов опроса из 1С-Битрикс и как передать в Excel произвольное количество столбцов SQL-запросом

DataVault на Greenplum с помощью DBT

Ближайшие события

Геймификация обучения в IT

Импорт и экспорт данных в PostgreSQL, гайд для начинающих

Школа аналитиков данных

С чем кушать Irregular Selectivity в MSSQL и не только

Идеальный каталог, замеры производительности

Как очищать данные при помощи SQL

Визуализация данных с помощью Oracle Apex

Вклад авторов