SQL *

Формальный непроцедурный язык программирования

СтатьиПостыНовостиАвторыКомпании

kapec_art 15 ноя 2021 в 16:48

Как я реализовал git-flow для SQL

7 мин

10K

.NET * SQL * Git *

Из песочницы

Технотекст 2021

Как подключить SQL объекты MSSQL Server к GIT и TeamCity.

AlexKMK 12 ноя 2021 в 13:13

Поиск стат. значимости в BigQuery или удаление шума

4 мин

1.6K

Программирование * SQL * Big Data *

Туториал

Всё началось с использования ML в BigQuery — оказалось это совсем не больно, и очень эффективно.

Мы в GFN.RU используем модель K-Means для поиска аномалий в работе сервиса. Ведь невозможно кожаному мешку смотреть десятки графиков по тысячам игр ежедневно. Пусть электрический болван подсказывает куда нужно глянуть.

polarnik 12 ноя 2021 в 08:11

Атака не клонов, или Генерация и анализ тестовых данных для нагрузки. Часть 1

6 мин

4.3K

Блог компании Конференции Олега Бунина (Онтико)SQL * Java * Тестирование IT-систем * Высоконагруженные системы *

Как добиться необходимого контроля, удобства и даже скорости при подготовке тестовых данных для микросервисов и тестов производительности? В каких случаях лучше не генерировать XML и JSON файлы с помощью конкатенации строк? Зачем анализировать статистику по SQL запросам?

Меня зовут Вячеслав Смирнов, и я ускоряю дистанционное банковское обслуживание юридических лиц, а еще поддерживаю чат QA — Load & Performance в Телеграм, где сообщество инженеров по тестированию производительности обсуждает тестирование нагрузки.

Статья получилась длинной, поэтому сегодня я расскажу про подготовку тестовых данных для тестирования производительности и про то, как с помощью SQL, Pandas и Java эти данные готовить. Поговорим про анализ метрик и логов с точки зрения данных и с использованием InfluxDB, Grafana и прочих инструментов, А ещё о том, как может выглядеть хороший отчет по системе, в которой много данных. В следующих частях перейду к генерации и анализу тестовых данных для нагрузки.

itresume 9 ноя 2021 в 14:17

10 легких задач по Python и SQL, которые оказались сложными :/

6 мин

65K

Занимательные задачкиPython * Программирование * SQL *

Мы уже больше года публикуем в своих соцсетях интересные задачки по программированию, Data Science, аналитике и другим темам. За все это время мы неоднократно сталкивались с такими мыслями, когда планировали очередную задачу:

Ну нет, это слишком легко и очевидно, люди от нас просто отпишутся за такие плевые задачи.

Однако, все оказалось иначе.

Мы собрали для Вас 10 интересных мини-задачек по Python и SQL, которые кажутся очень простыми, но большинство опрошенных (около 76%) дали неправильные ответы. Вот такая вот суровая статистика ¯\_(ツ)_/¯

Проверьте - а сколько задачек Вы решите правильно?

-9

nasingfaund 9 ноя 2021 в 10:31

Последний велосипедно-питоний бой с ошибками импорта sqlite за 2 174 433 строчки. Часть 3

16 мин

2.9K

Python * SQL * XML * SQLite * Data Engineering *

Туториал

Замечание. Вся трилогия (часть 1 тут, часть 2 тут) о велосипедостроении с sqlite, xml, csv только для совсем маленьких Питоньих кодеров. Не для крутых кодеров, они умрут от скуки в нашем опусе и ничего нового не увидят. В третьей части заканчиваем все, что начали ранее.

Начинаем изыски причины и местонахождения ошибки.

Итак: правильный ответ: ошибки в коде нет. Ну точнее ошибка возникает при работе кода из-за ошибки данных в файлах.

Чтобы убедиться, что это так, добавим в код обработку исключений.

Совсем немного поправим наш код, добавим обработку и вывод на печать исключений:

tablum 9 ноя 2021 в 07:01

«BI or not to BI»: небольшая история разработки небольшого BI-сервиса

5 мин

5.7K

Блог компании EXTRACTUM.IOРазвитие стартапаОблачные сервисы * SQL * Программирование *

В мае 2021 года меня похитили инопланетяне и приказали разработать сервис аналитики данных, в простонародье именуемый “self-service BI (business intelligence)”. И не просто какой-то аналог Redash или Superset в масштабе 1:43, а с нормальной поддержкой загрузки данных из файлов (локальных и через веб), ну и, конечно, с коннекторами к популярным базам данным. Например, чтобы можно было импортировать содержимое файлов json, xml или логов, а потом сджойнить их с выгрузкой из clickhouse. И ещё чтобы графики рисовались. Дашборды тоже было бы неплохо, но можно и без них.

Вот что они мне нарисовали в качестве ТЗ:

+30

motoroller95 7 ноя 2021 в 13:49

История поиска проблемы, которая происходит раз в 1000 лет

5 мин

7.6K

Ruby on Rails * SQL * Ruby *

Как сейчас помню, понедельник 25е октября, я заступаю на дежурство по проду и с самого утра мне прилетает задача: сегодня в ночь с 24 на 25 ноября, наблюдалась проблема с недоступностью приложения. Глянув сентри я увидел кучу ошибок от базы со statement timeout, а так же непонятные ActiveRecord::ConnectionNotEstablished: No connection pool with 'primary' found С мыслью "база не отвечала, проблема не на нашей стороне" я спокойно отдал задачу на разбирательство админам, а сам параллельно глянул графики, может там был всплеск каких-нибудь джобок или запросов, но ничего криминального в графане небыло: тяжеловесных джобок в 12 не запускается, а те, что запускаются отработали очень быстро.

Узнать, в чем была проблема

+15

zomblzum 5 ноя 2021 в 15:45

Когда «сделать плохо» == «сделать лучше»

5 мин

5.3K

Анализ и проектирование систем * SQL * Microsoft SQL Server * ООП *

В мире IT есть много разных концепций и подходов, которые облегчают процесс разработки, расширения архитектуры и создания прочных продуктов. KISS, DRY, SOLID и прочие умные слова - это то, что должен знать программист для того, чтобы считаться как минимум неплохим. Но в данном посте будет затронута и без того известная тема - все эти подходы это рекомендации, а не безукоризненный закон.

zomblzum 3 ноя 2021 в 13:53

Как поменять один символ в коде и спасти день

3 мин

6.7K

Отладка * Microsoft SQL Server * SQL * Программирование *

Из песочницы

Понедельник, 9 утра, сообщение в рабочем чате: "Всё сломалось, почините". Согласитесь, неприятная ситуация, особенно когда это ваш первый месяц работы, а сломалось что-то в функционале, с которым вы ещё ни разу не контактировали, да и не трогал его уже никто месяцами.

+18

azatyakupov 29 окт 2021 в 16:15

Реляционные СУБД: история появления, эволюция и перспективы

8 мин

24K

Блог компании QuadcodeSQL * Data Engineering *

Привет, Хабр! Меня зовут Азат Якупов, я работаю Data Architect в компании Quadcode. Сегодня хочу поговорить о реляционных СУБД, которые играют важную роль в современном IT-мире. О том, что они собой представляют и для чего нужны, понимают, вероятно, большинство читателей.

Но вот как и почему появились реляционные СУБД? Об этом многие из нас знают лишь приблизительно. А ведь история создания технологии весьма интересна, она позволяет лучше понять основу цифрового мира. Если вам интересна эта тема — прошу под кат.

neoflex 28 окт 2021 в 13:43

Миграция данных из различных RDBMS в HADOOP

11 мин

Блог компании NeoflexHadoop * Apache * SQL *

В статье будет рассмотрен процесс экспорта данных в Hadoop из различных РСУБД посредством фреймворка Spark. Для взаимодействия с фреймворком Spark будет использован язык программирования Python с применением api pySpark.

nasingfaund 28 окт 2021 в 13:17

Продолжаем велосипедостроение с Python, xml, csv, sqlite. Часть 2. Ищем и правим ошибки, пока не налетаем на…

7 мин

5.6K

Data Engineering * SQL * SQLite * XML * Python *

Туториал

Примечание. Как и первая часть эта тоже для совсем маленьких кодеров-велосипедостроителей на Питоне. Для прожженных кодеров будет скучно. Изначально хотели внести исправления сразу в первую статью по мере нахождения ошибок, но после некоторого раздумия решили, что это неудобно. Ошибки исчезнут совсем, а именно ошибки приносят максимальную пользу для начинающего кодера. А посему ошибки оставляем в первой части, а в этой начинаем от них избавляться.

окончание трилогии тут (часть 3): "Последний велосипедно-питоний бой с ошибками импорта sqlite за 2 174 433 строчки. Часть 3"

-1

emdobro 28 окт 2021 в 08:06

Clickhouse & Grafana: история успеха одних алертов

8 мин

19K

Блог компании ДомкликВеб-разработка * SQL * Веб-аналитика *

Меня зовут Елизавета Добрянская и я Frontend-разработчица в компании Домклик.

В этой статье я хочу рассказать, как мы танцевали с бубном при настройке алертов на клиентские метрики. Как, зачем и с чем мы столкнулись в этой задаче - читайте далее ?

+26

olegbunin 26 окт 2021 в 12:35

Как в Hazelcast добавляли распределенный SQL

11 мин

3.4K

Блог компании Конференции Олега Бунина (Онтико)Распределённые системы * Базы данных * SQL * Высоконагруженные системы *

Чтобы разработать свой распределенный SQL-движок, можно написать свой SQL-оптимизатор для построения движков. Вам придется сделать парсер, семантический анализатор и придумать правила трансформации и оптимизации. Всё протестировать, а потом как-то интегрировать в свою систему. Но можно пойти более быстрым путем — внедрить для этого готовый инструмент.

Владимир Озеров, бывший инженер Hazelcast, а сейчас руководитель Querify Labs, на конференции HighLoad++ 2021 поделился опытом разработки и проектирования с нуля распределенного SQL-движка для продукта Hazelcast IMDG. Видео его выступления можно посмотреть здесь.

Сегодня статья о том, для чего в Hazelcast IMDG понадобилась эта разработка, и в чем преимущества и недостатки фреймворка Apache Calсite. Как на нем были реализованы встроенные оптимизации, выбор вторичных индексов и планирование перемещения данных в кластере. И как справились с описанием запросов произвольной сложности, кооперативной многозадачностью и оптимизированием сетевого протокола.

+18

asketoff 25 окт 2021 в 08:11

Нано-статья о том, как я в SAS NULL-ключи джойнил

2 мин

2.5K

Блог компании МТСSQL *

Привет, Хабр! Меня зовут Сергей Барановский, я руководитель проектов по аналитике в Блоке по клиентскому опыту и сервису и сегодня я хочу поделиться наболевшим. Джойн таблиц — одна из самых базовых вещей в аналитике. Казалось бы, допустить здесь ошибку почти невозможно. И правда! Что может быть проще, чем стыковать таблицы ключ к ключу?! Ковыряться в носу и то сложнее — можно ненароком кровеносный сосуд задеть. И, потеряв бдительность из-за простоты процедуры, можно набрать корзину проблем на самых базовых вещах. Под катом — познавательный кейс для тех, кто ходит тропами SQL.

X5Tech 22 окт 2021 в 10:08

Собеседование на позицию Data Engineer в X5: чего ждать и как лучше подготовиться (часть 2)

6 мин

13K

Блог компании X5 TechData Engineering * Карьера в IT-индустрииBig Data * SQL *

В предыдущей статье мы поговорили про роль Data Engineer в Х5, какие задачи он решает и с каким технологическим стеком работает. Рассмотрели структуру собеседования, основные направления, по которым мы оцениваем кандидатов, и подробно разобрали базовые требования, предъявляемые нами к уровню владения Python.

В данной статье мы разберём требования к ключевым для Data Engineer в X5 навыкам: распределённые системы и вычисления на Hadoop / Spark, а также SQL и проектирование схемы данных.

PavloPoliakov 21 окт 2021 в 09:45

Храним данные в JSONB, как это влияет на скорость запросов?

4 мин

38K

Хранение данных * SQL * Базы данных * Программирование * PostgreSQL *

Добрый день, меня зовут Павел Поляков, я Principal Engineer в каршеринг компании SHARE NOW, в Гамбурге в ?? Германии. А еще я автор Telegram-канала Хороший разработчик знает, где рассказываю обо всем, что должен знать хороший разработчик.

Сегодня хочу поговорить о том стоит ли хранить данные в JSONB полях в PostgreSQL. Как это влияет на производительность?

terranus 15 окт 2021 в 08:55

Партицирование таблиц в PostgreSQL: чек-лист для старта

13 мин

95K

Блог компании SkyengPostgreSQL * SQL *

Часто возникает проблема: одна из таблиц в базе данных сильно выросла и время выполнения запросов к этой таблице увеличилось. Одним из вариантов решения подобной проблемы в PostgreSQL является партицирование. В статье затронем не только техническую реализацию, но и опишем этапы подготовки к партицированию.

Представим, что у нас есть батон хлеба. Порежем его на части. Каждый отрезанный кусочек — часть целого батона, но не сам батон. То есть мы поделили целое на части — это и есть партицирование. Батон как целое соответствует таблице, а кусочки батона как части — партициям этой таблицы.

+23

yooteam 14 окт 2021 в 10:33

Как управлять большими объемами данных: доклады с митапа High SQL

1 мин

Блог компании ЮMoneySQL * Microsoft SQL Server * Хранение данных * Конференции

7 октября мы провели второй митап о нюансах работы с большими объёмами данных. Под катом видео докладов наших разработчиков и приглашенного эксперта Microsoft Data Platform. Кейсы будут полезны тем, кто администрирует и разрабатывает DWH, создает аналитические запросы и работает c Microsoft SQL Server.

Смотреть доклады

pluzanov 12 окт 2021 в 15:00

PostgreSQL 15: Часть 2 или Коммитфест 2021-09

7 мин

Блог компании Postgres ProfessionalPostgreSQL * SQL *

30 сентября вышла новая версия PostgreSQL 14… но хватит уже жить прошлым☺, в этот же день закончился второй коммитфест 15 версии. А значит прямо сейчас можно узнать что нового ждет нас через год.

Список изменений в этом выпуске получился не очень длинным, но кое-что интересное всё-таки найдется:

Как заставить очистку в «агрессивном» режиме работать менее агрессивно?
Кто на самом деле владелец схемы PUBLIC?
Cколько разделяемой памяти потребуется для запуска сервера? А количество огромных страниц?

Читать дальше →

1 2 ...

48 49

51 52 ...

108 109