Александр @Anghei

Пользователь

germn Jan 10 2020 at 07:19

Отслеживаем прогресс выполнения в Python

2 min

171K

Python*Interfaces*Programming*

Tutorial

Translation

Зачем нужны индикаторы прогресса?

Индикаторы прогресса (progress bar) — визуальное отображение процесса работы. Они избавляют нас от необходимости беспокоиться о том, не завис ли скрипт, дают интуитивное представление о скорости его выполнения и подсказывают, сколько времени осталось до завершения.

Человек ранее не использовавший индикаторы прогресса может предположить, что их внедрение может сильно усложнить код. К счастью, это не так. Небольшие примеры ниже покажут, как быстро и просто начать отслеживать прогресс в консоли или в интерфейсе быстро набирающей популярность графической библиотеки PySimpleGUI.

Читать дальше →

+41

FooBar167 Jan 1 2020 at 20:10

Письмо начинающему изучать Data Science

2 min

64K

Programming*Image processing*Machine learning*Artificial IntelligencePython*

From sandbox

Я бы хотел получить такое письмо три года назад, когда только начинал изучать Data Science (DS). Чтобы там были необходимые ссылки на полезные материалы. Статья не претендует на полноту охвата необъятной области DS. Однако для начинающего специалиста будет полезна.

Нейронные сети – это...

Читать дальше →

+28

Leran2002 Apr 21 2015 at 05:48

Учебник по языку SQL (DDL, DML) на примере диалекта MS SQL Server. Часть пятая

41 min

204K

Microsoft SQL Server*SQL*

Tutorial

Предыдущие части

Часть первая — habrahabr.ru/post/255361
Часть вторая — habrahabr.ru/post/255523
Часть третья — habrahabr.ru/post/255825
Часть четвертая — habrahabr.ru/post/256045

В данной части мы рассмотрим

Здесь мы в общих чертах рассмотрим работу с операторами модификации данных:

INSERT – вставка новых данных
UPDATE – обновление данных
DELETE – удаление данных
SELECT … INTO … – сохранить результат запроса в новой таблице
MERGE – слияние данных
Использование конструкции OUTPUT
TRUNCATE TABLE – DDL-операция для быстрой очистки таблицы

В самом конце вас ждут «Приложение 1 – бонус по оператору SELECT» и «Приложение 2 – OVER и аналитические функции», в которых будут показаны некоторые расширенные конструкции:

PIVOT
UNPIVOT
GROUP BY ROLLUP
GROUP BY GROUPING SETS
использование приложения OVER

Операции модификации данных очень сильно связаны с конструкциями оператора SELECT, т.к. по сути выборка модифицируемых данных идет при помощи них. Поэтому для понимания данного материала, важное место имеет уверенное владение конструкциями оператора SELECT.

Читать дальше →

+13

Leran2002 Apr 19 2015 at 14:30

Учебник по языку SQL (DDL, DML) на примере диалекта MS SQL Server. Часть четвертая

32 min

398K

SQL*Microsoft SQL Server*

Tutorial

Предыдущие части

Часть первая — habrahabr.ru/post/255361
Часть вторая — habrahabr.ru/post/255523
Часть третья — habrahabr.ru/post/255825

В данной части мы рассмотрим

Многотабличные запросы:

Операции горизонтального соединения таблиц – JOIN
Связь таблиц при помощи WHERE-условия
Операции вертикального объединения результатов запросов – UNION

Работу с подзапросами:

Подзапросы в блоках FROM, SELECT
Подзапрос в конструкции APPLY
Использование предложения WITH
Подзапросы в блоке WHERE:
- Групповое сравнение — ALL, ANY
- Условие EXISTS
- Условие IN

Читать дальше →

+13

Leran2002 Apr 16 2015 at 04:37

Учебник по языку SQL (DDL, DML) на примере диалекта MS SQL Server. Часть третья

26 min

361K

SQL*Microsoft SQL Server*

Tutorial

Предыдущие части

Часть первая — habrahabr.ru/post/255361
Часть вторая — habrahabr.ru/post/255523

О чем будет рассказано в этой части

В этой части мы познакомимся:

с выражением CASE, которое позволяет включить условные выражения в запрос;
с агрегатными функциями, которые позволяют получить разного рода итоги (агрегированные значения) рассчитанные на основании детальных данных, полученных оператором «SELECT … WHERE …»;
с предложением GROUP BY, которое в скупе с агрегатными функциями позволяет получить итоги по детальным данным в разрезе групп;
с предложением HAVING, которое позволяет произвести фильтрацию по сгруппированным данным.

Читать дальше →

+18

Leran2002 Apr 12 2015 at 18:54

Учебник по языку SQL (DDL, DML) на примере диалекта MS SQL Server. Часть вторая

31 min

354K

SQL*Microsoft SQL Server*

Tutorial

Вступление и DDL – Data Definition Language (язык описания данных)

Часть первая — habrahabr.ru/post/255361

DML – Data Manipulation Language (язык манипулирования данными)

В первой части мы уже немного затронули язык DML, применяя почти весь набор его команд, за исключением команды MERGE.

Рассказывать про DML я буду по своей последовательности выработанной на личном опыте. По ходу, так же постараюсь рассказать про «скользкие» места, на которые стоит акцентировать внимание, эти «скользкие» места, схожи во многих диалектах языка SQL.

Т.к. учебник посвящается широкому кругу читателей (не только программистам), то и объяснение, порой будет соответствующее, т.е. долгое и нудное. Это мое видение материала, которое в основном получено на практике в результате профессиональной деятельности.

Основная цель данного учебника, шаг за шагом, выработать полное понимание сути языка SQL и научить правильно применять его конструкции. Профессионалам в этой области, может тоже будет интересно пролистать данный материал, может и они смогут вынести для себя что-то новое, а может просто, будет полезно почитать в целях освежить память. Надеюсь, что всем будет интересно.

Т.к. DML в диалекте БД MS SQL очень сильно связан с синтаксисом конструкции SELECT, то я начну рассказывать о DML именно с нее. На мой взгляд конструкция SELECT является самой главной конструкцией языка DML, т.к. за счет нее или ее частей осуществляется выборка необходимых данных из БД.

Читать дальше →

Leran2002 Apr 9 2015 at 09:31

Учебник по языку SQL (DDL, DML) на примере диалекта MS SQL Server. Часть первая

29 min

860K

SQL*Microsoft SQL Server*

Tutorial

From sandbox

О чем данный учебник

Данный учебник представляет собой что-то типа «штампа моей памяти» по языку SQL (DDL, DML), т.е. это информация, которая накопилась по ходу профессиональной деятельности и постоянно хранится в моей голове. Это для меня достаточный минимум, который применяется при работе с базами данных наиболее часто. Если встает необходимость применять более полные конструкции SQL, то я обычно обращаюсь за помощью в библиотеку MSDN расположенную в интернет. На мой взгляд, удержать все в голове очень сложно, да и нет особой необходимости в этом. Но знать основные конструкции очень полезно, т.к. они применимы практически в таком же виде во многих реляционных базах данных, таких как Oracle, MySQL, Firebird. Отличия в основном состоят в типах данных, которые могут отличаться в деталях. Основных конструкций языка SQL не так много, и при постоянной практике они быстро запоминаются. Например, для создания объектов (таблиц, ограничений, индексов и т.п.) достаточно иметь под рукой текстовый редактор среды (IDE) для работы с базой данных, и нет надобности изучать визуальный инструментарий заточенный для работы с конкретным типом баз данных (MS SQL, Oracle, MySQL, Firebird, …). Это удобно и тем, что весь текст находится перед глазами, и не нужно бегать по многочисленным вкладкам для того чтобы создать, например, индекс или ограничение. При постоянной работе с базой данных, создать, изменить, а особенно пересоздать объект при помощи скриптов получается в разы быстрее, чем если это делать в визуальном режиме. Так же в скриптовом режиме (соответственно, при должной аккуратности), проще задавать и контролировать правила наименования объектов (мое субъективное мнение). К тому же скрипты удобно использовать в случае, когда изменения, делаемые в одной базе данных (например, тестовой), необходимо перенести в таком же виде в другую базу (продуктивную).

Читать дальше →

+15

IndiraGandhi Dec 12 2016 at 11:25

Мониторинг Microsoft SQL Server «на коленке»

10 min

39K

Database Administration*

From sandbox

Когда я устроился на новую работу, передо мной была поставлена первая задача — разобраться, почему один из экземпляров SQL очень сильно нагружает диски. И предпринять необходимые действия для устранения этой ужасной проблемы. Я еще не сказал, что дисковый пул был всего один, и что при нагрузке на диски страдали все экземпляры сиквела? Так вот это было так. Что самое главное, как оказалось, мониторинг в лице Zabbix не собирал необходимые метрики, а на добавление оных нужно было заводить заявку и ждать. Ждать и смотреть, как «горит» дисковый массив. Или…

Было решено отправить заявку в путешествие сквозь шестерни бюрократического механизма и делать свой, временный мониторинг.

Для начала создадим БД и объекты, необходимые для сбора метрик производительности SQL-сервера.

Читать дальше →

+22

moscas Nov 25 2016 at 14:44

Релиз DataGrip 2016.3

4 min

22K

JetBrains corporate blogSQL*PostgreSQL*MySQL*Microsoft SQL Server*

Привет! Этот пост о том, что нового в DataGrip 2016.3. Напомню, что описанное справедливо и для других IDE на платформе IntelliJ с поддержкой баз данных: PHPStorm, PyCharm, RubyMine и, конечно, IntelliJ IDEA. Кроме одной маленькой возможности, о чём отмечу отдельно.

Этот релизный цикл был очень важным — удалось многое из того, что нас долго просили сделать: поддержка триггеров, поиск использований внутри представлений и функций, отложенное редактирование таблиц. Благодарим тех, кто не стесняется тестировать наши инструменты и пробует новые версии задолго до релиза.

Итак, DataGrip 2016.3!

Читать дальше →

+21

Cloud4Y Dec 8 2016 at 05:42

Информация на пороге бессмертия, часть 2: ДНК-накопитель

5 min

7.7K

Cloud4Y corporate blogIT Infrastructure*Virtualization*HostingData storage*

Представьте, что вы можете хранить каждый бит информации в чем-то таком же маленьком, как микроскопическая капелька крови. Странно? А ведь это именно то, к чему уже давно стремятся ученые — хранение данных в ДНК. Куда там хранилищам 5D, о которых мы недавно писали! Что это за новый и необычный тип хранилища? Как это работает? А самое главное, каков его потенциал?

Olga_ol Oct 4 2016 at 11:50

Лекции Техносферы. 1 семестр. Введение в анализ данных (весна 2016)

3 min

44K

VK corporate blogMathematics*Algorithms*R*Python*

Слушайте и смотрите новую подборку лекций Техносферы Mail.Ru. На этот раз представляем в открытом доступе весенний курс «Введение в анализ данных», на котором слушателей знакомят со сферой анализа данных, основными инструментами, задачами и методами, с которыми сталкивается любой исследователь данных в работе. Курс преподают Евгений Завьялов (аналитик проекта Поиск Mail.Ru, занимающийся извлечением полезных бизнесу знаний из данных, генерируемых поисковым движком и десктопными приложениями), Михаил Гришин (программист-исследователь из отдела анализа данных) и Сергей Рыбалкин (старший программист из студии Allods Team).

Лекция 1. Введение в Python

Из первой лекции вы узнаете, что такое анализ данных, какие инструменты используют для анализа данных, а также как работает Python.

Читать дальше →

+60

TashaFridrih Apr 14 2016 at 12:35

Более чем 80 средств мониторинга системы Linux

12 min

327K

ua-hosting.company corporate blog

Ниже будет приведен список инструментов мониторинга. Есть как минимум 80 способов, с помощью которых ваша машинка будет под контролем.

1. первый инструмент — top

Консольная команда top- удобный системный монитор, простой в использовании, с помощью которой выводится список работающих в системе процессов, информации о этих процессах. Данная команда в реальном времени сортирует их по нагрузке на процессор, инструмент предустановлен во многих системах UNIX.

+70

Wargaming Apr 27 2016 at 15:01

Мартовский Python Meetup: Python VS Erlang и возможности PostgreSQL

1 min

12K

ex-Wargaming corporate blogSQL*Python*PostgreSQL*Erlang/OTP*

Всем привет!
После долгого перерыва блудный Python Meetup снова с нами. На долгожданной мартовской встрече сообщества любителей и профессионалов языка программирования Python обсуждались животрепещущие темы: противостояние Python и Erlang, а также дополнительные возможности PostgreSQL.
Видеозаписи выступлений под катом. Приятного просмотра!

Читать дальше →

alizar Apr 17 2016 at 18:29

Знаменитая фотография из Чернобыльской АЭС — это селфи с длинной выдержкой

5 min

241K

Translation

^{Артур Корнеев, зам. директора объекта «Укрытие» на Чернобыльской АЭС, изучает ядерную лаву (так называемую «слоновью ногу»), Чернобыль, 1996. Фото: Министерство энергетики США}На первый взгляд, трудно понять, что происходит на фотографии. Из-под пола словно вырос гигантский гриб, а призрачные люди в касках как будто работают рядом с ним.Нечто необъяснимо жуткое в этой сцене, и тому есть причина. Вы видите крупнейшее скопление, вероятно, самого токсичного вещества, когда-либо созданного человеком. Это ядерная лава или кориум.

Читать дальше →

+56

246

alex_29 Apr 18 2016 at 06:12

Этого не будет в BI (Купив BI tool, вы этого не получите)

6 min

20K

Big Data*System Analysis and Design*Data visualization*Industrial Programming*Development of communication systems*

Введение:

На мой взгляд, одна из основных проблем между бизнес аналитиками и пограммистами Баз Данных – это их взаимодействие. Многие современные BI решения предлагают, по сути, перенести работу аналитиков на программистов. Либо поднять технический уровень аналитиков, приблизив их к программистам. Вместо этого, я предлагаю рассмотреть решение, которое берет информацию у программистов БД и отдаёт её бизнес-аналитикам. Это решение позволит каждому заниматься своим делом, а не становиться программистом и бизнес аналитиком в одном лице.

Подробности

windcatcher Feb 20 2016 at 14:52

Километры логов и восстановление баз данных на MS SQL

6 min

34K

СофтЛаб corporate blogMicrosoft SQL Server*

Или как без труда восстанавливать базы данных из длинной цепочки бэкапов

Читать дальше →

+12

varagian Feb 3 2016 at 10:04

Хабра-граф, -сообщества и куда же делась вся карма

7 min

29K

Big Data*Data Mining*Data visualization*Mathematics*

Вступление

Cегодня мы вместе с анализом графов, data mining, subgroup discovery и всеми веселыми штуками взглянем на Хабр. Весь код и данные прилагаются — каждый может взглянуть на них самостоятельно, легко повторить рассчеты из статьи и найти что-то интересное самостоятельно.

(это не просто картинка для привлечения внимания, а — граф связей ~45000 пользователей Хабра по тому, кто на кого подписан; размер вершины пропорционален числу подписчиков; все картинки кликабельны; подробности далее)

Обсуждаемые проблемы возникли, конечно же, далеко не вчера, но некоторые их аспекты кажутся мне достаточно новыми и поэтому достойными дискуссии, основанной на непредвзятых и репрезентативных данных. Например в комментариях этой статьи, увидел интересное утверждение:

Тут проблема в том, что на всем хабре за сегодня не насчитать больше 50-80 человек, которые вообще могут голосовать. У 90% пользователей карма просто ниже 5. Как итог оценивают комментарии и статьи только избранные. Это как жюри выходит такое.

И решил, что стоить его сформулировать в виде гипотезы и проверить:

Q1: Правда ли, что Хабр превратился в жюри-based сообщество, где два с половиной человека голосуют за статьи?

Вот в этой статье к нам вернулись "железные" Хабы и стало интересно, а как вообще представлены разные сообщества внутри Хабра? Формулируем в виде гипотезы:

Q2: Как сегментировано сообщество, или проще говоря сколько у нас здесь групп по интересам и соотвествуют ли они имеющимся хабам?

Последнее, но не менее интересное наблюдение, что активность на Хабре упала (по данным Хабра-пульса и моим субъективным наблюдениям), что даже решили ввести аккаунты "read & comment". Поэтому решил оценить активность сообщества и продумать, как информация о структуре сообщества может нам помочь:

Q3: Насколько активно сообщество и как нам может помочь структура внутренних групп?

За подробностями добро пожаловать под кат.

Структура статьи

Читать дальше →

+160

238

rdruzyagin Feb 1 2016 at 07:17

Cтатистический анализ в PostgreSQL с помощью PL/R

16 min

13K

PostgreSQL*SQL*Website development*

Друзья, на прошедшей в прошлом году конференции PG Day'15 Russia один из наших докладчиков, Joseph Conway, представил интересный материал об использовании созданного и поддерживаемого им уже больше десяти лет расширения PL/R, которое позволяет использовать язык для статистического анализа R внутри всеми любимой базы данных. Хочу предложить вашему вниманию follow-up статью, созданную на основе материалов, представленных в докладе Joe. Задача данной публикации — обзорно познакомить вас с возможностями языка PL/R. Надеюсь, что вы найдете представленную здесь информацию полезной для себя.

Последние тенденции в области Big Data поощряют сближение аналитики и данных, в то время как PL/R ненавязчиво предоставляет такой сервис вот уже 12 лет! Если вдруг вы не в курсе, PL/R – это расширение для PostgreSQL, позволяющее использовать R, язык для математических расчетов, прямо из PostgreSQL для того, чтобы легко и просто получать развернутую аналитику. Расширение доступно и активно совершенствуется с 2003 года. Оно работает со всеми поддерживаемыми версиями PostgreSQL и со всеми свежими версиями R. Тысячи людей во всем мире уже оценили его удобство и эффективность. Давайте же разберемся, что такое PL/R, обсудим достоинства и недостатки такого подхода к анализу данных и рассмотрим несколько примеров для наглядности.

Читать дальше →

+21

Ozerova Jan 28 2016 at 08:05

Удаление/восстановление Metro-приложений в Windows 10

14 min

192K

PowerShell*

From sandbox

Как бы не было много сторонников старых версий ОС, все же пришла пора переходить на Windows 10. В связи с этим предлагаю разобраться с предустановлеными Metro-приложениями. Согласитесь, мало кто будет использовать абсолютно все приложения, которые навязывает нам корпорация. Ведь большинство из них просто занимают место, а кого-то вообще раздражают. В этой статье я поделюсь с вами способом, которым можно «почистить» систему от именно таких — ненужных — приложений на Windows 10.

Читать дальше →

+15

AlanDenton Jan 13 2016 at 18:41

Что быстрее: 0 или NULL?

4 min

32K

SQL*Microsoft SQL Server*

Tutorial

Есть три агрегатные функции, которые чаще всего используются на практике: COUNT, SUM и AVG.

И если первая уже обсуждалась ранее, то с остальными есть интересные нюансы с производительностью. Но давайте обо всем по порядку…

При использовании агрегатных функций на плане выполнения, в зависимости от входного потока, может встречаться два оператора: Stream Aggregate и Hash Match.

Для выполнения первого может требоваться предварительно отсортированный входной набор значений и при этом Stream Aggregate не блокирует выполнение последующих за ним операторов.

В свою очередь, Hash Match является блокирующим оператором (за редким исключением) и не требует сортировки входного потока. Для работы Hash Match используется хеш-таблица, которая создается в памяти и в случае неправильной оценки ожидаемого количества строк, оператор может сливать результаты в tempdb.

Подробнее

+19