Пользователь

@erogov 19 апр 2017 в 07:52

Индексы в PostgreSQL — 1

17 мин

561K

Блог компании Postgres ProfessionalPostgreSQL * SQL *

Предисловие

В этой серии статей речь пойдет об индексах в PostgreSQL.

Любой вопрос можно рассматривать с разных точек зрения. Мы будем говорить о том, что должно интересовать прикладного разработчика, использующего СУБД: какие индексы существуют, почему в PostgreSQL их так много разных, и как их использовать для ускорения запросов. Пожалуй, тему можно было бы раскрыть и меньшим числом слов, но мы втайне надеемся на любознательного разработчика, которому также интересны и подробности внутреннего устройства, тем более, что понимание таких подробностей позволяет не только прислушиваться к чужому мнению, но и делать собственные выводы.

За скобками обсуждения останутся вопросы разработки новых типов индексов. Это требует знания языка Си и относится скорее к компетенции системного программиста, а не прикладного разработчика. По этой же причине мы практически не будем рассматривать программные интерфейсы, а остановимся только на том, что имеет значение для использования уже готовых к употреблению индексов.

В этой части мы поговорим про разделение сфер ответственности между общим механизмом индексирования, относящимся к ядру СУБД, и отдельными методами индексного доступа, которые в PostgreSQL можно добавлять как расширения. В следующей части мы рассмотрим интерфейс метода доступа и такие важные понятия, как классы и семейства операторов. После такого длинного, но необходимого введения мы подробно рассмотрим устройство и применение различных типов индексов: Hash, B-tree, GiST, SP-GiST, GIN и RUM, BRIN и Bloom.

Читать дальше →

+99

@ru_vds 20 апр 2017 в 10:00

Bash-скрипты, часть 5: сигналы, фоновые задачи, управление сценариями

9 мин

228K

Блог компании RUVDS.comНастройка Linux * Серверное администрирование *

Перевод

Bash-скрипты: начало
Bash-скрипты, часть 2: циклы
Bash-скрипты, часть 3: параметры и ключи командной строки
Bash-скрипты, часть 4: ввод и вывод
Bash-скрипты, часть 5: сигналы, фоновые задачи, управление сценариями
Bash-скрипты, часть 6: функции и разработка библиотек
Bash-скрипты, часть 7: sed и обработка текстов
Bash-скрипты, часть 8: язык обработки данных awk
Bash-скрипты, часть 9: регулярные выражения
Bash-скрипты, часть 10: практические примеры
Bash-скрипты, часть 11: expect и автоматизация интерактивных утилит

В прошлый раз мы говорили о работе с потоками ввода, вывода и ошибок в bash-скриптах, о дескрипторах файлов и о перенаправлении потоков. Сейчас вы знаете уже достаточно много для того, чтобы писать что-то своё. На данном этапе освоения bash у вас вполне могут возникнуть вопросы о том, как управлять работающими скриптами, как автоматизировать их запуск.

Читать дальше →

+20

@LukaSafonov 11 апр 2017 в 10:37

Продвинутое туннелирование: атакуем внутренние узлы корпоративной сети

20 мин

70K

Информационная безопасность *

Туториал

В этой статье будут рассмотрены сценарии атаки защищенных сегментов корпоративной сети с помощью pivoting-техник, metasploit framework и proxychains.

Читать дальше →

+28

@olemskoi 28 мар 2017 в 05:22

Сможет ли Питон прожевать миллион запросов в секунду?

6 мин

38K

Блог компании СлёрмПрограммирование * Высоконагруженные системы * Python * Open source *

Перевод

Возможно ли с помощью Python обработать миллион запросов в секунду? До недавнего времени это было немыслимо.

Многие компании мигрируют с Python на другие языки программирования для повышения производительности и, соответственно, экономии на стоимости вычислительных ресурсов. На самом деле в этом нет необходимости. Поставленных целей можно добиться и с помощью Python.

Python-сообщество в последнее время уделяет много внимания производительности. С помощью CPython 3.6 за счет новой реализации словарей удалось повысить скорость работы интерпретатора. А благодаря новому соглашению о вызове (calling convention) и словарному кэшу CPython 3.7 должен стать еще быстрее.

Для определенного класса задач хорошо подходит PyPy с его JIT-компиляцией. Также можно использовать NumPy, в котором улучшена поддержка расширений на Си. Ожидается, что в этом году PyPy достигнет совместимости с Python 3.5.

Эти замечательные решения вдохновили меня на создание нового в той области, где Python используется очень активно: в разработке веб- и микросервисов.

Читать дальше →

+61

@popstas 9 мар 2017 в 02:50

Ansible: настраиваем zsh терминал с antigen, autosuggestions, fzf и красивым prompt одной командой

6 мин

51K

*nix * Настройка Linux * Оболочки * Системное администрирование *

Я провожу в терминале много времени, поэтому хочется, чтобы все было красиво, быстро и удобно. Из этого рождается постоянное желание его настраивать, пробовать разные плагины. Шеллом я выбрал для себя zsh лет 5 назад, пару лет назад нашел oh-my-zsh для его удобной настройки.

Со временем к этому конфигу добавились некоторые сбоку торчащие части в виде powerline и percol.

Недавно я решил пересобрать все так, чтобы избавиться от ненужных плагинов, добавить нужные, сделать легкую установку и обновление. В итоге появилась роль ansible-role-zsh, которая полностью настраивает терминалы на локалке и на моих серверах.

Особенности:

устанавливается одной командой (кроме шрифта и темы вашего терминального клиента)
быстро загружается, быстро работает
полностью настраивается через ansible, ~/.zshrc
полностью локальная (в систему ничего не ставится, все хранится в ~/.oh-my-zsh)
оставляет возможность юзеру вносить свои настройки через ~/.zshrc.local
~~одинаково~~ работает на macOS, старом Debian, Ubuntu, CentOS
нормально выглядит на разных цветовых схемах (но лучше всего на Solarized Dark)
встроенная подсветка синтаксиса (помогает реже ошибаться и лучше читать длинные команды)
автодополнение по истории команд (помогает реже нажимать Ctrl+R)
отображение времени для долго выполняемых команд (помогает реже использовать time)

Демонстрация фич за 1 минуту:

Читать дальше →

+21

@ksg222 2 мар 2017 в 07:42

Ping и некоторые его параметры

9 мин

124K

Блог компании CBSCisco * Сетевые технологии * Системное администрирование *

«Для чего в команде ping используются опции Loose, Strict, Record, Timestamp и Verbose?» — такой вопрос мне недавно встретился в вендорном экзамене. Они позволяют влиять на маршрутизацию ICMP пакетов и собирать информацию о транзитных L3-устройствах. Но занимаясь сетевыми технологиями уже достаточно давно, я почти никогда их не использовал.

Мне стало не совсем понятно, почему такой вопрос вообще присутствует в тесте. Вернувшись домой, решил узнать, вдруг я действительно постоянно упускаю из виду что-то важное?

Читать дальше →

+30

@kdenisk 22 фев 2017 в 17:29

Нейронные сети в картинках: от одного нейрона до глубоких архитектур

7 мин

99K

Машинное обучение *

Многие материалы по нейронным сетям сразу начинаются с демонстрации довольно сложных архитектур. При этом самые базовые вещи, касающиеся функций активаций, инициализации весов, выбора количества слоёв в сети и т.д. если и рассматриваются, то вскользь. Получается начинающему практику нейронных сетей приходится брать типовые конфигурации и работать с ними фактически вслепую.

В статье мы пойдём по другому пути. Начнём с самой простой конфигурации — одного нейрона с одним входом и одним выходом, без активации. Далее будем маленькими итерациями усложнять конфигурацию сети и попробуем выжать из каждой из них разумный максимум. Это позволит подёргать сети за ниточки и наработать практическую интуицию в построении архитектур нейросетей, которая на практике оказывается очень ценным активом.

Читать дальше →

+54

@42p 26 фев 2017 в 13:44

Настройка DKIM/SPF/DMARC записей или защищаемся от спуфинга

5 мин

306K

DNS * Доменные имена * Спам и антиспам

Из песочницы

Приветствую, Хабр! В этой статье будет инструкция по настройке DKIM/SPF/DMARC записей. А побудило меня написать эту статью полное отсутствие документации на русском языке. Все статьи на эту тему, которые были мной найдены, были крайне не информативны.

Читать дальше →

+20

@alextitoff 26 фев 2017 в 20:39

Бесплатное программное обеспечение для IP-камер

5 мин

946K

Блог компании ИнтемсOpen source *

За 11 лет работы на рынке видеонаблюдения, нам пришлось столкнутся с множеством программ для управления системами видеонаблюдения, с какими-то мы работали, какие то тестировали, какие хотели потестировать, но так и не успели этого сделать, про какое-то просто читали в обзорах подобных тому, что читаете вы.

В итоге, как нам кажется у нас получился самый полный список программного обеспечения для систем видеонаблюдения.

Все программное обеспечение разбито на три группы:

Программное с открытым исходным кодом
Бесплатное программное обеспечение с ограниченным функционалом
Программное обеспечение бесплатное в течении пробного периода

Читать дальше →

+35

@homm 14 фев 2017 в 08:17

Как я сделал самый быстрый ресайз изображений. Часть 0

7 мин

36K

Python * Высоконагруженные системы * Обработка изображений *

Здравствуйте, меня зовут Саша, я написал самый быстрый ресайз изображений для современных х86 процессоров. Я так утверждаю, поскольку все остальные библиотеки, которые я сумел найти и протестировать, оказались медленнее. Я занялся этой задачей, когда работал над оптимизацией ресайза картинок на лету в Uploadcare. Мы решили открыть код и в результате появился проект Pillow-SIMD. Любой желающий с легкостью может использовать его в приложении на языке Python.

Любой код выполняется на конкретном железе и хорошей оптимизации можно добиться, только понимая его архитектуру. Всего я планирую выпустить 4 или 5 статей, в которых расскажу как применять знание архитектуры железа для оптимизации реальной задачи. Своим примером я хочу побудить вас оптимизировать другие прикладные задачи. Первые две статьи выйдут в течение недели, остальные — по мере готовности.

Читать дальше →

+75

@webhamster 8 фев 2017 в 14:00

Каково это — быть разработчиком в России, когда тебе сорок

37 мин

163K

Программирование *

Привет всем, я — сорокалетний программист-самоучка, а это моя история.

Пару недель назад я наткнулся на график распределения людей, интересующихся технологиями, ИТ и программированием. И он заставил меня задуматься о моей карьере.

Через каких-то 20 лет мне стукнет 60. И вероятность того, что я еще смогу заниматься тем, для чего был создан, составляет очень крошечную величину. Эти размышления привели меня туда, откуда все начиналось.

Я дебютировал в роли разработчика программного обеспечения в 1990 году, через год после того, как мне на 14-тилетие родители подарили ПЭВМ «Микроша».

Читать дальше →

+320

788

@sochix 7 фев 2017 в 14:14

Поиск по большим документам в ElasticSearch

5 мин

14K

SaaS / S+S * Высоконагруженные системы * Поисковые технологии *

Продолжаем цикл статей о том, как мы постигали ES в процессе создания Ambar. Первая статья цикла была о Хайлайтинге больших текстовых полей в ElasticSearch.

В этой статье мы расскажем о том как заставить ES работать быстро с документами более 100 Мб. Поиск в таких документах при подходе "в лоб" занимает десятки секунд. У нас получилось уменьшить это время до 6 мс.

Заинтересовавшихся просим под кат.

Читать дальше →

+15

@zilia 27 мар 2011 в 21:02

SSH-туннель домой без необходимости оставлять включённым домашний ПК

5 мин

219K

Информационная безопасность *

Disclaimer
Этот пост появился здесь по нескольким причинам:
1) Меня попросил сам Boomburum
2) Есть предположение, что на хабре всё-таки есть люди, имеющие прямое отношение к IT, но при этом имеющие весьма отдалённое представление о пользе SSH и её извлечении из обычного домашнего роутера, и которым, надеюсь, будет весьма интересно и полезно об этом узнать.

Хабралюдям, познавшим Дао IOS, tun, VPN, *wrt, WOL… etc, предлагается на выбор:
А) Закрыть топик, заняться делом и не выводить себя из нирваны чтением этой любительской фигни.
Б) Потратить время на конструктивную критику и полезные дополнения в комментариях.
Специально для GrammarNazi:
Пишите пожалуйста об ошибках в личку — обещаю исправиться.

Бла-бла-бла, а топик-то о чём?
Итак, я обещал рассказать «как поднять ssh-туннель домой без необходимости оставлять включённым домашний ПК» и, как правильно догадался peter23 речь пойдёт про ssh-сервер на роутере.

Читать дальше →

+209

100

@DaneSoul 2 фев 2017 в 10:39

Python: коллекции, часть 4/4: Все о выражениях-генераторах, генераторах списков, множеств и словарей

17 мин

216K

Программирование * Python *

Туториал

Часть 1	Часть 2	Часть 3	Часть 4

Заключительная часть моего цикла, посещенного работе с коллекциями. Данная статья самостоятельная, может изучаться и без предварительного изучения предыдущих.

Эта статья глубже и детальней предыдущих и поэтому может быть интересна не только новичкам, но и достаточно опытным Python-разработчикам.

Будут рассмотрены: выражения-генераторы, генераторы списка, словаря и множества, вложенные генераторы (5 вариантов), работа с enumerate(), range().
А также: классификация и терминология, синтаксис, аналоги в виде циклов и примеры применения.

Я постарался рассмотреть тонкости и нюансы, которые освещаются далеко не во всех книгах и курсах, и, в том числе, отсутствуют в уже опубликованных на Habrahabr статьях на эту тему.

1. Определения и классификация.
2. Синтаксис.
3. Аналоги в виде цикла for и в виде функций.
4. Выражения-генераторы.
5. Генерация стандартных коллекций.
6. Периодичность и частичный перебор.
7. Вложенные циклы и генераторы.
8. Использование range().
9. Приложение 1. Дополнительные примеры.
10. Приложение 2. Ссылки по теме.

Изучаем детали, иллюстрации и примеры

+17

@bykvaadm 26 янв 2017 в 14:32

Лабораторная работа «Обучаемся настраивать сети в GNU/Linux»

9 мин

52K

*nix * Настройка Linux * Сетевые технологии * Системное администрирование *

Туториал

Никто не любит длинные вступления, поэтому сразу к сути.
В данной импровизированной лаборатории я хотел бы осветить работу с сетями в GNU/Linux
и рассмотреть следующие темы:

Изучаем vlan. Строим сеть между vm1, vm2 в одном vlan. Пингуем, ловим пакеты, изучаем заголовки.
Разбиваем vm1 vm2 на разные vlan. Настраиваем intervlan routing с помощью R1.
Iptables. Настраиваем маскарад. Имитируем выход во внешние сети.
Iptables. Настраиваем port forwarding для сервисов на vm1 и v2, которые находятся за NAT.
Iptables. Настраиваем security zones. Изучаем tcp сессии.

З.Ы. все люди ошибаются, я открыт для ваших комментариев, если я написал какую-то глупость, готов ее исправить!

Читать дальше →

+13

@TipTep 20 янв 2017 в 07:45

А ваша служба является RESTful? Все что необходимо/обязательно знать про веб службы и REST

18 мин

169K

Проектирование API * Программирование * Веб-разработка *

Из песочницы

Введение

Вот не люблю я изобретать велосипед и статью я бы эту не написал, но пришлось. Про REST сказано уже довольно много. Многие поставщики веб служб готовы клясться, что их службы являются RESTful. Во время собеседования вы точно услышите хотя бы несколько вопросов про REST, независимо от того это собеседования для бэкенд, мобайл или фронтенд разработчика. Я вот помню как-то во время одного собеседования меня задали такой вопрос: «Вот вы написали в своем резюме, что знайте REST․ Ответьте пожалуйста, какой HTTP код вы получите, если при запросе к RESTful сервису ресурс не найден?». Ответ 404 был принят единогласно. Если честно, я так и не понял, как этот вопрос помог понять знаю ли я REST или нет, но одно могу уверенно сказать: REST понимают далеко не все. Вот некоторые вопросы, которые мучали меня долгое время:

Зачем REST стал таким трендовым? Это архитектура была же предложена еще в 2000 году?
Что я получу если моя служба будет RESTful?
Как определить является ли служба RESTful или нет?
Как правильно должны создаваться URL REST служб?
Какие http методы и коды должны быть использованы в RESTful службе?

Если вы не можете дать исчерпывающего ответа хотя бы на один из этих вопросов, то продолжайте чтение. Если вы можете однозначно ответить на все эти вопросы, можете привести формат правильного URL, считайте, что GET, POST, PUT, DELETE обязательно должны соответствовать CRUD операциям с ресурсами, то вам обязательно надо продолжать чтение.

Читать дальше →

+28

125

@SLY_G 13 янв 2017 в 12:42

Как сделать невозможные обои: история запрещённых симметрий

4 мин

43K

Научно-популярное

Перевод

Слева – узор обоев с симметрией вращения шестого порядка вокруг каждой из коричнево-зелёных розеток. Справа – узор обоев с зеркальной симметрией относительно горизонтальных линий, проходящих через каждый эллиптический элемент орнамента витража.

На первый взгляд придумывать обои не сложнее, чем выполнять задания из детского сада. Дизайнеры могут выбрать любое сочетание цветов и форм для первоначального кусочка, и просто размножить его в двух направлениях. В зависимости от узора начального кусочка и выбора направлений могут появляться и дополнительные симметрии – к примеру, симметрия шестого порядка на первой картинке, или зеркальная на второй. Оба узора созданы математиком Фрэнком Фарисом [Frank Farris] из калифорнийского университета Санта-Клары.

Читать дальше →

+46

@Karaoke 22 ноя 2016 в 13:32

Обучаемся самостоятельно: подборка видеокурсов по Computer Science

11 мин

134K

Блог компании EdisonАлгоритмы * Математика * Машинное обучение * Программирование *

Перевод

Содержание

+47

@tyomitch 6 ноя 2016 в 20:59

Как устроен парсер Python, и как втрое уменьшить потребление им памяти

12 мин

51K

Компиляторы * Python * Open source * C *

Любой, кто изучал устройство языков программирования, примерно представляет, как они работают: парсер в соответствии с формальной грамматикой ЯП превращает входной текст в некоторое древовидное представление, с которой работают последующие этапы (семантический анализ, различные трансформации, и генерация кода).

В Python всё немного сложнее: парсеров два. Первый парсер руководствуется грамматикой, заданной в файле Grammar/Grammar в виде регулярных выражений (с не совсем обычным синтаксисом). По этой грамматике при помощи Parser/pgen во время компиляции python генерируется целый набор конечных автоматов, распознающих заданные регулярные выражения — по одному КА для каждого нетерминала. Формат получающегося набора КА описан в Include/grammar.h, а сами КА задаются в Python/graminit.c, в виде глобальной структуры _PyParser_Grammar. Терминальные символы определены в Include/token.h, и им соответствуют номера 0..56; номера нетерминалов начинаются с 256.

Проиллюстрировать работу первого парсера проще всего на примере. Пусть у нас есть программа if 42: print("Hello world").

Читать дальше →

+107

@0serg 4 окт 2013 в 18:02

Простыми словами о преобразовании Фурье

Средний

14 мин

1.2M

Математика * Визуализация данных *

Из песочницы

Я полагаю что все в общих чертах знают о существовании такого замечательного математического инструмента как преобразование Фурье. Однако в ВУЗах его почему-то преподают настолько плохо, что понимают как это преобразование работает и как им правильно следует пользоваться сравнительно немного людей. Между тем математика данного преобразования на удивление красива, проста и изящна. Я предлагаю всем желающим узнать немного больше о преобразовании Фурье и близкой ему теме того как аналоговые сигналы удается эффективно превращать для вычислительной обработки в цифровые.

(с) xkcd

Без использования сложных формул и матлаба я постараюсь ответить на следующие вопросы:

FT, DTF, DTFT — в чем отличия и как совершенно разные казалось бы формулы дают столь концептуально похожие результаты?
Как правильно интерпретировать результаты быстрого преобразования Фурье (FFT)
Что делать если дан сигнал из 179 сэмплов а БПФ требует на вход последовательность по длине равную степени двойки
Почему при попытке получить с помощью Фурье спектр синусоиды вместо ожидаемой одиночной “палки” на графике вылезает странная загогулина и что с этим можно сделать
Зачем перед АЦП и после ЦАП ставят аналоговые фильтры
Можно ли оцифровать АЦП сигнал с частотой выше половины частоты дискретизации (школьный ответ неверен, правильный ответ — можно)
Как по цифровой последовательности восстанавливают исходный сигнал

Я буду исходить из предположения что читатель понимает что такое интеграл, комплексное число (а так же его модуль и аргумент), свертка функций, плюс хотя бы “на пальцах” представляет себе что такое дельта-функция Дирака. Не знаете — не беда, прочитайте вышеприведенные ссылки. Под “произведением функций” в данном тексте я везде буду понимать “поточечное умножение”

Итак, приступим?

+180

190

1 2 ...

13 14

16 17 18

Индексы в PostgreSQL — 1

Предисловие

Bash-скрипты, часть 5: сигналы, фоновые задачи, управление сценариями

Продвинутое туннелирование: атакуем внутренние узлы корпоративной сети

Сможет ли Питон прожевать миллион запросов в секунду?

Ansible: настраиваем zsh терминал с antigen, autosuggestions, fzf и красивым prompt одной командой

Особенности:

Ping и некоторые его параметры

Нейронные сети в картинках: от одного нейрона до глубоких архитектур

Настройка DKIM/SPF/DMARC записей или защищаемся от спуфинга

Бесплатное программное обеспечение для IP-камер

Как я сделал самый быстрый ресайз изображений. Часть 0

Каково это — быть разработчиком в России, когда тебе сорок

Поиск по большим документам в ElasticSearch

SSH-туннель домой без необходимости оставлять включённым домашний ПК

Python: коллекции, часть 4/4: Все о выражениях-генераторах, генераторах списков, множеств и словарей

Оглавление:

Лабораторная работа «Обучаемся настраивать сети в GNU/Linux»

А ваша служба является RESTful? Все что необходимо/обязательно знать про веб службы и REST

Введение

Как сделать невозможные обои: история запрещённых симметрий

Обучаемся самостоятельно: подборка видеокурсов по Computer Science

Содержание

Как устроен парсер Python, и как втрое уменьшить потребление им памяти

Простыми словами о преобразовании Фурье

Информация

Специализация