Статьи / Закладки / Профиль olegborzov / Хабр

Олег Борзов @olegborzov

Техлид

ПрофильСтатьи5ПостыНовостиКомментарии41

Kilor 26 ноя 2020 в 07:10

PostgreSQL в «Тензоре» — публикации за год

16 мин

6.5K

Блог компании ТензорERP-системы*PostgreSQL*SQL*Базы данных*

Ровно год назад с рассказа о нашем сервисе визуализации планов запросов мы начали публикацию на Хабре серии статей, посвященных работе с PostgreSQL и его особенностям. Это уже пройденные нами «грабли», интересные наработки, накопившиеся рекомендации, применяемые в разработке «Тензора» — те вещи, которые помогают нам делать СБИС более эффективным.

СБИС — это система полного цикла управления бизнесом — от кадрового учета, бухгалтерии, делопроизводства и налоговой отчетности, до таск-менеджмента, корпоративного портала и видеокоммуникаций. Поэтому каждый из 1 500 000 клиентов-организаций находит что-то полезное для себя и использует наши сервисы на постоянной основе — что дает ежемесячно более миллиона активных клиентов.

И все их данные надо где-то хранить и эффективно извлекать. Поэтому еще в далеком 2012 году мы сделали ставку на PostgreSQL, и теперь это основное хранилище данных наших сервисов:

почти 9000 баз общим объемом 1PB
свыше 200TB данных клиентов
1500 разработчиков работают с БД

Чтобы упорядочить накопившиеся знания, за минувший год мы опубликовали более 60 статей, в которых делимся своим реальным опытом, проверенным практикой «сурового энтерпрайза». Возможно, какие-то из них вы пропустили, поэтому под катом мы собрали дайджест, где каждый разработчик и DBA найдет что-то интересное для себя.

Для удобства все статьи разбиты на несколько циклов:

Анализ запросов
Наглядно демонстрируем все тайны EXPLAIN [ANALYZE].
SQL Antipatterns и оптимизация SQL
Понимаем как [не] надо решать те или иные задачи в PostgreSQL и почему.
SQL HowTo
Пробуем подходы к реализации сложных алгоритмов на SQL для развлечения и с пользой.
DBA
Присматриваем за базой, чтобы ей легко дышалось.
Прикладные решения
Решаем с помощью PostgreSQL конкретные бизнес-задачи.

Читать дальше →

+23

sismetanin 7 сен 2018 в 06:55

Анализ тональности текстов с помощью сверточных нейронных сетей

11 мин

61K

Блог компании VKBig Data*Data Mining*Python*Машинное обучение*

Туториал

Представьте, что у вас есть абзац текста. Можно ли понять, какую эмоцию несет этот текст: радость, грусть, гнев? Можно. Упростим себе задачу и будем классифицировать эмоцию как позитивную или как негативную, без уточнений. Есть много способов решать такую задачу, и один из них — свёрточные нейронные сети (Convolutional Neural Networks). CNN изначально были разработаны для обработки изображений, однако они успешно справляются с решением задач в сфере автоматической обработки текстов. Я познакомлю вас с бинарным анализом тональности русскоязычных текстов с помощью свёрточной нейронной сети, для которой векторные представления слов были сформированы на основе обученной Word2Vec модели.

Статья носит обзорный характер, я сделал акцент на практическую составляющую. И сразу хочу предупредить, что принимаемые на каждом этапе решения могут быть неоптимальными. Перед прочтением рекомендую ознакомиться с вводной статьей по использованию CNN в задачах обработки естественных языков, а также прочитать материал про методы векторного представление слов.

Читать дальше →

+34

vlstrochkov 13 окт 2020 в 16:00

Восемь интересных возможностей PostgreSQL, о которых вы, возможно, не знали

8 мин

28K

Блог компании OTUSPostgreSQL*SQL*Базы данных*

Перевод

Привет, Хабр! Приглашаем на бесплатный Demo-урок «Параллельный кластер CockroachDB», который пройдёт в рамках курса «PostgreSQL». Также публикуем перевод статьи Тома Брауна — Principal Systems Engineer at EnterpriseDB.

В этой статье рассмотрим несколько полезных советов по работе с PostgreSQL: ссылка на всю строку целиком, сравнение нескольких столбцов, общие табличные выражения, пользовательские параметры конфигурации, сравнение логических значений без "равно", изменение типа столбца без лишних затрат, информация о секции, в которой находится строка, таблицы — это типы.

+36

wider 7 авг 2020 в 09:29

Создание программного продукта и управление его развитием

5 мин

22K

Блог компании AcronisКарьера в IT-индустрииРазвитие стартапаУправление продуктом*Управление разработкой*

Привет, Хабр! Сегодня мы начинаем публикацию серии практических материалов для продакт-менеджеров, основателей стартапов и всех остальных, кто хочет приобрести навыки менеджера по разработке программных продуктов. Этот и последующие посты былы подготовлен на основе лекций курса «Создание программного продукта и управление его развитием», который был организован с помощью компании Acronis.

Всех, кто планирует запускать свои продукты, стремится расширить свои компетенции или хочет подискутировать с нами — прошу под кат.

+15

Turundur 8 сен 2020 в 08:36

Green Code и березки. Основные принципы зеленого кода в разработке

7 мин

6.5K

Блог компании ДомкликПрограммирование*Проектирование и рефакторинг*ЭкологияЭнергия и элементы питания

Всем привет. Меня зовут Стас, в компании Домклик я курирую разработку сервисов бек-офиса для ипотечного кредитования Сбербанка.

В последнее время во всевозможных докладах и подкастах я довольно часто стал встречать термин «Green Code». Покопавшись в интернете и изучив эту тему, я понял, что этим термином описывают комплекс приёмов в разработке и проектировании приложений, позволяющих сократить энергопотребление оборудования, на котором этот код выполняется.

Более-менее этим вопросом обычно озадачиваются разработчики мобильных приложений, в основном потому, что устройство, на котором будет выполняться их код, имеет ограниченную емкость батареи.

Тема стала достаточно «хайповой», и я решил прикинуть, как именно принципы «зеленого» могут быть отражены в WEB-разработке.

Читать дальше →

+16

ph_piter 28 авг 2020 в 07:34

О растущей популярности Kubernetes

7 мин

4.9K

Блог компании Издательский дом «Питер»Программирование*Облачные сервисы*Анализ и проектирование систем*Kubernetes*

Перевод

Привет, Хабр!

В конце лета мы хотим напомнить, что продолжаем проработку темы Kubernetes и решили опубликовать статью со Stackoverflow, демонстрирующую состояние дел в этом проекте на начало июня.

Приятного чтения!

Читать дальше →

+11

MarsiBarsi 12 авг 2020 в 16:00

Топ-10 Angular-приемов, выбранных сообществом

4 мин

13K

Блог компании Т-БанкAngular*JavaScript*TypeScript*Социальные сети и сообщества

В течение июня Саша Инкин и я, Рома Седов, запилили в Твиттере челлендж.

Каждый день мы публиковали по совету, хитрости или просто какой-нибудь полезной штуке из нашего опыта работы с Angular. Это движение было тепло встречено и поддержано комьюнити разработчиков.

Я решил написать статью о десяти приемах, которые набрали больше всего лайков, а также объяснить показанные в них концепции более подробно.

Давайте начнем!

+28

skryukov 11 авг 2020 в 08:00

Неофициальный гайд по Active Admin

15 мин

15K

Блог компании ДомкликRuby*Ruby on Rails*

Туториал

Статья про Ruby в блоге компании ДомКлик! Как так получилось, что в молодую компанию завезли мертвый язык? Секрет в том, что на Ruby можно быстро написать и протестировать бизнес-идею. И делается это не без помощи Rails и Active Admin — библиотеки, которая позволяет быстро создать админку с минимальными затратами сил и времени.

Часто можно встретить мнение, что Active Admin хорош только для 15-минутного блога. Мы в ДомКлик считаем (и доказываем на практике), что из этой библиотеки можно выжать намного больше.

Я расскажу про некоторые подходы, которые мы применяем при работе с Active Admin.

Читать дальше →

+21

Seleditor 6 авг 2020 в 10:27

Дождались: вышел LibreOffice 7.0

2 мин

42K

Блог компании SelectelOpen source*Софт

В этом месяце случилось сразу два приятных сюрприза. Первый — релиз ядра Linux Kernel 5.8. Второй — выход офисного пакета LibreOffice 7.0. Уже готовы пакеты для разных ОС, включая Linux, Windows, MacOS.

В седьмой версии офисного пакета много изменений. 74% добавлены сотрудниками организаций вроде Collabora, Red Hat и CIB, все остальное — результаты труда независимых разработчиков.

Что нового?

+68

Svetlana_get-it 7 авг 2020 в 10:01

Как подготовить хорошее резюме для IT-специалиста

10 мин

95K

Блог компании Headz.ioКарьера в IT-индустрииУправление персоналом*Управление проектами*

Если вы не зарегистрированы на hh.ru или подобных ресурсах, находите работу в профильных сообществах на Facebook, в Telegram и по «сарафанному радио», и у вас нет отбоя от предложений, вам не нужно резюме. Но обычно оно нужно тем, кто вас нанимает — с рекрутера или HR начинается первый контакт разработчика и работодателя. Они изучают резюме кандидата перед тем, как передать его техническим специалистам и нанимателю. Рекрутер и HR — это первый этап отбора во всех компаниях, начиная с провинциальной веб-студии и заканчивая Яндексом или Сбербанком. Важно быстро пройти этот этап, а чтобы это сделать и нужно хорошее резюме.

Мы в headz.io работали примерно с 5000 резюме тестировщиков, разработчиков, DevOps-инженеров и других IT-специалистов, чтобы помочь им устроиться на ту работу, которую они хотели. Поэтому можем рассказать, как подготовить резюме, чтобы быстро пройти рекрутера или HR и понравиться работодателю.

Читать дальше →

-5

Nastradamus 7 авг 2020 в 08:35

Kubernetes в ДомКлик: как спать спокойно, управляя кластером на 1000 микросервисов

8 мин

16K

Блог компании ДомкликDevOps*Kubernetes*

Технотекст 2020

Меня зовут Виктор Ягофаров, и я занимаюсь развитием Kubernetes-платформы в компании ДомКлик в должности технического руководителя разработки в команде Ops (эксплуатация). Я хотел бы рассказать об устройстве наших процессов Dev <-> Ops, об особенностях эксплуатации одного из самых больших k8s-кластеров в России, а также о DevOps/SRE-практиках, которые применяет наша команда.

Поехали!

+39

AloneCoder 5 авг 2020 в 17:43

Трюки с SQL от DBA. Небанальные советы для разработчиков БД

22 мин

34K

Блог компании VKPostgreSQL*SQL*Высоконагруженные системы*

Туториал

Перевод

Когда я начинал свою карьеру разработчика, моей первой работой стала DBA (администратор базы данных, АБД). В те годы, ещё до AWS RDS, Azure, Google Cloud и других облачных сервисов, существовало два типа АБД:

АБД инфраструктуры отвечали за настройку базы данных, конфигурирование хранилища и заботу о резервных копиях и репликации. После настройки БД инфраструктурный администратор время от времени «настраивал экземпляры», например, уточнял размеры кэшей.
АБД приложения получал от АБД инфраструктуры чистую базу и отвечал за её архитектуру: создание таблиц, индексов, ограничений и настройку SQL. АБД приложения также реализовывал ETL-процессы и миграцию данных. Если команды использовали хранимые процедуры, то АБД приложения поддерживал и их.

АБД приложений обычно были частью команд разработки. Они обладали глубокими познаниями по конкретной теме, поэтому обычно работали только над одним-двумя проектами. Инфраструктурные администраторы баз данных обычно входили в ИТ-команду и могли одновременно работать над несколькими проектами.

Читать дальше →

+68

AlexK23 5 авг 2020 в 09:01

Обновление версий PostgreSQL, или Как не уронить базу при update?

16 мин

45K

Блог компании ДомкликPostgreSQL*

Мы решили поделиться памяткой (чеклистом) нашей команды по обновлению PostgreSQL. В ней мы взяли за основу фичи, представленные в релизе официальной документации PostgreSQL, провели анализ на предмет нарушения совместимости и кому стоит обратить внимание на обновленную функциональность.

Читать дальше →

+51

NeverWalkAloner 4 авг 2020 в 04:40

Пишем веб сервис на Python с помощью FastAPI

17 мин

129K

Программирование*Python*

Знаю, знаю, наверное вы сейчас думаете «что, опять?!».

Да, на Хабре уже неоднократно писали о фреймворке FastAPI. Но я предлагаю рассмотреть этот инструмент немного подробнее и написать API своего собственного мини Хабра без кармы и рейтингов, зато ~~с блэкджеком и~~ с тестами, аутентификацией, миграциями и асинхронной работой с БД.

Читать дальше →

+22

fominslava 30 июл 2020 в 10:52

Lock-файлы npm

13 мин

43K

Блог компании ДомкликJavaScript*Node.JS*Веб-разработка*

Lock-файлы npm

Всем привет! В прошлом посте мы рассмотрели экосистему npm в качестве источника хаоса в нашем проекте, и научились с умом подходить к выбору зависимостей, чтобы минимизировать наши риски. Сегодня мы пойдем дальше и рассмотрим lock-файлы npm, которые помогают повысить стабильность проекта в процессе работы над ним.

Читать дальше →

+25

PZ1 28 июл 2020 в 07:56

Об отслеживании социальных контактов и аппаратных жетонах

9 мин

3.7K

Блог компании ДомкликНосимая электроникаНаучно-популярноеГаджеты

Перевод

Во время пандемии ко мне обратилась Европейская Комиссия с предложением разработать жетон отслеживания социальных контактов с защитой приватности, о чём вы можете почитать на странице проекта Simmel. А вскоре Сингапур объявил о разработке жетона TraceTogether. В рамках этого события меня пригласили поучаствовать в обзоре их решения. Срочность ситуации с COVID-19 и значительная сложность создания цепочек поставок привели к тому, что мы оказались в ситуации выпущенных шасси самолёта, который коснулся посадочной полосы. Учитывая многочисленные проблемы, связанные с приватностью и технологиями, положение было сложным, его не получится описать в серии твитов. Поэтому опишу свои впечатления в виде коротких эссе. Поскольку мне удалось поработать с TraceTogether всего час, то по большей части буду рассказывать о контексте, в рамках которого дам оценку этому жетону.

Читать дальше →

+15

fominslava 23 июл 2020 в 11:44

Выбор зависимостей JavaScript

10 мин

14K

Блог компании ДомкликВеб-разработка*Node.JS*JavaScript*

Выбор зависимостей JavaScript

Всем привет! В предыдущем посте мы подробно поговорили про добавление зависимостей в проект и про способы и стратегии их обновления.

В этом посте, как и обещал, я хочу начать обсуждение таких невероятно важных вопросов, как стабильность и безопасность в управлении зависимостями. Надеюсь, мои советы помогут вам контролировать хаос, снижать риски и всегда оставаться на безопасной стороне!

Читать дальше →

+30

MaxRokatansky 20 июл 2020 в 15:35

Sktime: унифицированная библиотека Python для машинного обучения и работы с временными рядами

7 мин

15K

Блог компании OTUSМашинное обучение*Математика*Big Data*

Перевод

Всем привет. В преддверии старта базового и продвинутого курсов «Математика для Data Science», мы подготовили перевод еще одного интересного материала.

Решение задач из области data science на Python – это непросто

Почему? Существующие инструменты плохо подходят для решения задач, связанных с временными рядами и эти инструменты сложно интегрировать друг с другом. Методы пакета scikit-learn предполагают, что данные структурированы в табличном формате и каждый столбец состоит из независимых и одинаково распределенных случайных величин – предположений, которые не имеют ничего общего с данными временных рядов. Пакеты, в которых есть модули для машинного обучения и работы с временными рядами, такие как statsmodels, не особо хорошо дружат между собой. Более того, множество важных операций с временными рядами, такие как разбиение данных на обучающий и тестовый наборы по временным промежуткам, в существующих пакетах недоступны.

Для решения подобных задач и была создана sktime.

Читать дальше →

fominslava 14 июл 2020 в 09:08

Установка и обновление зависимостей в JavaScript

11 мин

75K

Блог компании ДомкликВеб-разработка*Node.JS*JavaScript*

Установка и обновление зависимостей JavaScript

И снова привет! В прошлом посте мы начали рассматривать процесс управления зависимостями в JavaScript, разобрали основы: что такое npm-пакет, как выглядит манифест пакета, в каких полях прописываются зависимости и в принципе что такое дерево зависимостей, а также основы семантического версионирования (semver). Если вы пропустили предыдущий пост, то рекомендую начать с него.

Сегодня мы пойдем немного дальше и более подробно рассмотрим как работает semver, как правильно прописывать диапазоны зависимостей, а также устанавливать и обновлять их.

Читать дальше →

+31

ownhrd 18 июн 2020 в 08:37

Долгосрочное хранение данных в Elasticsearch

11 мин

23K

Блог компании Домклик*nix*Big Data*Поисковые технологии*Системное администрирование*

Туториал

Меня зовут Игорь Сидоренко, я техлид в команде админов, поддерживающих в рабочем состоянии всю инфраструктуру Домклик.

Хочу поделиться своим опытом в настройке распределённого хранения данных в Elasticsearch. Мы рассмотрим, какие настройки на нодах отвечают за распределение шардов, как устроен и работает ILM.

Много грязных технических подробностей

+29

1 2

4 5 6