Богдан @bohdan-shulha

User

Профиль Публикации Комментарии 406Закладки 271

stkrizh 18 мая 2021 в 20:50

Протоколы в Python: утиная типизация по-новому

8 мин

44K

Python*

В новых версиях Python аннотации типов получают всё большую поддержку, всё чаще и чаще используются в библиотеках, фреймворках, и проектах на Python. Помимо дополнительной документированности кода, аннотации типов позволяют таким инструментам, как mypy, статически произвести дополнительные проверки корректности программы и выявить возможные ошибки в коде. В этой статье пойдет речь об одной, как мне кажется, интересной теме, касающейся статической проверки типов в Python – протоколах, или как сказано в PEP-544, статической утиной типизации.

+30

exmachine 13 мая 2021 в 09:18

Ровняем шарды

12 мин

3.2K

NoSQL*MongoDB*Администрирование баз данных*Хранение данных*Хранилища данных*

"Размышления без практики приводят к заблуждению, практика без размышления приводит к затруднению."

Мы ведём войну с индивидуальностью у шардов в кластере MongoDB. Это продолжение статьи Шардинг от которого невозможно отказаться, а это значит, что наступила пора конкретики.

Как я и обещал, здесь мы рассмотрим подробнее:

настройку процесса выравнивания размера шардов
расчет поправок для коррекции границ
мониторинг распределения данных в коллекциях

Читать дальше →

+11

Hasselhoff 17 мая 2021 в 17:06

Линейная алгебра для Data Science и Machine Learning

7 мин

29K

Блог компании SkillfactoryPython*Математика*Машинное обучение*

Перевод

Линейная алгебра в Data Science и Machine Learning является основополагающей. Новички, начинающие свой путь обучения в области Data Science, а также признанные практики должны развить хорошее понимание основных понятий линейной алгебры.

Специально к новому старту курса математика и Machine Learning для Data Science делимся переводом статьи Бенджамина Оби Тайо — физика, кандидата наук и преподавателя Data Science — о том, что нужно знать, чтобы лучше понимать Data Science и Machine Learning.

uchitel 14 мая 2021 в 15:42

Погружаемся в статистику вместе с Python. Часть 1. Z-статистика и p-value

19 мин

49K

Python*Математика*Визуализация данных*

Не знаю как вам, а мне статистика далась очень не просто. Причем "далась" - это еще громко сказано. Да, оказалось что можно довольно долго ехать на методичках, кое как вникая в смысл четырехэтажных формул, а иногда даже не понимая результатов, но все равно ехать. Ехать и не получать никакого удовольствия - вроде бы все понятно, но ощущение, что ты "не совсем в теме" все никак не покидает. Какое-то время пытался читать книги по R и не то что бы совсем безрезультатно, но и не "огонь". Нашел наикрутейшую книгу "Статистика для всех" Сары Бослаф, прочитал... все равно остались какие-то нюансы смысл которых так и не понятен до конца.

В общем, как вы догадались - эта статья из серии "Пробую объяснить на пальцах, что бы самому разобраться." Так что если вы неравнодушны к статистике, то прошу под кат.

Начать погружение

MaxRokatansky 13 мая 2021 в 17:14

Как построить систему распознавания лиц с помощью Elasticsearch и Python

5 мин

7.9K

Блог компании OTUSPython*Data Engineering*

Перевод

Пытались ли вы когда-нибудь искать объекты на изображениях? Elasticsearch может помочь вам хранить, анализировать и искать объекты на изображениях или видео.

В этом кратком руководстве мы покажем вам, как создать систему распознавания лиц с помощью Python. Узнайте больше о том, как обнаруживать и кодировать информацию о внешности - и находить совпадения в поиске.

zubiy_n 24 апр 2021 в 16:36

Распознавание дорожных знаков

6 мин

12K

Python*Обработка изображений*Машинное обучение*

Туториал

Компьютерное зрение — это область компьютерных наук, которая фокусируется на воспроизведении частей сложной системы зрения человека и позволяет компьютерам идентифицировать и обрабатывать объекты на изображениях и видео, а также людей. Ранние эксперименты в области компьютерного зрения начались в 1950-х годах и впервые были коммерчески использованы для различения печатного и рукописного текста в 1970-х годах. Сегодня приложения компьютерного зрения выросли в геометрической прогрессии. В этой статье показан пример как можно распознавать дорожные знаки с помощью компьютерного зрения.

ArkadiyXIII 29 апр 2021 в 08:45

Анатомия юнит-теста

11 мин

22K

Тестирование IT-систем*Программирование*Проектирование и рефакторинг*Тестирование веб-сервисов*

Эта статья является конспектом книги «Принципы юнит-тестирования». Материал статьи посвящен структуре юнит-теста.

В этой статье рассмотрим структуру типичного юнит-теста, которая обычно описывается паттерном AAA (arrange, act, assert — подготовка, действие и проверка). Затронем именование юнит-тестов. Автор книги описал распространенные советы по именованию и показал, почему он несогласен с ними и привел альтернативы.

Zashibis 28 апр 2021 в 14:29

Краткое введение в Машинное обучение

13 мин

24K

Машинное обучение*Искусственный интеллект

Пару лет назад я рассказывал жене сказки, что когда я буду старым маразматиком, мое ближайшее окружение не будет страдать от этого, ведь за мной будут ухаживать роботы. Новости о прогрессе искусственного интеллекта впечатляли меня (нейросетки то, нейросетки сё), свет в конце тоннеля манил, как и зарплаты специалистов в этой области. Разумеется, я не смог пройти мимо и решил погрузиться в Machine Learning.

Для старта хотелось почитать что-то совсем базовое, но поиск по строкам "машинное обучение для чайников" вменяемых результатов не дал. Все статьи начинались с тривиальных рассуждений, а потом перепрыгивали на загадочные формулы без особых пояснений. Я не сдавался и добыл несколько книг с хорошими отзывами, но получил то же самое, только уже на 600 страниц. Спустя полгода поисков могу сообщить вам следующее: при текущих темпах развития AI я не увижу роботов в старости, для работы с Machine Learning на самом деле не нужна математика, и как минимум одна статья "машинное обучение для чайников" существует, вы ее сейчас читаете.

wincomm 29 апр 2021 в 12:49

Тестирование push-уведомлений в мобильных приложениях

5 мин

35K

Блог компании ЮлаТестирование мобильных приложений*

Push-уведомления — это сообщения, отправляемые приложением на мобильное устройство клиента. Они обычно используются для доставки обновлений продуктов, напоминаний, персонализированных предложений, последних новостей и любой информации, которая является неотъемлемой частью функциональности приложения и требует особого внимания или быстрых действий.

Читать дальше →

capissimo 29 апр 2021 в 12:15

Что такое machine learning?

14 мин

8.1K

IT-стандарты*Терминология ITМашинное обучение*Учебный процесс в ITИскусственный интеллект

Туториал

Перевод

Данный пост содержит выдержки из одноименной статьи Дэниела Фагеллы, руководителя отдела исследований в компании Emerj от 26.02.2020. Слегка укороченный перевод данной статьи служит доказательством концепции, изложенной мной в предыдущем посте о принятом за рубежом понимании термина machine learning.

tmat 24 фев 2021 в 18:08

Всё, о чём должен знать разработчик Телеграм-ботов

15 мин

637K

Мессенджеры*API*

Вы вряд ли найдете в интернете что-то про разработку ботов, кроме документаций к библиотекам, историй "как я создал такого-то бота" и туториалов вроде "как создать бота, который будет говорить hello world". При этом многие неочевидные моменты просто нигде не описаны.

Как вообще устроены боты? Как они взаимодействуют с пользователями? Что с их помощью можно реализовать, а что нельзя?

Подробный гайд о том, как работать с ботами — под катом.

+127

host_m 21 янв 2021 в 11:55

Трюк с XOR для собеседований и не только

8 мин

115K

Блог компании VDSina.ruПрограммирование*Алгоритмы*

Перевод

Есть целая куча популярных задач для собеседований, которые можно решить одним из двух способов: или логичным применением стандартных структур данных и алгоритмов, или использованием некоторых свойств XOR сложным для понимания способом.

Хоть и непривычно ожидать решения с XOR на собеседованиях, довольно забавно разбираться, как они работают. Оказывается, все они основаны на одном фундаментальном трюке, который я постепенно раскрою в этом посте. Далее мы рассмотрим множество способов применения этого трюка с XOR, например, при решении популярной задачи с собеседований:

Дан массив из n — 1 целых чисел, находящихся в интервале от 1 до n. Все числа встречаются только один раз, за исключением одного числа, которого нет. Найдите отсутствующее число.

Разумеется, существует множество прямолинейных способов решения этой задачи, однако есть и довольно неожиданный, в котором применяется XOR.

Читать дальше →

+80

104

Pavel_Yurkin 4 фев 2021 в 10:00

PostgreSQL. Плохие запросы, примеры и их поиск

9 мин

29K

Блог компании Конференции Олега Бунина (Онтико)PostgreSQL*Администрирование баз данных*

При поиске проблем в RDBMs разработчик обычно подозревает медленные запросы. А что, если дело не в них? О том, какого типа запросы дают нагрузку на базу данных, не позволяя вашему приложению работать должным образом, рассказал в своем докладе на конференции Saint HighLoad++ Online 2020 администратор баз данных Data Egret Андрей Сальников.

Он поделился тем, как backend-разработчику определять такие запросы, и каким инструментом для этого лучше воспользоваться. Особенно эти знания пригодятся в случае, если нужно найти проблемы в работающей системе здесь и сейчас, когда дорога каждая минута, а работа приложения с базой данных тормозит.

+18

nikolai-averin 2 фев 2021 в 23:43

SQL миграции в Postgres. Часть 1

Средний

15 мин

33K

PostgreSQL*SQL*Администрирование баз данных*

FAQ

Технотекст 2021

Как обновить значение атрибута для всех записей таблицы? Как добавить первичный или уникальный ключ в таблицу? Как разбить таблицу на две? Как ...

Если приложение может быть недоступно какое-то время для проведения миграций, то ответы на эти вопросы не представляют сложности. А что делать, если миграции нужно проводить на горячую – не останавливая базу данных и не мешая другим с ней работать?

На эти и другие вопросы, возникающие при проведении миграций схемы и данных в PostgreSQL, постараемся дать ответы в виде практических советов.

Читать дальше →

+32

nevoroman 27 янв 2021 в 11:15

Как Контур балансирует нагрузку в микросервисах

10 мин

6.4K

Блог компании КонтурВысокая производительность*Системное администрирование*Программирование*IT-инфраструктура*

Контур — большой. У Контура очень много продуктов и большинство состоит из огромного множества микросервисов, количество которых может измеряться сотнями. К примеру запрос на главную страницу продукта может вылиться разветвленное дерево, глубина которого иногда достигает семи или восьми.

Понятное дело, подавляющее большинство этих микросервисов реплицировано и распределено между разными дата-центрами — что делает задачу «сходить в соседний микросервис» сложнее, чем кажется. А потому нам очень важны умные механизмы межсервисного взаимодействия. Об одном из таких механизмов — балансировке нагрузки между репликами микросервисов — мы сегодня и поговорим.

+20

egryaznov 25 янв 2021 в 17:04

Удивительно быстрые алгоритмы

5 мин

26K

Алгоритмы*

Туториал

Изучая программирование я встречаю примеры невозможных алгоритмов. Интуиция говорит, что такого не может быть, но компьютер опровергает её простым запуском кода. Как такую задачу, требующую минимум кубических затрат по времени, можно решить всего за квадрат? А вон ту я точно решу за линию. Что? Есть гораздо более эффективный и элегантный алгоритм, работающий за логарифм? Удивительно!

В этой статье я приведу несколько таких "ломающих шаблоны" алгоритмов, показывающих что интуиция может сильно переоценивать временную сложность задачи.

Интересно? Добро пожаловать под кат!

Читать дальше →

+21

quasilyte 24 янв 2021 в 17:52

Релиз ruleguard v0.3.0

8 мин

2.7K

Open source*Программирование*Go*Управление разработкой*

Релиз ruleguard v0.3.0

А что, если я скажу вам, что линтеры для Go можно создавать вот таким декларативным способом?

func alwaysTrue(m dsl.Matcher) {
    m.Match(`strings.Count($_, $_) >= 0`).Report(`always evaluates to true`)
    m.Match(`bytes.Count($_, $_) >= 0`).Report(`always evaluates to true`)
}

func replaceAll() {
    m.Match(`strings.Replace($s, $d, $w, $n)`).
        Where(m["n"].Value.Int() <= 0).
        Suggest(`strings.ReplaceAll($s, $d, $w)`)
}

Год назад я уже рассказывал об утилите ruleguard. Сегодня хотелось бы поделиться тем, что нового появилось за это время.

Основные нововведения:

Поддержка установки наборов правил через Go модули (bundles)
Программируемые фильтры (компилируются в байт-код)
Добавлен режим отладки фильтров
Появился хороший обучающий материал: ruleguard by example
У проекта появились реальные пользователи и внешние наборы правил
Онлайн песочница, позволяющая попробовать ruleguard прямо в браузере

Автор иллюстрации: Татьяна Уфимцева @leased_line

Читать дальше →

+14

Sergey1124 24 янв 2021 в 22:24

Новый подход к просмотру логов

7 мин

30K

Open source*Java*Отладка*Визуализация данных*

Из песочницы

Одно время, приходилось много работать с логами. Они могли быть большими и находиться на разных серверах. Требовалось не найти что-то конкретное, а понять почему система ведёт себя не так как надо. По некоторым причинам, лог-агрегатора не было.

Хотелось иметь просмотрщик логов, позволяющий, в любой момент, открыть любой файл, без скачивания на локальную машину, как команда less в linux консоли. Но при этом, должна быть удобная подсветка текста, как в IDE, и фильтрация событий по различным параметрам. Фильтрация и поиск должны работать по событиям в логе, а не по строкам, как grep, это важно когда есть многострочные записи, например ошибки со стектрейсами. Так же должна быть возможность просматривать записи сразу из нескольких файлов на одной странице, смёржив их по таймстемпу, даже если файлы находятся на разных нодах.

+17

Asya_Dyu 21 янв 2021 в 17:21

Слайды для миллиардного стартапа

8 мин

11K

Графический дизайн*Венчурные инвестицииРазвитие стартапаДизайнПрезентации

Перевод

В рамках бесплатного спринта по созданию презентаций для стартапов я перевела полезные советы от Y Combinator.

Y Combinator — лучший в мире акселератор для стартапов по количеству единорогов (25), по объему привлеченных инвестиций ($27 млрд) и по капитализации выпускников ($300+ млрд). 125 компаний с оценкой $150M+

Ниже приведена адаптация презентации, которую я даю стартапам YC, прежде чем мы попросим их создать свои презентации для Demo Day.

Вот как сделать надежную презентацию для Demo Day. Следует помнить, что у вас уже есть все необходимое для создания отличной презентации.

Вероятно есть 100 причин, почему ваша компания великолепна, но люди смогут вспомнить парочку из них после короткой презентации или питча. С каждым из вас мы сели и выяснили 5-7 самых важных идей, которые люди должны знать о вашем стартапе. Вы хотите, чтобы инвесторы запомнили именно эти 5-7 пунктов.

Как вы уже поняли после Prototype Day, вам повезет, если они смогут вспомнить хотя бы 1 или 2 из этих пунктов в контексте 100 других компаний, презентующихся вместе с вами.

3 4 ...

12 13

Протоколы в Python: утиная типизация по-новому

Ровняем шарды

Линейная алгебра для Data Science и Machine Learning

Погружаемся в статистику вместе с Python. Часть 1. Z-статистика и p-value

Как построить систему распознавания лиц с помощью Elasticsearch и Python

Распознавание дорожных знаков

Анатомия юнит-теста

Краткое введение в Машинное обучение

Тестирование push-уведомлений в мобильных приложениях

Что такое machine learning?

Всё, о чём должен знать разработчик Телеграм-ботов

Трюк с XOR для собеседований и не только

Рекомендательный движок за 2 строчки кода

PostgreSQL. Плохие запросы, примеры и их поиск

SQL миграции в Postgres. Часть 1

Как Контур балансирует нагрузку в микросервисах

Удивительно быстрые алгоритмы

Релиз ruleguard v0.3.0

Релиз ruleguard v0.3.0

Новый подход к просмотру логов

Слайды для миллиардного стартапа

Информация