Статьи / Закладки / Профиль ElmElman / Хабр

@Kipriz 29 ноя 2022 в 09:53

33 питона: зоопарк позиций, которые требуют знания python

7 мин

14K

Блог компании OTUSPython * Управление персоналом * Карьера в IT-индустрии

В прошлом году передо мной встала задача собрать команду для разработки платформы обработки данных. Причём не только команду разработки самой платформы, но ещё и команду дата-инженеров, которые будут пользоваться этой самой платформой: писать конфигурации дата-пайплайнов и наполнять дата-лейк данными. И ещё были нужны аналитики данных, кто бы разбирался в предметных областях и понимал, о чём те или иные таблицы. А так как данных много (пара тысяч таблиц), понадобились дата-сайентисты, кто бы не просто мог ответить на вопрос о качестве данных, но и предложить как это качество данных проверять на масштабе нескольких тысяч таблиц, нескольких сотен дата-пайплайнов и нескольких сотен гигайбайт данных каждый день.

Прошло почти два года со старта проекта, и я готов подвести некоторые итоги и поделиться опытом.

Начну с темы найма. Найма питонистов всех мастей.

Завораживающее предисловие, не правда ли?

Читать далее про разных питонистов

@olegchir 26 июн 2019 в 12:42

«Не так важны инструменты, как умение мыслить о системах, которые они создают». Большое интервью с Мартином Клеппманом

22 мин

14K

Блог компании JUG Ru GroupИнтервьюКонференцииПрограммирование * Распределённые системы *

Мартин Клеппман (Martin Kleppman) – исследователь в Кембриджском университете, работающий над CRDT и формальной верификацией алгоритмов. Его книга «Designing Data-Intensive Applications», опубликованная в 2017 году, стала бестселлером в области хранения и обработки данных.

Kevin Scott (CTO в Microsoft) однажды сказал: «Эта книга должна быть обязательной для инженеров-разработчиков. Это редкий ресурс, объединяющий теорию и практику, помогающий разработчикам глубже продумывать дизайн и реализацию инфраструктуры и систем обработки данных». Что-то похожее говорил и Jay Kreps — создатель Apache Kafka и CEO Confluent.

А прежде чем заняться академическими исследованиями, Мартин работал в индустрии и стал сооснователем двух успешных стартапов: Rapportive (купленный LinkedIn в 2012 году) и Go Test It (куплен RedGate).

Этот хабрапост – развернутое интервью с Мартином. Примерные темы обсуждения:

Переход от бизнеса к академическим исследованиям;
Предпосылки написания Designing Data-Intensive Applications;
Здравый смысл против искусственного ажиотажа и рекламы инструментов;
Ненужность теоремы CAP и другие ошибки индустрии;
Полезность децентрализации;
Блокчейны, Dat, IPFS, Filecoin, WebRTC;
Новые CRDT. Формальная верификация на Isabelle;
Дискуссия про event sourcing. Низкоуровневый подход. XA-транзакции;
Apache Kafka, PostgreSQL, Memcached, Redis, Elasticsearch;
Использование всего этого в реальной жизни;
Порог входа в доклады Мартина и конференция Hydra.

Интервью провёл Вадим Цесько (@incubos) — ведущий разработчик в команде Платформы компании Одноклассники. Научные и инженерные интересы Вадима касаются распределённых систем и хранилищ данных, а также верификации программных систем.

Читать дальше →

+30

33 питона: зоопарк позиций, которые требуют знания python

«Не так важны инструменты, как умение мыслить о системах, которые они создают». Большое интервью с Мартином Клеппманом

Информация

Специализация