Pull to refresh
2
0
Send message

Data Build Tool или что общего между Хранилищем Данных и Смузи

Reading time10 min
Views25K

На каких принципах строится идеальное Хранилище Данных?

Фокус на бизнес-ценности и аналитике при отсутствии boilerplate code. Управление DWH как кодовой базой: версионирование, ревью, автоматическое тестирование и CI. Модульность, расширяемость, открытый исходный код и сообщество. Дружественная пользовательская документация и визуализация зависимостей (Data Lineage).

Обо всём этом подробнее и о роли DBT в экосистеме Big Data & Analytics — добро пожаловать под кат.
Читать дальше →
Total votes 9: ↑8 and ↓1+10
Comments2

Merge Join

Reading time10 min
Views12K

По материалам статьи Craig Freedman: Merge Join

Соединение слиянием одновременно считывает и сравнивает два отсортированных входных потока, по одной строке за шаг. На каждом из этих шагов происходит сравнение со следующей строкой входного потока. Если строки равны, выводится присоединяемая строка, и процесс продолжается дальше. Если строки не равны, исключается меньшее из двух входных значений, и процесс продолжается. Так как входные потоки отсортированы, легко видно, что исключаемая строка будет меньше любой из оставшихся строк в любом из входных потоков и, таким образом, не должна участвовать в соединении.

Этот алгоритм в псевдокоде можно выразить следующим образом:

Эта статья посвящена физическому оператору соединения - соединению слиянием (Merge Join или MJ). В отличие от Nested Loops Join, которое поддерживает любые предикаты соединения, соединение слиянием требует существования не менее одного предиката соединения по эквивалентности. Кроме того, получаемые соединением слиянием данные должны быть отсортированы по ключу соединения. Например, если мы имеем предикат соединения "T1.a = T2.b", таблица T1 должна быть отсортирована по T1.a, а таблица T2 должна быть сортирована по T2.b.

Читать далее
Total votes 3: ↑3 and ↓0+3
Comments2

Магия оптимизации SQL запросов

Reading time7 min
Views64K

Даже самый простой SQL запрос можно выполнить по-разному. Но из всех вариантов СУБД нужно выбрать оптимальный, как же это сделать? Неужели придётся перебрать все возможные варианты? Давайте разбираться.

Читать далее
Total votes 24: ↑24 and ↓0+24
Comments19

Префиксы is, has, can, should… в нейминге переменных и функций

Level of difficultyEasy
Reading time5 min
Views23K

Префиксы помогают разработчикам быстро понять предназначение переменных и функций, что особенно полезно в больших проектах или когда код должен быть понятен новым участникам команды

Читать далее
Total votes 70: ↑66 and ↓4+71
Comments56

Выстраиваем понятный онбординг: кейс команды тестирования из Яндекс Диска

Level of difficultyEasy
Reading time8 min
Views3.3K

Привет, Хабр! Меня зовут Антон Морозов, я инженер по тестированию в Яндекс 360. Я работаю над мобильным Яндекс Диском — это проект с тысячами тест-кейсов, который развивается уже тринадцатый год. 

Погружение в продукт и новую команду — непростая задача для новичка, но нам удалось выстроить безболезненную адаптацию. В статье поделюсь практиками в команде QA, которые помогли нам за последние четыре года успешно адаптировать новичков (с оттоком 0% за 4 года)

Читать далее
Total votes 16: ↑13 and ↓3+13
Comments3

Разными способами пишем игру «Камень-ножницы-бумага» на Python

Level of difficultyEasy
Reading time10 min
Views6.2K

Когда вы впервые учитесь программировать, вы ищете (или, возможно, вам поручают) проекты, которые нужны для закрепления базовых концепций языка. Но как часто вы, набравшись чуть-чуть больше знаний и опыта, пересматриваете такие проекты самых для начинающих?

В этой статье мы сделаем именно это. Вернёмся к стандартному проекту для начинающих — реализации игры «Камень, ножницы, бумага» на Python, посмотрев, как её можно «улучшить».

Читать далее
Total votes 3: ↑2 and ↓1+1
Comments4

Восхитительная теория [якорных] баз данных от Ларса Рённбека

Level of difficultyMedium
Reading time10 min
Views6.6K

Обнаружил серию статей по принципам организации информации и базам данных от математика из Стокгольмского университета и с энтузиазмом перевожу. Моя уверенность в том, что реляционки с 3-й формой нормализации - лучшее, что придумало человечество, резко убавилась... Я бы назвал это "субъективной теорией информации", автор называет "Transitional modeling", но обычно это применяется под названием "якорная модель данных"...

Читать далее
Total votes 10: ↑7 and ↓3+5
Comments21

Яндекс запустил Нейро. Рассказываем, как он работает

Level of difficultyMedium
Reading time14 min
Views61K

Сегодня мы запустили новый сервис Нейро — новый способ поиска ответов на вопросы. Пользователь может задать Нейро любой вопрос, а тот сам подберёт подходящие материалы в Поиске, проанализирует их и соберёт найденную информацию в одном ответе, подкрепив его ссылками на источники. Нейро объединил опыт Яндекса в создании поисковых технологий и больших языковых моделей. 

Меня зовут Андрей Сюткин, и я отвечаю за ML-трек в Нейро. В этой статье покажу, как выглядит архитектура Нейро и как формируются ответы на технологическом уровне. Ну и, конечно же, поговорим о нейросетях, в том числе о YandexGPT 3, без обучения которых новый сервис просто не увидел бы свет.

Читать далее
Total votes 92: ↑82 and ↓10+91
Comments143

Бесшовность 2.0: как работает шардирование в Сбере

Level of difficultyMedium
Reading time10 min
Views6.4K

Если у вас не просто большая компания, а целая экосистема с разными сервисами, IT-инфраструктура должна обеспечивать бесшовность. Клиенты и сотрудники могут входить в систему с разных устройств, но изменение информации в одном канале должно отображаться в других, а целостность данных сохраняться, даже если вход совершен в двух каналах параллельно. И в идеале — так, чтобы клиент не видел «внутренней кухни».

Меня зовут Владимир Паршин, я ведущий ИТ-инженер в СберТехе. Расскажу, как выстроена работа с бесшовностью в Сбере.

В статье будет про драматичное прошлое, Джастина Бибера и балансировку нагрузки. А главное — про то, какие решения СберТеха под капотом банка сейчас обеспечивают обработку данных огромного числа клиентов и сотрудников.

Читать далее
Total votes 14: ↑11 and ↓3+14
Comments6

Что делать, если кандидат оказался сеньором или психом: советы на случай форс-мажоров

Level of difficultyEasy
Reading time7 min
Views76K

Меня зовут Александр Гирев, я Android-разработчик и технический интервьюер. В одной компании я выполнял роль interview expert: следил за качеством собеседований, готовил рекомендации и матрицы вопросов, обучал начинающих интервьюеров.

Однажды на интервью я спросил кандидата, был ли у него опыт проведения технических собеседований. Кандидат спросил: «Что за опыт — задать пару технических вопросов?». Услышав это, я слегка подвис, ведь я считал интервью серьёзным навыком, почти искусством.

В основе статьи лежит мой опыт проведения собеседований. Расскажу про важные качества технического интервьюера, хорошие и плохие примеры фидбека и про то, как быть, если на собеседовании случился форс-мажор.

Читать далее
Total votes 77: ↑59 and ↓18+61
Comments154

Ликбез по методологиям проектирования хранилищ данных

Level of difficultyEasy
Reading time2 min
Views11K

Хранилище данных — это информационная система, в которой хранятся исторические и коммутативные данные из одного или нескольких источников. Он предназначен для анализа, составления отчетов и интеграции данных транзакций из разных источников.

Рассмотрим сильные и слабые стороны самых популярных методологий.

Читать далее
Total votes 8: ↑4 and ↓4+2
Comments8

Как стать хорошим менеджером и наладить коммуникацию в команде? Советы от экспертов

Reading time9 min
Views5.6K

В жизни IT-специалиста может наступить момент, когда прежние задачи уже не интересны. Он работает настолько долго, что знает все процессы буквально наизусть. Более того — готов привносить изменения в работу команды.

Один из таких специалистов — Иван, разработчик в Selectel. Несколько лет он занимался бэкендом и ему стало казаться, что потолок достигнут и расти больше некуда. Поэтому Иван задумался о том, чтобы стать менеджером. Но как это сделать не во вред себе и своим интересам? И получится ли у него стать хорошим менеджером?

В этой статье на примере Ивана рассказываем, как техническому специалисту стать менеджером, какие есть барьеры и как их преодолеть.
Читать дальше →
Total votes 26: ↑23 and ↓3+30
Comments9

Как мы разгрузили руководителей проектов и освободили время для «профильных» задач

Level of difficultyEasy
Reading time4 min
Views8.6K

Руководители IT-проектов (РП) на рынке труда в остром дефиците: по данным hh.ru на 1 вакансию приходится 1,9 резюме. Поэтому часто в компаниях один РП ведет по 5-6 проектов. При такой загрузке успеть все и сохранить качество практически невозможно.

Решить проблему с загрузкой нам помог администратор проектов. Прежде чем ввести эту роль, мы детализировали все задачи РП и выделили «рутину». Её и передали администратору. Как итог у РП появилась возможность вести больше проектов, сохраняя высокий уровень качества. 

В статье Света Кыштымова, администратор проектов в Naumen, рассказала о роли администратора и задачах которые выполняет.

Читать далее
Total votes 11: ↑9 and ↓2+9
Comments14

Статический анализ структуры базы данных (часть 2)

Level of difficultyMedium
Reading time10 min
Views5K

Продолжим разбор проверок структуры базы данных, на примере PostgeSQL. Данная статья будет посвящена проверкам связанным с ограниением FOREIGN KEY (FK). Часть проверок целесообразно выполнять на регулярной основе, а некоторые позволяют лучше понять структуру проекта при первом знакомстве и применяются только один раз.

Читать далее
Total votes 8: ↑7 and ↓1+12
Comments2

Что такое semantic-release и как с ним работать

Level of difficultyMedium
Reading time7 min
Views4.9K

Привет! Я — Алексей Бондаренко, работаю в команде Платформа Банки.ру. Сегодня хочу рассказать о semantic-release и его практическом применении на примере упрощения разработки и внедрения библиотеки в проект. 

Читать далее
Total votes 13: ↑11 and ↓2+15
Comments5

Как системному аналитику не делать чужую работу

Level of difficultyEasy
Reading time8 min
Views14K

Выжимка требований и обязанностей после исследования кучи вакансий, частые хотелки бизнеса и реальные задачи системного аналитика. Отсеиваем лишнее. Покажите своему руководителю, чтобы перестать делать всё, везде и сразу.

Читать далее
Total votes 26: ↑24 and ↓2+25
Comments14

22 метрики для маркетплейса и что с ними делать — американский опыт глазами российского Менеджера продукта

Level of difficultyMedium
Reading time12 min
Views4.9K

Я Илья Пухов, Старший менеджер продукта в маркетплейсе Детского мира, до этого PM в Авито и основатель маркетплейса Гильдия Квестов. Статья основана на воркшопе по метрикам маркетплейсов CPO Outdoorsy и ветерана индустрии Колина Гардинера (1). Я дополнил материал основываясь на моем профессиональном опыте, и знанях из лекций значимых авторов в этой области. Например Елены Серегиной из Яндекса и Ильи Красинского. Постарался заполнить пробелы и создать полноценное руководство. Кое-где с комментариями из российской практики.

Читать далее
Total votes 7: ↑5 and ↓2+7
Comments9

Об эффективном использовании заметок на примерах из работы и личной жизни

Level of difficultyMedium
Reading time5 min
Views5.6K

Личная жизнь – штука сложная, работа – ещё сложнее. В условиях поистине огромной кучи «контекстов» не забывать даже самые важные вещи бывает непросто, а делать то, что надо и когда надо – порой просто невозможно. Нерешаемая задача? Отнюдь. Всё уже на самом деле давно изобретено для решения этой проблемы, просто надо знать методы и инструменты, а также немного научиться на собственном опыте. В этой статье я расскажу как об известных, так и о моих собственных методиках «упорядочивания хаоса».

Читать далее
Total votes 10: ↑8 and ↓2+8
Comments23

Принципы общения с людьми при провалах — 25 тезисов для обретения дзена

Level of difficultyEasy
Reading time9 min
Views15K

Я часто сталкиваюсь с необязательностью даже нормальных знакомых, друзей или коллег. Что уж говорить про выкрутасы всяких рандомных персонажей, с которыми иногда приходится общаться. Мне надоело говорить всем одно и то же, поэтому написал алгоритм для делового общения. Вот принципы, которые сделают комфортной вашу коммуникацию в сети.

Создал две версии. Одна — стерильная (на заглавной картинке выше), для обсуждения на вечернем чаепитии благородных девиц. Её можно скинуть совету директоров для распространения на бизнес-завтраках или для обучения сотрудников на тренингах по деловой коммуникации. Вторая — гораздо более доходчивая, для погружения в суровую жизненную реальность. Выбирайте что по вкусу.

Читать далее
Total votes 32: ↑23 and ↓9+17
Comments19

Где моя эффективность, босс? Как использовать метрики в управлении командой

Level of difficultyEasy
Reading time6 min
Views4.4K

Привет! Я Саша, тимлид одной из команд первичной недвижимости в Циан. Мы активно используем данные для принятия управленческих решений. Не только продуктовых, но и при управлении командами разработки. В статье я расскажу, как это устроено у нас в компании, и покажу на примере своих метрик, как это можно использовать у себя.

Читать далее
Total votes 17: ↑15 and ↓2+15
Comments11

Information

Rating
Does not participate
Registered
Activity