Очевидный для ML-инженера факт: если на вход модели подать мусор — на выходе тоже будет мусор. Это правило действует всегда, независимо от того, насколько у нас крутая модель. Поэтому важно понимать, как ваши данные будут храниться, использоваться, версионироваться и воспроизведутся ли при этом результаты экспериментов. Для всех перечисленных задач есть множество различных инструментов: DVC, MLflow, W&B, ClearML и другие. Git использовать недостаточно, потому что он не был спроектирован под требования ML. Но есть инструмент, который подходит для версионирования данных и не только — это ClearML. О нем я сегодня и расскажу.
Выпускающий редактор
Работаете с микросервисами? Идём в сторону Go
Разработчики приложений с микросервисной архитектурой обращаются к Golang не только как к основному языку, но и как к вспомогательному — в дополнение к другим, более сложным. А мы решили обратиться к спикеру курса «Golang-разработчик» Виталию Лихачеву, Senior Software Engineer в Avito, чтобы он нам рассказал, почему лично он выбрал бы Go.
Почему fsync(): Потеря несинхронизированных данных на одном узле приводит к глобальной потере данных
Независимо от механизма репликации, необходимо использовать fsync() для предотвращения глобальной потери данных в non-Byzantine протоколах.
Как отследить pod-to-pod-трафик Kubernetes
В этой статье мы рассмотрим тонкости сетевого взаимодействия Kubernetes и углубимся в фундаментальные принципы и механизмы, которые управляют связью между подами.
Почему SRE приносит пользу командам и клиентам
SRE объединяет группы разработчиков программного обеспечения и инженеров эксплуатации и помогает создавать надежные, отказоустойчивые и масштабируемые системы. Некоторые из преимуществ этой методологии:
• Улучшаются коммуникации в команде
• Совершенствуется культура
• Уменьшается доля ручного труда
• Клиенты чаще остаются довольны
Понятные Terraform-проекты
Код Terraform является декларативным. Мы используем его, чтобы определить, что мы хотим получить от наших облачных провайдеров. Если перевести этот код на простой язык, то он будет выглядеть как подробный список покупок:
Дай мне частную виртуальную сеть с базой данных и кластером kubernetes. Кластер должен иметь некоторое количество узлов, и все они должны использовать определенный тип CPU. База данных должна быть расположена именно здесь, и она должна иметь возможность хранить определенное количество гигабайт…
Цель этой статьи — рассказать о том, как мы в Bulder Bank подходим к проблеме написания понятного кода Terraform.
Медленно меняющиеся измерения (SCDs) в эпоху облачного хранилища данных
Как работать с медленно меняющимися измерениями при использовании облачного хранилища данных?
В этом вопросе скрывается довольно много ответов, поэтому давайте сделаем паузу.
Осваиваем чистую архитектуру кода на Golang: практическое руководство по сущностям и слоям моделей
В архитектуре кода иногда разделяют слой сущностей и слой моделей. В этой статье я расскажу о них и приведу два примера кода на языке Golang.
Почему IT-командам в 2023 стоит уделять внимание лидерским качествам сотрудников
Хотя экономическая ситуация в этом году может показаться более нестабильной, чем в прошлые годы, бизнес по-прежнему инвестирует в проекты, меняющие мир. Компании понимают, что их клиенты, будь то другие организации или потребители, ждут интуитивно понятных цифровых продуктов. И именно такие решения ждут от команд разработчиков.
Комбинируем Prometheus, ChatGPT и Slack — получается Robusta
Что получится, если объединить Prometheus, работающий на Kubernetes, умный движок, взаимодействующий с ChatGPT, и мессенджер типа Slack? Вы получите платформу с открытым исходным кодом для поиска и устранения ошибок в Kubernetes под названием Robusta.
В этом посте мы рассмотрим применение Robusta поверх стека мониторинга Prometheus и покажем, почему возникают алерты и как их можно устранить.
Время лидов: 7 soft skills, которые помогут управленцу в IT
Однажды сеньор взглянет в зеркало и поймет: он готов стать техлидом. После этого сеньор заглянет вглубь себя — а сможет ли он руководить командой IT-специалистов? Хватит ли ему навыков для эффективных управленческих решений и грамотного распределения ресурсов? А если нет — то что делать?
Разбираем вместе с тренерами по soft skills Андреем Буловым и Ксенией Клён навыки крутого IT-лида, думаем, как их можно прокачать, если «маловато будет».
В стране потоков — Кафка, часть 4: «Мой кластер потерян!» — принятие неудачи
В предыдущих частях серии статей мы рассмотрели принципы работы преимущественно с точки зрения приложения. В этой заключительной части мы фокусируемся на инфраструктуре.
Серия статей состоит из следующих связанных частей:
Часть 1: Сообщение producer’а;
Часть 2: Подъем consumer’ов;
Часть 3: Смещения и как с ними справляться;
Часть 4: Мой кластер потерян! — Принятие неудачи.
Обычно предприятия используют Kafka в качестве основы для своей платформы обработки данных. Дело в том, что она справляется с широким спектром критически важных для бизнеса рабочих нагрузок. Но рано или поздно все может быть обречено на провал. Вот почему важно учитывать неудачи при проектировании (да, ошибки реальны) вашей общей архитектуры и мыслить терминами резервного копирования и аварийного восстановления.
Топ-11 ошибок при установке Kubernetes, которые не стоит допускать
Автор делится своим опытом установки Kubernetes на AWS Cloud и с использованием Ubuntu 20.04. Он столкнулся с некоторыми ошибками в процессе установки, и смог найти решения для них.
10 soft skills, которые необходимы каждой IT-команде
В этой статье вы узнайте, какие нетехнические навыки наиболее ценятся в IT-командах, включая два обязательных «мягких» навыка, которые могут или привести ваш проект к успеху, или разрушить то, к чему вы стремились.
Как собирать логи с помощью Fluentd и Fluent Bit
Логирование — это один из трех столпов мониторинга в распределенных системах. Мы можем видеть бурное развитие популярных продуктов с открытым исходным кодом типа ELK stack, и полноценных коммерческих продуктов, которые помогают с проблемами протоколирования в больших масштабах — Splunk, к примеру. Однако в таких сложных системах как Kubernetes протоколирование остается сложной проблемой. Она усугубляется постоянным ростом объема данных из–за всё большего внедрения контейнеризации.
В этой статье мы рассмотрим различные виды логов Kubernetes, необходимых для улучшения системы мониторинга, уделим внимание подходам к сбору, агрегации и анализу логов. Также мы приведем решение с использованием open source-сервисов Fluentd и Fluent Bit — оно упростит сбор данных.
Партицирование в Greenplum 7: что нового
Greenplum 7 — первая версия СУБД, совместимая с секционированными таблицами из PostgreSQL: World DB.
Небольшая предыстория: до PostgreSQL 10 партицирование в PostgreSQL выполнялось в очень ограниченной форме и по сути, было просто вариантом наследования таблиц. Начиная с PostgreSQL 10, мы можем использовать декларативный синтаксис для определения парадигмы разделов.
В рамках слияния с PostgreSQL 12 Greenplum 7 вобрал в себя весь синтаксис PostgreSQL для разбиения таблиц, сохранив при этом синтаксис Greenplum. В результате у Greenplum 7 есть шанс взять лучшее из обоих миров — что именно, обсудим в этой статье.
Kubernetes без Kubelet: рассказываем об инструменте KWOK
Вы когда-нибудь задумывались, как:
• настроить кластер из тысяч узлов за считанные секунды;
• имитировать реальные узлы с низким потреблением ресурсов;
• протестировать контроллер K8s в масштабе, но при этом не затратив больших средств инфраструктуры.
Если вы ответили «Да» на большинство вопросов, то вам, вероятно, будет интересно узнать о KWOK — инструменте, который позволяет создавать кластер из тысяч узлов.
Разбираемся в Apache Kafka: подборка полезных статей и кейсов
Разрабатываете приложения с применением Apache Kafka? Мы собрали для вас статьи, которые помогут освоить инструмент, познакомят с рабочими кейсами с использованием ПО. Делимся пользой и свежими идеями, подборками книг и реализованными задумками.