Как стать автором
Обновить
19
33.6
Дарья Некрасова @SovaSova15

Выпускающий редактор

Отправить сообщение

ClearML Data Management

Время на прочтение15 мин
Количество просмотров2.8K


Очевидный для ML-инженера факт: если на вход модели подать мусор — на выходе тоже будет мусор. Это правило действует всегда, независимо от того, насколько у нас крутая модель. Поэтому важно понимать, как ваши данные будут храниться, использоваться, версионироваться и воспроизведутся ли при этом результаты экспериментов. Для всех перечисленных задач есть множество различных инструментов: DVC, MLflow, W&B, ClearML и другие. Git использовать недостаточно, потому что он не был спроектирован под требования ML. Но есть инструмент, который подходит для версионирования данных и не только — это ClearML. О нем я сегодня и расскажу.

Читать дальше →
Всего голосов 20: ↑20 и ↓0+23
Комментарии2

Работаете с микросервисами? Идём в сторону Go

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров6.6K

Разработчики приложений с микросервисной архитектурой обращаются к Golang не только как к основному языку, но и как к вспомогательному — в дополнение к другим, более сложным. А мы решили обратиться к спикеру курса «Golang-разработчик» Виталию Лихачеву, Senior Software Engineer в Avito, чтобы он нам рассказал, почему лично он выбрал бы Go. 

Читать далее
Всего голосов 18: ↑9 и ↓9+1
Комментарии5

Почему fsync(): Потеря несинхронизированных данных на одном узле приводит к глобальной потере данных

Время на прочтение9 мин
Количество просмотров2.3K

Независимо от механизма репликации, необходимо использовать fsync() для предотвращения глобальной потери данных в non-Byzantine протоколах.

Читать далее
Всего голосов 13: ↑12 и ↓1+14
Комментарии2

Как отследить pod-to-pod-трафик Kubernetes

Время на прочтение8 мин
Количество просмотров4.4K

В этой статье мы рассмотрим тонкости сетевого взаимодействия Kubernetes и углубимся в фундаментальные принципы и механизмы, которые управляют связью между подами. 

Читать далее
Всего голосов 12: ↑11 и ↓1+11
Комментарии3

Почему SRE приносит пользу командам и клиентам

Время на прочтение6 мин
Количество просмотров3.4K

SRE объединяет группы разработчиков программного обеспечения и инженеров эксплуатации и помогает создавать надежные, отказоустойчивые и масштабируемые системы. Некоторые из преимуществ этой методологии:

• Улучшаются коммуникации в команде

• Совершенствуется культура

• Уменьшается доля ручного труда

• Клиенты чаще остаются довольны

Читать далее
Всего голосов 9: ↑8 и ↓1+8
Комментарии0

Понятные Terraform-проекты

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров5.1K

Код Terraform является декларативным. Мы используем его, чтобы определить, что мы хотим получить от наших облачных провайдеров. Если перевести этот код на простой язык, то он будет выглядеть как подробный список покупок:

Дай мне частную виртуальную сеть с базой данных и кластером kubernetes. Кластер должен иметь некоторое количество узлов, и все они должны использовать определенный тип CPU. База данных должна быть расположена именно здесь, и она должна иметь возможность хранить определенное количество гигабайт…

Цель этой статьи — рассказать о том, как мы в Bulder Bank подходим к проблеме написания понятного кода Terraform.

Читать далее
Всего голосов 12: ↑12 и ↓0+12
Комментарии0

Медленно меняющиеся измерения (SCDs) в эпоху облачного хранилища данных

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.4K

Как работать с медленно меняющимися измерениями при использовании облачного хранилища данных?

В этом вопросе скрывается довольно много ответов, поэтому давайте сделаем паузу.

Читать далее
Всего голосов 8: ↑8 и ↓0+8
Комментарии1

Осваиваем чистую архитектуру кода на Golang: практическое руководство по сущностям и слоям моделей

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров13K

В архитектуре кода иногда разделяют слой сущностей и слой моделей. В этой статье я расскажу о них и приведу два примера кода на языке Golang.

Читать далее
Всего голосов 15: ↑11 и ↓4+10
Комментарии3

Почему IT-командам в 2023 стоит уделять внимание лидерским качествам сотрудников

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.7K

Хотя экономическая ситуация в этом году может показаться более нестабильной, чем в прошлые годы, бизнес по-прежнему инвестирует в проекты, меняющие мир. Компании понимают, что их клиенты, будь то другие организации или потребители, ждут интуитивно понятных цифровых продуктов. И именно такие решения ждут от команд разработчиков.

Читать далее
Всего голосов 12: ↑8 и ↓4+5
Комментарии0

Комбинируем Prometheus, ChatGPT и Slack — получается Robusta

Время на прочтение4 мин
Количество просмотров4.6K

Что получится, если объединить Prometheus, работающий на Kubernetes, умный движок, взаимодействующий с ChatGPT, и мессенджер типа Slack? Вы получите платформу с открытым исходным кодом для поиска и устранения ошибок в Kubernetes под названием Robusta.

В этом посте мы рассмотрим применение Robusta поверх стека мониторинга Prometheus и покажем, почему возникают алерты и как их можно устранить.

Читать далее
Всего голосов 10: ↑9 и ↓1+9
Комментарии0

Время лидов: 7 soft skills, которые помогут управленцу в IT

Время на прочтение5 мин
Количество просмотров8.1K

Однажды сеньор взглянет в зеркало и поймет: он готов стать техлидом. После этого сеньор заглянет вглубь себя — а сможет ли он руководить командой IT-специалистов? Хватит ли ему навыков для эффективных управленческих решений и грамотного распределения ресурсов? А если нет — то что делать?

Разбираем вместе с тренерами по soft skills Андреем Буловым и Ксенией Клён навыки крутого IT-лида, думаем, как их можно прокачать, если «маловато будет». 

Читать далее
Всего голосов 15: ↑10 и ↓5+6
Комментарии3

В стране потоков — Кафка, часть 4: «Мой кластер потерян!» — принятие неудачи

Время на прочтение4 мин
Количество просмотров1.8K

В предыдущих частях серии статей мы рассмотрели принципы работы преимущественно с точки зрения приложения. В этой заключительной части мы фокусируемся на инфраструктуре.

Серия статей состоит из следующих связанных частей:

Часть 1: Сообщение producer’а;

Часть 2: Подъем consumer’ов;

Часть 3: Смещения и как с ними справляться;

Часть 4: Мой кластер потерян! — Принятие неудачи.

Обычно предприятия используют Kafka в качестве основы для своей платформы обработки данных. Дело в том, что она справляется с широким спектром критически важных для бизнеса рабочих нагрузок. Но рано или поздно все может быть обречено на провал. Вот почему важно учитывать неудачи при проектировании (да, ошибки реальны) вашей общей архитектуры и мыслить терминами резервного копирования и аварийного восстановления.

Читать далее
Всего голосов 7: ↑7 и ↓0+7
Комментарии0

Топ-11 ошибок при установке Kubernetes, которые не стоит допускать

Время на прочтение14 мин
Количество просмотров15K

Автор делится своим опытом установки Kubernetes на AWS Cloud и с использованием Ubuntu 20.04. Он столкнулся с некоторыми ошибками в процессе установки, и смог найти решения для них.

Читать далее
Всего голосов 15: ↑10 и ↓5+6
Комментарии9

10 soft skills, которые необходимы каждой IT-команде

Время на прочтение6 мин
Количество просмотров6K

В этой статье вы узнайте, какие нетехнические навыки наиболее ценятся в IT-командах, включая два обязательных «мягких» навыка, которые могут или привести ваш проект к успеху, или разрушить то, к чему вы стремились.

Читать далее
Всего голосов 10: ↑7 и ↓3+5
Комментарии1

Как собирать логи с помощью Fluentd и Fluent Bit

Время на прочтение4 мин
Количество просмотров11K

Логирование — это один из трех столпов мониторинга в распределенных системах. Мы можем видеть бурное развитие популярных продуктов с открытым исходным кодом типа ELK stack, и полноценных коммерческих продуктов, которые помогают с проблемами протоколирования в больших масштабах — Splunk, к примеру. Однако в таких сложных системах как Kubernetes протоколирование остается сложной проблемой. Она усугубляется постоянным ростом объема данных из–за всё большего внедрения контейнеризации.  

В этой статье мы рассмотрим различные виды логов Kubernetes, необходимых для улучшения системы мониторинга, уделим внимание подходам к сбору, агрегации и анализу логов. Также мы приведем решение с использованием open source-сервисов Fluentd и Fluent Bit — оно упростит сбор данных.

Читать далее
Всего голосов 11: ↑9 и ↓2+8
Комментарии0

Партицирование в Greenplum 7: что нового

Время на прочтение10 мин
Количество просмотров7.1K

Greenplum 7 — первая версия СУБД, совместимая с секционированными таблицами из PostgreSQL: World DB. 

Небольшая предыстория: до PostgreSQL 10 партицирование в PostgreSQL выполнялось в очень ограниченной форме и по сути, было просто вариантом наследования таблиц. Начиная с PostgreSQL 10, мы можем использовать декларативный синтаксис для определения парадигмы разделов. 

В рамках слияния с PostgreSQL 12 Greenplum 7 вобрал в себя весь синтаксис PostgreSQL для разбиения таблиц, сохранив при этом синтаксис Greenplum. В результате у Greenplum 7 есть шанс взять лучшее из обоих миров — что именно, обсудим в этой статье. 

Читать далее
Всего голосов 13: ↑13 и ↓0+13
Комментарии1

Kubernetes без Kubelet: рассказываем об инструменте KWOK

Время на прочтение10 мин
Количество просмотров3.1K

Вы когда-нибудь задумывались, как:

• настроить кластер из тысяч узлов за считанные секунды;
• имитировать реальные узлы с низким потреблением ресурсов;
• протестировать контроллер K8s в масштабе, но при этом не затратив больших средств инфраструктуры.

Если вы ответили «Да» на большинство вопросов, то вам, вероятно, будет интересно узнать о KWOK — инструменте, который позволяет создавать кластер из тысяч узлов.

Читать далее
Всего голосов 8: ↑6 и ↓2+5
Комментарии0

Разбираемся в Apache Kafka: подборка полезных статей и кейсов

Время на прочтение3 мин
Количество просмотров16K

Разрабатываете приложения с применением Apache Kafka? Мы собрали для вас статьи, которые помогут освоить инструмент, познакомят с рабочими кейсами с использованием ПО. Делимся пользой и свежими идеями, подборками книг и реализованными задумками.

Читать далее
Всего голосов 12: ↑11 и ↓1+11
Комментарии1

Информация

В рейтинге
180-я
Откуда
Россия
Работает в
Зарегистрирована
Активность

Специализация

Community manager
Intern
HTML
Project management