Как стать автором
Обновить
19
0
Алексей Курих @yrepear

Разработчик связей с общественностью

Отправить сообщение

Согласованность данных: что это на самом деле такое и почему с ней все так сложно

Время на прочтение10 мин
Количество просмотров14K


Понятие согласованности данных сложное, неоднозначное и включает в себя широкий спектр определений, лишь частично совпадающих друг с другом. Команда VK Cloud перевела статью, в которой автор определяет термин «согласованность» в области распределенных БД и рассуждает на тему этой самой согласованности.
Читать дальше →
Всего голосов 22: ↑20 и ↓2+32
Комментарии2

Как быстро и просто обновлять YAML-файлы с помощью kubectl

Время на прочтение2 мин
Количество просмотров3.2K


Первое, что приходит в голову, когда речь идёт про обновление YAML-файлов — использовать sedawk или perl и т.п. Но если использовать встроенную функцию Kubectl patch, дело пойдёт значительно проще. Команда VK Cloud перевела статью о более простом способе обновления YAML-файлов.
Читать дальше →
Всего голосов 21: ↑16 и ↓5+23
Комментарии6

Data Mesh: что это такое и для чего он нужен инженерам

Время на прочтение11 мин
Количество просмотров11K


Команда VK Cloud перевела статью о новом подходе к построению архитектуры данных Data Mesh с помощью lakeFS — системы управления версиями данных с открытым исходным кодом, которая преобразует хранилище объектов в Git-подобные репозитории. Разбираем, что такое Data Mesh, суть этого подхода и как с его помощью повысить эффективность работы с данными.
Читать дальше →
Всего голосов 10: ↑8 и ↓2+15
Комментарии2

Реализация мультиоблачной стратегии для Cloud Storage в Битрикс24

Время на прочтение8 мин
Количество просмотров1.8K


Битрикс24 — корпоративное SaaS-решение (Software as a Service, программное обеспечение как услуга), которым пользуются компании разного масштаба и профиля для коммуникации между сотрудниками, хранения файлов, документов, ведения CRM. Битрикс24 используют тысячи клиентов, каждый из которых генерирует и хранит на базе сервиса гигабайты и даже терабайты данных. Для их хранения используется объектное S3-хранилище Cloud Storage от VK Cloud.

Директор направления облачных сервисов Битрикс24 Александр Демидов рассказал команде VK Cloud, зачем понадобилось S3-хранилище, как его внедряли и интегрировали в архитектуру облачного сервиса Битрикс24.
Читать дальше →
Всего голосов 25: ↑25 и ↓0+25
Комментарии0

Иерархические пространства имен в Kubernetes: объясняем на примере

Время на прочтение7 мин
Количество просмотров6.8K


Пространства имен — критически важный ресурс для поддержки мультитенантной архитектуры кластера Kubernetes. Но ими трудно управлять при работе с крупномасштабными мультитенантными кластерами. К счастью, процесс можно упростить, добавив в Kubernetes функцию иерархических пространств имен. Команда VK Cloud перевела статью о том, как это сделать.

Это статья для тех, у кого есть общее представление о Kubernetes, кластерах, контейнерах и подах. Также потребуются базовые знания о пространствах имен в Kubernetes.
Читать дальше →
Всего голосов 13: ↑13 и ↓0+13
Комментарии2

Как MLOps помогает обеспечить гибкость машинного обучения и стимулирует инновации

Время на прочтение6 мин
Количество просмотров1.9K


Многие компании внедряли машинное обучение рывками, приобретая и разрабатывая модели, алгоритмы, инструменты и сервисы под конкретные задачи. Этот подход неизбежен на старте, когда бизнес только узнает о возможностях технологий. Но в результате получается сборная солянка из изолированных, запускаемых вручную, нестандартизированных процессов и компонентов. Как следствие, появляются неэффективные громоздкие сервисы, которые приносят меньше пользы, чем могли бы, или полностью блокируют дальнейшее развитие. 

Команда VK Cloud перевела статью о значимости стандартизации и автоматизации ML-процессов и как с этим поможет подход MLOps.
Читать дальше →
Всего голосов 19: ↑19 и ↓0+19
Комментарии1

Что выбрать для очередного API: HTTP или gRPC

Время на прочтение6 мин
Количество просмотров20K


Команда VK Cloud перевела статью с подробным техническим сравнением двух типов API: HTTP и gRPC. Автор рассказывает о своем опыте работы и описывает нюансы, преимущества и недостатки каждой технологии.
Читать дальше →
Всего голосов 28: ↑22 и ↓6+29
Комментарии9

13 распространенных задач в Kubernetes и способы их решения

Время на прочтение13 мин
Количество просмотров24K


Команда VK Cloud перевела статью о проблемах в Kubernetes, с которыми часто сталкиваются инженеры-разработчики при запуске новых масштабируемых отказоустойчивых веб-сервисов. 
Читать дальше →
Всего голосов 33: ↑29 и ↓4+40
Комментарии3

Семь прогнозов: что ждет data-инжиниринг в 2023 году

Время на прочтение7 мин
Количество просмотров4.9K


Команда VK Cloud перевела статью о том, что ждет дата-инжиниринг в новом 2023 году. Предсказания на грядущий год редко претендуют на серьезность, но и у них есть своя цель. Они помогают нам отвлечься от повседневности и задуматься о том, на что стоит ставить в долгосрочной перспективе.
Читать дальше →
Всего голосов 9: ↑8 и ↓1+15
Комментарии2

Классика, визуализация и GNN: три решения для ML-модели с графовыми данными

Время на прочтение7 мин
Количество просмотров2.3K


Большинство современных нейросетей построены на основе графовых данных. Однако чтобы спроектировать на их основе сложную систему, ML-модель должна уметь эти данные векторизировать, а это далеко не тривиальная задача. 

Мы задали ее командам-участникам хакатона «Цифровой прорыв в ЦФО», который прошел в сентябре в московском офисе VK. И сейчас покажем три, на наш взгляд, лучших решения и подхода к созданию моделей на основе графов.
Читать дальше →
Всего голосов 14: ↑14 и ↓0+14
Комментарии1

Вся правда о кубах данных OLAP: развенчиваем мифы

Время на прочтение4 мин
Количество просмотров46K


Кубы данных — не самая простая тема в дата-инжиниринге. Это тот самый случай, когда на пять запросов об определении приходятся пять разных вариантов ответа. Эта неоднозначность породила неудачную универсальную метафору, с помощью которой описываются кубы данных, — схему трехмерного куба. При этом в объяснениях нет примеров, рассказывающих, как в дата-пайплайне реализуется эта концепция.
Читать дальше →
Всего голосов 29: ↑27 и ↓2+36
Комментарии7

Выбросьте блокноты, или почему заниматься Data Science нужно так, будто вы разработчик

Время на прочтение7 мин
Количество просмотров13K


Большинство дата-сайентистов использовали или до сих пор используют notebooks. В чем-то это здорово, но кажется, что дата-сайентисты должны действовать как разработчики. И поэтому с notebooks надо переходить на скрипты, разрабатываемые в IDE.
Читать дальше →
Всего голосов 14: ↑11 и ↓3+15
Комментарии23

Двухсторонние очереди в Python: как альтернатива спискам повышает производительность

Время на прочтение4 мин
Количество просмотров14K


Когда речь заходит о хранении данных упорядоченной последовательности, многим в первую очередь приходит в голову мысль о списках. Пожалуй, списки считают самой популярной контейнерной структурой данных и часто используют для хранения данных любого типа, в том числе целых чисел, строк или пользовательских экземпляров. Изменяемость списков — одна из главных причин этой популярности: элементы списка можно добавлять и удалять.

В некоторых приложениях необходима обработка данных по методу FIFO (first-in, first-out). Он подразумевает, что элементы, добавленные в последовательность первыми (first-in), будут первыми из неë удалены (first-out). Эту задачу можно решить и с помощью объекта «список», и с помощью двухсторонних очередей. Но для этой цели двухсторонние очереди удобнее списков благодаря особенностям их реализации. 
Читать дальше →
Всего голосов 33: ↑30 и ↓3+38
Комментарии6

Вижу цель: три решения задачи по созданию предсказательной ML-модели

Время на прочтение6 мин
Количество просмотров1.8K


Использование интеллектуальных систем в продуктах на пике популярности: алгоритмы помогают определить, какую музыку и фильмы предпочитают пользователи, куда они хотят полететь в отпуск, — и почти никогда не ошибаются. 

Создание точных интеллектуальных систем — актуальная и сложная задача. Актуальная, потому что интеллектуальные системы активно используют, например, интернет-магазины, стриминговые сервисы, развлекательные площадки. Алгоритмы помогают компаниям повысить конверсию и средний чек, увеличить лояльность и уменьшить отток клиентов. 
Читать дальше →
Всего голосов 35: ↑35 и ↓0+35
Комментарии0

Что ждет data-инжиниринг в будущем

Время на прочтение4 мин
Количество просмотров3.7K


Отношение к data-инжинирингу и к профильным специалистам со временем меняется. Возможно ли, что в скором времени data-инженеры перестанут быть востребованными? Команда VK Cloud перевела статью о ближайшем будущем для всех тех, кто работает с данными.

Что такое data-инжиниринг


Давно ли работающие с данными компании открыли новую профессиональную область и мы услышали термин «data-инжиниринг»? Лет десять назад. Когда бизнес осознал, насколько полезными могут быть данные, спрос на data-инженеров резко вырос. По данным Google, отмечается экспоненциальный рост интереса к термину «data-инженер», который достиг пика примерно в 2020 году.



Так что же такое data-инжиниринг, столь стремительно набравший обороты и остающийся востребованным вот уже несколько лет?  В традиционном понимании data-инженерами называют людей, занимающихся перемещением, формированием и преобразованием данных из источников с помощью инструментов извлечения аналитических сведений, которые нужны для работы разных отделов компании.
Читать дальше →
Всего голосов 6: ↑5 и ↓1+14
Комментарии2

Эволюция архитектуры данных: как потребности бизнеса изменили инструменты для хранения данных

Время на прочтение7 мин
Количество просмотров6.6K


Команда VK Cloud перевела статью о том, как с течением времени менялась и развивалась архитектура данных и какие инструменты появлялись в ответ на потребности бизнеса.

Введение


Задачи по работе с данными отделяют от бизнес- и других аналитических задач (BI, дата-сайенс, когнитивные решения и т. п.) с тех пор, как появились первые ИТ-системы и бизнес-приложения. Из-за высокой ресурсоемкости рабочие нагрузки по аналитической обработке данных приходится отделять от ИТ-систем, отвечающих за бизнес-операции, иначе они столкнутся со сбоями и нехваткой ресурсов, что приведет к неудобствам для пользователей, работающих с системой.
Читать дальше →
Всего голосов 15: ↑14 и ↓1+23
Комментарии7

Подводные камни Spark: что делать с перезаписью и дополнением в таблицах

Время на прочтение11 мин
Количество просмотров4.1K


Таблицы — это фундаментальная часть заданий Spark, и при изучении документации кажется, что работать с ними нетрудно. На самом же деле опасности поджидают на каждом повороте. Команда VK Cloud перевела статью о том, с какими трудностями вы можете столкнуться и как их преодолеть.
Читать дальше →
Всего голосов 16: ↑16 и ↓0+16
Комментарии0

Информация

В рейтинге
Не участвует
Откуда
Россия
Работает в
Зарегистрирован
Активность