Как стать автором
Обновить
47.95

Хранилища данных *

Публикации, рассказывающие о хранилищах данных

Сначала показывать
Порог рейтинга
Уровень сложности

Виртуализация мечты: работаем над дорожной картой развития систем виртуализации

Уровень сложностиПростой
Время на прочтение1 мин
Количество просмотров1.2K

Уважаемые Хабровчане!

Как вы, наверняка, знаете, производителей отечественных систем виртуализации существенно больше, чем производителей СХД. Навскидку, более 30 российских компаний занимаются данным классом продуктов, с различными подходами к разработке и продаже данных решений. Однако, на просторах рунета не утихают горячие споры о том, что не хватает даже многих базовых функций виртуализации, не говоря уже о каких-то «вишенках на торте», обсуждаемых на ежегодных форумах в Каталонии.

Поэтому мы предлагаем пройтись новым «хаброопросом» по базовым функциям систем виртуализации, которые жизненно необходимы вам, нашим текущим или потенциальным заказчикам.

Среднее время прохождения - 5 минут, а сам опрос находится по ссылке.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии1

От технарей — для технарей: как я заглянул в будущее на конференции SmartDev 2023

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров17K

Привет, Хабр! На связи Андрей Аврамчук (@Mimizavr). Недавно я побывал на конференции «Сбера» SmartDev 2023. Там у Хабра была собственная медиастудия, где мы поговорили о новых продуктах со спикерами компании.

Прямо скажу, почувствовал себя Фраем из Футурамы. Оказалось, будущее наступило, а я даже не заметил. И ключевой вопрос айтишного будущего: как сплотить сообщество? Если хотите узнать, какие ответы на него давали спикеры-эксперты — от Евгения Касперского до гендиректора Gitee, приходите под кат. Я расскажу, что увидел, заглянув в будущее, и что о нём рассказали спикеры «Сбера». 

Увидеть будущее
Всего голосов 26: ↑22 и ↓4+18
Комментарии8

IMSProg — программатор для CH341a в Linux

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров13K

Несколько лет назад я полностью перешел на Linux, и все меня устраивало за исключением отсутствия некоторых просто необходимых программ.

Читать далее
Всего голосов 67: ↑67 и ↓0+67
Комментарии43

Неструктурированные данные: что это, в чем их опасность и как защититься?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров3.9K

Объемы, разнообразие, а главное, ценность информации продолжают расти. Особенно выделяются неструктурированные данные, которые не имеют четкой организации, структуры или формата. Этим они отличаются от структурированных данных, которые обычно хранятся в базах данных и подчиняются строгим схемам и форматам, таким как таблицы, поля и столбцы.

Неструктурированные данные могут представлять собой текст, изображения, аудио- и видеозаписи, электронные письма и множество других форм. Это огромный массив ценной информации, но управление, анализ и обеспечение его безопасности вызывают сложности.

В этой статье я рассмотрю значимость неструктурированных данных, опасности, которые они могут нести для компании, а также расскажем о том, что нужно делать, чтобы обеспечить их безопасность.

Читать далее
Всего голосов 7: ↑7 и ↓0+7
Комментарии4

Истории

Новая файловая система Composefs для Linux: что это такое и как она работает

Время на прочтение3 мин
Количество просмотров4.3K

В ноябре 2022 года Александр Ларсон, сотрудник Red Hat, разработавший Flatpack, предложил реализацию файловой системы Composefs. Она в некоторых моментах похожа на Squashfs, подходит для монтирования образов в режиме «Только для чтения». Особенности новой ФС — совместное хранение содержимого нескольких примонтированных дисковых образов и поддержка проверки подлинности читаемых данных. Позиционируется она как инструмент для монтирования образов контейнеров, а также применения для Git-подобного репозитория OSTree. Подробности о новинке — под катом.

Читать далее
Всего голосов 11: ↑11 и ↓0+11
Комментарии5

Data-рынок: как российские ЦОДы справляются с нарастающим спросом

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров3.9K

Традиционно рынок серверов, систем хранения данных и сетевого оборудования в России был представлен зарубежными компаниями — Dell, HP, Cisco и другими. В 2022-2023 гг data-центры взяли активный курс на импортозамещение при поддержке государства и отечественных поставщиков, поэтому приходится менять устоявшиеся годами бизнес-цепочки. При этом цифровизация требует все новых и новых ресурсов. Сегодня мы заглянем на рынок ЦОДов и постараемся понять, какие у него перспективы, и как российские data-центры справляются с огромным спросом. 

Читать далее
Всего голосов 9: ↑9 и ↓0+9
Комментарии2

Интегрируем Clickhouse в Zabbix

Уровень сложностиСложный
Время на прочтение6 мин
Количество просмотров4.2K

В прошлом материале мы рассказали, с какой проблемой столкнулись, и проанализировали четыре СУБД в поиске рабочего решения. Мы оценили преимущества и недостатки каждого отобранного варианта и остановились на ClickHouse. Несмотря на то, что готовой интеграции этой БД с Zabbix не существует, CH отлично подходил как решение под наши инженерные задачи.

БД в Zabbix

Прежде чем мы перейдем к рассказу о реализации, расскажем о специфике работы БД в Zabbix. Вся ее логика вынесена в отдельную библиотеку — zbxhistory. Она используется сервером и прокси для сохранения данных мониторинга. В классе history описывается интерфейс, который имплементируется каждой реализацией подключения к хранилищу данных.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии5

Становясь Пангеей: будущее современного стека для анализа данных

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров3.1K

Это перевод поста из блога The Analytics Engineering Roundup (горячо рекомендую!) под названием Becoming Pangea про тенденции в индустрии данных и аналитики, стратегические преимущества и проблемы, с которыми сталкиваются компании в ней, влияние основных облачных провайдеров на её будущее и роль стандартов в формировании в ней технологических экосистем.

Как выжить стартапу в области данных?
Всего голосов 3: ↑3 и ↓0+3
Комментарии4

YDB знакомится с TPC-C: раскрываем производительность наших распределенных транзакций

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров3.5K

В нашем предыдущем посте о производительности YDB, посвященном Yahoo! Cloud Serving Benchmark (YCSB), мы упоминали, что готовим к публикации результаты других бенчмарков. Мы придерживаемся плана и сегодня рады представить вашему вниманию наши первые результаты бенчмарка TPC-C*, который является индустриальным стандартом оценки производительности онлайн транзакций (OLTP). Согласно этим результатам есть сценарии, в которых YDB немного превосходит CockroachDB, другую хорошо известную распределенную SQL СУБД.

Читать далее
Всего голосов 9: ↑9 и ↓0+9
Комментарии2

Виртуальный хостинг с Python в качестве сервиса доступа к данным или для Webhook — разворачиваем в несколько кликов

Время на прочтение7 мин
Количество просмотров7.8K

Меня зовут Андрей Устьянцев, я ведущий аналитик направления Big Data Лиги Цифровой Экономики. Этот текст — техническое продолжение ранее написанных мной материалов: 

Читать далее
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Как оценить объем работ по миграции хранилища данных на Arenadata DB / Greenplum: методика и пример

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.5K

Некоторое время назад многие российские компании, чей бизнес очень сильно завязан на обработке и анализе больших объемов данных (банки, ритейл, телеком) задумались о том, как можно уменьшить стоимость владения хранилищами данных, построенных на западных технологиях. События последнего времени только ускорили этот процесс. И сейчас количество компаний, для которых актуальна миграция существующих хранилищ данных, построенных на Oracle, MS SQL и других проприетарных СУБД, на решения открытого ПО и отечественных поставщиков, резко выросло, а СУБД GreenPlum фактически становится отраслевым стандартом в хранилищах данных.

При этом и компании-заказчику, и организации-исполнителю необходимо оценить бюджет проекта миграции. Первые обычно запрашивают подобную оценку у вторых.

Именно такую задачу поставил нам клиент – крупная торговая компания. После небольшого ознакомления с возможными методиками, выбор пал на метод COSMIC (Common Software Measurement International Consortium [1]), являющийся одной из разновидностей оценки функционального объема по функциональным точкам и выросший до стандарта ISO 19761. Плюсом в пользу СOSMIC стало разработанное консорциумом адаптированное руководство для оценки функционального объема хранилищ данных [2].

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии1

Производительность блочного хранилища на основе софт рейдов (mdadm, LVM и ZFS) при использовании iSER и NVMe-oF

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров4.9K

Смысл данной статьи показать максимальную производительность, когда вопрос сохранности данных решается репликами или бэкапами.

Цель - протестировать производительность трёх систем объединения физических устройств в одно логическое систем при использовании iSER и NVMe-oF.

И сравниваться будет три системы, которые показали самые высокие показатели по результатам тестов из первой части статьи.

Читать далее
Всего голосов 5: ↑4 и ↓1+3
Комментарии36

Переходим на Greenplum быстро

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров5.3K

В условиях отсутствия возможности лицензирования и поддержки иностранных вендорских решений по хранилищам данных, встал вопрос о замене этих решений на отечественное программное обеспечение, с вендорской поддержкой, находящееся в реестре российского ПО и которое не уступает по производительности и объемам хранения зарубежным аналогам, таким как Teradata, Oracle, SAP HANA. Как показал анализ, таким требованиям отвечает лишь решения, основанные на MPP СУБД на базе Greenplum, в частности Arenadata DB (ADB). Но как быстро и безболезненно начать миграцию с привычных хранилищ на open-source? Постараюсь в статье рассказать и показать, что удалось придумать в этом направлении

Читать далее
Всего голосов 7: ↑7 и ↓0+7
Комментарии7

Ближайшие события

Нужна ли Redis новая архитектура? (13 лет спустя)

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров3.3K

Redis — это фундаментальная технология, и поэтому мы время от времени встречаем людей, рассматривающих альтернативные архитектуры. Несколько лет назад эту тему подняла компания KeyDB , а недавно новый проект Dragonfly заявил, что является самым быстрым Redis-совместимым хранилищем данных в памяти. Мы верим, что эти проекты привносят много интересных технологий и идей, достойных обсуждения. Нам в компании Redis нравятся такого рода вызовы, поскольку они требуют от нас подтверждения архитектурных принципов, с которыми изначально был разработан Redis (снимаем шляпу перед Сальваторе Санфилиппо, также известному как antirez).

Хотя мы всегда ищем новые вызовы для инноваций и повышения производительности и возможностей Redis, мы хотим поделиться своей точкой зрения и некоторыми размышлениями о том, почему архитектура Redis остается лучшей в своем классе для хранилища данных в памяти в режиме реального времени (кешбаза данных и все, что между ними).

Читать далее
Всего голосов 15: ↑14 и ↓1+13
Комментарии7

TSDB Loki с высоты птичьего полета

Уровень сложностиСложный
Время на прочтение8 мин
Количество просмотров3.9K

Проблемы роста — обычное дело, и базы данных в этом смысле не исключение. Полтора года назад команда Loki задумалась о том, как на порядок повысить кардинальность (cardinality), производительность запросов (query throughput) и надежность (reliability). Работа над новым индексным слоем почти закончена — время остановиться и посмотреть: что же мы делаем, чтобы оставаться на пике прогресса.

Читать далее
Всего голосов 27: ↑27 и ↓0+27
Комментарии0

Таблица-справочник – генератор DAG? А что так можно было?

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров6.9K

Таблица справочник, которая является медленно изменяющейся и также генерирует DAG.

В статье рассказывается как можно хранить бизнес-метрики и собирать их через DAG.

Читать далее
Всего голосов 11: ↑7 и ↓4+3
Комментарии9

1.1.Переписываем наш Object Cloud

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.5K

Привет всем, Мы в прошлой части сделали огромный первый шаг в NixOS,сделав набросок, чего мы хотим от системы и немного пробежались по одному из вариантов описания конфигурации системы ,какой мы ее видим после ребилда, а сейчас нам осталось немного ее доделать, в некоторых местах улучшить codestyle ,что бы можно было уже переходить с чистой душой дальше, уже в сторону контейнеров и виртуальных машин и встроенных средств ,которые предоставляют деплой.

Читать далее
Всего голосов 8: ↑7 и ↓1+6
Комментарии0

Как интегрировать данные в Хранилище быстро, качественно и дешево

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров2.2K

Всем привет! Меня зовут Алексей, и я уже более 20 лет в ИТ, занимался разработкой, затем системным анализом и управлением проектами, а в последние годы ­– интеграционными потоками, данными и архитектурой систем. Сейчас я работаю в Quillis на позиции технического руководителя команды инженеров данных. Сегодня мы попробуем найти почти универсальное решение для организации, которая на определенном этапе развития столкнулась с необходимостью управлять накопленными корпоративными данными о продажах, клиентах, товарах и любых других сущностях.

Читать далее
Рейтинг0
Комментарии7

Накопители на магнитной ленте начинают и выигрывают: технология продолжает совершенствоваться десятилетия спустя

Время на прочтение3 мин
Количество просмотров13K
image

По данным аналитической компании Trend Focus, продажи ленточных накопителей в 2022-2023 гг. резко выросли. Так, в 2022 году отгрузка такого типа накопителей выросла сразу на 14%, в то время как продажи жестких дисков упали на 40% — и это включая корпоративные HDD высокой емкости. В 2023 году результаты подводить пока рано, но, опираясь на текущие показатели продаж, аналитики прогнозируют 13% рост по сравнению с 2022 годом.

Удивляться не приходится — потребности гиперскейлеров, владельцев и операторов ЦОД в емких накопителях растут, так что тенденция вполне объяснима. Технология, к слову, продолжает совершенствоваться. Относительно недавно был анонсирован стандарт LTO-9, а сейчас появился новый, еще более емкий накопитель. На одном носителе теперь можно записать около 150 ТБ данных, что примерно в три раза больше по сравнению с LTO-9. Подробности — под катом.
Читать дальше →
Всего голосов 54: ↑53 и ↓1+52
Комментарии17

Архитектура аналитической платформы Modus ч.2: BI

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.6K

Привет, Хабр!

На связи Саша Чебанов, product owner компании Modus. Сегодня хочу поделиться второй статьей из цикла «Архитектура аналитической платформы». Поговорим об общем устройстве BI-системы и подробнее остановимся на анатомии Modus BI. Вы узнаете, из каких компонентов состоит аналитическая BI-система, какие данные ей нужны, откуда она их берет и как они превращаются в графики и диаграммы. Поехали!

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии4

Вклад авторов