Как стать автором

Хранилища данных *

Публикации, рассказывающие о хранилищах данных

СтатьиПостыНовостиАвторыКомпании

ibshcherbakov 12 фев в 14:16

Установка Arenadata DB 7.2 на компьютер с небольшим объемом оперативной памяти

Средний

4 мин

707

Big Data*SQL*Хранилища данных*

Из песочницы

Установка Arenadata DB 7.2 выполняется с помощью Arenadata Cluster Manager (ADCM). Это средство предназначено для разворачивания кластера на большом числе хостов с большим объемом оперативной памяти на каждом из них. А если кластер Arenadata нужен не для производительной работы, а для проведения экспериментов или для разработки/тестирования, можно ли развернуть его на компьютере с небольшим объемом оперативной памяти, например, 32 Гб? Будет ли кластер работать стабильно? Позволит ли он выполнять тяжелые операции? Каково минимальное количество виртуальных машин, на которых можно запустить Arenadata DB 7.2?

Читать далее

+1

Alex-Nik 12 фев в 11:33

Вся правда о данных: от примитивов до озера данных в эпоху микросервисов. Гайд для Java-разработчика

Простой

127 мин

3.8K

Java*Хранение данных*Хранилища данных*Анализ и проектирование систем*

Обзор

Из песочницы

Данные — это новая нефть. От эффективности работы с ними напрямую зависит успех любого проекта, особенно в эпоху микросервисов. В этой статье мы погрузимся в мир данных и рассмотрим его с точки зрения Java-разработчика, который хочет добиться продуктивности и оставаться во всеоружии при работе с любыми объемами информации.

Цель этой статьи - предоставить полное руководство по структурам, концептам и инструментам для работы с данными в экосистеме Java, с уклоном в микросервисную архитектуру.

Мы пройдем путь от простейших структур данных, таких как примитивы и массивы, до сложных концептов, таких как озера данных и потоки событий. Рассмотрим различные способы хранения, обработки и передачи данных, а также архитектурные компоненты, необходимые для построения эффективных систем. Подробно остановимся на стратегиях развития - как правильно выбрать структуру и инструменты в зависимости от стадии развития проекта, от прототипа до высоконагруженной системы. Особое внимание уделим специфике микросервисной архитектуры и тому, как она влияет на выбор подходов к работе с данными.

Статья будет полезна Java-разработчикам разного уровня: от начинающих, желающих систематизировать свои знания, до опытных, ищущих решения для сложных задач в области хранения, передачи и обработки данных.

Читать далее

+1

Alek_Che 7 фев в 12:21

Интеграция 1С и КХД через HTTP‐ и WS‐сервисы

Сложный

9 мин

1.7K

Блог компании Modus BIХранилища данных*1С*

Туториал

Ранее мы уже писали о возможных способах интеграции 1С и КХД. Также мы подробно рассматривали возможность использования стандартного интерфейса OData, его преимущества и недостатки. В этой статье разберем интеграцию с использованием HTTP (REST) и Web-сервисов (SOAP).

Читать далее

+2

AERODISK 5 фев в 06:00

Маппинг без мучений: упрощаем жизнь системным администраторам

Средний

6 мин

6K

Блог компании АЭРОДИСКСистемное администрирование*IT-инфраструктура*Хранение данных*Хранилища данных*

Обзор

Системный администратор знает: управлять инфраструктурой в крупных компаниях без автоматизации — это как одной лопатой карьер выкапывать. Особенно когда дело касается маппинга томов в СХД. Однотипные действия, повторяемые десятки раз в режиме высокой концентрации, неизбежные крошечные ошибки, способные обернуться часами простоя и восстановлением данных из резервных копий (бэкап же не для слабаков?).

Звучит знакомо? Мы тоже видели такие сценарии. Поэтому, посовещавшись с коллегами, мы в итоге мы решили больше не устраивать чемпионат по спортивному конфигурированию СХД, а организовать альтернативное соревнование, но уже по экономии кликов в особо крупном размере.

Мы оптимизировали процесс работы с маппингом в виде более удобного, продуманного интерфейса, с поддержкой групповых действий, который позволит админам работать быстро, безопасно и без лишних телодвижений.

Более того, подробнее мы поговорим об этом на нашем вебинаре, который состоится 11 февраля в 15:00. Зарегистрироваться вы можете по ССЫЛКЕ.

Читать далее

0

imzorin 4 фев в 13:19

Цикл статей о Greenplum. Часть 3. Оптимизация

Средний

12 мин

2.6K

Блог компании Axenix (ex-Accenture)PostgreSQL*SQL*Data Engineering*Хранилища данных*

Туториал

Приветствуем вас на заключительном этапе в цикле статей о Greenplum. Ранее мы уже обсудили то, как выглядит архитектура системы. Посмотрели «под капот», подробнее обсудили виды хостов и их предназначение, узнали, как обрабатываются запросы пользователей.

Во второй статье погрузились в то, какие виды таблиц бывают, что такое дистрибьюция и партиционирование, как можно начать оптимизировать работу с таблицами ещё на этапе их создания.

Освежить память о содержании предыдущих статей можно здесь и здесь.

В данной статье мы совместно с @omoskvinрасскажем о том, что влияет на оптимальность выполнения запросов, как отслеживать различные проблемы и, конечно же, как с ними справляться.

Читать далее

+10

abalaban 2 фев в 14:16

Приключение по перереносу аналитики из Oracle в Iceberg

Простой

5 мин

3K

Хранение данных*Хранилища данных*Big Data*Open source*

Из песочницы

Перевод

Мы начали с простой цели: разобраться в небольших операционных данных из нашей среды Oracle E-Business Suite (OEBS). Сначала всё казалось несложным. У нас был классический data warehouse: пакетная обработка, массовые загрузки и привычная реляционная СУБД. Но по мере того как мы углублялись в проект, казалось бы рутинная задача превратилась в исследование и эксперименты с неожиданными поворотами и поиском чего-то действительно универсального.

Читать далее

+1

TatianaSezemina 28 янв в 12:01

Дорожная карта миграции большого хранилища данных

Средний

11 мин

2.5K

Блог компании Конференции Олега Бунина (Онтико)Блог компании Холдинг Т1Хранилища данных*Управление проектами*Хранение данных*

Туториал

Недавно решали на работе задачу миграции хранилища данных. Оно у нас одно из крупнейших в отрасли, по крайней мере, в нашей стране. Оказалось, что даже на этапе планирования всё не так просто, как кажется. Делюсь проблемами, их решениями и получившейся дорожной картой.

Привет, Хабр! Меня зовут Татьяна Сеземина. Я — директор портфеля проектов Т1 ИИ и руковожу проектами разработки и миграции больших хранилищ данных, сейчас мои проекты касаются отраслей ритейла и логистики. Каждый проект миграции длится от года до нескольких лет. Одна из моих команд столкнулась с необходимостью детального планирования длительной многолетней миграции хранилища, вплоть до каждого объекта. Расскажу, почему так произошло и как такую проблему решать.

Читать далее

+8

MsDoos 24 янв в 11:00

Настройка бэкапов в S3 через Microsoft SQL Server без скриптов и стороннего ПО

Средний

8 мин

5.1K

Блог компании SelectelХранилища данных*Базы данных*Microsoft SQL Server*IT-инфраструктура*

✏️ Технотекст 7

Привет, Хабр! Меня зовут Даниил, я дежурный системный инженер в Selectel. Но так было не всегда. Несколько лет назад я работал системным администратором в маленькой компании. И в какой-то момент мы решили внедрять 1С. А так как все вокруг у нас было на Windows, выбор пал на Microsoft SQL Server. Связка казалась самой очевидной и простой. В то время опыта у меня было маловато, многого я не знал, но прекрасно понимал, что резервное копирование — наше все. Так я без должного опыта занялся настройкой бэкапирования через MS SQL. Путь оказался не самым простым, поэтому я решил поделиться с новичками набитыми шишками и полученным опытом.

Читать дальше →

+41

Xcom-shop 21 янв в 12:48

Правда ли, что ленточные хранилища – самые надежные, и когда стоит покупать именно их, а не HDD

Простой

8 мин

8.4K

Блог компании Группа компаний X-ComХранение данных*Хранилища данных*Big Data*

Мнение

Ленточные накопители сохраняют свою актуальность даже в эпоху SSD и облачных технологий. Благодаря высокой надежности, экономической эффективности и уникальным свойствам они остаются незаменимыми в решении задач архивного хранения и резервирования данных. В этой статье мы рассмотрим, почему ленточные хранилища превосходят HDD, изучим их ключевые преимущества и ограничения, а также определим сценарии использования, в которых они наиболее уместны.

Читать далее

+12

Viktor9354 20 янв в 14:05

localForage — Что делать если localStorage уже не хватает?

Простой

4 мин

4.7K

JavaScript*Хранение данных*Хранилища данных*

Обзор

localStorage и sessionStorage сильно ограничены в размере - всего 5 МБ, а использование IndexedDB для обхода этого ограничения не всегда является удобным из-за сложного API.

localForage решает сразу обе проблемы!

Читать далее

+5

Nikittq 17 янв в 13:16

Импортозамещение SCADA: опыт перевода крупного производства на отечественную платформу

Простой

5 мин

7.1K

SCADA*Хранение данных*Хранилища данных*Функциональное программирование*Управление продуктом*

Из песочницы

В последние несколько лет российские предприятия столкнулись с необходимостью перевода своих систем управления с импортных SCADA-платформ на отечественные аналоги. Основными причинами стали санкции, разрыв отношений с зарубежными вендорами ПО, невозможность продления лицензий и получения техподдержки. Особенно острой эта проблема оказалась для непрерывных производств, где остановка технологического процесса даже на 30 минут может обернуться серьезными убытками и повреждением оборудования.

Летом 2023 года к к нам обратилось предприятие химической промышленности крупного Российского холдинга. На нем много лет использовалась SCADA-система Wonderware InTouch. Из-за санкционных наложений, иностранный вендор расторг контракт на обслуживание и техподдержку. Более того, была предпринята попытка удаленно остановить производство путем отключения серверов SCADA. Последствия удалось минимизировать, изолировав промышленную сеть, однако функционал системы снизился на треть, а ее развитие и масштабирование оказалось невозможным. Нам было необходимо решить следующие проблемы:

1. Отсутствие возможности обслуживания данной системы. Ввиду того, что данную SCADA систему разрабатывала и обслуживала иностранная компания, после начала СВО все контракты по обслуживанию и технической поддержке были расторгнуты.

2. Ограниченный функционал системы. После того как контракты были расторгнуты иностранная компания, имея удалённый доступ, попыталась дистанционно остановить производство путём отключения рабочих серверов. Заказчик, увидев странное в системе предпринял действия по изоляции своей производственной сети, однако иностранной организации всё-таки удалось нарушить состав системы, тем самым снизив её функционал на треть.

Читать далее

+3

ManticoreSearch 17 янв в 09:49

Переиндексация в Manticore Search с использованием mysqldump

3 мин

523

GitHub*MySQL*Open source*Поисковые технологии*Хранилища данных*

Кейс

Перевод

Эта статья написана Мариусом Матилионисом, старшим разработчиком и экспертом по Manticore Search в компании Ivinco. Ivinco специализируется на предоставлении передовых решений для поиска, оптимизации баз данных, управлении инцидентами и настройке систем мониторинга, помогая бизнесам достигать более быстрых, эффективных и масштабируемых операций.

Читать далее

+6

GrishinAlex 14 янв в 12:19

Облачные хранилища в мире Top Gear

Простой

12 мин

7.7K

Блог компании SelectelIT-инфраструктура*Облачные сервисы*Хранение данных*Хранилища данных*

Мнение

✏️ Технотекст 7

Привет, Хабр! Меня зовут Александр Гришин, я менеджер продуктов и отвечаю за развитие облачных баз данных и объектного хранилища в Selectel. Считаю, что новый год — отличное время, чтобы взглянуть на технологии по-новому. Например… через призму Top Gear.

Предлагаю вам немного развлечь себя разными аналогиями между миром транспорта и инструментами хранения данных. Ведь в мире облачных технологий, как и в программе Top Gear, для каждой задачи есть свой «транспорт».

Только представьте: выбирая подходящий инструмент хранения данных в облаке, вы словно решаете, какой вид транспорта использовать для своей задачи — от мощного корабля-контейнеровоза до стремительного гоночного болида. Давайте же погрузимся в экосистему облачных хранилищ и найдем, что подходит именно вам. Подробности под катом!

Читать дальше →

+52

Altfor 11 янв в 22:52

Iomega home media drive — восстановление и открытие чакр

Простой

4 мин

3.6K

*nix*Хранилища данных*

Лет 15 назад мною в подарок моей будущей супруге было куплено такое устройство — «Сетевое хранилище Iomega Home Media Network Hard Drive». В принципе, нормальная железяка, но она не нашла своего места. Главная проблема заключалась в том, что по самбе хранилище работало неоправданно медленно, а веб‑интерфейс — это не для ежедневного использования.

Так и валялось оно без дела, а когда я, спустя годы, попытался его включить, выяснилось, что диск приказал долго жить.

Спустя ещё пару лет было решено, что негоже вещи кануть в Лету, не оставив следа. Ну а заодно, как водится, можно хорошенько поковыряться во внутрянке, авось чего интересного выяснится.

Читать далее

+17

DmitriiReshetnikov 11 янв в 22:20

Миграция данных: Понятие, виды и примеры на Python

3 мин

5K

Программирование*Хранилища данных*Big Data*Data Engineering*Python*

Обзор

Миграция данных — это важный процесс, который включает в себя перенос информации из одной системы хранения данных в другую. Это может быть необходимо по множеству причин, таких как обновление систем, интеграция новых технологий или соблюдение нормативных требований. В данной статье мы рассмотрим основные виды миграции данных и приведем примеры реализации некоторых из них на Python.

Читать далее

0

SergeyProkhorenko 11 янв в 07:00

В PostgreSQL необходим официальный бенчмарк для функции uuidv7()

Средний

4 мин

4.1K

Высоконагруженные системы*Анализ и проектирование систем*IT-стандарты*Big Data*Хранилища данных*

Аналитика

В 18 версии PostgreSQL появится функция uuidv7(). Она разработана для замены последовательных автоинкрементных идентификаторов SERIAL, BIGSERIAL и IDENTITY, которые могут привести к катастрофическому дублированию ключей при слиянии данных, и для замены более медленных UUIDv4.

Использование функции uuidv7() позволит упростить архитектуру информационных систем, упростить SQL-запросы, избежать некоторых ошибок, облегчить внесение изменений и благодаря этому повысить надежность и снизить стоимость разработки и сопровождения информационных систем.

Однако для объективной и корректной оценки использования функции uuidv7() необходим официальный бенчмарк в PostgreSQL. Без такого бенчмарка может быть сделан необоснованный выбор в пользу автоинкремента.

Читать далее

+5

Bright_Translate 10 янв в 16:01

Эксперимент по ускорению SQLite

Средний

5 мин

7.6K

Блог компании RUVDS.comБазы данных*Хранение данных*Хранилища данных*

Обзор

Перевод

SQLite быстра, но можно ли сделать её ещё быстрее? Исследователи из Университетов Хельсинки и Кембриджа задались этим вопросом и опубликовали работу Serverless Runtime / Database Co-Design With Asynchronous I/O. В ней они продемонстрировали возможность 100-кратного снижения времени задержки, и ниже я в общих чертах эту их работу прокомментирую.

Речь пойдёт об исследовании возможностей Limbo — переписанной на Rust версии SQLite.

Читать дальше →

+51

technokratiya 8 янв в 12:10

Гонка за ИИ уже оставляет свой след: Ирландия и её огромные дата-центры — предупреждающий пример

7 мин

12K

Искусственный интеллектХранилища данных*

Опасения по поводу отключений электричества заставили ирландского оператора энергосистемы приостановить строительство новых дата-центров вблизи Дублина до 2028 года. Десятки огромных дата-центров на окраинах Дублина потребляют больше электричества, чем все городские дома в Ирландии.

Теперь страна, сделавшая себя вычислительной фабрикой для Amazon, Google, Meta, Microsoft и TikTok, задается вопросом, стоило ли это того, поскольку технологические гиганты ищут по всему миру места для постройки еще больше дата-центров, чтобы поддержать следующую волну искусственного интеллекта.

Читать далее

-1

timflooke 6 янв в 21:33

Корпус для домашнего NAS сервера. Как это было…

4 мин

36K

3D-принтерыХранилища данных*Git*

Всем привет! Эта статья продолжение первой, опубликованной раннее Домашний NAS сервер, где была разработана электроника и проведено первоначальное тестирование.

Но, без корпуса использовать данный NAS сервер крайне не удобно и есть риск повредить и сломать его, а также нет должного охлаждения, что тоже негативно сказывается на работе сервера.

В данной статье будут описаны разработка и сборка корпуса, надеюсь будет интересно!

Читать далее

+135

k0rsakov 27 дек 2024 в 09:00

Инфраструктура для Data-Engineer Liquibase

Простой

5 мин

3.1K

Data Engineering*Хранение данных*Хранилища данных*Big Data*IT-инфраструктура*

Туториал

Liquibase — это по сути реализация принципов IaC, но для баз данных, что делает его ключевым инструментом для DataBase as Code (DBaC). Как IaC управляет инфраструктурой, так Liquibase управляет схемами баз данных, обеспечивая автоматизацию, консистентность и версионирование изменений.

Читать далее

0

5

6 7 ...