Как стать автором
Обновить

YTsaurus: основная система для хранения и обработки данных Яндекса теперь open source

Время на прочтение 14 мин
Количество просмотров 22K
Блог компании Яндекс Open source *C++ *Big Data *

Привет! Меня зовут Максим Бабенко, я руковожу отделом технологий распределённых вычислений в Яндексе. Сегодня мы выложили в опенсорс платформу YTsaurus — одну из основных инфраструктурных BigData-систем, разработанных в Яндексе.

YTsaurus — результат почти десятилетнего труда, которым нам хочется поделиться с миром. В этой статье мы расскажем историю возникновения YT,  ответим на вопрос, зачем нужен YTsaurus, опишем ключевые возможности системы и обозначим область её применения.

В Github-репозитории находится серверный код YTsaurus, инфраструктура развёртывания с использованием k8s, а также веб-интерфейс системы и клиентский SDK для распространённых языков программирования — C++, Java, Go и Python. Всё это — под лицензией Apache 2.0, что позволяет всем желающим загрузить его на свои серверы, а также дорабатывать его под свои нужды.

Читать далее
Всего голосов 183: ↑182 и ↓1 +181
Комментарии 19

Selectel получил статус DRaaS-провайдера компании VMware: что это значит

Время на прочтение 2 мин
Количество просмотров 1.5K
Блог компании Selectel IT-инфраструктура *IT-компании

Привет, Хабр! Мы официально получили статус авторизованного DRaaS-провайдера VMware. В России мы лишь вторая компания с таким статусом, и не будем скрывать — очень этим гордимся. Аббревиатура DRaaS означает Disaster Recovery as a Service. Под катом кратко расскажем, как обеспечивается защита на уровне Disaster Recovery и для кого она актуальна.
Читать дальше →
Всего голосов 33: ↑32 и ↓1 +31
Комментарии 0

Презентация Mailion — корпоративной почты нового поколения. Прямая трансляция от МойОфис

Время на прочтение 2 мин
Количество просмотров 1.7K
Блог компании МойОфис Развитие стартапа Софт Презентации

Привет, Хабр! Сегодня, 30 ноября, состоится пресс-конференция МойОфис, в рамках которой мы представим Mailion — корпоративную почту нового поколения для крупных компаний и госучреждений. В 11:30 по Москве начнется прямая трансляция мероприятия, присоединяйтесь!

На пресс-конференции представители компании познакомят вас с возможностями нового продукта и объяснят, чем Mailion отличается от уже существующих решений. Также на мероприятии выступят ведущие аналитики и эксперты отрасли, которые расскажут о трендах рынка корпоративных почтовых систем и результатах нагрузочного тестирования.

Читать далее
Всего голосов 20: ↑16 и ↓4 +12
Комментарии 0

Черная пятница, ну почти

Время на прочтение 2 мин
Количество просмотров 820
Блог компании Southbridge

Привет! На связи Слёрм.

А вы тоже иногда не доверяете отзывам и красивой обложке, а предпочитаете проверять качество начинки продукта на себе? Мы приглашаем всех, кто хочет заглянуть под капот K8s, на первую неделю потока «Kubernetes: Мега», который пройдет с 11 ноября по 23 декабря.

Читать далее
Всего голосов 14: ↑10 и ↓4 +6
Комментарии 0

Не отказывай в устойчивости: митап для Java‑разработчиков

Время на прочтение 2 мин
Количество просмотров 458
Блог компании Альфа-Банк Java *Хакатоны Конференции

6 декабря случится наш первый митап для Java‑разработчиков — Alfa Backend Stories Meetup. По такому случаю решили провести его в стиле мира «Стражей Галактики», а тематика — отказоустойчивость, актуальная сейчас — на примере Альфа-Банка покажем, как это работает. В программе: два доклада, воркшоп, afterparty, любимые саундтреки, комиксы и научная фантастика.

Читать далее
Всего голосов 14: ↑14 и ↓0 +14
Комментарии 0

Backblaze опубликовала статистику по эксплуатации 230 тысяч HDD в 2022 году

Время на прочтение 2 мин
Количество просмотров 2.2K
Хранение данных *Хранилища данных *Исследования и прогнозы в IT *Компьютерное железо

Backblaze, которая занимается облачными хранилищами данных, опубликовала ежегодный отчёт по работе 231 тысячи жёстких дисков в 2022 году. Он охватывает как диски с данными, которые эксплуатируются внутри компании, так и используемые совместно с партнёрами и клиентами.

Читать далее
Всего голосов 11: ↑10 и ↓1 +9
Комментарии 2

Дешевые потребительские SSD оказались надежнее серверных HDD — статистика Backblaze

Время на прочтение 2 мин
Количество просмотров 4.3K
Блог компании Дата-центр «Миран» Системное администрирование *Накопители


С момента появления на рынке твердотельных накопителей основной точкой их противостояния с классическими HDD стала отказоустойчивость. Ранние поколения SSD имели ряд детских проблем, некоторые из которых присутствуют до сих пор. Например, отказ контроллера SSD, который превращал накопитель в цифровой гроб, или потеря данных при длительном отсутствии питания. Позиции технология HDD хоть и сдала, но в корпоративном сегменте жесткие диски до сих пор доминируют: они в разы дешевле и надежнее.

Последнее исследование облачного провайдера Backblaze в рамках собственных мощностей, проводимое в период с 2018 по 2022 годы, сообщает удивительное: на SSD отказывают вдвое реже, чем HDD. В исследовании приняли участие 2903 твердотельных диска 13 потребительских моделей нижнего и среднего ценовых сегментов.
Читать дальше →
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 9

Инфраструктура современного офиса — 3

Время на прочтение 6 мин
Количество просмотров 9.6K
IT-инфраструктура *
Что-то я затянул с очередной серией, но тому были причины: от кучи неотложных дел на работе, до раненого автомобиля :(
Ладно, в этот раз — организация внешних вводов, вопросы построения телефонии и некоторые аспекты построения Wi-fi. Как и в предыдущих сериях, я не претендую на глубину раскрытия техники, стремясь лишь показать основные варианты развития элементов инфраструктуры. Предыдущие серии про инфраструктуру здесь и здесь (а здесь — бонус трек про оборудование Allied Telesis).

Провайдерские вводы


Существует целый спектр возможных решений, каждое из которых следует принимать руководствуясь масштабом организации, бюджетом и внешними факторами. Рассмотрим основные по пунктам:
  1. Вы — небольшая компания (до десяти человек), заезжаете в подвал жилого дома или, пуще того, в квартиру на первом этаже жилого здания.
    В такой ситуации с выбором провайдера привередничать не приходится и надо рассчитывать на наличие в здании местного провайдера (если их несколько — вам сильно повезло, конкуренция повышает уровень сервиса). Можно пытаться экономить, оформляя интернет на физическое лицо, однако, в таком случае, стоит быть готовым к тому, что в прайм-тайм местечковый провайдер решит, например, «поменять сетевое оборудование», что приведет к неприятному простою в работе. Целесообразно в такой ситуации предусмотреть резерв хотя бы в виде мобильного интернета (Skylink, Yota, Edge/GPRS) — критически важное письмо в таком случае, пусть медленно, но доползёт. Телефония в такой ситуации, как правило, исполняется в виде «медно-волоконного канала» городского провайдера.
  2. Вы все еще небольшая компания, но сидите в гараже (бытовке, ларьке, домике на дереве, здании на территории промзоны).
    Все безрадостно — ваш единственный выход — радиоканал до ближайшей точки присутствия скоростного интернета, либо, если шансов добить по радио нету — интернет через сотовый телефон. Если шансы все же есть, запасайтесь дальнобойными направленными антеннами и шагайте в ближайшее место, где может быть интернет. В моей практике был случай, когда автосервис около года работал через стрим, который находился в двух километрах от. Проблемы в таком случае те же, что и в предыдущем (нестабильность местного кабельного провайдера), правда, в случае использования длинного Wi-Fi линка вы еще и от погоды зависеть будете. В сильный дождь или снегопад перебои — не редкость..
  3. Вы заезжаете в бизнес-центр.
    Все уже лучше, но не без специфики: как правило владельцы бизнес центров уже договорились с одним-двумя большими провайдерами, что ограничивает ваш выбор (притащить своего провайдера удастся только если вы — очень большая компания с серьезной арендной ставкой). Плюс ситуации в том, что канал организуют быстро, и, скорее всего без проблем. Явный минус — один — монополисты в здании тарифы могут воротить очень грустные.
  4. (моя ситуация) Вы заезжаете в отдельно стоящее здание.
    Геморрой страшный, но при должном подходе получится очень красиво :) Подробно об этом сценарии — чуть ниже.

Итак, отдельно стоящее здание. Учитывая, что вы — хозяин положения, при организации провайдерских вводов стоит учитывать следующее:
  • Отказоустойчивость (любой более-менее серьезный маршрутизатор умеет выбирать живой канал). По возможности закладывайте два независимых канала от независимых провайдеров;
  • Дороговизна (более серьезный провайдер будет просить более серьезных денег). При этом более дешевый провайдер будет, скорее всего, грешить всеми детскими болезнями домовых сетей — падения канала в течение дня, « плановые профилактические работы» в прайм-тайм и прочие прелести
  • Время подключения. Если в предыдущих сценариях вас скорее всего подключили бы в течение дня-двух, то построение индивидуального канала может стать вопросом нескольких месяцев (тут и согласования с городскими кабельными службами, и неповоротливость больших провайдеров, и проблемы со строителями..)

И все? А где же телефония и WiFi? В конце-концов и про вводы можно поподробнее..
Всего голосов 44: ↑40 и ↓4 +36
Комментарии 50

Как сделать бюджетный геокластерный хостинг

Время на прочтение 3 мин
Количество просмотров 901
Хостинг
В качестве распределенного хостинга возьмем классический пример — создание блогосервиса на основе mu-Wordpress.
Задача — при ограниченном бюджете собрать отказоустойчивую (насколько это возможно) геораспределенную систему. Соответственно все оборудование берется в аредну в различных Дата-Центрах.
И тут следует сказать что не все Дата-Центры одинаково полезны. Высококачественные сдают сервер за 800$, а у низкокачественных вполне можно взять примерно такой же сервер в аренду уже за 100$. И именно эти особенности надо учитывать при создании геокластера.

Теперь о небольших хаках. По умолчанию в mu-Wordpress функция отдачи загружаемого контента сделана крайне неудачно — через PHP. Соответственно она была заменена на загрузку отдельным сервисом и вставкой загружаемого контента прямой ссылкой на статику.
Вторым хаком была модификация контроля кеширования. Кроме указаний кешировать статичные элементы дизайна был введен еще такой хак, который запрещал кешировать запись на время ее обсуждения (по умолчанию — 14 дней), а уже после она отдавалась с заголовком разрешающим кеширование. Кроме того хитро кешировались фиды RSS.
Финальным хаком стала система синхронизации БД — каждый INSERT/DELETE/UPDATE выполнялся на «соседе». Получился такой себе софт-рейд в контексте MySQL+PHP.
Читать дальше →
Всего голосов 49: ↑33 и ↓16 +17
Комментарии 25

Отказоустойчивая система из мусора

Время на прочтение 2 мин
Количество просмотров 2K
Системное администрирование *
Собственно история была такова.
Для одной фирмы N необходимо было разработать дешевую и надежную систему хранения и обработки данных. Вкратце про данные. Необходимо принимать с клиентов информацию (упущу какую именно, что-то вроде налоговой отчетности) и хранить ее долгие годы. Достаточно часто требовался поиск по этой информации и еще более часто модификация данных, внесенных за последние пару часов. Потеря информации недопустима ни в каких случаях. В том числе при пожаре или землетрясении. Раньше все это делалось на бумаге и хранилось в боооольших папках. Для разбора папок существовал целый отдел бессмысленных и беспощадных людей.

Все это предстояло перенести на автоматизированную основу. Самое интересное – разработку оплачивали вполне пристойно, а вот на железо денег не выделили вовсе – попросили чтобы все это подняли на имеющемся железе. Парк машин состоял из десятка морально мертвых монстров и именно на них надо было поднять БД-сервер и бэкап сервер.

Читать дальше →
Всего голосов 36: ↑27 и ↓9 +18
Комментарии 27

Установка Debian\Ubuntu 10.04 на массив RAID 5

Время на прочтение 7 мин
Количество просмотров 4.2K
Чулан
Данная статья размещена по просьбе человека не имеющего аккаунта на хабре, но мечтающего влиться в его ряды.
Если у кого-то есть инвайт и желание им поделиться, пишите пожалуйста на e-mail: cibertox (друг человека) bk точка ру

Разворачивая WEB сервер, пришлось задуматься о том, чтобы не потерять весь проект, в случае непредвиденной гибели жестких дисков, как обычно это бывает по закону подлости — неожиданно.
Ответ напрашивается сам собой –использовать RAID, при этом еще и высокой скорости работы хотелось- значит RAID5 (Но этот способ годится и для использования массивов 6го и 10го уровней)
Основной проблемой в развертывании Debian\Ubuntu- невозможность установить систему, в чистом виде, на этот массив из-за того, что части файла копируются на все диски массива, а их сборка передпологает сложные вычисления.
Существуют варианты установки системного загрузчика на флешку, но это тупиковый путь и использование его на полноценной продакшн системе, не считаю правильным, все равно есть жесткие диски, да и бегать в дата центр из-за неожиданно сдохшей флешки с загрузчиком на борту – маразм!
Значит у нас есть готовый сервер с четырьмя хардами, полностью собранный.

Добро пожаловать в подкат.
Читать дальше →
Всего голосов 21: ↑13 и ↓8 +5
Комментарии 5

Новая система хранения в облаке

Время на прочтение 5 мин
Количество просмотров 19K
Блог компании Оверсан
Буквально пару дней назад мы ввели в эксплуатацию новейшую систему хранения, над созданием которой трудились последние полгода. Прежде чем рассказать, что же в ней нового, я расскажу об истории ее развития.

Нужно сразу отметить, что система хранения — краеугольный камень в устройстве облачных хостингов. Есть два обязательных требования к хранилищу. Во-первых, оно должны быть сетевым, чтобы виртуальные машины пользователей могли свободно перемещаться между вычислительными узлами. Во-вторых, оно должно быть производительным для параллельных операций, так как его одновременно использует большое количество клиентов.
Читать дальше →
Всего голосов 58: ↑49 и ↓9 +40
Комментарии 80

Построение отказоустойчивой (fault tolerant) системы

Время на прочтение 8 мин
Количество просмотров 43K
Проектирование и рефакторинг *
В разработке банковского ПО данному аспекту системы уделяется наибольшее внимание. Часто, описывая отказоустойчивую систему, используют слова: Fault Tolerance, Resilience, Reliability, Stability, DR (disaster recovery). Данная характеристика — суть способность системы продолжать корректно работать при падении одной или нескольких подсистем, от которых она зависит. Я кратко опишу какие подходы могут применяться в данной области и приведу пару примеров.
Читать дальше →
Всего голосов 75: ↑68 и ↓7 +61
Комментарии 10

NetApp Metrocluster

Время на прочтение 6 мин
Количество просмотров 16K
Блог компании NetApp


В 2007 году, консалтинговое агентство Forrester провело опрос 250 IT-специалистов, с целью оценить риски аварий для IT, как внутри датацентра, так и вне его, например риски природных аварий и катастроф.

После обработки и публикации результатов стало понятно, что привычное средство обеспечения отказоустойчивости в виде, например, традиционного «дублирующего, избыточного контроллера и RAID» может защитить всего от 31% всех возможных отказов.

На графике вы видите также такие IT-дизастеры как отказы электропитания (" — что случилось с вашим электричеством? — Оно моргнуло." ), проблемы с ПО ("…и будет закрыто"), человеческие ошибки ("как ты сказал имя тома, который надо было размонтировать и грохнуть?"), ошибки сетевых настроек (" — а какой интерфейс использовать? — попробуй eth0."), а также и разнообразные природные (и не очень) катаклизмы, такие как пожары, наводнения и так далее.

Таким образом становится ясно, что традиционные средства защиты работоспособности данных защищают его, увы, недостаточно, сколько бы «девяток» вам ни обещали в рекламе. И когда стоимость потери или простоя данных становится весьма существенной, встает вопрос поиска решения, обеспечивающего большую надежность, чем решения традиционные.
Читать дальше →
Всего голосов 23: ↑20 и ↓3 +17
Комментарии 59

Кластерные системы

Время на прочтение 3 мин
Количество просмотров 29K
Блог компании Parking.ru

Parking.ru как облачный провайдер имеет опыт оказания не только услуг с «обычной» надежностью, но и услуг хостинга высокой доступности, построенных на кластеризованной дублированной инфраструктуре.

Имея весомый опыт в построении таких инфраструктурных проектов, мы решили предложить его не только избранным клиентам (которые уже много лет используют эти услуги), а сделать стандартизированное предложение для всех желающих.
Какие кластеры мы строим?
Всего голосов 5: ↑2 и ↓3 -1
Комментарии 25

Itanium Poulson: что нового

Время на прочтение 2 мин
Количество просмотров 13K
Блог компании Intel
image

В начале 2011 года Intel объявила о готовящемся выпуске камня поколения Itanium под кодовым названием «Poulson» на Solid State Circuit, а совсем недавно, в ходе конференции HotChips, проходившей на территории Стэнфордского университета, компания Intel раскрыла первые подробности этого процессора.

Наблюдать за развитием линейки Itanium может быть интересно и тем, кто использует решения на базе Intel Xeon, так как многие разработки переносятся с Itanium в новые версии именно Xeon'ов (такие как QuickPath и Scalable Memory Interconnects, Intel 7500 Scalable Memory Buffer и использование DDR3).

Ключевые особенности процессора таковы: новая архитектура, в два раза больше процессорных ядер, в два раза больше возможностей обработки процессов.
Читать дальше →
Всего голосов 34: ↑31 и ↓3 +28
Комментарии 13

«Одиссей» стирает границу между серверами x86 и бизнес-критичными системами

Время на прочтение 3 мин
Количество просмотров 8.2K
Блог компании Hewlett Packard Enterprise
22 ноября HP представила проект Odyssey, который расширит свободу выбора аппаратных платформ и операционных систем для развертывания критичных для бизнеса приложений. В ближайшие два года компания дополнит портфель своих бизнес-критичных систем лезвиями на базе процессоров Intel Xeon, поддерживающими Windows и Linux. Для шасси флагманской модели HP Integrity Superdome 2 будет выпущено лезвие DragonHawk, а для стандартных полок HP BladeSystem c7000 и с3000 – лезвие HydraLynx.
Читать дальше →
Всего голосов 19: ↑16 и ↓3 +13
Комментарии 12

Бесплатный семинар «Разработка высоконагруженных веб-проектов: как выдерживать миллионы хитов в сутки, чтобы все работало и ничего не «падало»

Время на прочтение 2 мин
Количество просмотров 14K
Блог компании Битрикс24
Компания «1С-Битрикс» регулярно проводит обучающие семинары, на которых мы рассказываем о наших продуктах, а приглашенные спикеры делают доклады по смежным темам (например, о контекстной рекламе, о SEO, о веб-аналитике).

Очередной наш семинар, который пройдет 22 мая в конференц-зале «1С», мы решили провести в несколько ином формате: мы выбрали достаточно узкую тематику для семинара — производительность и отказоустойчивость веб-проектов — и постараемся максимально полно осветить все нюансы.

Для кого этот семинар? В основном — для веб-разработчиков, которые зачастую поневоле становятся и системными администраторами. :) И для системных администраторов, которым не чуждо написание кода. :)

Подробная программа семинара — на нашем сайте.

Заинтересовались? Приходите, пожалуйста, к нам 22 мая. Участие — бесплатное, но требуется регистрация.

Пока еще сомневаетесь? :) Под катом — подробнее о семинаре.
Читать дальше →
Всего голосов 39: ↑35 и ↓4 +31
Комментарии 12

Катастрофоустойчивые IT-системы: как внедрить в своей компании

Время на прочтение 9 мин
Количество просмотров 50K
Блог компании КРОК
Представьте, что ваш дата-центр (или боевой сервер) сегодня упал. Просто взял и упал. Как показывает практика, готовы к этому далеко не все:

  • 93% компаний, которые теряли свой ЦОД на 10 и более дней из-за катастрофы, стали банкротами в течение года (National Archives & Records Administration in Washington)
  • Каждую неделю в США выходит из строя 140 000 жестких дисков (Mozy Online Backup)
  • У 75% компаний нет решений для аварийного восстановления (Forrester Research, Inc.)
  • 34% компаний не тестируют резервные копии.
  • 77% тех, кто тестируют, обнаруживали нечитаемые накопители в своих библиотеках.

В предыдущих постах (раз и два) я писал про организационные меры, которые ускорят и облегчат восстановление ИТ-систем и связанных с ними процессов компании при чрезвычайной ситуации.



Сейчас поговорим про технические решения, которые в этом помогут. Их стоимость разнится от нескольких тысяч до сотен тысяч долларов.
Читать дальше →
Всего голосов 22: ↑17 и ↓5 +12
Комментарии 17

Семинар «Битрикс Хайлоад» — как это было, презентации, видео

Время на прочтение 4 мин
Количество просмотров 20K
Блог компании Битрикс24 Разработка веб-сайтов *
Помните нашего старого знакомого — веб-разработчика и по совместительству системного администратора? :) Он, как и многие другие наши читатели, сходил 22 мая на семинар «Разработка высоконагруженных веб-проектов: как выдерживать миллионы хитов в сутки, чтобы все работало и ничего не «падало», который мы анонсировали в том числе и на Хабре.

После этого, как нам кажется, жить ему стало немножко легче, а разработка и сопровождение больших «тяжелых» проектов стали понятнее.

* * *

Почти половина регистраций на семинар (и, видимо, и самих слушателей) была с Хабра. Мы очень рады тому, что тема оказалась востребованной.

Многие и лично, и в твиттере спрашивали, будут ли опубликованы презентации и видео…

Да, конечно!

С удовольствием делимся всеми материалами с вами!
Всего голосов 92: ↑63 и ↓29 +34
Комментарии 11