Обновить
691.57

IT-инфраструктура *

Инфоцентры + базы данных + системы связи

Сначала показывать
Период
Уровень сложности

ИИ правит миром, но не ЦОДом

Время на прочтение3 мин
Просмотры957

Привет, Хабр! Мы все читаем одни и те же новости: ИИ пишет код, управляет дронами и вот-вот отберёт у людей всю работу. Кажется, он везде. Но на самом деле есть одна интересная сфера, куда нейросетям пока вход закрыт. Ещё удивительнее то, что речь идёт именно о той деятельности, которая связана с рождением всех этих умных алгоритмов — дата-центры. И тут возникает парадокс: туда, где создают LLM, наотрез отказываются пускать их к рулю. Почему?

Читать далее

Тренды DevOps 2025: Новые версии K8s и OpenSearch. Гид по главным изменениям

Уровень сложностиПростой
Время на прочтение2 мин
Просмотры3.3K

Привет, коллеги! Год продолжает радовать нас мощными апдейтами!) Делимся подборкой самого интересного, что случилось в мире DevOps-инструментов недавно.

Динамическое обновление ресурсов Pod и Kubernetes

Одна из самых крутых фич, которая стала стабильной в Kubernetes 1.33, - это возможность изменять запросы и лимиты CPU/памяти у работающих подов без их перезапуска.

Читать далее

Такой разный DevOps

Уровень сложностиСредний
Время на прочтение5 мин
Просмотры7.1K

Истории из нашей практики: разные подходы к организации инфраструктуры и процессов DevOps. Первая статья из серии.

Читать далее

Делаем свой ChatGPT за 10$ в месяц: разворачиваем LLM на облаке. Подробный гайд на VPS + API-обертка

Время на прочтение13 мин
Просмотры20K

Еще недавно поиск в Google или Яндекс был главным инструментом инженера. Сегодня все изменилось: AI-помощники вроде ChatGPT, Gemini или Claude, понимающие запросы на естественном языке, кардинально меняют подход к работе. Однако их использование упирается в серьезные преграды: вопросы конфиденциальности корпоративных данных, географические блокировки и лимиты бесплатных тарифов стали новой головной болью.

Что, если получить все преимущества мощной языковой модели, но без этих недостатков? Решение — развернуть собственную модель на своих серверах. Эта статья —практический гид по созданию автономного чат-бота, который не уходит в облако, работает без интернета и полностью защищает данные. Я пройду путь от теории до работающего локального прототипа.

Читать дальше

Дата-центры в космосе: гигантские радиаторы вместо кондиционера

Уровень сложностиПростой
Время на прочтение4 мин
Просмотры2K

Nvidia помогает стартапу Starcloud запустить H100 на орбиту. SpaceX отправит спутник с GPU в ноябре — первый раз в истории дата-центр полетит над антеннами и проводами.

Читать далее

От валидации функционала к обеспечению киберустойчивости. При чем здесь тестирование?

Уровень сложностиПростой
Время на прочтение3 мин
Просмотры435

В условиях экспоненциального роста сложности ИТ-инфраструктур и постоянно эволюционирующих киберугроз, тестирование перестает быть опциональной процедурой и становится критической необходимостью. Недооценка его роли, к сожалению, до сих пор приводит к катастрофическим последствиям, которые измеряются не только финансовыми убытками, но и компрометацией всей системы безопасности.

Читать далее

Оптимизируем производительность веб-приложения с Redis

Время на прочтение10 мин
Просмотры3.3K

Привет, Хабр! С вами Александр Константинов, технический эксперт по облачным технологиям из Cloud.ru. Сегодня хочу показать вам наглядно, как можно оптимизировать производительность веб-приложения. Рассмотрим это на усредненном примере кейса, который типичен для многих наших клиентов, пройдем весь путь настройки, выполним нагрузочное тестирование и сравним до/после.

Надеюсь, материал окажется полезным всем разработчикам и инженерам, кто сталкивается с проблемами производительности в своих проектах. Плохая новость в том, что путь, который я опишу, подходит не всем, хорошая ― в том, что мы рассмотрим кому он не подходит, и вы не будете тратить время на сомнения и тесты.

Узнать больше

Архитектура ИТ решений. Часть 2. Бизнес-архитектура

Уровень сложностиСредний
Время на прочтение11 мин
Просмотры4.7K

Продолжаем рассматривать вопросы, связанные с проработкой архитектурных решений в области цифровизации предприятий.

Сталкивались ли Вы с ситуацией, когда ИТ проект, в котором задействована сильная команда разработчиков, в конечном счете выпускает программный продукт, не удовлетворяющий потребностям бизнеса? Когда полученный вариант попросту никак не облегчает жизнь компании, не избавляет от ее болей и печалей, не переводит ее процессы на качественно новый уровень.

Чаще всего такой итог означает, что затеявшие цифровую трансформацию специалисты, не справились со своей основной задачей и просчитались, скорее всего, еще на этапе анализа. А причина тому - отсутствие экспертизы в области архитектуры бизнеса. И аргумент: «как нам заказчик объяснил, так мы и сделали», служит слабым оправданием.

Команда профи, должна была, обследовав предприятие, указать на нелогичность цепочек бизнес-процессов, нерелевантность используемых бизнес-сервисов, избыточность организационной структуры, искажения потоков ценностей и прочие упущения, присущие первоначально сложившейся архитектуре.

Квалифицированный специалист в области организации бизнеса должен гарантировать качественный инжиниринг и реинжиниринг деятельности предприятия, используя при этом профессиональные подходы, инструменты и приемы. Результат этих активностей и должен заложить основу для последующей эффективной цифровизации деятельности заказчика.

В данном аспекте важно учитывать, что на больших предприятиях цифровизацией будут заниматься множество команд, использующих разные технологические платформы, методологии, и накопленный ранее приватный опыт автоматизации. Их технические новации в свою очередь будут влиять на выстраивание бизнес-решений, определяя то, как бизнес будет меняться и развиваться. А потому, если централизовано не управлять слоем бизнес-архитектуры, то разнообразные ИТ-технологии могут привести к культивированию зоопарка управленческих, финансовых, предпринимательских и прочих бизнес-решений в общей структуре предприятия, вызывая противоречия, неконструктивную конкуренцию, затруднение в управлении и прочие кризисные предпосылки.

Читать далее

CRM, где C — это cloud? Разворачиваем в облаке Twenty CRM для вашего стартапа бесплатно

Уровень сложностиПростой
Время на прочтение13 мин
Просмотры515

Как и любого уважающего себя молодого человека меня нередко преследуют мысли об открытии своего собственного технологического стартапа, ну или хотя бы магазина рыболовных приспособлений у метро. Но каждый раз все разбивается о суровые реалии нашего мира. Любое дело подразумевает наличие команды, учет товаров, обслуживание клиентов и многое другое. 

А как обслужить клиента и удобно хранить информацию о нем? Для этого существует CRM — система управления отношениями с клиентами, которая помогает бизнесу собирать, хранить и использовать данные о клиентах, автоматизировать продажи и улучшать обслуживание. 

Многие существующие на рынке CRM-решения выставляют огромный ценник и, на фоне не всегда высокой маржинальности реализуемой услуги или товара, многие идеи теряют свою актуальность в силу существенных издержек, ведь нередко поддержание работоспособности подобных программных решений занимает значимую часть общих расходов компании. Однако нет большей неудачи, чем перестать пытаться. В гонке за сокращением расходов существующей только в моем воображении компании, был найден следующий выход.

Читать далее

Снижаем стоимость инференса. Часть 2. IBM KServe ModelMesh, vLLM Production Stack и что внутри у нашего решения

Уровень сложностиСложный
Время на прочтение24 мин
Просмотры589

Привет, Хабр! На связи снова Данила Гудынин, DevOps-инженер направления Evolution ML Inference в Cloud.ru.

В прошлой статье про снижение стоимости инференса мы пробежались по теории того, что и на каких уровнях стека можно подкрутить, чтобы повысить утилизацию своих GPU. Там вы могли определиться, какой подход в принципе подходит для ваших задач.

В этой части мы нырнем в практически-технический хар дкор и расскажем, как оптимизировать работу своих графических процессоров с KServe ModelMesh или vLLM Production Stack, подсветим, где разбросаны грабли в этом деле, а еще заглянем под капот к Cloud.ru Shared GPU и объясним, как именно он позволяет нам ставить цены на уровне западных облаков при кратно более дорогом железе в РФ.

ML-инженеры, DevOps и MLOps-архитекторы, можете сразу добавлять в закладки, чтобы возвращаться и списывать нужные конфиги. Наливайте бочку чая или чего покрепче, постарался изложить все сугубо по делу, много кода спрятал в «раскрывашки», так что не пугайтесь обозначенного выше времени чтения.

Читать далее

Важность масштабирования Kaspersky Security Center

Уровень сложностиПростой
Время на прочтение4 мин
Просмотры4.6K

Вопрос масштабирования сервисов достаточно часто, и временами больно, встаёт ребром в самый неподходящий момент, ложа при этом за собой бизнес процессы, и вызывая нервный тик у администраторов.

В этой статье, на реальном примере из моего опыта инженерного обслуживания средств антивирусной защиты Kaspersky, мы с вами разберём шаги по недопущению таких трепещущих ситуаций.

Читать

Отказ от самурайства: EXANTE меняет инфраструктуру или Как мы ошиблись в реализации Cloud Native

Уровень сложностиПростой
Время на прочтение6 мин
Просмотры800

От Kubernetes-хаоса к Infrastructure 2.0: опыт EXANTE, ошибки, неожиданные инсайты и новые подходы к современной инфраструктуре будущего

Читать далее

Топ-10 мифов о публичных облаках в корпоративном сегменте

Уровень сложностиПростой
Время на прочтение10 мин
Просмотры2.3K

Пусть плюнет в меня IT-директор той компании, который ни разу не задумывался о переходе в облако. Ну, а что? С одной стороны, это должно быть выгодно. Конечно, есть кое-какие вопросики к безопасности, но ведь люди пользуются – и ничего. С другой стороны, переход на облачную инфраструктуру вроде как требует пересмотреть модель бюджетирования. А так не хочется. Да и надо ли? В общем, вопросов, ответы на которые формируются на основе слухов или давно неактуальных данных, хватает. Поэтому мы собрали 10 самых распространенных мифов об облаке, чтобы выяснить, где правда, а где домыслы, не имеющие ничего общего с реальностью.

Читать далее

Ближайшие события

9 из 10 компаний внедрили ИИ. Многие уже разочаровались

Время на прочтение4 мин
Просмотры5.4K

Стоит ли бизнесу так дорого платить за искусственный интеллект?

По данным отчета McKinsey, 78% компаний внедрили хотя бы пилотные AI-решения. Но есть нюанс: реальную ценность получают далеко не все.

На первый взгляд — это революция. Но массовое внедрение далеко не всегда про эффективность. И для многих компаний ИИ остается скорее витриной для инвесторов и партнеров, чем реальным источником прибыли и оптимизации процессов.

Почему так происходит? Ответ станет очевиднее, если посмотреть на последствия первой волны энтузиазма.

Читать далее

Как снизить затраты на генеративный ИИ: практическое руководство по выбору видеокарты

Уровень сложностиСредний
Время на прочтение5 мин
Просмотры2.8K

Привет, Хабр! Я Идрис Юсупов, занимаюсь направлением искусственного интеллекта в AutoFAQ. Мы делаем омниканальную платформу на базе ИИ для поддержки клиентов и сотрудников.

Недавно я решил проверить, какие видеокарты выбрать для генеративного ИИ. Почему это важно? Потому что для компаний вопрос выбора железа всегда болезненный. Оно должно помогать решать задачи и при этом оставаться в разумных рамках по стоимости.

Материал будет полезен ИТ-директорам, архитекторам решений и инженерам, которые выбирают видеокарты для запуска генеративного ИИ в корпоративной инфраструктуре. В статье расскажу, где хватает проверенных карт, а где уже стоит смотреть на новое поколение вроде Blackwell. Под катом — цифры, метрики и выводы.

Читать далее

NoCode инструменты для создания AI-приложений с RAG: быстрый старт

Уровень сложностиПростой
Время на прочтение12 мин
Просмотры7.3K

Активное развитие AI не позволяет остаться в стороне почти никому. Будучи студентом одного из хороших факультетов в области CS, я не мог остаться в стороне и был вынужден начать погружаться в данный вопрос с головой. Во-первых, тематика перекликается с учебными вопросами, а во-вторых — актуальна в рамках рабочих задач. С учетом моего небольшого, но прицельного опыта работы, сформировалось стойкое впечатление, что в ближайшее время AI радикально изменит процессы в компаниях и к этому нужно быть готовым. Вопрос хорошо это или плохо — философский.

Если хочешь разобраться в теме — попробуй сделать что-то на практике. Наверняка многие уже наслышаны про RAG. Вот, например, отличные на мой взгляд статьи — 1 и 2. Я же решил написать небольшую инструкцию, без технических деталей, следуя который любой сможет познакомиться с данной технологией, определить для себя ее ценность и начать более детальное изучение. Попробуем от и до реализовать небольшого ассистента, который будет отвечать на ваши вопросы с учетом базы знаний. Нередко такое может пригодиться при подготовке к экзамену, когда один и тот же курс читается по-разному даже в соседних группах, а преподаватель не приемлет ответы, расходящиеся с его конспектами. Было бы круто иметь инструмент, который отвечает строго по тексту ;)

Читать далее

2FA ALD Pro. Авторизация пользователей по сертификатам в домене

Уровень сложностиСредний
Время на прочтение14 мин
Просмотры2.2K

Внедрение двухфакторной аутентификации (2FA) часто воспринимается как сложная и ресурсоемкая задача, особенно в гетерогенных средах. Многие хотят повысить безопасность, используя имеющиеся средства, но не знают, с какой стороны подойти к реализации.

В этой статье я подробно разберу, как настроить двухфакторную аутентификацию с помощью сертификатов на токенах Рутокен для пользователей как родного домена ALD Pro, так и доверенного домена Microsoft Active Directory. Мы пройдем весь путь от инициализации токена и генерации ключей до настройки клиентов Astra Linux Special Edition (ALSE) и получения заветного окна ввода PIN-кода при входе в систему.

Это руководство формата HowTo призвано развеять миф о сложности 2FA и показать, что данный механизм в связке с отечественными решениями готов к работе уже сегодня.

Читать далее

Как улучшить мониторинг и не потерять логи: Zabbix + ELK

Уровень сложностиПростой
Время на прочтение5 мин
Просмотры4.6K

Привет, Хабр! Меня зовут Сергей, я DevOps-инженер в компании Webest. В работе ежедневно сталкиваюсь с задачами мониторинга и анализа логов, и знаю, как иногда трудно разобраться в причине, почему лег прод в 5:21 утра.

Здесь на помощь приходит Zabbix. Он как верный пес: всегда громко «лает», когда что-то идет не так, и даже может «принести» алерт прямо к тебе с тапочками. Но на этом история не заканчивается. Если нужно понять, что именно сломалось и по какой причине, приходится копать глубже — в мир логов, где живет ELK Stack.

В статье хочу поделиться опытом для чего программы нужны, как дополняют друг друга, каким образом их можно связать и нужно ли.

Читать далее

Как выбрать действительно безопасное облако. Взгляд юриста

Уровень сложностиПростой
Время на прочтение8 мин
Просмотры2.7K

Привет, Хабр! С вами Анастасия Ильханова, я работаю юристом в Cloud.ru и постоянно сталкиваюсь с тем, что клиенты спрашивают о безопасности хранения данных в облаке, запрашивают лицензии, просят разъяснить положения договора и т. д. Моя задача в этой статье — разложить по полочкам ответы на основные вопросы клиентов и подытожить их в виде понятного чек-листа для компаний, ИП и отдельных разработчиков, которые готовятся использованию облаков.

Читать дальше

Cloud4Y строит ЦОДы в МО: сводка новостей – Часть 7

Время на прочтение4 мин
Просмотры1.4K

Привет, Хабр!

Лето — не повод сбавлять обороты. Строительство ЦОДов в Марфино и Мытищах продолжается, и мы делимся с вами свежими новостями. Если вдруг пропустили предыдущие серии — ловите ссылки: раз, два, три, четыре, пять, шесть.

Читать далее

Вклад авторов