Pull to refresh
127
87

Технический писатель, ИТ-редактор блога MWS

Send message

Что могут векторные СУБД — open source инструменты & облако

Level of difficultyMedium
Reading time6 min
Views4.5K

Разработка систем искусственного интеллекта и обучение моделей подразумевает взаимодействие с огромными сводами неструктурированных данных — например, текстом и изображениями. Решать эту задачу помогают векторные БД. Они работают с так называемыми векторными представлениями (эмбеддингами), имеют продвинутые алгоритмы индексирования и особенно эффективны для реализации поиска по сходству. 

Учитывая популярность темы машинного обучения, новые векторные СУБД появляются чуть ли не каждый день. Мы сделали подборку open source решений, о которых мало рассказывали на Хабре: от крупных проектов вроде Qdrant до малоизвестных продуктов.

Векторные базы данных можно развернуть в облаке, обеспечивая мощную инфраструктуру, которая значительно улучшает управление крупномасштабными и сложными данными. На виртуальную инфраструктуру MWS сейчас действует скидка 50%.

Читать далее
Total votes 16: ↑15 and ↓1+22
Comments5

Противостояние или союз: перспективы открытых и проприетарных ML-моделей

Level of difficultyEasy
Reading time7 min
Views1K

Еще пару лет назад у всех на слуху было всего одно название — ChatGPT. Сегодня популярность набрали десятки генеративных моделей, а также построенных на их основе сервисов: от проприетарных (Google Gemini или Bing Chat) до открытых (Falcon или Mistral). Для массового внедрения ML-моделей создано достаточно подходящих мощностей. Компании, использующие технологии ИИ, нейронных сетей, больших данных, Data Science могут воспользоваться GPU-ресурсами MWS.

Неудивительно, что ажиотаж вокруг генеративных моделей тянет за собой весь рынок систем ИИ. Так, по оценкам Statista Market Insights, в 2023 году его объем составил $196 млрд, но всего двумя годами ранее эта цифра не превышала $21 млрд. При этом многие аналитики убеждены, что отрасль вырастет еще на 37% в течение семи лет.

Последний год в ИТ-сообществе идет обсуждение перспектив ML-решений. Кто возьмет пальму первенства — открытые или закрытые модели? В материале рассмотрим ситуацию, прогнозы и состояние законодательства.

Читать далее
Total votes 8: ↑8 and ↓0+11
Comments1

Возвращение частного облака и интерес к инфраструктуре «реального времени»: что с последними трендами

Level of difficultyEasy
Reading time6 min
Views1.5K

Начиная с середины 2010-х эксперты пророчили «смерть» частному облаку — то есть облачной среде, созданной и используемой одной компанией, в отличие от общей инфраструктуры, доступной в публичных облаках. Большая часть интереса к экосистеме облачных вычислений была сосредоточена на публичных облачных платформах. Бизнес массово переходил на IaaS, чтобы уменьшить затраты на обслуживание железа и поддержку ИТ-систем. 

Пользователями private cloud в основном оставались компании со специфическими требованиями к безопасности. Например, медицинские организации, которым необходимо хранить данные о пациентах в соответствии с нормами федерального законодательства. 

В сегодняшнем материале поговорим, как возродился интерес организаций к частным облакам, о тренде на универсальные и отраслевые платформы и о том, из-за чего активно развивается направление edge computing.

Читать далее
Total votes 10: ↑9 and ↓1+11
Comments0

Открытые инструменты для бизнес-аналитики — когда нужно построить дашборды и работать с потоковыми данными

Level of difficultyEasy
Reading time6 min
Views5.4K

Бизнес-аналитика — неотъемлемая часть работы в ИТ, предоставляющая компаниям ценную информацию для принятия стратегически важных решений. В условиях растущего объема данных и необходимости оперативного анализа возникает потребность в мощных инструментах, способных визуализировать данные, мониторить потоки информации и интегрироваться с IDE. 

Чтобы облегчить выполнение этих задач, можно использовать open source решения. Мы собрали компактный список таких инструментов, включающий платформы для визуализации данных и другие утилиты, облегчающие работу разработчиков.

Открытые инструменты предлагают мощные возможности для создания дашбордов и работы с потоковыми данными. Благодаря гибкости и масштабируемости, они могут быть адаптированы к потребностям различных компаний.

Читать далее
Total votes 12: ↑11 and ↓1+14
Comments0

Что нужно знать про объектные хранилища

Level of difficultyEasy
Reading time7 min
Views4.5K

Цифровые хранилища данных изменили способы производства, обработки и хранения информации. Переломный момент наступил в 1996 году, когда цифровое хранилище стало более рентабельным, чем бумажное.

В 1999 году в мире появилось ≈1,5 эксабайт уникальной информации, которая хранилась на бумаге, пленке, оптических и магнитных носителях. Причем печатные материалы всех видов составили лишь 0,003% от общего объема хранимой информации.

По подсчетам IDC и Seagate, глобальная сфера данных к 2025 году достигнет 175 зеттабайт, то есть увеличится более чем в 100 тыс. раз за четверть века. А с развитием генеративных нейронных сетей данных может стать еще больше.

Возникают закономерные вопросы: где хранить информацию, в каком виде и как получать к ней доступ. Человечество изобретает новые накопители (например, жесткие диски с технологией разогрева магнитных пластин лазером) и строит дата-центры, хранящие эксабайты информации, часть из которых предоставляется заказчикам в виде объектных хранилищ. Цель этой статьи — рассказать об особенностях использования таких хранилищ.

Читать далее
Total votes 6: ↑6 and ↓0+8
Comments0

Дата-центры будущего: в поисках мощности и новых источников энергии для LLM

Level of difficultyEasy
Reading time8 min
Views1.4K
image

Большие языковые модели (LLM) требуют значительных вычислительных мощностей. И это лишь часть затрат. Бурный рост продуктов генеративного искусственного интеллекта приводит к огромным расходам энергии — энергопотребление ЦОДов постепенно достигает гигантских объемов.

Дата-центры потребуют модернизации — например, сочетания нескольких возобновляемых источников энергии. Другие решения появляются на стыке нескольких технологий: системы ИИ могут управлять переключением между различными источниками энергии в поисках оптимального сценария питания.

По прогнозам Dell'Oro Group, к 2027 году инвестиции в ИТ-инфраструктуру для ИИ приведут к увеличению капитальных затрат на дата-центры до 500 млрд долларов.

Сегодня расскажем про тренды оптимизации, которые не только удовлетворят растущий спрос, но и позволят строить дата-центры в больших количествах и гораздо большем масштабе, чем сейчас.
Читать дальше →
Total votes 4: ↑4 and ↓0+4
Comments1

Открытые инструменты визуализации данных

Level of difficultyEasy
Reading time7 min
Views9.2K
image

Бизнесу нужны данные, чтобы эффективно работать. Не важно, какой инструмент вы используете для анализа, главное, чтобы он экономил ваше время и повышал производительность.

Современные технологии делают цифровые процессы извлечения полезной информации и принятия решений доступными для всех компаний, независимо от их специализации или уровня подготовки сотрудников.

Сегодня расскажем о некоторых открытых (и бесплатных) инструментах визуализации данных. Мы отобрали их по количеству звезд на GitHub. Хотя они не так известны, как Tableau Public или PowerBI, эти приложения позволяют легко создавать диаграммы и дашборды, фокусируясь не на инструментах, а на данных и их бизнес-ценности.

А еще напомним, что данные практически любого объема и формата вы можете хранить в облаке. Сейчас на объектное хранилище MWS действует скидка 50%.

Читать дальше →
Total votes 17: ↑16 and ↓1+17
Comments5

Не все просто с open source: история развития, облачные инструменты и новые риски

Level of difficultyEasy
Reading time7 min
Views2K
image

Согласно результатам опроса, проведенного компанией «АксТим», в 2026 году 92% российских компаний будут использовать решения на базе open source. Интересно, что в 2021 году оpen source уже использовали все компании-разработчики и 79% компаний-потребителей.

Упоминание open source можно было встретить еще в документации и пресс-релизах организаций в 80-х. Сейчас опыт работы с open source интересен всем — от стартапов до облачных провайдеров, которые используют целый каскад знаковых инструментов.

Но с опенсорсом не все так просто. Разработчики, продакты и руководители далеко не всегда понимают, что будет, если «база», на которой построен их проект, перейдет в разряд проприетарного ПО или вообще прекратит существование.

Сегодня подробнее обсудим историю открытого программного обеспечения — от момента зарождения до современных облачных инструментов и новых вызовов.

Читать дальше →
Total votes 8: ↑7 and ↓1+9
Comments3

Как устраивать DDoS-атаки: от 2010-х до наших дней

Level of difficultyEasy
Reading time6 min
Views5.7K

Завершаем серию статей об эволюции DDoS-атак. Сегодня расскажем, как развивались атаки и методы их проведения в нулевых — когда DDoS стали использовать для маскировки других киберпреступлений, а бизнес начал активнее внедрять облачные инструменты защиты.

Читать далее
Total votes 7: ↑7 and ↓0+10
Comments1

Grafana — прошлое, настоящее, будущее и альтернативы

Level of difficultyEasy
Reading time4 min
Views16K
image

Grafana — популярное приложение для мониторинга и визуализации данных, которое широко используется облачными провайдерами для мониторинга различных компонентов облачной инфраструктуры, таких как виртуальные машины, контейнеры, базы данных, сети. Grafana позволяет отслеживать производительность и использование ресурсов в режиме реального времени.

В этом году приложению исполняется десять лет, инструмент по-прежнему востребован в России. Поэтому мы решили поговорить об истории Grafana, а также обсудить роль этого открытого решения в развитии open source сообщества в целом.

Читать дальше →
Total votes 10: ↑9 and ↓1+9
Comments2

Встречают по README — что нужно знать о документации

Level of difficultyEasy
Reading time6 min
Views9.6K
image

Сокращение времени на поиск информации — задача, о которой говорят непростительно мало. Эту задачу должны решать отдельные разработчики и, в целом, компании. Например, CloudMTS предоставляет материалы, чтобы пользователи быстро освоились и успешно работали в облаке. База знаний, с которой можно самостоятельно изучать облачные сервисы, это хорошее подспорье для беспроблемной миграции.

Проводя аналогию дальше, знакомство с новой разработкой может упросить файл README — базовый компонент документации. 

Должны ли разработчики писать документацию? Как это часто бывает, однозначного ответа на этот вопрос нет.

Сегодня поговорим об инструментах для сборки и работы с README, а также обсудим тему документации.
Читать дальше →
Total votes 20: ↑20 and ↓0+23
Comments4

Упростить развертывание приложений в облаке — open source инструменты, которые помогут это сделать

Level of difficultyEasy
Reading time5 min
Views2.5K

C помощью cloud-сервисов можно решить множество задач бизнеса — например, организовать централизованное управление корпоративной ИТ-инфраструктурой, разместить клиентские приложения и обеспечить высокую доступность веб-ресурсов при пиковых нагрузках, сократить затраты на серверы и сетевое оборудование.

Но деплой в облаке — задача нетривиальная. Нужно подготовить код и среду, проверить работоспособность и доступность сервиса. Есть открытые решения, которые упрощают этот процесс. Некоторые из них уже набрали популярность — например, Piku и Dokku. Но мы решили поговорить о менее известных, но не менее интересных утилитах, позволяющих запустить коммерческие проекты и снизить расходы на администрирование: Kamal, Qovery, Cuber и MicroK8s.

Читать далее
Total votes 10: ↑9 and ↓1+13
Comments0

Зачем нам так много языков программирования?

Level of difficultyEasy
Reading time6 min
Views11K

В мире насчитывают примерно 7 000 естественных языков и 9 000 языков программирования. Но, в то время как количество первых стабильно сокращается, число вторых продолжает уверенно расти.

Сегодня поговорим о универсальном языке программирования «для всего» и причинах появления новых ЯП. Обсудим несколько свежих разработок — например, Carbon, которому пророчат будущее преемника C++, язык для проектирования нейросетей Mojo, облачный язык программирования Wing.

Читать далее
Total votes 16: ↑8 and ↓8+5
Comments46

Есть ли альтернатива Terraform?

Level of difficultyEasy
Reading time5 min
Views8.4K

В начале 2010-х годов системные администраторы часто сталкивались с проблемой управления распределенной инфраструктурой. Возникла потребность в унифицированном инструменте для управления инфраструктурой как кодом.

В 2014 году компания HashiCorp создала оpen source проект Terraform. С момента запуска Terraform получил огромную популярность и сегодня остается одним из самых востребованных инструментов для реализации подхода Infrastructure as Code.

В прошлом году HashiCorp перешла с open source лицензии MPL на более закрытые условия распространения программного обеспечения, в частности — лицензию BSL.

Разбираемся, что к чему, как реагирует сообщество, и на что обратить внимание компаниям с точки зрения стратегического развития своих ИТ‑продуктов.

Читать далее
Total votes 14: ↑7 and ↓7+3
Comments4

Бэкапы исторических масштабов — как человечество сохраняет большие объемы данных?

Level of difficultyEasy
Reading time7 min
Views4.1K
image

Корпоративные решения для синхронизации, резервного копирования и безопасного обмена файлами легко позволяют отправлять большие данные в облако. Но что, если нам необходимо собрать и сохранить грандиозный объем данных — например, записать историю человеческой цивилизации? Как это сделать, насколько надежны цифровые носители, есть ли конкурентноспособные альтернативы?

Сегодня поговорим о проектах, посвященных созданию массивных архивов и бэкапов, и роли систем ИИ в подобных задачах.
Читать дальше →
Total votes 10: ↑9 and ↓1+12
Comments7

Прокачиваем навыки в сфере ML — что изучать в 2024-м

Level of difficultyEasy
Reading time6 min
Views15K

Бизнесу нужны технологии, способные обрабатывать огромные объемы данных, предоставлять релевантные рекомендации, оценивать финансовую надежность клиентов и обеспечивать эффективный поиск информации. Ключевым элементом для автоматизации рутинных задач и создании бизнес-решений на основе данных становится ML.

Ритейл, банки, технологические предприятия, компании-разработчики и все те, кто собирает большие массивы неструктурированных данных, для запуска сложных моделей могут использовать вычислительные ресурсы облака. Например, строить нейросети с помощью ML-платформы или использовать объектное хранилище для обработки Big Data.

Но чтобы грамотно использовать инструменты для работы с AI- и ML-задачами, нужно приобрести необходимо знания и навыки. Поможет разобраться в машинном обучении и инструментах для работы с ML-моделями подборка новых и высокооцененных специализированных курсов, книг и других тематических материалов.

Читать далее
Total votes 18: ↑15 and ↓3+17
Comments0

Удары по корневой инфраструктуре, медленные атаки и хактивизм: как менялись DDoS-атаки в нулевых

Level of difficultyEasy
Reading time6 min
Views2.5K

Частота и масштаб DDoS-атак увеличиваются ежегодно. Услуги DDoS as a service позволяют всем желающим относительно легко проводить продолжительные атаки, которые трудно нейтрализовать. В CloudMTS мы уделяем пристальное внимание защите инфраструктуры и хотим ближе познакомить вас с истоком проблем распределенных атак.

Первые шаги в истории DDoS не привлекали внимание широкой публики, но со временем методы злоумышленников становились все изощреннее, а результаты их применения — более заметными: под ударом оказался как бизнес, так и корневая инфраструктура интернета. Обсудим, какими были DDoS-атаки в период с 2000-го по 2010-й.

Читать далее
Total votes 10: ↑10 and ↓0+10
Comments1

Открытые инструменты для превентивной защиты и ИБ-аудита

Reading time5 min
Views5.2K

Есть два ключевых подхода к защите ИТ-систем: реактивный и превентивный. Реактивный — это реагирование на атаки и реализованные ИБ-риски, в том числе восстановление данных, установка патчей и обновлений, прочие активности. Превентивный подход подразумевает обнаружение и минимизацию возможных угроз. 

Для выстраивания комплексной системы безопасности следует внедрять оба подхода. Но ресурсов собственного штата ИБ-специалистов не всегда хватает. Чтобы решить кадровую проблему и повысить безопасность, компания может обратиться к облачному провайдеру, который обеспечивает безопасность с помощью портфеля готовых сервисов. 

Так у МТС есть собственный Security Operation Center для комплексной защиты всех ресурсов клиентов от киберугроз при помощи мониторинга и реагирования 24/7 на инциденты ИБ. Изначально SOC защищал исключительно инфраструктуру МТС и дочерних предприятий, но со временем ИБ-услуги стали доступны всем клиентам.

В другом сценарии (который, впрочем, легко реализовать не вместо облачных сервисов, а вместе с ними) специалисты по кибербезу действуют своими силами и используют открытые технологии. Сегодня мы остановимся на знакомстве с некоторыми интересными open source (Apache License 2.0) инструментами для ИБ-аудита, превентивной защиты и организации безопасных инфраструктурных решений.

Читать далее
Total votes 13: ↑13 and ↓0+13
Comments0

Как стать SRE-инженером в 2024 году

Level of difficultyEasy
Reading time5 min
Views13K

Традиционным ИТ-командам трудно успеть за быстрым ростом масштабов и сложности приложений. Растут и требования, которые предъявляют к приложениям пользователи. В этих условиях крайне важно поддерживать бесперебойную работу инфраструктуры. 

На помощь приходят SRE-инженеры. SRE (Site Reliability Engineering) фокусируется на создании высоконадежных систем и их поддержке. Главная задача SRE-инженеров — поддерживать высокую доступность приложений и быстрое реагировать на проблемы в производственной среде.

Сегодня мы разберемся, насколько востребована и перспективна эта специализация, какие навыки потребуются, чтобы освоить ее с начального уровня.  

Читать далее
Total votes 12: ↑8 and ↓4+11
Comments3

Почему работа с данными так популярна: Data Scientist, Big Data и объектное хранение

Level of difficultyEasy
Reading time9 min
Views6.3K

По оценкам Cybersecurity Ventures, к 2025 году общий объем данных в облаках достигнет 100 зеттабайт, или 50% всех мировых данных на тот момент. Ландшафт хранения этой информации разнообразен: от недорогих обычных серверов до огромных хранилищ на сотни петабайт. 

При экспоненциальном росте информации возможности работы с данными расширяются. Отчет LinkedIn о новых вакансиях показывает, что мировой рынок работы в области науки о данных вырастет до 230,80 млрд долларов к 2026 году. 

Наука о данных является востребованной, интересной, и, казалось бы, очень сложной областью знаний. Однако хорошая новость заключается в том, что она доступна для новичков. В статье мы разберемся, с какими базовыми основами нужно познакомиться при работе с данными.

Читать далее
Total votes 11: ↑7 and ↓4+9
Comments1
1
23 ...

Information

Rating
50-th
Works in
Registered
Activity