Как стать автором
Обновить
186.63
MWS
Больше, чем облако
Сначала показывать

Почему галлюцинируют нейросети [и что с этим делают]

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров7.4K

Австрийский математик Курт Гёдель еще в 1931 году сформулировал и доказал две теоремы о неполноте. В общем случае первая теорема гласит, что всякая непротиворечивая теория имеет утверждения, которые нельзя доказать средствами этой теории. Теорема оказала значительное влияние на различные научные области и в некоторой степени может способствовать пониманию того, почему галлюцинации в системах ИИ неизбежны. 

Сегодня мы обсудим, как современные исследователи решают проблему галлюцинаций LLM, какие методы для этого применяют и как выгодно использовать виртуальную инфраструктуру с GPU для обучения нейросетей.

Читать далее
Всего голосов 17: ↑13 и ↓4+16
Комментарии4

Tcl — как скриптовый язык для университетских проектов стали использовать по всему миру

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров8.9K

Одна из ключевых облачных фич — масштабирование (о возможностях облака с примерами из реального бизнеса подробнее рассказали тут). Настраивать масштабирование, а также балансировщики нагрузки и виртуальные машины можно различными способами. Один из нетипичных вариантов — использование языка Tcl.

Tcl (Tool Command Language) разработал программист Джон Оустерхаут в середине 1980-х. Tcl достаточно универсален — он помогает управлять сетевыми устройствами и работать с облачными интерфейсами.

В начале девяностых вокруг решения сформировалось серьезное академическое комьюнити. Затем сообщество стало шире — участники разрабатывали новые расширения и средства для работы с БД.

История языка насчитывает уже больше тридцати лет, и сегодня мы расскажем о том, как продвигалось его развитие.

Читать далее
Всего голосов 18: ↑17 и ↓1+21
Комментарии4

Автоматизировать аналитику, визуализировать данные и не только — примеры российских BI-решений

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5.5K

Большинство российских BI-решений к 2024 году уже достигли необходимого уровня развития, чтобы заменить зарубежные продукты. Но требования клиентов к BI-системам сильно отличаются. Кому-то необходимы простые и понятные дашборды, другим — возможность настройки по специфическим требованиям, а также включение технологического решения в реестр российского ПО. 

Мы уже рассказывали, как перейти на российские BI-решения без потери эффективности (запись открыта по ссылке, подключайтесь). А сегодня подробнее разберем, что могут предложить Analytic Workspace, Glarus BI, Modus BI и LuxMS BI.

Читать далее
Всего голосов 8: ↑7 и ↓1+9
Комментарии3

No-code решения для разработчиков, о которых мало кто говорит

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров15K

Существуют сотни фреймворков, библиотек и платформ для разработки в формате no-code. Сегодня обсудим те из них, что имеют высокие рейтинги на GitHub, но могли пройти мимо вас незамеченными — Formily, Mitosis, FlowiseAI и ToolJet.

Читать далее
Всего голосов 16: ↑12 и ↓4+13
Комментарии6

Проблемы открытых знаний и литература в формате Open Knowledge

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.3K

Недавно в MWS начался новый бесплатный образовательный курс «Основы сетевых технологий». Мы уделяем большое внимание теме распространения знаний и много пишем о книгах, онлайн-курсах и вебинарах, которые помогают в самообразовании. 

Открытые знания дают свободный доступ к информации, но с этой инициативой не все так просто. Сторонники открытых знаний считают, что информация должна быть бесплатной, приносить пользу обществу и использоваться в образовании и науке. Но не все авторы готовы работать бесплатно. Это приводит к конфликту: одни выступают за свободный доступ к знаниям, другие — за защиту авторских прав. 

Поговорим о том, как возникло движение Open Knowledge, а также предложим пару примечательных книг по облачной тематике с открытых платформ.

Читать далее
Всего голосов 8: ↑8 и ↓0+16
Комментарии0

Новые языки для облачных вычислений — от управления конфигурациями до диалекта Python

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.6K

Языки программирования растут как грибы после дождя — чем больше задач у программиста, тем выше потребность в новых инструментах. Авторы этих языков стремятся переосмыслить статус-кво или создать специализированные ЯП, предназначенные для решения конкретных задач. Сегодня мы подготовили компактную подборку перспективных инструментов, ориентированных на работу с облачными технологиями.

Облачные языки позволяют эффективно управлять распределёнными ресурсами, учитывая необходимость обработки больших объёмов данных и обеспечения масштабируемости без потери производительности.

Читать далее
Всего голосов 8: ↑7 и ↓1+12
Комментарии1

Open source решения для управления и работы с данными в облаке

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров2.7K

Хабр, привет! Сегодня у нас подборка перспективных open source решений, которые могут упростить хранение данных и работу с ними в облаке. Говорим про Garage, LinDB, LitData и Triplit.

Если вам нужно надежное решение для работы со структурированными данными с возможностью практически неограниченного масштабирования, сервисы MWS помогут организовать полный цикл работы с данными. Вы сможете создать собственную DWH-платформу с масштабированием по клику.

Читать далее
Всего голосов 7: ↑7 и ↓0+10
Комментарии1

Мечты о безбумажном офисе

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров2.3K

Концепция ЭДО и безбумажного офиса обрела широкую популярность десятилетия назад. Время от времени появлялись устройства, которые считались «предвестниками цифрового офиса будущего». Казалось, что вскоре многие организационные процессы и документооборот станут цифровыми. Однако реализация концепции безбумажного офиса потребовала значительно больше времени.

Сейчас в «цифру» переходит не только первичная документация, но и кадровые документы. Сервисы кадрового электронного документооборота (КЭДО) помогают быстрее и проще нанимать новых сотрудников, контролировать своевременное подписание документов, уменьшить нагрузку на кадровиков, а также сократить время и усилия, затрачиваемые на печать, хранение, обработку и доставку бумажных документов. Теперь всё это доступно на базе российского ПО VK HR Tek.

В этой статье мы рассмотрим устройства, которые опередили своё время, и объясним, почему, несмотря на усилия учёных и инженеров, безбумажный офис так долго оставался утопией. Также расскажем, какую роль в появлении современного ЭДО сыграли достижения аэрокосмической отрасли в 1990-х годах.

Читать далее
Всего голосов 8: ↑6 и ↓2+8
Комментарии6

Слепые вычисления и квантовые сети — на пути к квантовому интернету

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.9K

В поисках новых способов повысить скорость и качество передачи контента (по этому поводу будет вебинар, подключайтесь), рано или поздно возникает вопрос: можно ли передавать данные мгновенно и безопасно, независимо от расстояния? Наши представления о способах обмена информацией в интернете может вскоре изменить квантовая сеть.

Квантовые коммуникации становятся доступнее, не в последнюю очередь благодаря облачным технологиям. Облако позволяет исследователям и компаниям экспериментировать с квантовыми алгоритмами без необходимости владеть дорогостоящим оборудованием.

Можно уверенно сказать, что полноценные квантовые машины будут продолжать работать с виртуальной инфраструктурой. Чтобы обеспечить их работу, инженеры уже разработали протоколы, которые защищают данные и обеспечивают их приватность при обработке квантовым компьютером в облаке.

Мы уже можем примерно представить будущее квантового интернета.

Читать далее
Всего голосов 7: ↑6 и ↓1+8
Комментарии4

Открытые инструменты для GPU-вычислений

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.6K

Вычисления на GPU могут быть полезны многим разработчикам, поскольку они позволяют повысить производительность кода. Эта технология доступна, но для ускорения выполнения кода или создания красочной визуализации нельзя просто перенести вычисления с CPU на GPU — для этого требуются специальные компиляторы и библиотеки.

Сегодня собрали несколько интересных решений, которые пригодятся в разнообразных задачах: от ускорения высоконагруженных вычислений до генерации графики.

Читать далее
Всего голосов 7: ↑7 и ↓0+9
Комментарии3

История и новые кейсы цифровых двойников: от космоса до интеграции с ML

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров913

История цифровых двойников (ЦД) берет свое начало в 1960-х годах — с появлением систем автоматизированного проектирования CAD и CAE, которые по мере своего развития постепенно сформировали принципы автоматизированной разработки виртуальных копий физических объектов. Подобные системы стали важным компонентом пайплайна, связанного с построением цифровых двойников. Например, теперь их используют при проектировании зданий, помещений, даже целых городов.

Сегодня поговорим о развитии цифровых двойников: как концепция, описанная в научно-популярной книге «Зеркальные миры», нашла отражение в реальном мире. Также рассмотрим несколько кейсов — как в реальной жизни применяют связку «цифровой двойник + машинное обучение».

Читать далее
Всего голосов 9: ↑7 и ↓2+9
Комментарии1

Кто пытался сделать политики конфиденциальности и обработки ПД чуточку понятнее, и к чему привели такие попытки

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.1K

Разные компании по-разному оформляют свои политики конфиденциальности — единого формата нет. Подавляющее большинство из них написано тяжелым юридическим языком, поэтому многие даже не пытаются изучать их, например, чтобы понять, как тот или иной сервис будет работать с персональными данными.

Есть множество инициатив, призванных повысить прозрачность таких документов: от унифицированных иконок на сайтах до браузерных расширений, и новые проекты продолжают появляться. Мы решили взглянуть на ситуацию со стандартизацией политик конфиденциальности и обсудить, нужен ли им единый формат.

Читать далее
Всего голосов 14: ↑13 и ↓1+15
Комментарии1

Как самому собрать дата-центр: навыки гибкого мышления, 5000+ деталей и 80 часов работы

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров6.3K

Проектирование ЦОДа — сложная инженерная задача, требующая гибкости мышления и творческого подхода. Нужно тщательно спланировать все детали. В этом плане строительство дата-центра определенно напоминает работу с конструктором, развивающую пространственное мышление, логику и навыки решения проблем.

Есть и ещё одно сходство — и дата-центры, и конструкторы можно масштабировать, добавляя новые компоненты по мере необходимости. Проектировщики дата-центров используют модульный подход для разработки эффективных и надежных решений.

А чтобы пойти ещё дальше, мы решили провести простой эксперимент с DIY дата-центром из конструктора.

Читать далее
Всего голосов 8: ↑8 и ↓0+10
Комментарии0

Как правильно использовать большие данные: строим хранилища на MPP-СУБД

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.3K

Немного контекста.

·       Данные нужны везде — для понимания трендов и рисков, для улучшения клиентского опыта, для технической аналитики. 

·       Вместе с цифровизацией и экспоненциальным ростом объема и разнообразия данных растет потребность в надежных, масштабируемых, производительных хранилищах.

·       Чтобы самостоятельно извлекать ценность из данных и оперативно использовать их в работе, нужно построить и поддерживать соответствующую инфраструктуру. Это трудозатратный подход.

Сегодня поделимся нашим опытом, как снизить капиталовложения в оборудование с большим объемом памяти, добиться производительности и высокой отказоустойчивости при создании DataLake и Data Warehouse.

Читать далее
Всего голосов 12: ↑9 и ↓3+10
Комментарии7

Reality check, или какие барьеры стоят между бизнесом и квантовыми компьютерами

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров816

В облаке MWS вы можете связать площадки между собой через защищенный канал поверх сетей общего пользования. VPN-туннелирование использует протоколы шифрования и аутентификации, обеспечивающие защиту передаваемых данных и обмен ключами для сохранения безопасности и целостности информации (больше подробностей о VPN-туннелях — на сайте).

Однако есть мнение, что развитие квантовых технологий скоро приведет к появлению высокопроизводительных квантовых компьютеров, для которых алгоритмы современной криптографии не будут являться стойкими. Так ли это на самом деле или хайп вокруг квантовых вычислений преувеличен? Обсудим аргументы сторон, а также поговорим о том, почему постквантовые алгоритмы шифрования могут быть полезны уже сегодня.

Читать далее
Всего голосов 7: ↑7 и ↓0+10
Комментарии0

Через аркадные автоматы к облаку: как GPU принес счастье

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.2K

История видеокарт началась задолго до появления персональных компьютеров. Так, в 1970-х чипы для работы с графикой устанавливали в аркадные автоматы. Со временем были сформированы стандарты работы с GPU, а спектр задач, которые оказались способны решать эти устройства, расширился до декодирования видео и математических вычислений. 

Сегодня GPU каждый может использовать на простых ПК для 3D-моделирования, графического дизайна, анимации, архитектуры и конструирования — и всё без закупки графических станций.

Рассказываем, когда и как применялись графические процессоры, а также — чем отличались их предшественники от того, что мы имеем сегодня.

Читать далее
Всего голосов 9: ↑9 и ↓0+14
Комментарии4

Пайплайны, разметка и версионирование — открытые решения для работы с неструктурированными данными

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.4K

Подготовили подборку решений для анализа и обработки неструктурированных данных. Инструменты помогут с разметкой текста, построением соответствующих пайплайнов и версионированием масштабных сводов информации для машинного обучения и не только. Поговорим про Sycamore, Surya, OmniParse, Unstract и Oxen — каждый из этих инструментов имеет открытый исходный код.

Кроме того, организации могут значительно сэкономить на управлении и эксплуатации неструктурированных данных за счет объектного облачного хранилища. Запустили тест-драйв, проверяйте. 

Читать далее
Всего голосов 7: ↑7 и ↓0+10
Комментарии0

Все проблемы A-U-T-H и слабые пароли

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.9K
image

По данным Verizon, более 80% инцидентов взлома связаны со слабыми или украденными паролями. Защититься от несанкционированного доступа, следовать принципам Zero Trust и минимизировать вероятность таких инцидентов помогает сервис многофакторной аутентификации (MFA).

MWS запустил облачный сервис MFA — это хороший повод обсудить важные компоненты управления доступом и идентификационными данными (IAM).

Термины аутентификация и авторизация часто используют как взаимозаменяемые, что вызывает путаницу и может приводить к проблемам в ИБ. С одной стороны, в ИТ-сообществе встречается мнение о том, что терминологию стоит пересмотреть и внедрить более «прозрачные» названия процессов.

С другой стороны, участники ИБ-сообщества не видят проблемы в наименованиях и призывают сконцентрироваться на более насущных вопросах — в частности, искоренении слабых паролей. Мы решили обсудить различные предложения и точки зрения на ситуацию.
Читать дальше →
Всего голосов 12: ↑11 и ↓1+14
Комментарии4

Как рост вычислительных мощностей отражается на точности и качестве моделей

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров948
image

ИИ развивается стремительными темпами, но чем сложнее становятся технологии, тем больше усилий требуется для создания подходящей инфраструктуры. По данным TrendForce, объём поставок ИИ-серверов во втором квартале 2024 года увеличился почти на 20% по сравнению с предыдущим кварталом. Аналитики ожидают, что по сравнению с 2023 годом годовой рост может составить 41,5%. Облачные провайдеры перенаправляют бюджеты на закупку ИИ-серверов. Для сравнения, рост поставок обычных серверов составит всего 1,9%.


Один из главных способов получить доступ к передовым чипам — облако. Виртуальные GPU-серверы — эффективное решение для работы с нейронными сетями, большими данными и параллельными вычислениями. Однако необходимость сокращения издержек разработки систем ИИ становится всё более очевидной, а преимущества в решении данной задачи — фактором конкуренции в этой области.


Посмотрим, что происходит в сфере аппаратного и программного обеспечения.

Читать дальше →
Всего голосов 10: ↑9 и ↓1+9
Комментарии0

Что могут векторные СУБД — open source инструменты & облако

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров5.8K

Разработка систем искусственного интеллекта и обучение моделей подразумевает взаимодействие с огромными сводами неструктурированных данных — например, текстом и изображениями. Решать эту задачу помогают векторные БД. Они работают с так называемыми векторными представлениями (эмбеддингами), имеют продвинутые алгоритмы индексирования и особенно эффективны для реализации поиска по сходству. 

Учитывая популярность темы машинного обучения, новые векторные СУБД появляются чуть ли не каждый день. Мы сделали подборку open source решений, о которых мало рассказывали на Хабре: от крупных проектов вроде Qdrant до малоизвестных продуктов.

Векторные базы данных можно развернуть в облаке, обеспечивая мощную инфраструктуру, которая значительно улучшает управление крупномасштабными и сложными данными. На виртуальную инфраструктуру MWS сейчас действует скидка 50%.

Читать далее
Всего голосов 17: ↑16 и ↓1+23
Комментарии5
1
23 ...

Информация

Сайт
mws.ru
Дата регистрации
Дата основания
Численность
501–1 000 человек
Местоположение
Россия