Pull to refresh
37
0
Send message

Эмуляция PMEM на серверах Intel

Reading time6 min
Reach and readers8.5K
Постоянная память (Persistent Memory, PMEM) – это быстрая память, обладающая возможностью хранить данные после отключения питания компьютера. Нередко её называют «Non-Volatile Random Access Memory» (NVRAM) – «энергонезависимой оперативной памятью», или просто «энергонезависимой памятью». Ещё одно наименование такой памяти – NVDIMM. Оно указывает на то, что в состав постоянной памяти входят модули традиционной оперативной памяти.


Иногда мы просто не знаем, какую картинку вставить до ката. И сегодня именно такой случай. Путь будет кот :)

Исторически сложилось так, что приложения организуют данные с использованием двух уровней памяти. Первый – быстрая оперативная память, второй – сравнительно медленные накопители информации. Появление PMEM означает возникновение третьего уровня памяти, занимающего место между первым и вторым.
Читать дальше →

OvS, DPDK и Intel HT: 12-кратное ускорение виртуального коммутатора

Reading time7 min
Reach and readers9.2K
Сегодня расскажем об Open vSwitch, интегрированном с Data Plane Development Kit (OvS-DPDK). Это – высокопроизводительный виртуальный многоуровневый коммутатор с открытым исходным кодом, доступный по лицензии Apache 2.0. Интеграция OvS с DPDK позволяет значительно повысить скорость обработки сетевых пакетов.
image

Open vSwitch нашёл практическое применение во множестве проектов. Коммутатор поддерживает протокол OpenFlow, подходит для работы в программно-определяемых сетях (Software Defined Network, SDN). OvS можно конфигурировать с помощью протокола управления OVSDB.
Читать дальше →

SPDK: ускорение работы с NVMe-дисками

Reading time8 min
Reach and readers13K
SPDK (Storage Performance Developer Kit) – это набор инструментов и библиотек с открытым исходным кодом, которые призваны содействовать разработке высокопроизводительных масштабируемых приложений, ориентированных на взаимодействие с дисковыми накопителями. В этом материале мы сосредоточимся на имеющемся в SPDK NVMe-драйвере, работающем в пользовательском пространстве Linux, а также рассмотрим реализацию приложения-примера «Hello World» на платформе Intel.


Читать дальше →

Оптимизация нейросетевой платформы Caffe для архитектуры Intel

Reading time22 min
Reach and readers10K
Современные программы, претендующие на звание эффективных, должны учитывать особенности аппаратного обеспечения, на котором они будут исполняться. В частности, речь идёт о многоядерных процессорах, например, таких, как Intel Xeon и Intel Xeon Phi, о больших размерах кэш-памяти, о наборах инструкций, скажем, Intel AVX2 и Intel AVX-512, позволяющих повысить производительность вычислений.


Еле удержались, чтобы не пошутить про руссиано)

Вот, например, Caffe – популярная платформа для разработки нейронных сетей глубокого обучения. Её создали в Berkley Vision and Learning Center (BVLC), она пришлась по душе сообществу независимых разработчиков, которые вносят посильный вклад в её развитие. Платформа живёт и развивается, доказательство тому – статистика на странице проекта в GitHub. Caffe называют «быстрой открытой платформой для глубокого обучения». Можно ли ускорить такой вот «быстрый» набор инструментов? Задавшись этим вопросом, мы решили оптимизировать Caffe для архитектуры Intel.
Читать дальше →

IoT в вендинговом бизнесе: интеллектуальный торговый автомат

Reading time21 min
Reach and readers18K
Сегодня расскажем о том, как был создан интеллектуальный торговый автомат. Сначала, с использованием Intel IoT Developer Kit и Grove IoT Commercial Developer Kit, мы построили прототип, который, после успешных испытаний, преобразовали в решение, подходящее для практического использования. В частности, в готовом автомате использованы шлюз Intel для интернета вещей, датчики промышленного класса, Intel IoT Gateway Software Suite, Intel System Studio и облачные службы Microsoft Azure. Получившийся в итоге программно-аппаратный комплекс способен отслеживать наличие товара в автомате, вести журнал продаж, напоминать о необходимости обслуживания автомата. Шлюз собирает сведения, поступающие от датчика температуры, от шаговых двигателей, приводящих в движение спирали для выдачи товаров, и от приложения, ответственного за продажу. Данные можно анализировать на шлюзе и передавать в облако для накопления и дальнейшего исследования.


Читать дальше →

Подключение шлюзов Intel для интернета вещей к AWS и обмен данными с облаком при помощи Node-RED или Python

Reading time10 min
Reach and readers6.1K
Расскажем о том, как подключить шлюз Intel для интернета вещей к Amazon Web Services (AWS) и приступить к созданию приложений, рассчитанных на работу с этой платформой, с использованием Node-RED и Python. В итоге мы придём к решению, в котором шлюз будет передавать в облако данные, используя протокол MQTT.


Читать дальше →

Машинное обучение и Intel Xeon: рекомендательная система для внутриигровых покупок Tencent

Reading time5 min
Reach and readers7.8K
В наши дни онлайн-игры весьма популярны, особенно среди молодёжи. Играми занимают свободное время, нередко виртуальными соратниками или врагами становятся члены семей или друзья. Во многих случаях игрокам нужно что-либо покупать для того, чтобы улучшить своего персонажа и получить преимущество перед другими геймерами.


— Лошадью ходи, век воли не видать!

Для того, чтобы усовершенствовать способы взаимодействия с пользователями, Tencent внедрила рекомендательную систему. Эта система построена на основе методов машинного обучения и призвана помогать пользователям принимать решения о внутриигровых покупках.
Читать дальше →

Просто, мощно, навсегда. Элекард CodecWorks 990 — программный лайв транскодер для AVC и HEVC

Reading time8 min
Reach and readers14K


В прошлой статье мы рассмотрели, как работает аппаратное ускорение кодирования и декодирования видео Quick Sync Video (QSV) в процессорах 6-го поколения Skylake. Маленький участок SoC специально выделили для размещения специализированных интегральных схем, которые занимаются только обработкой видео. Воспроизведение видео с аппаратной поддержкой стало гораздо меньше отнимать ресурсов у других задач в ОС, меньше нагревать CPU и потреблять меньше электроэнергии. Благодаря QSV, например, ноутбук MacBook Air воспроизводит более 10 часов видео на одном заряде аккумулятора.
Читать дальше →

IoT-решение для транспорта: путь от идеи к производству

Reading time9 min
Reach and readers9K
Сегодня расскажем о быстрой разработке IoT-системы, которая предназначена для грузовиков-рефрижераторов. Она помогает наблюдать за температурой в холодильной камере и за дверями грузового отсека.

Работа над проектом разделена на два этапа. Сначала, с использованием Grove IoT Commercial Development Kit, создан прототип, который позволил подтвердить работоспособность системы. После этого прототип был преобразован в решение, пригодное для практического использования.


Читать дальше →

Intel значит побеждать: захват игромира прошёл успешно

Reading time8 min
Reach and readers18K
Выставки Игромир в Крокус-экспо уже давно стали осенней классикой для Москвичей. Вендоры и студии готовятся к этому событию за несколько месяцев, на само мероприятие приезжают из других городов и даже стран, и каждый раз говорят, что «в прошлом году было лучше». Впрочем, у людей всегда раньше было лучше, а киборгов у нас тут, вроде, пока нет среди читателей.



Разумеется, компания Intel была также представлена на Игромире. Пройти мимо огромной пирамиды с игровыми ПК и ярко-синих декораций было сложно. И, поверьте, там было на что посмотреть. Но для Intel была важена не только своя площадка, и на то есть несколько причин…
Читать дальше →

96 вычислительных ядер и оптимизация кода муравьиного алгоритма поиска маршрутов

Reading time10 min
Reach and readers18K
Сегодня поговорим об оптимизации кода, который реализует муравьиный алгоритм нахождения оптимальных путей на графах. Узкие места в программе будем искать с помощью Intel VTune Amplifier XE 2016 Update 2, а оптимизировать с использованием MPI, OpenMP и библиотеки Intel Threading Building Blocks.



Наша цель заключается в том, чтобы добиться эффективной работы программы на компьютере с четырьмя процессорами Intel Xeon E7-8890 v4. Система оснащена 512 Гб оперативной памяти, на ней установлена Linux 3.10.0-327.el7.x86_64, код компилировался с помощью Intel Parallel Studio XE 2016 U2.
Читать дальше →

VP8, VP9 и H265. Аппаратное ускорение кодирования и декодирования видео в процессорах 6-го поколения Skylake

Reading time9 min
Reach and readers71K
Более шести лет назад 13 сентября 2010 года на форуме IDF компания Intel представила микроархитектуру процессоров Sandy Bridge — второго поколения процессоров Intel Core. Процессор и графическое ядро объединили на одном кристалле, а само графическое ядро значительно обновилось и увеличило тактовую частоту. Именно в Sandy Bridge появилось «секретное оружие» — технология Intel Quick Sync Video (QSV) для аппаратного ускорения кодирования и декодирования видео. Маленький участок SoC специально выделили для размещения специализированных интегральных схем, которые занимаются только видео. Это был настоящий аппаратный транскодер.


Встроенная графика 9-го поколения HD Graphics 530 в процессоре Intel Core i7 6700K с 24 блоками выполнения команд (EU), организованными в три фрагмента по 8 блоков.
Читать дальше →

Двойная скорость и половина памяти: оптимизация PHP 7

Reading time13 min
Reach and readers22K
Ключ к высокой производительности приложений – оптимизация. При этом, чем ниже уровень, на котором код подстраивают под особенности аппаратного обеспечения – тем большего можно добиться. А ещё более впечатляющих результатов можно достичь тогда, когда при проектировании аппаратного обеспечения учитываются особенности кода. Сегодня мы расскажем о том, как идёт работа над ускорением PHP 7, которую совместно, практически непрерывно, ведут Intel и сообщество PHP-разработчиков.


Читать дальше →

Инструменты Intel для оптимизации приложений и задача о течениях в пористых средах

Reading time31 min
Reach and readers13K
Современные компьютерные системы, от обычного ноутбука до вычислительного кластера, рассчитаны на параллельную обработку данных. Поэтому, чем полнее программы задействуют эту возможность, тем больше у них шансов раскрыть потенциал существующих аппаратных решений. Однако, прежде чем переходить к параллельной схеме исполнения кода, этот код должен максимально эффективно работать в однопоточном режиме. Иначе увеличение числа потоков не даст ожидаемого роста производительности.

Оптимизации, которые влияют на скорость вычислений при использовании любого числа потоков, сводятся к учёту в коде особенностей процессорных архитектур, наборов инструкций, к поиску наиболее рациональных способов работы с разными видами памяти. Помощь в подобной оптимизации способен оказать, например, подход к исследованию производительности методом «сверху вниз» с использованием низкоуровневых данных о системных событиях, которые преобразуются в доступные для анализа и практического применения высокоуровневые показатели.



Здесь мы рассмотрим методику оптимизации вычислений, связанных с моделированием течений многофазных жидкостей в пористых средах по методике, предложенной в этой работе. Речь идёт о численном методе решения дифференциальных уравнений гиперболического типа в частных производных.
Читать дальше →

Ускоряем трафаретные вычисления: сборка и запуск YASK на процессорах Intel

Reading time6 min
Reach and readers4.1K
Трафаретные вычисления нашли широкое применение в научных и технических приложениях. Их используют для решения дифференциальных уравнений методом конечных разностей, в задачах вычислительной механики.

Высокопроизводительные вычисления (HPC, High Performance Computing), идёт ли речь о суперкомпьютере, или о системе, построенной на одном-двух многоядерных процессорах – это вычисления параллельные. Если алгоритм поддаётся разбивке на блоки, которые можно обрабатывать одновременно, это значит, что он способен будет эффективно исполняться в параллельной среде. Но не только это важно: не стоит забывать об оптимизации кода, учитывающей, кроме прочего, особенности работы с данными на уровне отдельных видов памяти, доступной процессорам. В частности, речь идёт об эффективной работе с кэш-памятью.



При прочих равных условиях, распараллеленный алгоритм, который лучше всего учитывает особенности кэш-памяти, будет работать быстрее других. И, естественно, если говорить о скорости вычислений, то код, который наиболее полно использует возможности конкретной платформы, на уровне инструкций и архитектуры процессора, окажется в выигрыше. Существуют специализированные программные пакеты для подготовки такого кода. Один из них – YASK.
Читать дальше →

Идёт? Бежит? Поднимается по лестнице? Intel Edison знает ответ

Reading time5 min
Reach and readers6K
Сегодня мы расскажем о проекте, нацеленном на распознавание некоторых видов физической активности человека. Делается это с помощью платы Intel Edison, к которой подключён акселерометр ADXL345.


Данные о том, чем именно занят пользователь, способны найти множество применений. Особенно это касается сферы носимой электроники. Например, в среде здравоохранения такие сведения можно использовать для наблюдения за пациентами, в спорте – для анализа особенностей выполнения упражнений и фитнес-трекинга.

В нашем проекте для анализа данных акселерометра используется метод опорных векторов (Support Vector Machine, SVM). Программная часть реализована с применением популярной библиотеки LIBSVM. Код написан в двух вариантах: на Python и Node.js.
Читать дальше →

IoT-проект для умного дома: строим прототип

Reading time10 min
Reach and readers19K
Недавно мы рассказывали о подходе к работе над IoT-проектами. В прошлый раз нас больше всего интересовала методика, этапы превращения идеи сначала в прототип, а потом – в продукт, готовый к производству. Сегодня предлагаем углубиться в технические детали. А именно –поговорим о том, как создать функциональный прототип умного дома.



В проекте задействован Intel IoT Commercial Development Kit, компьютер малого форм-фактора Intel NUC Kit DE3815TYKHE, плата Arduino 101 и некоторые дополнительные компоненты. Освоив этот материал, вы cможете сделать то же самое, что получилось у нас, даже если ваш опыт создания IoT-решений невелик.

Вот, что вы узнаете, освоив это руководство:
Читать дальше →

Шаблоны взаимодействия для интернета вещей

Reading time11 min
Reach and readers14K
Прежде чем начать новый IoT-проект, стоит поразмыслить о том, какие шаблоны обмена информацией наилучшим образом для него подойдут. На самом деле, принять это решение следует как можно раньше, ещё до того, как выбраны протоколы, способы связи и вспомогательная инфраструктура разрабатываемой системы. В основе этой рекомендации лежит одна простая причина: не приняв подобное решение в самом начале, разработчик, по мере развития проекта, рискует сам себя загнать в угол, выбраться из которого можно будет лишь серьёзно переработав код, архитектуру, модель безопасности решения, и то, как оно взаимодействует с внешним миром.


Сегодня мы рассмотрим одиннадцать шаблонов взаимодействия в IoT-системах.
Читать дальше →

Подключаем устройства Intel для интернета вещей к Microsoft Azure IoT Suite

Reading time9 min
Reach and readers8.2K
Если подключить устройства для IoT, основанные на микроконтроллерах Intel, к PAAS-решению Microsoft Azure IoT Suite, получится среда для реализации бесчисленного множества проектов в области интернета вещей. Сегодня мы расскажем об особенностях Azure IoT Suite и поговорим о том, как связывать с этим набором облачных служб Intel Edison, Intel Curie и шлюзы от Intel.


Читать дальше →

Intel Joule: подробности

Reading time5 min
Reach and readers22K
Что общего у японского робота-бармена, который умеет поддерживать осмысленный диалог с человеком, и защитных очков для компании Airbus, которые оберегают не только глаза работника от опасных предметов, но и самолёт, который он собирает, от ошибок?

Если ответить сложно, то вот подсказка. Общее у них то же самое, что у французского полицейского мотоциклетного шлема, который распознаёт номера на транспорте и показывает тому, кто его носит, полезные сведения, и у электронной панды Bamboo от Microsoft, которая знает уйму иностранных языков и умеет анализировать эмоциональную окраску высказываний.

Полагаем, многие уже догадались: всё это создано с использованием вычислительной платформы для интернета вещей Intel Joule. Её, 16 августа, представил на IDF 2016 в Сан-Франциско CEO Intel Брайан Кржанич.
Читать дальше →

Information

Rating
Does not participate
Registered
Activity