Как стать автором
Обновить
36
0

Пользователь

Отправить сообщение

Эмуляция PMEM на серверах Intel

Время на прочтение6 мин
Количество просмотров8K
Постоянная память (Persistent Memory, PMEM) – это быстрая память, обладающая возможностью хранить данные после отключения питания компьютера. Нередко её называют «Non-Volatile Random Access Memory» (NVRAM) – «энергонезависимой оперативной памятью», или просто «энергонезависимой памятью». Ещё одно наименование такой памяти – NVDIMM. Оно указывает на то, что в состав постоянной памяти входят модули традиционной оперативной памяти.


Иногда мы просто не знаем, какую картинку вставить до ката. И сегодня именно такой случай. Путь будет кот :)

Исторически сложилось так, что приложения организуют данные с использованием двух уровней памяти. Первый – быстрая оперативная память, второй – сравнительно медленные накопители информации. Появление PMEM означает возникновение третьего уровня памяти, занимающего место между первым и вторым.
Читать дальше →
Всего голосов 28: ↑25 и ↓3+22
Комментарии0

OvS, DPDK и Intel HT: 12-кратное ускорение виртуального коммутатора

Время на прочтение7 мин
Количество просмотров8.2K
Сегодня расскажем об Open vSwitch, интегрированном с Data Plane Development Kit (OvS-DPDK). Это – высокопроизводительный виртуальный многоуровневый коммутатор с открытым исходным кодом, доступный по лицензии Apache 2.0. Интеграция OvS с DPDK позволяет значительно повысить скорость обработки сетевых пакетов.
image

Open vSwitch нашёл практическое применение во множестве проектов. Коммутатор поддерживает протокол OpenFlow, подходит для работы в программно-определяемых сетях (Software Defined Network, SDN). OvS можно конфигурировать с помощью протокола управления OVSDB.
Читать дальше →
Всего голосов 18: ↑18 и ↓0+18
Комментарии4

SPDK: ускорение работы с NVMe-дисками

Время на прочтение8 мин
Количество просмотров11K
SPDK (Storage Performance Developer Kit) – это набор инструментов и библиотек с открытым исходным кодом, которые призваны содействовать разработке высокопроизводительных масштабируемых приложений, ориентированных на взаимодействие с дисковыми накопителями. В этом материале мы сосредоточимся на имеющемся в SPDK NVMe-драйвере, работающем в пользовательском пространстве Linux, а также рассмотрим реализацию приложения-примера «Hello World» на платформе Intel.


Читать дальше →
Всего голосов 14: ↑14 и ↓0+14
Комментарии4

Оптимизация нейросетевой платформы Caffe для архитектуры Intel

Время на прочтение22 мин
Количество просмотров9.8K
Современные программы, претендующие на звание эффективных, должны учитывать особенности аппаратного обеспечения, на котором они будут исполняться. В частности, речь идёт о многоядерных процессорах, например, таких, как Intel Xeon и Intel Xeon Phi, о больших размерах кэш-памяти, о наборах инструкций, скажем, Intel AVX2 и Intel AVX-512, позволяющих повысить производительность вычислений.


Еле удержались, чтобы не пошутить про руссиано)

Вот, например, Caffe – популярная платформа для разработки нейронных сетей глубокого обучения. Её создали в Berkley Vision and Learning Center (BVLC), она пришлась по душе сообществу независимых разработчиков, которые вносят посильный вклад в её развитие. Платформа живёт и развивается, доказательство тому – статистика на странице проекта в GitHub. Caffe называют «быстрой открытой платформой для глубокого обучения». Можно ли ускорить такой вот «быстрый» набор инструментов? Задавшись этим вопросом, мы решили оптимизировать Caffe для архитектуры Intel.
Читать дальше →
Всего голосов 26: ↑25 и ↓1+24
Комментарии2

IoT в вендинговом бизнесе: интеллектуальный торговый автомат

Время на прочтение21 мин
Количество просмотров16K
Сегодня расскажем о том, как был создан интеллектуальный торговый автомат. Сначала, с использованием Intel IoT Developer Kit и Grove IoT Commercial Developer Kit, мы построили прототип, который, после успешных испытаний, преобразовали в решение, подходящее для практического использования. В частности, в готовом автомате использованы шлюз Intel для интернета вещей, датчики промышленного класса, Intel IoT Gateway Software Suite, Intel System Studio и облачные службы Microsoft Azure. Получившийся в итоге программно-аппаратный комплекс способен отслеживать наличие товара в автомате, вести журнал продаж, напоминать о необходимости обслуживания автомата. Шлюз собирает сведения, поступающие от датчика температуры, от шаговых двигателей, приводящих в движение спирали для выдачи товаров, и от приложения, ответственного за продажу. Данные можно анализировать на шлюзе и передавать в облако для накопления и дальнейшего исследования.


Читать дальше →
Всего голосов 22: ↑21 и ↓1+20
Комментарии16

Подключение шлюзов Intel для интернета вещей к AWS и обмен данными с облаком при помощи Node-RED или Python

Время на прочтение10 мин
Количество просмотров5.9K
Расскажем о том, как подключить шлюз Intel для интернета вещей к Amazon Web Services (AWS) и приступить к созданию приложений, рассчитанных на работу с этой платформой, с использованием Node-RED и Python. В итоге мы придём к решению, в котором шлюз будет передавать в облако данные, используя протокол MQTT.


Читать дальше →
Всего голосов 24: ↑22 и ↓2+20
Комментарии0

Машинное обучение и Intel Xeon: рекомендательная система для внутриигровых покупок Tencent

Время на прочтение5 мин
Количество просмотров7.4K
В наши дни онлайн-игры весьма популярны, особенно среди молодёжи. Играми занимают свободное время, нередко виртуальными соратниками или врагами становятся члены семей или друзья. Во многих случаях игрокам нужно что-либо покупать для того, чтобы улучшить своего персонажа и получить преимущество перед другими геймерами.


— Лошадью ходи, век воли не видать!

Для того, чтобы усовершенствовать способы взаимодействия с пользователями, Tencent внедрила рекомендательную систему. Эта система построена на основе методов машинного обучения и призвана помогать пользователям принимать решения о внутриигровых покупках.
Читать дальше →
Всего голосов 18: ↑18 и ↓0+18
Комментарии3

Просто, мощно, навсегда. Элекард CodecWorks 990 — программный лайв транскодер для AVC и HEVC

Время на прочтение8 мин
Количество просмотров13K


В прошлой статье мы рассмотрели, как работает аппаратное ускорение кодирования и декодирования видео Quick Sync Video (QSV) в процессорах 6-го поколения Skylake. Маленький участок SoC специально выделили для размещения специализированных интегральных схем, которые занимаются только обработкой видео. Воспроизведение видео с аппаратной поддержкой стало гораздо меньше отнимать ресурсов у других задач в ОС, меньше нагревать CPU и потреблять меньше электроэнергии. Благодаря QSV, например, ноутбук MacBook Air воспроизводит более 10 часов видео на одном заряде аккумулятора.
Читать дальше →
Всего голосов 31: ↑28 и ↓3+25
Комментарии1

IoT-решение для транспорта: путь от идеи к производству

Время на прочтение9 мин
Количество просмотров8.7K
Сегодня расскажем о быстрой разработке IoT-системы, которая предназначена для грузовиков-рефрижераторов. Она помогает наблюдать за температурой в холодильной камере и за дверями грузового отсека.

Работа над проектом разделена на два этапа. Сначала, с использованием Grove IoT Commercial Development Kit, создан прототип, который позволил подтвердить работоспособность системы. После этого прототип был преобразован в решение, пригодное для практического использования.


Читать дальше →
Всего голосов 39: ↑33 и ↓6+27
Комментарии3

Intel значит побеждать: захват игромира прошёл успешно

Время на прочтение8 мин
Количество просмотров18K
Выставки Игромир в Крокус-экспо уже давно стали осенней классикой для Москвичей. Вендоры и студии готовятся к этому событию за несколько месяцев, на само мероприятие приезжают из других городов и даже стран, и каждый раз говорят, что «в прошлом году было лучше». Впрочем, у людей всегда раньше было лучше, а киборгов у нас тут, вроде, пока нет среди читателей.



Разумеется, компания Intel была также представлена на Игромире. Пройти мимо огромной пирамиды с игровыми ПК и ярко-синих декораций было сложно. И, поверьте, там было на что посмотреть. Но для Intel была важена не только своя площадка, и на то есть несколько причин…
Читать дальше →
Всего голосов 25: ↑21 и ↓4+17
Комментарии39

96 вычислительных ядер и оптимизация кода муравьиного алгоритма поиска маршрутов

Время на прочтение10 мин
Количество просмотров17K
Сегодня поговорим об оптимизации кода, который реализует муравьиный алгоритм нахождения оптимальных путей на графах. Узкие места в программе будем искать с помощью Intel VTune Amplifier XE 2016 Update 2, а оптимизировать с использованием MPI, OpenMP и библиотеки Intel Threading Building Blocks.



Наша цель заключается в том, чтобы добиться эффективной работы программы на компьютере с четырьмя процессорами Intel Xeon E7-8890 v4. Система оснащена 512 Гб оперативной памяти, на ней установлена Linux 3.10.0-327.el7.x86_64, код компилировался с помощью Intel Parallel Studio XE 2016 U2.
Читать дальше →
Всего голосов 50: ↑49 и ↓1+48
Комментарии11

VP8, VP9 и H265. Аппаратное ускорение кодирования и декодирования видео в процессорах 6-го поколения Skylake

Время на прочтение9 мин
Количество просмотров66K
Более шести лет назад 13 сентября 2010 года на форуме IDF компания Intel представила микроархитектуру процессоров Sandy Bridge — второго поколения процессоров Intel Core. Процессор и графическое ядро объединили на одном кристалле, а само графическое ядро значительно обновилось и увеличило тактовую частоту. Именно в Sandy Bridge появилось «секретное оружие» — технология Intel Quick Sync Video (QSV) для аппаратного ускорения кодирования и декодирования видео. Маленький участок SoC специально выделили для размещения специализированных интегральных схем, которые занимаются только видео. Это был настоящий аппаратный транскодер.


Встроенная графика 9-го поколения HD Graphics 530 в процессоре Intel Core i7 6700K с 24 блоками выполнения команд (EU), организованными в три фрагмента по 8 блоков.
Читать дальше →
Всего голосов 32: ↑32 и ↓0+32
Комментарии34

Двойная скорость и половина памяти: оптимизация PHP 7

Время на прочтение13 мин
Количество просмотров22K
Ключ к высокой производительности приложений – оптимизация. При этом, чем ниже уровень, на котором код подстраивают под особенности аппаратного обеспечения – тем большего можно добиться. А ещё более впечатляющих результатов можно достичь тогда, когда при проектировании аппаратного обеспечения учитываются особенности кода. Сегодня мы расскажем о том, как идёт работа над ускорением PHP 7, которую совместно, практически непрерывно, ведут Intel и сообщество PHP-разработчиков.


Читать дальше →
Всего голосов 42: ↑39 и ↓3+36
Комментарии2

Инструменты Intel для оптимизации приложений и задача о течениях в пористых средах

Время на прочтение31 мин
Количество просмотров12K
Современные компьютерные системы, от обычного ноутбука до вычислительного кластера, рассчитаны на параллельную обработку данных. Поэтому, чем полнее программы задействуют эту возможность, тем больше у них шансов раскрыть потенциал существующих аппаратных решений. Однако, прежде чем переходить к параллельной схеме исполнения кода, этот код должен максимально эффективно работать в однопоточном режиме. Иначе увеличение числа потоков не даст ожидаемого роста производительности.

Оптимизации, которые влияют на скорость вычислений при использовании любого числа потоков, сводятся к учёту в коде особенностей процессорных архитектур, наборов инструкций, к поиску наиболее рациональных способов работы с разными видами памяти. Помощь в подобной оптимизации способен оказать, например, подход к исследованию производительности методом «сверху вниз» с использованием низкоуровневых данных о системных событиях, которые преобразуются в доступные для анализа и практического применения высокоуровневые показатели.



Здесь мы рассмотрим методику оптимизации вычислений, связанных с моделированием течений многофазных жидкостей в пористых средах по методике, предложенной в этой работе. Речь идёт о численном методе решения дифференциальных уравнений гиперболического типа в частных производных.
Читать дальше →
Всего голосов 40: ↑39 и ↓1+38
Комментарии11

Ускоряем трафаретные вычисления: сборка и запуск YASK на процессорах Intel

Время на прочтение6 мин
Количество просмотров3.8K
Трафаретные вычисления нашли широкое применение в научных и технических приложениях. Их используют для решения дифференциальных уравнений методом конечных разностей, в задачах вычислительной механики.

Высокопроизводительные вычисления (HPC, High Performance Computing), идёт ли речь о суперкомпьютере, или о системе, построенной на одном-двух многоядерных процессорах – это вычисления параллельные. Если алгоритм поддаётся разбивке на блоки, которые можно обрабатывать одновременно, это значит, что он способен будет эффективно исполняться в параллельной среде. Но не только это важно: не стоит забывать об оптимизации кода, учитывающей, кроме прочего, особенности работы с данными на уровне отдельных видов памяти, доступной процессорам. В частности, речь идёт об эффективной работе с кэш-памятью.



При прочих равных условиях, распараллеленный алгоритм, который лучше всего учитывает особенности кэш-памяти, будет работать быстрее других. И, естественно, если говорить о скорости вычислений, то код, который наиболее полно использует возможности конкретной платформы, на уровне инструкций и архитектуры процессора, окажется в выигрыше. Существуют специализированные программные пакеты для подготовки такого кода. Один из них – YASK.
Читать дальше →
Всего голосов 15: ↑15 и ↓0+15
Комментарии1

Идёт? Бежит? Поднимается по лестнице? Intel Edison знает ответ

Время на прочтение5 мин
Количество просмотров5.8K
Сегодня мы расскажем о проекте, нацеленном на распознавание некоторых видов физической активности человека. Делается это с помощью платы Intel Edison, к которой подключён акселерометр ADXL345.


Данные о том, чем именно занят пользователь, способны найти множество применений. Особенно это касается сферы носимой электроники. Например, в среде здравоохранения такие сведения можно использовать для наблюдения за пациентами, в спорте – для анализа особенностей выполнения упражнений и фитнес-трекинга.

В нашем проекте для анализа данных акселерометра используется метод опорных векторов (Support Vector Machine, SVM). Программная часть реализована с применением популярной библиотеки LIBSVM. Код написан в двух вариантах: на Python и Node.js.
Читать дальше →
Всего голосов 26: ↑22 и ↓4+18
Комментарии0

IoT-проект для умного дома: строим прототип

Время на прочтение10 мин
Количество просмотров18K
Недавно мы рассказывали о подходе к работе над IoT-проектами. В прошлый раз нас больше всего интересовала методика, этапы превращения идеи сначала в прототип, а потом – в продукт, готовый к производству. Сегодня предлагаем углубиться в технические детали. А именно –поговорим о том, как создать функциональный прототип умного дома.



В проекте задействован Intel IoT Commercial Development Kit, компьютер малого форм-фактора Intel NUC Kit DE3815TYKHE, плата Arduino 101 и некоторые дополнительные компоненты. Освоив этот материал, вы cможете сделать то же самое, что получилось у нас, даже если ваш опыт создания IoT-решений невелик.

Вот, что вы узнаете, освоив это руководство:
Читать дальше →
Всего голосов 18: ↑15 и ↓3+12
Комментарии19

Шаблоны взаимодействия для интернета вещей

Время на прочтение11 мин
Количество просмотров13K
Прежде чем начать новый IoT-проект, стоит поразмыслить о том, какие шаблоны обмена информацией наилучшим образом для него подойдут. На самом деле, принять это решение следует как можно раньше, ещё до того, как выбраны протоколы, способы связи и вспомогательная инфраструктура разрабатываемой системы. В основе этой рекомендации лежит одна простая причина: не приняв подобное решение в самом начале, разработчик, по мере развития проекта, рискует сам себя загнать в угол, выбраться из которого можно будет лишь серьёзно переработав код, архитектуру, модель безопасности решения, и то, как оно взаимодействует с внешним миром.


Сегодня мы рассмотрим одиннадцать шаблонов взаимодействия в IoT-системах.
Читать дальше →
Всего голосов 25: ↑22 и ↓3+19
Комментарии4

Подключаем устройства Intel для интернета вещей к Microsoft Azure IoT Suite

Время на прочтение9 мин
Количество просмотров8K
Если подключить устройства для IoT, основанные на микроконтроллерах Intel, к PAAS-решению Microsoft Azure IoT Suite, получится среда для реализации бесчисленного множества проектов в области интернета вещей. Сегодня мы расскажем об особенностях Azure IoT Suite и поговорим о том, как связывать с этим набором облачных служб Intel Edison, Intel Curie и шлюзы от Intel.


Читать дальше →
Всего голосов 29: ↑28 и ↓1+27
Комментарии1

Intel Joule: подробности

Время на прочтение5 мин
Количество просмотров21K
Что общего у японского робота-бармена, который умеет поддерживать осмысленный диалог с человеком, и защитных очков для компании Airbus, которые оберегают не только глаза работника от опасных предметов, но и самолёт, который он собирает, от ошибок?

Если ответить сложно, то вот подсказка. Общее у них то же самое, что у французского полицейского мотоциклетного шлема, который распознаёт номера на транспорте и показывает тому, кто его носит, полезные сведения, и у электронной панды Bamboo от Microsoft, которая знает уйму иностранных языков и умеет анализировать эмоциональную окраску высказываний.

Полагаем, многие уже догадались: всё это создано с использованием вычислительной платформы для интернета вещей Intel Joule. Её, 16 августа, представил на IDF 2016 в Сан-Франциско CEO Intel Брайан Кржанич.
Читать дальше →
Всего голосов 27: ↑26 и ↓1+25
Комментарии31

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность