Как стать автором
Обновить
78.31

Процессоры

Изучаем мозги вычислительных устройств

Сначала показывать
Порог рейтинга
Уровень сложности

Суперкомпьютер Эльбрус-3

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров15K

История Эльбрус-3

В период с 1984 по 1985 год, когда завершалась разработка первых процессоров «Эльбрус-2», команда Эльбруса под руководством Бориса Арташесовича Бабаяна приступила к предварительным работам над машинами следующего поколения. В 1985 году ИТМиВТ получил государственный заказ на проектирование и создание машины с теоретической максимальной производительностью в 10 ГФлопс. Основные требования к «Эльбрусу-3» оставались такими же, как и к «Эльбрусу-1» и «Эльбрусу-2». Особое внимание уделялось высокой производительности как в научных, так и в универсальных вычислениях, надёжности и совместимости программного обеспечения с ранними моделями «Эльбруса».

В конструкции «Эльбруса-1» и «Эльбруса-2» присутствовал ряд недостатков, которые делали их неподходящими в качестве основной машины с требуемой производительностью, необходимой в государственном применении. Помимо архитектурных ограничений в производительности, требовалось получать больше информации о выполнении программного кода и зависимостях команд и данных в момент исполнения, которая не была доступна динамическому планировщику в момент исполнения.

Планировщик мог учитывать в лучшем случае до 32 инструкции наперёд (общее количество буферных станций, содержащих инструкции и операнды или адреса операндов в каждом функциональном блоке). Часто этого было недостаточно, особенно в случае передачи условного управления (ветвления кода). Более того, динамическое планирование существенно затрудняло отладку. Невозможно было статически определить точный порядок исполнения инструкций. Вариативность в планировании одного исполнения к другому также влияли на показатели производительности. Бабаян отмечает, что ему было крайне трудно демонстрировать работу системы приёмной комиссии по причине того, что не удавалось добиться повторяемости результатов измерения производительности. По этим причинам было решено использовать конвейерные функциональные блоки и сосредоточиться на статическом планировании исполнения команд.

Читать далее

Процессор ЭВМ ЕС-1030. Особенности микропрограмм

Уровень сложностиСредний
Время на прочтение34 мин
Количество просмотров1.9K

В предпоследней статье цикла, посвящённого процессору и памяти ЭВМ ЕС-1030, говорится об известных из доступных источников особенностях микропрограмм.

Читать далее

Давайте уже на праздниках: проводим каникулы как инженер

Время на прочтение1 мин
Количество просмотров4.8K

Что делать, когда селедку под шубой уже доели, а за работу садиться еще рано?

Мы позаботилась о ваших планах на новогодние каникулы. Собрали семь инженерных дел, с которыми праздничные дни пройдут познавательно и продуктивно. Для удобного планирования подготовили чек-лист — скачивайте, переходите по ссылкам и выбирайте дело по душе.

Читать далее

Процессор ЭВМ ЕС-1030. Аппаратный контроль и диагностика

Уровень сложностиСредний
Время на прочтение34 мин
Количество просмотров1.7K

Очередная статья цикла об устройстве процессора ЭВМ ЕС-1030 рассказывает об аппаратном контроле работы ЦП, обработке ошибок и сбоев и о средствах диагностики.

Читать далее

Деление беззнаковых 8-битных чисел

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров6.4K

Деление — достаточно затратная операция. Например, на CPU Cannon Lake задержки 32-битного деления находятся в интервале 10-15 тактов, а на Zen4 — 9-14 тактов. Задержки 32-битного умножения на обоих CPU составляют 3-4 такта.

Ни в одном из популярных ISA SIMD (SSE, AVX, AVX-512, ARM Neon, ARM SVE) нет целочисленного деления, оно есть только в RISC-V Vector Extension. Однако во всех этих ISA есть деление с плавающей запятой.

В этой статье мы представим два подхода к реализации SIMD-деления 8-битных беззнаковых чисел.

Читать далее

Процессоры, видеокарты, оперативка — топовое железо 2024 года

Время на прочтение8 мин
Количество просмотров7.8K

Очередной год подходит к концу, а города украшены к празднику. Это значит, что пришла пора подводить итоги. Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В этом дайджесте собрал самые интересные новинки железа за 2024 год. Подробности под катом!
Читать дальше →

От спецификации до производства: как устроена магистратура, где студенты разрабатывают чипы

Время на прочтение15 мин
Количество просмотров5.8K

«Несколько лет в университете приносят меньше знаний, чем несколько месяцев практики в реальной компании». Этот аргумент в пользу «ненужности» высшего образования звучит все громче. Но что если результат обучения в магистратуре — не вымученный, написанный «в стол» диплом, а топология микроконтроллера, готовая к печати на фабрике? 

Несколько лет назад МИЭТ и YADRO решили заложить в основу новой магистерской программы проект, который объединит студентов, желающих стать инженерами в сфере микроэлектроники. Александр Силантьев, руководитель лаборатории НИЛ СФБ и старший преподаватель НИУ МИЭТ, лектор Школы синтеза цифровых схем, рассказал про то, как строится программа и какие обязательные этапы проходят будущие инженеры. А еще — про характеристики созданного магистрантами чипа, который скоро вернется с фабрики. 

Читать далее

Китайские чипы буксуют: Huawei снова выбирает 7-нм

Время на прочтение4 мин
Количество просмотров4.3K

Год назад Huawei и SMIC совершили прорыв, выпустив 7-нм процессор HiSilicon Kirin 9000S для смартфона Mate 60 Pro. Этот шаг стал достижением в условиях ограничений, наложенных на китайскую полупроводниковую отрасль. К сожалению, новый флагман Huawei Mate 70 Pro показывает, что дальнейший прогресс в производстве чипов в Китае замедлился. Процессор нового устройства Kirin 9020 основан на технологии 7-нм. Для смартфонов это пока не критично, ведь производительность чипа остается на хорошем уровне. Но в сегменте искусственного интеллекта отставание в техпроцессе может стать значительным препятствием для Huawei.

Читать далее

Лучшие одноплатные компьютеры: топ-5 моделей для разработки и хобби

Время на прочтение6 мин
Количество просмотров18K

Одноплатные компьютеры стали настоящей находкой для разработчиков, энтузиастов и инженеров. Эти компактные устройства способны справляться с задачами от автоматизации дома до сложных вычислений. В подборке мы собрали пять моделей, каждая из которых заслуживает внимания благодаря уникальным возможностям, производительности и ценовому диапазону. В общем, почти на любой вкус и потребности.
Читать дальше →

Процессор ЭВМ ЕС-1030. Блок обращения к оперативной памяти

Уровень сложностиСредний
Время на прочтение21 мин
Количество просмотров883

В этой статье рассматривается устройство и логика работы блока обращения к оперативной памяти процессора ЭВМ ЕС-1030.

Читать далее

Загадка потерянного инкремента

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров6.5K

Всё вроде должно быть просто

Сцена этого конкретного преступления может показаться неправдоподобной: аномалия производительности, возникающая в простейшем машинном коде. На самом деле, его даже можно назвать чрезмерно упрощённым, ведь он не выполняет никакой полезной работы. Он нужен лишь для того, чтобы продемонстрировать поведение оборудования в образовательных целях.

Но по моему опыту, чрезвычайно простой машинный код — это, на самом деле, один из самых частых источников чего-то странного. Так как мы передаём CPU ограниченное количество крайне специфичных команд без остальной части когда, то упираемся в границы того, что проектировщики оборудования ожидали встретить в реальном мире. В этой ситуации вы с большей вероятностью сможете пощупать границы микроархитектуры, чем в более стандартном сценарии.

Читать далее

ISA и другие legacy-интерфейсы в современных встраиваемых компьютерах

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров4.4K

Несмотря на постоянное увеличение скорости и пропускной способности интерфейсов передачи данных, до сих пор в некоторых областях промышленности востребованы интерфейсы, разработанные еще в 80-е годы XX века. Связано это прежде всего с тем, что к некоторым промышленные объекты и устройствам предъявляются требования по доступности и непрерывной работе в течение десятков лет после ввода в эксплуатацию.

Примерами таких шин являются: ISA (Industry Standard Architecture) и VME (Versa Module Eurocard).

Шина VME, стандартизированная в 1981 году, служит ярким примером востребованности технологий, разработанных в предыдущие годы. Основное назначение данной шины - использование в сложных системах, таких как промышленные контроллеры, системы обработки данных и встраиваемые решения. Шина VME по-прежнему используется в специализированных областях, таких как аэрокосмическая и оборонная промышленность, где требуется высокая надежность и производительность. VME дала основу для развития и появления новых современных стандартов последовательных шин, таких как VITA 46 (VPX) и VITA 65 (OpenVPX), параллельно оставаясь востребованной на рынке.

Читать далее

ЭВМ ЕС-1030. Оперативная память

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров2.4K

Продолжение цикла, посвящённого процессору ЭВМ ЕС-1030. Хотя, строго говоря, оперативная память в состав процессора не входит, её характеристики и режимы работы весьма значительно влияют на устройство и работу процессора, а поэтому заслуживают внимания.

Читать далее

Ближайшие события

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров4.2K

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

На Хабре уже тестирование Эльбрусов на разных языках программирования (например, здесь). И данный обзор стоит рассматривать как дополнение, с ещё одним тестом, новыми версиями компиляторов и новыми участниками (Rust, С++). Так же обзор сделан с упором на тест возможностей именно компиляторов и настройки оптимизации.

Читать далее

Разработка на Go, верификация, DevOps и программирование микроконтроллеров на RISC-V: выбирай бесплатный курс

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров3K

Новость для тех, кто хочет сделать начало следующего года особенным для своего развития. Второй год мы запускаем бесплатные практические курсы по востребованным инженерным направлениям. К уже классическим трекам по верификации, DevOps и Go-разработке добавился новый: «Программирование микроконтроллеров RISC-V: от основ работы с открытой архитектурой до создания собственного устройства». Регистрируйтесь на курсы до 16 января 2025 года, чтобы изучить современные подходы к разработке, создать проекты для портфолио и поработать под руководством опытных инженеров.

Читать далее

Процессор ЭВМ ЕС-1030. Блок микропрограммного управления

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров1.5K

Продолжение цикла статьей о процессоре и памяти ЭВМ ЕС-1030. В данной статье собраны доступные сведения о блоке микропрограммного управления и о долговременном запоминающем устройстве — постоянной памяти микропрограмм.

Читать далее

В чем разница между Ryzen 7 9700X и Ryzen 7 9800X3D и что лучше купить

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров9.7K

Когда речь заходит о сборке ПК, сложнее всего почему-то выбрать именно процессор. В 2024 году AMD представила две новинки, которые привлекли наибольшее внимание публики. Первый - Ryzen 7 9800X3D, а второй - Ryzen 7 9700X. Несмотря на принципиальную схожесть, эти чипы явно нацелены на разные аудитории. У одного невероятная энергоэффективность в сочетании с высокой мощностью, а у другого - колоссальный объем кэша. Осталось только понять, что брать и, главное, для чего.

Читать далее

Процессор ЭВМ ЕС-1030. Арифметико-логический блок

Уровень сложностиСредний
Время на прочтение29 мин
Количество просмотров3K

Очередная статья цикла, посвящённого процессору ЭВМ ЕС-1030 и рассказывающая об устройстве наиболее громоздкого (и, возможно, наиболее безумного по конструкции) блока этой машины.

Читать далее

Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПС

Время на прочтение12 мин
Количество просмотров2.2K

Пишем Surfgrad, высокопроизводительную библиотеку для автоматического дифференцирования выражений при помощи WebGPU.

Я работаю в компании Nomic, и многие из моих коллег заняты созданием больших TSNE-подобных визуализаций, работающих в браузере. При визуализации таких двумерных карт возникает две проблемы: проецировать эти конструкции (напр. TSNE и UMAP) в 2D-координатную систему протекает медленно и требует больших затрат оперативной памяти, особенно по мере того, как вы увеличиваете датасет и пытаетесь визуализировать в браузере миллионы точек данных, не расплавив при этом ноутбук невзначай.

Отобразить в браузере миллионы точек данных, не расплавив компьютер — та ещё задача. Мне доводилось слышать, что многие проблемы с масштабированием удаётся решать при помощи инструмента Deepscatter, разработанного Беном Шмидтом.

Но многие из таких разговоров, которые мне известны, вертятся вокруг Typescript и великолепия WebGPU как такового. Готовя эту статью, я не смог найти ни одной библиотеки для автоматического дифференцирования выражений, которая была бы написана с применением WebGPU. Но было бы упущением не назвать здесь два репозитория с функционально схожим наполнением: webGPT (библиотека на основе трансформеров, приспособлена только для логического вывода) и webgpu-blas (ядра для быстрого перемножения матриц под webGPU). Поэтому, в качестве самообразования и желая получше изучить WebGPU и Typescript, я решил написать Surfgrad, высокопроизводительную библиотеку для автоматического дифференцирования выражений под управлением WebGPU. Она обеспечивает тензорные операции в браузере. Как понятно по названию и по принципу работы, она во многом сделана по примеру tinygrad и micrograd.

Читать далее

Jintide: доступный и недорогой аналог Intel. Проверим?

Время на прочтение9 мин
Количество просмотров15K

Китайская компания Montage Technology представила новую линейку процессоров Jintide, которая имеет от 16 до 48 ядер и базируется на архитектуре x86. Если вы вдруг пропустили, этот производитель выпускает процессоры, которые по сути являются «клонами» Intel Xeon, но при этом стоят значительно дешевле.

Мы подумали, а почему бы нам не протестировать эти процессоры в сторонних серверах и найти ответы на простые вопросы:

— Можно ли взять серверы под Intel, но без процессоров — и поставить в них китайские копии, таким образом уменьшив конечную стоимость сервера, но не потеряв в функциональности и производительности?

— Действительно ли они ничем не отличаются от Intel, и если отличаются, то как это сказывается на реальной работе ОС и приложений?

Под катом расскажем об итогах тестирования и поделимся мнением, подходит ли китайское «железо» для высоких нагрузок.

Узнать результаты тестирования