Обновить
128K+

Процессоры

Изучаем мозги вычислительных устройств

146,48
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Каталог из 83 форматов с плавающей точкой, который сам себя проверяет

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели6.5K

Если вы ловили расхождение точности между двумя реализациями одной сети, то знаете это чувство: один matmul на двух устройствах даёт разные числа, и непонятно — это баг, bf16 округлил или формат не тот. Две команды меряют один результат разными линейками.

Я сделал одну линейку с точными насечками: машинно-проверяемый каталог из 83 числовых форматов в 13 кластерах. Для каждого — разрядка битов, смещение, кодирование inf/NaN/субнормалей и общий якорь проверки 0x47C0. Из одного источника истины генерируются Markdown, JSON, Python, Rust, C и RTL для кремния.

У каждого формата стоит метка зрелости: 51 Verified, 12 Historical, 11 Experimental, 9 Open. И отдельная ось — граница RTL: где правило e = round((N−1)/φ²) ещё работающее железо (GF16 доведён до кремния), а где уже гипотеза (GF512/GF1024 — экстраполяция без строки Verilog). Внутри — лестница зрелости форматов, связь с IEEE P3109 и реальный баг в умножителе, который нашли только потому, что под форматом есть железо.

Как устроена линейка

Новости

От золотого сечения до троичности Брусенцова: одно семейство числовых форматов от 2 до 1024 бит

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели6.8K

Почему bfloat16 стал стандартом для обучения нейросетей? Не потому, что он оптимален как число, — а потому что под него десять лет затачивали GPU и TPU. Снимаем этот эффект железа и смотрим на числа честно.

В статье: семейство форматов GoldenFloat (GF4, GF8, GF16, GF32, GF64, GF1024) с основанием φ = (1+√5)/2; метрика «бит на значение» (GF16 = 2.5725 обходит bf16 = 2.6135 на одном корпусе); и неожиданный мост к троичной машине «Сетунь» Н. П. Брусенцова — три состояния −1/0/+1 как предельная точка той же φ-лестницы.

Без обещаний золотых гор: что измерено — измерено, что только спека — помечено.

Читать про φ-форматы

Российский микроконтроллерный блок управления судовыми преобразователями частоты. Часть 2

Уровень сложностиСложный
Время на прочтение15 мин
Охват и читатели17K

Статья посвящена микроконтроллерным системам управления преобразователями частоты для электродвигателей переменного тока. Рассматриваются различные варианты структуры и конструкции систем управления преобразователями частоты. Приводится техническое описание российского микроконтроллерного блока управления БУПЧ, который входит в состав преобразователей частоты для судовых систем электродвижения концерна «Русэлпром»: его состав, устройство, технические характеристики, преимущества и недостатки по сравнению с западными аналогами. Рассматривается сервисное программное обеспечение, которое существенно сокращает время тестирования и отладки основного программного обеспечения для БУПЧ, уменьшает вероятность ошибок в нем, способных привести к аварийным ситуациям, позволяет проверить правильность работы БУПЧ и преобразователя частоты, а при возникновении ошибок – быстро определить их причины.

Статья предназначена главным образом для специалистов в области микроконтроллерного управления электродвигателями, но может быть полезна всем, интересующимся микропроцессорной и преобразовательной техникой, а также электроприводом.

Вторая часть статьи

RICE, ICE, MoSCoW: когда фреймворк приоритизации вас топит

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели12K

Когда я пришёл в Instameal, у нас был бэклог на сорок задач и ни одного чёткого критерия почему одно важнее другого.

Мы попробовали RICE. Потом ICE. Потом MoSCoW. Потом снова RICE с другими весами.

Проблема была не в том, что мы выбирали неправильный фреймворк. Проблема была в том, что мы думали: выберем правильный инструмент - и приоритеты выстроятся сами.

Не выстроятся.

Что такое каждый из трёх

RICE: Reach (охват) × Impact (влияние) × Confidence (уверенность) / Effort (усилия). Даёт цифру. Чем выше - тем выше приоритет.

ICE: Impact × Confidence × Ease. Проще, быстрее считается. Используется в growth-командах для быстрой оценки экспериментов.

MoSCoW: Must have / Should have / Could have / Won't have. Не числа, а категории. Используется для определения скоупа: что точно идёт в релиз, что - нет.

На бумаге выглядит логично. На практике каждый из них создаёт свою специфическую проблему.

Когда RICE вас топит

RICE создаёт иллюзию объективности.

Вы получаете число: 84.6. Задача с числом 84.6 важнее задачи с числом 71.2. Кажется, что это данные. На самом деле это ваши субъективные оценки, умноженные друг на друга и поделённые на другую субъективную оценку.

Confidence 80% - откуда? Reach 500 пользователей в месяц - это предположение или из аналитики? Impact «3» - кто решил что именно три?

В Instameal мы однажды потратили два часа на заполнение RICE-таблицы для восьми задач. В конце получили список. Топ-3 задачи в списке совпали ровно с тем, что интуитивно предлагал лид разработки до всего этого упражнения.

Читать далее

Мейнфрейм 1960-х в браузере: как работает IBM System/360 на микрокоде

Уровень сложностиСложный
Время на прочтение20 мин
Охват и читатели11K

IBM System/360 выглядит как музейная машина с лампами, тумблерами и памятью на магнитных сердечниках, но внутри это сложная инженерная система с микрокодом, каналами ввода-вывода и десятками скрытых регистров. Симулятор Model 50 позволяет пройти ниже уровня ассемблера и увидеть, как одна машинная команда раскладывается на микрокоманды, управляющие реальным аппаратным устройством.

Разобрать микрокод

Поддержка AM5 до 2029 года, но есть ли в этом смысл

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6.5K

Несколько дней назад мы разбирали, почему AMD продлила поддержку AM5 до 2029 года и почему это скорее аккуратный маркетинговый ход, чем настоящая забота о пользователях. Тогда в конце остался главный вопрос: а заведется ли новый Ryzen именно на вашей плате? Потому что 2029 год это красивая дата, но сама по себе она только про сокет в целом. А вот про конкретные материнки в ней нет ни слова, хотя это важный нюанс, поэтому разберем его подробно и по-человечески.

Читать далее

Принцип Ландауэра — сколько весит один бит информации и почему стирание памяти греет Вселенную

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели17K

Компьютеры греются. Это знает каждый, кто хоть раз держал ноутбук на коленях час-другой. Виноваты несовершенство кремния, сопротивление проводников, паразитные токи. Уберешь все дефекты - и вычисления станут бесплатными. Ага.

Вот только это неправда. Даже абсолютно идеальный процессор, без единого недостатка в конструкции, обязан выделять тепло. 

Но что, если…

Читать далее

SI/PI в разработке электронных устройств: анализ, который сэкономит вам время, деньги и нервы

Время на прочтение10 мин
Охват и читатели12K

Привет, Хабр! Меня зовут Алексей, я старший инженер в отделе моделирования физических процессов в YADRO. Вот уже четвертый год я помогаю печатным узлам стать лучше, технологичнее и стабильнее — об этом расскажу дальше. Но основной темой статьи будет анализ целостности сигналов (Signal Integrity, SI) и питания (Power Integrity, PI) в разработке современных электронных устройств. Этот этап часто недооценивают на практике, а в результате компания может столкнуться с лишними финансовыми затратами на доработку КД и повторное производство доработанных модулей и с переносом срока выпуска итогового продукта. 

Давайте разбираться, как работает анализ, зачем нужны SI/PI-инженеры и какую роль они играют в процессе разработки. Статья будет интересна инженерам-схемотехникам, топологам и руководителям проектов по разработке печатных плат: сможете оценить, насколько моделирование важно для вашего проекта.

Читать далее

Zynq 7000. Переносим I²C Master Controller.  Linux + buildroot + kernel driver

Уровень сложностиСредний
Время на прочтение131 мин
Охват и читатели11K

Теперь пора переносить проект под управление ОС Linux. В этой статье мы подробно вопросы разберем как пройти весь путь от FSBL до вывода системной консоли на OLED SSD1306. Для этого нам потребуется собрать все необходимые загрузочные артефакты: FSBL c отладкой для информативной загрузки, DTS, out-of-tree драйвер для I2C Controller, ядро и rootfs, соберем uImage, потом слепим BOOT.BIN и загрузим его на SD-карту.

В общем, всем интересующимся добро пожаловать под кат!

Читать далее

К1921ВГ015: Как инженеры компании “Чистое небо” реализуют авионику БПЛА на российских RISC-V микроконтроллерах

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели11K

Беспилотная авиация сильно зависит не только от двигателей, корпусов и аккумуляторов. Внутри любого БпЛА есть более компактный, но критически важный уровень - авионика, полетные контроллеры, регуляторы оборотов и программная среда, которая связывает все это в работающую систему.

Для российских разработчиков здесь есть отдельная инженерная задача: перейти от импортных микроконтроллеров и привычного программного окружения к отечественной элементной базе без потери функциональности и без полной перестройки процессов разработки.

Один из таких кейсов реализует компания "Чистое небо" совместно с АО "НИИЭТ" (входит в ГК Элемент) и разработчиками ОСРВ Embox. Команда работает над переносом открытого программного обеспечения для БпЛА на российские микроконтроллеры К1921ВГ015 с архитектурой RISC-V. Если вам интересна эта тема, добро пожаловать под кат!

Читать далее

Пишу алгоритм FFT на Си для процессора Эльбрус

Уровень сложностиСложный
Время на прочтение347 мин
Охват и читатели18K

Примерно полгода назад я познакомился с VLIW‑процессором Эльбрус-8СВ. На тот момент у меня уже был опыт написания кода на ассемблере для VLIW‑процессора TMS320C66. Поэтому я захотел сделать нечто похожее для Эльбруса, а именно, написать алгоритм FFT на ассемблере. Но из‑за нехватки документации на инструкции процессора мне пришлось начать с реализации какого‑нибудь простого алгоритма на Си, чтобы изучать его ассемблерный вывод.
По результатам этой работы была опубликована предыдущая статья на Хабре.

После завершения той статьи я решил попробовать написать алгоритм FFT на Си для Эльбруса. Работа ещё не завершена, но определённые успехи уже есть (сравнение с EML присутствует). В этой статье я хочу поделиться полученными на данный момент результатами.

Читать далее

Оптимизация производительности современных процессоров, 2-е издание. Книга с ароматом железа

Время на прочтение6 мин
Охват и читатели11K

Приветствуем, уважаемые читатели! На связи Олег Сивченко @OlegSivchenko.

Пару месяцев назад мы анонсировали выход русскоязычного издания знаменитой в узких кругах книги Дениса Бахвалова, которая в оригинале называется «Performance Analysis and Tuning on Modern CPUs» или просто «perf-book». Теперь она, наконец, в продаже и на полках магазинов. Русское издание называется «Оптимизация производительности современных процессоров. 2-е изд.». Это один из моих наиболее сложных, выстраданных, многоэтапных и при этом ценных проектов за последние четыре года. Уверен, он бы не состоялся без активного участия автора, его искренней заинтересованности и содействия в редактуре, проверке терминологии и в целом качества перевода, а также при составлении глоссария.

Читать далее

Лучший игровой процессор подешевел, но в сборке это ничего не меняет

Время на прочтение4 мин
Охват и читатели11K

Наверняка вы уже слышали, что AMD выкатила на Computex новый игровой процессор Ryzen 7 7700X3D за 329 долларов. О нем много писали, но дальше характеристик статьи уходили редко. На бумаге он интересный, но не выдающийся: восемь ядер, та самая технология 3D V-Cache. По сути, это слегка придушенная по частотам версия легендарного 7800X3D, который стоит ощутимо дороже. Но куда интереснее глянуть между строк и понять, что это означает кроме того, что это носитель лучшей игровой технологии, за которую раньше платили заметно больше. И если взглянуть с этого ракурса, то процессор становится еще более интересным. Пока все кинулись считать, насколько он выгоден, давайте разберемся в ситуации немного глубже.

Читать далее

Ближайшие события

Intel Xeon 6+: 288 E-ядер на 18A и взгляд на то, что будет дальше у Intel

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели14K

В начале июня на мероприятии Computex Intel анонсировала новую линейку процессоров Xeon® 6+ под кодовым именем Clearwater Forest. Это второе поколение серверных процессоров, построенных целиком на E-ядрах. Топовая модель Xeon® 6990E+ имеет 288 физических ядер в одном сокете и изготавливается на Intel 18A — самом передовом техпроцессе компании на сегодняшний день.

Заодно Intel приоткрыла часть деталей по следующему серверному флагману — Xeon® Diamond Rapids, выход которого запланирован на 2027 год.

С вами Сергей Ковалёв, продакт-менеджер выделенных серверов в Selectel, подробности под катом.

Читать далее

AMD продлила жизнь AM5 до 2029 года, но это не забота о нас с вами

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.9K

На Computex 2026 AMD сделала то, чего от нее давно ждали: продлила поддержку сокета AM5 до 2029 года вместо обещанного раньше 2027-го. Мол, больше лет, больше процессоров, никакой спешки с заменой материнской платы. Звучит как настоящая забота о пользователях, но если посмотреть, в каких условиях принималось решение, картина становится очень любопытной. Продлить AM5 сейчас AMD почти ничего не стоило, а использование этого как маркетингового инструмента сделало этот ход очень точным. Главное — не радоваться раньше времени. Сейчас расскажу все по порядку.

Читать далее

От «Амура» к Baikal‑U и К1921ВГ1Т: как РЕГЛАБ переводит модули R500 на отечественные микроконтроллеры

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели9.7K

Для производителя ПЛК переход на отечественный микроконтроллер начинается не с замены строки в BOM, а с пересборки части аппаратной и программной платформы. Микроконтроллер в серийном модуле — это не просто строка в спецификации: его замена требует прежде всего устойчивой программной поддержки в серии, а также адаптации схемотехники и обвязки под новый кристалл.

В случае РЕГЛАБ задача дополнительно усложняется масштабом линейки: более 100 серийных изделий, более 1500 типов компонентов и разные классы модулей в линейке REGUL. Для части задач достаточно компактного микроконтроллера уровня «Амур» К1948ВК018, который уже применен в серийных модулях. Для основных изделий рассматривается Baikal‑U, а для наиболее требовательных — К1921ВГ1Т НИИЭТ.

В этом материале разбираем, как выглядит такой переход с инженерной стороны: где RISC‑V MCU уже дошел до серии, какие ограничения остаются по памяти, периферии, корпусам и SDK, а также почему выбор микроконтроллера для промышленной автоматики нельзя свести к таблице характеристик. Если вам интересна эта тема, то добро пожаловать под кат.

Читать далее

Пока, Закон Мура: Huawei анонсировала архитектуру LogicFolding и предложила Закон Тау

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели12K

Гордон Мур в 1965-м предсказал будущее полупроводниковой индустрии на полвека вперед. Но он не предвидел, что его Закон похоронит китаянка- инженер на конференции в Шанхае. 

В мае 2026-го глава Huawei Хэ Тинбо показала миру архитектуру LogicFolding и предложила новый принцип развития чипов — Закон Тау. Что это за технология, чем возражают скептики и как Закон Тау может повлиять на лидерство компании — в статье. 

Читать

Как процессоры обмениваются данными в многопроцессорных системах

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели14K

Привет, Хабр! Меня зовут Максим, в YADRO я разрабатываю методики тестирования аппаратных средств. В этой статье я подробно опишу, как процессоры обмениваются данными в многопроцессорных системах Intel. Расскажу, как здесь выбирать процессор с учетом количества линков UPI (Ultra Path Interconnect) и почему иногда даже мощные серверные процессоры не спасают от тормозов запущенного на них софта.

В материале я буду объяснять базовые понятия, так что он вполне сгодится даже для первого знакомства с темой — аппаратных инженеров, программистов, сисадминов и всех, кому интересна компьютерная архитектура.

Читать далее

К каким социальным проблемам приводит неправильная последовательность глав в учебнике по программированию

Время на прочтение3 мин
Охват и читатели14K

Сегодня видел план вводного курса, написанный начинающей американской преподавательницей. План иллюстрирует распостраненную ошибку — неправильный порядок подачи материала:

Читать далее

Настоящий медный custom

Время на прочтение18 мин
Охват и читатели16K

Что делать, если акрил кажется слишком хрупким, шланги мутнеют, а твоя RTX 4080 воет под нагрузкой?

Правильно! Взять полтора метра 15миллиметровой водопроводной меди, газовую горелку, собрать плоскошлифовальный станок из дрели и построить бесшумный реактор вопреки всем проблемам, которые препятствуют этому....

Читать далее
1
23 ...