Pull to refresh

Comments 63

UFO just landed and posted this here

Это потребует собирать приложения под две архитектуры. То есть гонять в два раза больше тестов или писать приложения сразу под архитектуру.

И зоопарк железа придётся тестировать.

И возможно придётся заключать два договора на поддержку железа.

UFO just landed and posted this here

А тут и RISC-V дойдет до высокой производительности. Давно пора отвязываться от конкретной архитектуры.

Не выйдет. Слишком много платформо зависимых оптимизаций везде. Это чистые деньги.

Даже под АРМ пока далеко не все готово. Еще годы до того пока он в серверах массовым станет. О RISC-V даже говорить еще рано.

арм вообще в серверной нише почти не зайдетсован, он только в последние несколько лет чуть затронул высокопроизводительную область, архитектура изначально для другого делалась. в отличие от рисков, эти то как раз с нужными расширениями могут потеснить "универсалов" х86. Под мак с его миграциями по архитектурам смогли оптимизировать всякие адобы, так здесь в чем проблема? Тем более сейчас большие тяжелые приложения для серверов часто пишутся на безопасных жавах и шарпах, там implement depended встроить намного тяжелее того же С++, переезд не сильно сложнее очередного релиза. Часть конечно останется, как и разные "динозавры" на коболе пашут на старых IBM-ах. Да никто и не говорит "давайте разом все разом переведем на риски". Конечно так разом не будет, будет там по началу всякие веб-сервера со скриптовыми языками, которым вообще все равно на чем работать, там немножко другие критерии как, чего и с какой скоростью запускать.

Ну и мне думается, у вас немножко искаженное представленние что есть платформозависимая оптимизация. Большинство оптимизаций как таковых на языках высокого уровня зависит больше от алгоритма и языка, а не от способов адрессации данных ассемблерными командами. Большинство платформозависимых оптимизаций сейчас выполняет компилятор добавлением нескольких флагов - как именно распределить регистры, как положить данные чтобы лучше в кэш попало, как их перетасовать для ООО выполнения. Еще и в статике просчитает, что кое-какие части всегда возвращают 42 и выполнять эти куски кода вообще не надо. Не так то просто обогнать хороший оптимизирующий компилятор на голом асме. Современные языки вообще специально очень сильно затрудняют создание ассемблерных вставок или самомодифицирующегося кода. Потому что цена у таких оптимизаций не только время очень редких высококвалифицированных программистов, цена у таких оптимизаций - безопасность. Остальное - это просто платформозависимые части кода: всякие служебные команды настройки режимов работы железа, работа с железными регистрами, с определенными служебными адресами памяти и прочее, которое в общем-то поставляются вместе с железом и по возможности отделяется от пользователя библиотечным обертками. Для безопасности. Никому не нужен процессор, под который нет хорошего компилятора, распростроненных библиотек и операционной системы. Это все входит в экосистему архитектуры, для рисков тоже в процессе активного совершенствования и оптимизации.

В мире уйма кода которому 20+ лет. И он в продакшене крутится. В нем есть всякое. Его даже современным компилятором пересобрать может быть проблемой, не говоря уже о другой платформе.

Про готовность джавы к арму лучше всего говорят патчнотсы свеженького патча к 17lts https://www.oracle.com/java/technologies/javase/17-0-6-relnotes.html#R17_0_6 Куча пунктов про arm в компиляторе. И раз их добавили к старому lts релизу они заметно влияют. Рано это в прод еще.

А так да работа идет. Производительность в попугаях на ватт и на доллар у АРМ уже отличная выходит. Осталось эти попугаи превратить во что-то реальное.

Как только у RISC-V попугаи не хуже будут и над ним работа пойдет. Может даже немного раньше. Пока точно рано. Там даже проц сырой, все остальное так просто никакое.

ну вот как начали использовать джаву на арме - тут же начали обнаруживать недочеты и выпускать фиксы к ним.

А через пару лет уже должно быть норм.

Вы считаете, что при проектировании капитальной переделки ЦОДа надо ориентироваться на то, что гоняется уже 20+ лет? Да, сегодня делать цоды на рисках просто напросто не из чего - высокопроизводительная микроархитектура в разработке. А вот на армах есть из чего и что хорошо подходит под актуальные задачи в разработке сегодня.

А RISC-V не просто "новая ISA". Там есть множество больших и маленьких причин, которые обеспечивают очень большое сообщетсво по разработке его экосистемы, и его сделают вполне себе конкурентом х86, вопрос только когда и насколько широко.

Конечно. Этот код и следующие 20 лет работать будет скорее всего.

Цоды делаются не под архитектуру, а под питание и охлаждение. Если будет спрос на больше мощности на стойку ее и обеспечат. Не будет - не сделают. А что там стоять будет вообще не важно.

Когда это важный вопрос. Если через 10+ лет (что похоже на правду), то еще годы никто и шевелиться не будет.

А как же тогда вездесущие платформо зависимые оптимизации, если все равно что ставить в стойки цода?

ЦОДу все равно. Для него это не платформа. Это печка потребляющая вот столько электричества, требующая вот такого охлаждения и занимающая столько-то места.

Тем кто свой софт запускает уже все равно что там с электричеством. Для них это сервер стоящий вот столько денег сразу и столько в месяц.

Сколько-то лет назад все серьёзные приложения работали на RISC и SPARC, а х86 оставались крохи. Ничего, индустрия как-то справлялась с портированием и оптимизациями.

Простите, вопрос не по теме новости, но по вашим услугам.

Почему у вас на странице с ценами VPS/VDS объём накопителя называется ROM? Я уж подумал что кроме read-only-memory есть другая расшифровка, но ничего не нагуглил.

UFO just landed and posted this here

ROM - Read Only Memory (память только для чтения), ПЗУ - постоянное запоминающее устройство.

Если накопитель ещё как-то можно назвать ПЗУ - не общепринято, но логика есть, то называть его ROM явно неправильно.

Диски CD-ROM вот щас на вас посмотрели с недоумением своим единственным глазком.
ROM и ПЗУ — это вообще-то полные синонимы, второе, это не более чем перевод первого на русский язык.

Это вы контекст не поняли. Там накопители HDD/SSD называют ROM.

Какая-то хрень. Стойка потребляет больше, а тепла при этом выделяет меньше. Куда, по-мнению автора, девается потребленная энергия ?

+ 1

Абсолютно согласен, коллега. С точки зрения физики процессор — это просто нагревательный элемент, ничего более.

Ну, если на стойке поставили 400 Вт кипятильники вместо 200 Вт, то общая температура стойки может упасть только если охлаждение стойки сильно улучшилось, либо теплоизоляция между процессором и стойкой стала сильно эффективнее. Но второй вариант вроде как нельзя назвать прогрессом, а первый — реально непонятно, в чём проблема.

Короче, опять chatGPT писала статью?

Автор все правильно написал, мог бы конечно больше конкретики.

При уменьшении температуры, увеличивается количество теплоносителя (воздуха), необходимого для отвода того же количества тепла, старые ЦОД рассчитаны на другие объемы и скорости, толщина воздуховодов, теплообменники (если они есть) и т.п. они просто не справятся.

Если что, когда теплоноситель воздух — его температура заметно ближе к температуре процессора, чем если теплоносителем будет жидкость (точнее у жидкости больше запас тепловой емкости).

А почему это проблема? Мне почему-то кажется, что если температура процессора довольно низкая, то все в пределах нормы и можно ничего не делать. А когда эффективность системы охлаждения от этого падает, то он нагреется до привычной температуры и ситуация не поменяется. Кажется, что баланс будет в итоге достигнут, если система охлаждения вообще способна отводить X ватт тепла при Y температуре внутри. Но причем тогда факт, что процессоры стали холоднее?

Если взять рабочую температуру старого процессора 80, а нового 52 и температуру в холодной секции 10 грудусов (все цифры примерные), то раньше перепад темпуратуры был 70 грудусов, а станет 42. Тоже количство воздуха прозодящее через менее горячий процессор, унесёт от него меньше тепла. Так как воздух надо охладить, то больше воздуха - больше расход энергии на охлаждение.

Я так понимаю, что процессоры не меньше груются, а более эфективно расходуют энергию. Но поскольку их стало больше на единицу площади, не факт, что камень выделяет меньше тепла.

Осталось понять откуда такие низкие рабочие температуры новых процессоров взялись.

В Интеле умные люди работают, они в курсе как их процы охлаждают и какие температуры удобны пользователям.

Больше плотность транзисторов, которые меньше не стали. Проблема вылезла уже давно, примерно лет 10-15 назад в десктопе, особенно лихо на современных процессорах, где спокойно разница температур между крышкой и горячим местом кристалла может быть 20-40 градусов. До серверов это дошло позже во нескольким причинам: во-первых, ниже рабочие частоты и напряжения и отобранные кристаллы, во-вторых большая площадь этих кристаллов при не таком большом TDP (который, к слову с мощностью ничего общего не имеет и как раз-таки и является характеристикой требуемого охлаждения), и отсутствия до недавнего времени механизмов «подкидывания дров в топку» в виде турбо-частот, которые теперь могут выжрать почти весь лимит процессора по мощности одним ядром (и греться тоже им одним).

Собственно, для понимания сути проблемы надо вдумчиво читать, что такое TDP и как он во времена 2011/1155 появился. В конечном итоге увеличение мощности одновременно с уменьшением дельты температур между воздухом и температурой крышки процессора приводит к тому, что надо применять вдвое-втрое более эффективность систем охлаждения сервера, либо снизить буквально на 10 градусов температуру среды.

Я не понял. Вы два раза перескочили между определениями.

TDP это понятная штука. Сколько тепла надо уметь отводить от процессора. Как это делается это другой вопрос. Как оно внутри процессора распределяется это третий вопрос.

Максимальная рабочая температура процессора считается в целом. Нет там разницы по кристаллу. Он маленький. Температура крышки это опять отдельный показатель. Кажется что сильно ухудшить температуру кристалла при неизменной температуре крышки физически не выйдет. Если я где-то не прав дайте ссылку почитать.

Изменять требования внешних условий для процессора на десятки градусов это безумно дорого. Особенно дорого оно становится от мысли что клиенты могут выбрать другие процессоры, которые не требуют таких жестких внешних условий и могут работать в типичных. И это может вызвать разнообразные проблемы, вроде очень жестких требований к осушению воздуха. Конденсат это дело такое. Инженеры Интела точно в курсе всего этого. Я на всех современных процах вижу типичные требования: около 80-90 градусов начало тротлинга. Если вы видите другое опять покажите ссылку.

В статье насилие переводчика над собирателем журналов произошло. В процессоре есть несколько точек, где (иногда) измеряют температуру. В частности, есть Tjunction (где-то в ядре), а есть Tcase на IHS (теплораспрелелитель процессора, крышка). Вот последняя при переводе из оригинального case стала, видимо, сначала корпусом, а потом шасси, потому что корпус у гражданских, а шасси - у сервер-бояр. Если Вы зайдёте на Intel ARK и посмотрите там Tcase у Sapphire Rapids, она там будет, в зависимости от модели, то 65 градусов, то 85. Но у самого процессора редко когда есть датчик Tcase, зато почти всегда есть датчик Tjunction, и троттлиться он будет по тому, что у него есть, а не по спеке.

А почему это проблема? Мне почему-то кажется, что если температура процессора довольно низкая, то все в пределах нормы и можно ничего не делать

Там немного другое — потребление процессора возросло, и соответственно, тепла он тоже больше выделяет. Просто более эффективный теплоотвод рассеивает теперь это тепло более равномерно по большому радиатору, а не локально. Но забирать этого самого тепла в пересчёте на ватты приходится больше. И более низкая температура большого радиатора только усугубляет проблему, т.к. охлаждение тем эффективнее работает, чем выше разница температур теплоносителя и радиатора, и соответственно, хуже, если разница невелика.

Ну так радиатор, если он неэффективно охлаждается, просто нагреется и всё. Кмк, там проблема в термоинтерфейсах кристалл — радиатор, либо кристалл требует более низкой температуры, нежели раньше.

При уменьшении температуры, увеличивается количество теплоносителя (воздуха), необходимого для отвода того же количества тепла,

Это понятно. Но почему температура уменьшается, если мощность кипятильников увеличилась?

Предположу, что виноват прогресс радиаторов (тепловые трубки, большая площадь). Ну он тоже не от любви к искусству произошёл, значит пришлось снижать температуру кристаллов. Вообще, полупроводники в принципе не любят перегрев, горячий кремний становится проводником. Возможно, с современными нормами и плотностями они тепло прям совсем не любят.

Не, большие радиаторы просто разогреются до нужной температуры и всё. После этого теплообмен станет даже лучше, чем на маленьких. Процессор — это же натурально кипятильник: 400 Вт не шутки, а значит и кило алюминия/меди разогреет очень быстро.

Не выделяет меньше, а макс. температура ниже. В статье это объясняют "общая температура шасси, за счет современных технологий и материалов, снизилась с 80-84 градусов до 52-58 градусов"© Объяснение несколько натянутое, но в принципе логика тут есть.

я тоже не понял в чем там проблема.

у меня только гипотеза - что это рабочая температура была до 84 градусов а стала до 58.

Если раньше можно было дуть понемногу, чтобы оно охладилось на 1 градус (с 84 до 83) - и норм. То теперь стало так, что теперь чтобы охладить на тот же 1 градус (с 58 до 57) - приходится дуть сильнее.

А если попробовать не дуть (т.е. подождать пока воздух нагреется до 80), то как только процессор вышел за 58 градусов - его вырубит внутренняя логика и ничего хорошего ...

О! Это идея — что понизили рабочую температуру. То есть, машинки стали менее прихотливые, то есть хуже в этом аспекте.

Они стали не менее, в в квадрате более прихотливыми.
Раньше они, условно, выделяли 200Вт и требовали держать температуру теплообменника не выше 80 градусов, а сейчас выделяют 400Вт, и требуют держать температуру теплообменника не более 57. То есть, они дважды усилили требования к системе охлаждения, ибо каждое из условий (и рассеять не 200, а 400, и удержать температуру не 80, а 57) требует усиления системы охлаждения

В оригинале это звучит как "One of the bigger challenges being substantially lower case temperatures compared to prior generations. These have fallen from 80C to 82C just a few years ago to as low as 55C for a growing number of models. ", поэтому на самом деле все же непонятно откуда это ограничение на 55 градусов. Современный проц не может разогреть корпус (case) до (старых) 80 градусов при двойном (относительно старого) tdp ? Так радовались бы, его походу и охлаждать не надо, если раньше до 80 нагревался и это было нормой.

То есть откуда вообще взялась драма с необходимостью охлаждать 57 градусный корпус?

То есть откуда вообще взялась драма с необходимостью охлаждать 57 градусный корпус?

ну, если не охлаждать - то корпус станет 58-градусным, а потом и 59 градусным,

и моя гипотеза такая - что если раньше процессоры включали внутреннюю логику "ой что-то мне плохо, снижаем частоту\выключаемся" на 80 градусах, то теперь они стали более нежными и начинают это делать на 55 градусах ( "to as low as 55C for a growing number of models " ).

UPD: вторая гипотеза - лоббирование новых ЦОД, которые "лучше старых"

ну, если не охлаждать - то корпус станет 58-градусным, а потом и 59 градусным,

Дождаться 80 и тогда охлаждать.

моя гипотеза такая - что если раньше процессоры включали внутреннюю логику "ой что-то мне плохо, снижаем частоту\выключаемся" на 80 градусах, то теперь они стали более нежными и начинают это делать на 55 градусах

dts max - 96 градусов, t case даже у 60 ядерного интела 79 градусов (у 32 ядерных 85).

Дождаться 80 и тогда охлаждать.

Рискну предположить, что при 80 градусах на радиаторе, глубоко внутри на кристалле уже будет температура, несовместимая с кремниевой жизнью.

Дождаться 80 и тогда охлаждать.

Возможно, это событие не наступит никогда)
Где-то на 65 устройство сократит частоту вдвое, где-то на 70ти еще вдвое, потом еще, а там, гляди, и темппература уже не растет)

Ой. Да, более прихотливыми, опечатался.

Йа есть иногда забывать русская йазыка.

UFO just landed and posted this here
UFO just landed and posted this here

До работы в айти, я работал в цеху в котором из-за особенности здания, его переодически подтапливало. Комп от сырости глючил.

Я решили это установкой внутри корпуса 100 ватной лампы накаливания. Комп глючить перестал.

Кто-нибудь может техническим языком объяснить в чем проблема отвода тепла от менее нагретого сервера? Это про то, что скорость отвода тепла больше если больше разница температур?

Возможно, желательные температуры для постоянной работы чипов упали с 80-84 до 50-60. Автор не так понял и перефразировал по-своему. Иначе, очень трудно понять, где тут может быть проблема и как она может возникнуть в принципе.

О том, есть ли такая желательная температура, я не слышал, если что.

Я так понял, что раньше на шасси было условно одно место с температурой 80 градусов и отвод тепла от него через воздух с температурой 20 градусов был эффективен. Сейчас весь модуль греется равномерно до 50 и охлаждать его воздухом с температурой в 20 градусов гораздо сложнее. Хотя опять же не совсем понятно, почему бы всему модулю не разрешить нагреться до желанных 80....

Это из школьной задачки →
Когда чай остынет сильнее: если сначала растворить в нем кусок сахара, а потом подождать 5 минут или наоборот → сначала подождать 5 минут и потом растворить сахар?

Растворение потребляет одинаковое количество тепла вне зависимости от температуры. Конвекция уносит в единицу времени тем больше тепла, чем выше температура.

Т.е. чем ниже температура, тем дольше будет остывать чай на 1°.
Соответственно, чтобы сдуть 1° при 80° нужно меньше воздуха, чем при 50°.

Почему-то все забывают про температуру окружающей среды. По сути шасси с температурой 90 градусов, даже при температуре окружающей среды в 50 градусов будет самостоятельно охлаждаться, только воздух гоняй. А если температура шасси и окружающей среды близки (50/30), то потребуется уже компрессорная система с фрионом и т.п. Разница принципиальная.

Когда надо забирать несколько киловатт тепла от каждой стойки, а стоек тех легион — температура окружающей среды никак не поможет.

Статья сумбурная. Но понять всетаки можно о чем речь. Видимо имеется ввиду что раньше(сейчас) источник нагрева был локализован на процессоре, тепло с которого снималось на радиатор и далее потоком воздуха выдувалось в горячий коридор. Т.е.локализованый источник нагрева технически проще остужать.

Теперь же (в будущем) конструкция шасси проектируется так что само шасси становится радиатором и тепло равномерно распределяется по всему объему (площади) шасси. Теперь надо остужать все шасси, обеспечивая равномерный съем тепла со всего объема (площади) шасси. Скорее всего это достигается в основном за счет использования алюминиевой подложки у плат.

В таком варианте более эффективным становится охлаждение в жидкости (имерсионная ванна) за счет равномерного съема тепла со всей площади поверхностей шасси. Либо водоблоки. И то и другое это уже совсем другой ЦОД. Да и эти технологии предъявляют некоторые особенности либо к элементам и материалам плат (в случае с имерсией) либо к конструкции плат и шасси (в случае водоблоков).

В любом случае, уровень статьи крайне низок и остается только гадать какой смысл был заложен в этом наборе фраз.

UFO just landed and posted this here

Подвести больше питания к стойке и отвести больше тепла реально. Придется устроить большой ремонт, но это не беда. Он будет делаться под новое железо, а не просто так.

Остальное откровенная чушь. В том числе про подорожание. Дорожать может и будет, но по другим причинам. Инфляция, например.

+1. Статью стоило назвать не "... станут причиной технической непригодности многих ЦОДов", а "... заставят модернизировать силовые кабели и системы охлаждения". Постепенно, пару стоек выводится на ремонт и модернизируются, потом следующие. Нормальный процесс.

как может увеличиться общее потребление стойки и при этом снизиться выделение тепла?

было 200 процессоров в стойке по 100 ватт с тепературой каждый по 80, стало 400 процессоров по 150 ватт каждый с температурой по 50, и если теспература выше 50ти, то начинает тротлить.
Это я так вижу попытку обьяснить написаное. В реальности я в спеках процессоров вижу температуру до тротлинга 80 градусов, поэтому тоже не понимаю о какой проблеме с охлаждением говорят, указывая что температуры стали меньше

Автор статьи плохо понимает теплофизику.
"С точки зрения термодинамики общее рассеянное тепло шасси в 55-60 градусов отводить сложнее, чем если бы процессоры выдавали по 80-84 градуса, как ранее."
Закон Ньютона-Рихмана гласит:
q=k*(Tc-Tохл).
q - плотность теплового потока, k - коэффициент теплоотдачи зависящий от скорости охлаждающего воздуха, Tс - температура охлаждаемой стенки, Tохл - температура воздуха.
Автор видимо думает, что большая температура процессора означает больший тепловой поток который снимается с процессора и ... уносится куда-нибудь в подпространство (типа ай, как хорошо!).
На самом деле - это тот тепловой поток который создает процессор и который НУЖНО снять. Как? Увеличивая скорость потока (мощность вентиляторов), использую водяные системы охлаждения, и т.п...
Всё остальное правильно. Новые процессоры хотят больше электричества (которое рассеят в виде тепла), в стойке больше процессоров, и т.п... Т.е. тупо охлаждение ЦОДов не справляется.
Прошу прощения у тех хабравчан у кого был курс теплообмена и кому это очевидно.

Как раз в этом он прав. Tc-Tохл это как раз оно. Понизить (от того что сейчас есть) температуру подводимого к процессору воздуха очень сложно. Значит надо растить объем прокачиваемого воздуха, что дорого.

А вот уводить тепло в подпространство, в народе называемое чиллерами, несложно. Поставить больше чиллеров чтобы рассеивать больше тепла в подпространство тоже несложно и недорого.

Если имеется ввиду, что держать процессор при 50 градусах сложнее чем при 80 (надо больший объем прокачивать), то это в общем-то очевидно и незачем статью городить.

Может автор перепутал вычислительную (MIPS) и тепловую мощность (Вт)?

Не совсем понял про понижение температуры. Если недостаточно отводить тепло от процессора, то процессор отлично нагреется до 80 градусов и даже выше.

Вопрос лишь в тротлинге. Но насколько я знаю, у современных процессоров порог тротлинга совсем не 55 градусов, а те же 80.

Sign up to leave a comment.