Тут вы вступаете на скользкую дорожку бюджета линии и SI (Signal Integrity). На 25ГБит модуляуция идет на существннно более выской частоте -> выше требования к кабелю. Неспроста чем выше скорость - тем короче и толще DAC. И особенно печально то, что не так то просто посмотреть на физические уровни сигнала и понять, что там уже всё на грани.
На качественных коротких кабелях, которые аккуратно уложены, без маленьких радиусов, скорее всего сработает.
Вам надо определиться, вы хотите денег сейчас или профессионального роста. Если роста - ищите нормальное место работы, даже если там будет меньше денег. Но вам сецчас нужен старший товарищ, который сможет рассказать, как правильно, как неправильно, и, самое главное - почему.
А вот так! Представляете, как смешно читать комментарии про то, как "правильно надо проводить интервью" тем, кто их реально проводит и видит весь этот поток кандидатов?
Переходите в бигтех, там над вашим синьор грейдом будет возможность еще на 3 грейда вырасти, причем это будут актуальные знания, а не "эксперт в легаси". Эффект масшиаба работает, сложность систем выше, возможностей изучать новое больше.
У вас в этом цикле потерялось, что у трансиверов важнф как скорости и типы модуляции на оптической стороне, так и на медной.
Скажем, трансиверами с оптикой типа DR удобно соединять свитчи с чипами разных поколений без потери скорости лейнов и гирбоксов, т.к. они бывают и с 4x25G лейнами, и с 2x50G, и 1x100G по медной стороне.
Так же обошли стороной LPO/LRO трансиверы и их отличие от полноценных, с DSP. Ну и ничего нету про высокоскоростные варианты от нвидии, у них уже 1.6T в продаже.
Память изнашивается и деградирует, в видеокартах есть механизм-аналог Post Package Repair, но количество "запасных" ячеек конечное. Как только они заканчиваются - видечип на выброс.
Скажите, у вас есть возможность там позапускать vtune amplifier? Он умеет показывать backend-bound задачи, и, кажется, может даже более детал но показать, куда именно уперлись.
Вообще, довольно интересная история конкретно с imul - видимо, он разбивается на несколько микроинструкций, потому что, как гласит Intel® 64 and IA-32 Architectures Optimization Reference Manual Volume 2, в haswell операция умножения может работать только на первом порту (slow int)
Было бы интересно посмотреть на результаты с simd alu, там 2 блока на разных портах.
Очевидно, с кондиционером первая задача - понять, какие фичи нужны (нужен ли инверторный? мультисплит? какие ограничения на длины магистралей? обогрев?). Это фаза исследования, которую сложно разбить на этапы заранее, но можно останавливаться и фиксировать промежуточные этапы, как описано в статье.
То, что описано в верхнем комменте ветки - это когда выбор поставлен на поток. В работе такое безусловно часто встречается, все эти задачки по перекрашиванию кнопок и перекладыванию json-ов.
В 90х годах было много рекламы изучения английского по курсу Илоны Давыдовой - там еще кассеты были, которые якобы нельзя копировать, иначе эффект пропадёт. Я как прочитал про циклически-волновой способ - сразу вспомнил.
Почему вы пишете, что это первый ARM процессор от Nvidia? У них уже много лет есть опыт, в 2008 году вышел процессор Tegra, потом Jetson - для embedded применений, 3 года назад серверный Grace. Они даже чуть не купили сам ARM - сделка была заблокирована антимонопольными комитетами.
Если будете подобное еще раз проектировать - посмотрите в сторону разъёмов именно для внутри-системного использования, типа SlimSAS 8i (до gen4 можно использовать, в зависимости от спек конкретного кабеля и разъемов), либо MCIO, он же sff-ta-1016.
Прорыв всё же случился раньше, когда они выпустили 32ТБ диски, там впервые были масс-прод диски с технологией HAMR. забавно, что первой в поиске про них как раз статья из блога Селектел на хабре: https://habr.com/ru/companies/selectel/articles/868396/
Иммерсионка, погружные ДЦ - нишевые истории, там всё очень плохо с обслуживанием.
Дальше, про реакторы - больше всего энергии будут потреблять кластера обучения для всяких нейросеток, у которых есть очень неприятная особенность: они синхронно потребляют либо очень много энергии (цикл обучения), либо потребление резко падает в ноль (чекпоинты, восстановление после ошибки, перезапуск джобов и т.д.). И это крайне плохой тип нагрузки почти для любой генерации, кроме гидро, но особенно плохо для атомных реакторов. Потребление кластеров обучения при этом растёт, уже сейчас это единицы и десятки мегаватт, через 5 лет это будут сотни мегаватт и даже единицы гиваватт. Про космос уже сказали, охлаждение в вакууме - это огромная проблема, получение даже единиц мегаватт энергии - тоже. Опять же, огромные проблемы с обслуживанием. Радстойкие высокоэффективные ИИ акселераторы- тоже смешно. Сейчас рядом в картами от нвидии чихнуть опасно, из строя могут выйти, а вы радстойкие хотите.
Про видеть процесс - я почувствовал радикальное улучшение жизни, когда приладил настольную лампу, чтобы светить с нужной стороны на свариваемый участок. Всё же маска притеняет свет, даже когда "открыта", и на "закрытой" яркость высокая.
А ещё - как будто бы электрод 2.4мм примерно всегда можно использовать, но он всегда должен быть наточен хорошо.
Тут вы вступаете на скользкую дорожку бюджета линии и SI (Signal Integrity). На 25ГБит модуляуция идет на существннно более выской частоте -> выше требования к кабелю. Неспроста чем выше скорость - тем короче и толще DAC. И особенно печально то, что не так то просто посмотреть на физические уровни сигнала и понять, что там уже всё на грани.
На качественных коротких кабелях, которые аккуратно уложены, без маленьких радиусов, скорее всего сработает.
Вам надо определиться, вы хотите денег сейчас или профессионального роста. Если роста - ищите нормальное место работы, даже если там будет меньше денег. Но вам сецчас нужен старший товарищ, который сможет рассказать, как правильно, как неправильно, и, самое главное - почему.
А вот так! Представляете, как смешно читать комментарии про то, как "правильно надо проводить интервью" тем, кто их реально проводит и видит весь этот поток кандидатов?
Зато в ллм-ку промт написать могут)
Очень плохо решаются, в современных GPU это проблема напрямую касается, например, HBM памяти.
Из вариантов:
backside power delivery, чтобы можно было более жирные дорожки питания расположить с другой стороны чипа от сигнальных дорожек
подложки из сапфира/искусственного алмаза и прочих подобных материалов, которые обладают лучшей тепловой проводимостью
водяное или даже двухфазное охлаждение с микроканалами, которые сформированы прямо в подложке
Переходите в бигтех, там над вашим синьор грейдом будет возможность еще на 3 грейда вырасти, причем это будут актуальные знания, а не "эксперт в легаси". Эффект масшиаба работает, сложность систем выше, возможностей изучать новое больше.
У вас в этом цикле потерялось, что у трансиверов важнф как скорости и типы модуляции на оптической стороне, так и на медной.
Скажем, трансиверами с оптикой типа DR удобно соединять свитчи с чипами разных поколений без потери скорости лейнов и гирбоксов, т.к. они бывают и с 4x25G лейнами, и с 2x50G, и 1x100G по медной стороне.
Так же обошли стороной LPO/LRO трансиверы и их отличие от полноценных, с DSP. Ну и ничего нету про высокоскоростные варианты от нвидии, у них уже 1.6T в продаже.
Вы же про Назарова тут? Очень грустно, что у нас такие лидеры мнений.
Прям конденсатор из кремния отковырять?)
Я слышал, что HBM память в Китае умеют перепаивать, но вживую (или хотя бы на фото) ни одной починенной так карты не видел.
Возможно ли это делать на Blackwell серии, где используется CoWoS-L технология - даже не представляю.
Память изнашивается и деградирует, в видеокартах есть механизм-аналог Post Package Repair, но количество "запасных" ячеек конечное. Как только они заканчиваются - видечип на выброс.
Всё чудесатее и чудесатее!
Скажите, у вас есть возможность там позапускать vtune amplifier? Он умеет показывать backend-bound задачи, и, кажется, может даже более детал но показать, куда именно уперлись.
Вообще, довольно интересная история конкретно с imul - видимо, он разбивается на несколько микроинструкций, потому что, как гласит Intel® 64 and IA-32 Architectures
Optimization Reference Manual
Volume 2, в haswell операция умножения может работать только на первом порту (slow int)
Было бы интересно посмотреть на результаты с simd alu, там 2 блока на разных портах.
Очевидно, с кондиционером первая задача - понять, какие фичи нужны (нужен ли инверторный? мультисплит? какие ограничения на длины магистралей? обогрев?). Это фаза исследования, которую сложно разбить на этапы заранее, но можно останавливаться и фиксировать промежуточные этапы, как описано в статье.
То, что описано в верхнем комменте ветки - это когда выбор поставлен на поток. В работе такое безусловно часто встречается, все эти задачки по перекрашиванию кнопок и перекладыванию json-ов.
В 90х годах было много рекламы изучения английского по курсу Илоны Давыдовой - там еще кассеты были, которые якобы нельзя копировать, иначе эффект пропадёт. Я как прочитал про циклически-волновой способ - сразу вспомнил.
Возможно, вы хотите сказать, что не было интерливинга? Пробовали переключать опцию, которая обычно называется Memory channel interleaving?
Почему вы пишете, что это первый ARM процессор от Nvidia? У них уже много лет есть опыт, в 2008 году вышел процессор Tegra, потом Jetson - для embedded применений, 3 года назад серверный Grace. Они даже чуть не купили сам ARM - сделка была заблокирована антимонопольными комитетами.
На хабре про всё это тоже было: https://habr.com/ru/companies/serverflow/articles/838040/
Если будете подобное еще раз проектировать - посмотрите в сторону разъёмов именно для внутри-системного использования, типа SlimSAS 8i (до gen4 можно использовать, в зависимости от спек конкретного кабеля и разъемов), либо MCIO, он же sff-ta-1016.
Прорыв всё же случился раньше, когда они выпустили 32ТБ диски, там впервые были масс-прод диски с технологией HAMR. забавно, что первой в поиске про них как раз статья из блога Селектел на хабре: https://habr.com/ru/companies/selectel/articles/868396/
Скажите, а вы в дата-центре были?)
Иммерсионка, погружные ДЦ - нишевые истории, там всё очень плохо с обслуживанием.
Дальше, про реакторы - больше всего энергии будут потреблять кластера обучения для всяких нейросеток, у которых есть очень неприятная особенность: они синхронно потребляют либо очень много энергии (цикл обучения), либо потребление резко падает в ноль (чекпоинты, восстановление после ошибки, перезапуск джобов и т.д.). И это крайне плохой тип нагрузки почти для любой генерации, кроме гидро, но особенно плохо для атомных реакторов. Потребление кластеров обучения при этом растёт, уже сейчас это единицы и десятки мегаватт, через 5 лет это будут сотни мегаватт и даже единицы гиваватт. Про космос уже сказали, охлаждение в вакууме - это огромная проблема, получение даже единиц мегаватт энергии - тоже. Опять же, огромные проблемы с обслуживанием. Радстойкие высокоэффективные ИИ акселераторы- тоже смешно. Сейчас рядом в картами от нвидии чихнуть опасно, из строя могут выйти, а вы радстойкие хотите.
Про видеть процесс - я почувствовал радикальное улучшение жизни, когда приладил настольную лампу, чтобы светить с нужной стороны на свариваемый участок. Всё же маска притеняет свет, даже когда "открыта", и на "закрытой" яркость высокая.
А ещё - как будто бы электрод 2.4мм примерно всегда можно использовать, но он всегда должен быть наточен хорошо.
Для алюминия переменка нужна, чтобы оксидную плёнку разбивать. У неё температура плавления почти в 2 раза выше, чем у самого алюминия.
А вот нержа - для неё достаточно среды аргона, ну и присадку из нержавейки, а дальше хоть TIG, хоть MIG (полуавтомат с баллоном аргона) - норм будет.