Pull to refresh
-11
Моё имя — стёршийся иероглиф@beeruser

Пользователь

0,2
Rating
13
Subscribers
Send message

А вы не могли бы показать демку под 2600, которая не является "туфтой безыдейной".

Меня вот впечатлило. Стильная и крутая работа для этой платформы.

Только не plan, а plane. План это что-то другое.

В данном случае изображение лежит в 4 банках памяти для ускорения вывода данных в ЦАПы. И в режиме 13h в том числе. Просто железо само переключает банки на основе 2 младших битов адреса (chain-4).

Аптайм рухнул на 0,35%

Кто-то может не успеть забрать новую версию эмулятора терминала как только она появилась.

Наш суд - самый гуманный суд в мире(с)

Принимая во внимание злопамятность человека, на месте тех, кто не заплатил, и ещё не самоубился, я бы напрягся.

на адреса трёх американских семей, вынуждая вооружённые группы захвата врываться в чужие дома.

Учитывая, что они палят во всё, что движется (или даже в спящих людей), такие шуточки заканчиваются плохо.

https://ru.wikipedia.org/wiki/Сваттинг

2МБ? Что вы там хотите напихать?

notepad.exe в Windows11 на диске занимает 360кб (триста шестьдесят килобайт).

50 мегабайт, которые показывает винда - это рантайм вместе с замапленными библиотеками.

С веб-технологиями ваш редактор будет занимать мегабайт 300 в памяти.

Может, всё таки, рукожопы? Да не, АПИ плохой...

рукалицо

А ехать никуда не надо - ща как запустим спутники, так российский чебурнет будет доступен по всему миру!

В Роскосмосе рассказали о запуске спутников для доступа в интернет

Очевидно, что нет. Если вы смотрите в дизасм, а видите фигу, и не знаете как представляются команды и какие они бывают в принципе, то не можете нормально понимать работу целых стадий конвейера. Например fetch или bp, макрофьюжен, МОП и т.д.

Пролистать спеку чтобы читать асм - несколько вечеров.

Устройство процессора на хорошем уровне - месяцы или даже годы.

Если вы не можете читать асм, то скорее всего не понимаете и принципы работы CPU. Соответственно целый пласт задач не можете эффективно решать на С. Выбрать правильные структуры данных для минимизации кэш-миссов, разрабатывать на SIMD, писать локлесс алгоритмы. Да просто разобраться где компилятор генерит неэффективный код и как это можно улучшить.

Дык вроде перед рендерингом все абсолютные координаты конвертируются в экранные координаты float от 0 до 1

И что с того? Они перестанут быть флотами?

В NDC координаты преобразуются после всех трансформаций и перспективного деления.

В C++ для эпсилона есть std::numeric_limits<float>::epsilon()

Бестолковая вещь в данном контексте. Пу сути она возвращает минимально возможный float.

На работе с координатами ваш epsilon аналогичен нулю.

https://gcc.godbolt.org/z/c4r74afMr

Что касается мужиков – они должны пахать, сознание терять в этой ситуации, потому что нам действительно надо поднимать экономику», – заявил Онищенко.

 ...

При этом он подчеркнул, что речь идёт о необходимости серьёзной отдачи и высокой работоспособности.

Дерипаска покусал Онищенко.

Только вот интересно - детьми заниматься, бытом и т.д. данные товарищи как предлагают? Если человек сознание теряет от усталости, о какой отдаче и работоспособности идёт речь?

"представители компании сообщили, что их интересуют эксплойты для BSD. На этот раз вознаграждение может составить до 500 000 долларов за работающий эксплойт."

Нормальная экономика =)

А тут эпл под который это все в принципе не заточено

Поддержка Apple Silicon в llama.cpp как раз "в первых рядах" появилась.

UMA, кэш-когерентность GPU, наличие NPU. Это всё идеально подходит для AI, в отличие от "традиционного железа".

поводу матриц пикселей тут как раз все норм: если это RGB, то нужно обрабатывать 3 матрицы параллельно.

Бессмыслица какая-то. Изображение это двухмерный массив данных. Причём тут вообще матрицы? Современные шейдеры намного сложнее чем перемножение пары матриц - там и проходы по спискам, обходы иерархий, много целочисленной математики - тысячи инструкций на пиксель.

Параллельно обрабатываются не "3 матрицы" , а одна и та же операция на всех SIMD слотах.

Однако все же MAC операций в GPU насыпано в разы больше, чем любых других арифметико-логических.

Если мы говорим про рендер 3D графики, это не так.

Откройте в вашей ссылке блок-схему мультипроцессора Figure 7. Количество int32 блоков и fp32 блоков одинаково. Другие блоки не участвуют в рендере. DLSS пост процессинг, где работают тензорный ядра - опционален. На многих актуальных GPU их вообще нет.

Я конечно понимаю, что про GPU у вас написано "для затравки", но всё равно "кровь из глаз".

Поскольку каждое изображение представляет собой трехмерную матрицу пикселей

Двухмерную

В отличие от CPU, графические ускорители состоят из тысяч небольших по размеру ядер, в которых реализованы только сумматоры и умножители: все, что нужно для эффективной работы с матрицами.

Что-то из начала нулевых?

Современные GPU ядра выполняют все те же инструкции, что и " универсальные вычислительные ядра". В отличие от обычных RISC процессоров, они имеют аппаратные реализации тригонометрических функций, а так же имеют множество специализированного железа - текстурники, тензорные блоки, рейтрейсинг.

GPU выполняют обычный C++ код.

это же колдунство какое то

для тех, кто не знает, как представляются числа в дополнительном коде.

В любом случае оригинальный if(data[j] >= 128компилятор сворачивает в cmov и ничего делать не нужно.

https://gcc.godbolt.org/z/6TzYzohfr

30+ лет назад...

Непонятно что вы хотите доказать, но TAGE был придуман в 2006, а первые процессоры с таким предсказателем вышли в 2010+.

То что было 30 лет назад, сейчас никуда не годится.

Это вроде совсем основы IT?

Для большинства людей, что-то более низкоуровневое чем Python, это тёмный лес.

Вот выпустил бы charblanchard 1.0.0 и забил на gpl-ную версию. Думаю тогда бы вопросов не возникло.

1
23 ...

Information

Rating
3,385-th
Date of birth
Registered
Activity

Specialization

Десктоп разработчик, Разработчик игр
Ведущий
From 300,000 ₽