alizar 31 мая 2011 в 13:16

64-битная ОС на ассемблере

1 мин

28K

Assembler*

+86

181

Комментарии 181

andre_colonel 31 мая 2011 в 13:29

>>программка “Hello World!” компилируется в файл 31 байт.
непонятное достижение. Если в .com файл компилировать под тот же DOS, то выйдет не больше

TL1 31 мая 2011 в 14:20

Меньше.

мув адрес строки куда-то

мов ах, что-то

инт 21ш или типа того ; печать строки

мов чего-то

инт чего-то ; выход

строка

sgzmd 31 мая 2011 в 15:02

а если инт 21ш нету? ;)

andre_colonel 31 мая 2011 в 15:26

Мы же говорим о программировании под ОС, где оно есть (DOS). (кстати, почему 21ш а не 21х?). В приведенном автором статьи исходнике тоже ведь вызывается os_print_string.

Halt 31 мая 2011 в 19:21

0xB800 — наше все %)

НЛО прилетело и опубликовало эту надпись здесь

curlydevil 31 мая 2011 в 16:11

Программирование в 1С накладывает свой отпечаток…

+20

TL1 31 мая 2011 в 16:25

Никогда в жизни даже не видел 1С.

a97 31 мая 2011 в 16:38

Теперь не отвертитесь

Если   (ВидДок="РасходнаяКредит") Тогда
	Если Конт.ПризнакНакладной=Перечисление.ПризнРасхНакл.Продажа Тогда
		Операция="Продажа";
	ИначеЕсли Конт.ПризнакНакладной=Перечисление.ПризнРасхНакл.ВозвратПоставщику Тогда
		Операция="ВозвратПоставщику";
	КонецЕсли;
ИначеЕсли  (ВидДок="ПриходнаяКредит") Тогда
	Если (Конт.ПризнакНакладной=Перечисление.ПризнПрихНакл.Закупка)
	 ИЛИ (Конт.ПризнакНакладной=Перечисление.ПризнПрихНакл.Импорт) Тогда
		Операция="Закупка";
	ИначеЕсли Конт.ПризнакНакладной=Перечисление.ПризнПрихНакл.ВозвратОтПокупателя Тогда
		Операция="ВозвратОтПокупателя";
	КонецЕсли;
КонецЕсли;

+51

egorF 31 мая 2011 в 17:00

обоже. это же ад!!! какой сон разума породил это чудовище?? ===8-o

+28

Halt 31 мая 2011 в 19:23

Я сильно подозреваю, что если бы писать можно было бы только латиницей, то мы наблюдали бы ровно то же самое, но уже в транслите… Так что пусть хоть так

egorF 31 мая 2011 в 19:31

кстати, да.

Colobock 31 мая 2011 в 19:25

Вы подумайте, как выглядят программы для англоязычного программера. Например, BASIC.

calx 31 мая 2011 в 20:34

похоже, ноги растут вот отсюда: ru.wikipedia.org/wiki/%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D1%8F%D0%B7%D1%8B%D0%BA

k0t0vsky 1 июн 2011 в 01:13

Похоже) и руки

k0t0vsky 1 июн 2011 в 01:11

Когда такое уведел впервые в 1С Конфигураторе (это у них так среда разработки называется) решил для себя, что постараюсь сделать все, чтобы не пришлось писать на таком, хотя бы даже «Привет мир». Какое-то внутреннее отторжение нахлынуло. Правда ребята 1С кодеры успокаивали тем, что можно переключаться на англ.

egorF 1 июн 2011 в 01:12

Как правильно заметили тут рядом, на английском это было бы ужаснее, потому что англ. бухгалтерские термины не совпадают, следовательно, это был бы транслит.

VolCh 1 июн 2011 в 01:24

Основная проблема даже не в этом, а в том, что если не писать свою конфигурацию с нуля, а пилить существующую, то получится дикая мешанина русского и английского.

k0t0vsky 1 июн 2011 в 01:25

Вместо того чтобы прививать новым разработчикам необходимость и желание развивать английский, решили пойти по пути быстрее поймут больше денег получим. 1С то ведь софт на рынок толкает, а дальше следующая ступенька (франчайзи) подключается. Зачем им голову морочить заморскими познаниями…

Mezomish 6 июн 2011 в 21:38

Это ещё ладно. Оцените следующее:

Только сегодня догнал тонкий юмор суровых девелов 1С.
В файлах обмена кодировка файла указана в этом файле строкой:
Кодировка=DOS
или
Кодироовка=Windows

egorF 7 июн 2011 в 04:30

аут.

d43 31 мая 2011 в 17:36

Зато под 1С индусы поди не пишут.

Halt 31 мая 2011 в 19:22

И слава богу, ибо и своих хватает…

Ilya_Smelykh 31 мая 2011 в 18:18

Этот код выглядит как код FoxPro переведенные с помощью Magic Goody…

thebestzorro 31 мая 2011 в 21:08

Впечатляет, первый раз такое вижу.

Siddthartha 31 мая 2011 в 22:02

программирование для 1С — огромный рынок. но немногие программисты соглашаются становится еще и бухгалтерами)

НЛО прилетело и опубликовало эту надпись здесь

VolCh 1 июн 2011 в 00:14

Если не поддаваться эмоциям то не так уж много разницы с, например, SgnExpInv :)

НЛО прилетело и опубликовало эту надпись здесь

VolCh 1 июн 2011 в 01:00

Я работал какое-то время с 1С и как произносить перед зеркалом «ПризнРасхНакл» было моей наименьшей проблемой :) На самом деле кусок кода выше чуть ли не образец читабельности для 1С начала 2000-х, можно сказать почти совершенный код в части именования.

GLiTch 31 мая 2011 в 22:26

Бывает и вариант бухгалтеров, становящихся программистами.

random1911 31 мая 2011 в 22:38

когда-то, в период юношеского максимализма, я мечтал о том, как русский язык станет главным в мире, и что именно он будет лежать в основе языков программирования.
Если бы мне тогда показали это, я бы гораздо раньше понял бредовость всей этой затеи.

Godless 2 июн 2011 в 14:33

Вы счастливый человек. И я вам завидую. Совсем немного, по белому, но завидую.

mawrodaki 31 мая 2011 в 20:50

отчепяток...)

TL1 31 мая 2011 в 16:25

Я всё равно инструкции не помню, в прошлый раз писал на асме под DOS около 13 лет назад. Если бы написал латиницей, впаяли бы 10 минусов за ошибки в коде :)

+20

DpyuD 31 мая 2011 в 19:01

Определился бы тогда хотя бы, как писать — мов или мув)

Levsha100 31 мая 2011 в 21:26

habrahabr.ru/blogs/crazydev/72627/

цикл_пока откроем 1 закроем 

начнемс 

ошибка:

очистить_экран откроем закроем закончим_однако 

обновить_однако откроем закроем закончим_однако 

если откроем ход равно ложь закроем 

начнемс

НЛО прилетело и опубликовало эту надпись здесь

DoctorDemon 31 мая 2011 в 17:40

mov ah, 09h
mov dx, string_addr
int 21h
ret

Halt 31 мая 2011 в 19:25

тогда уж lea dx, msg или mov dx, offset msg :)
и да, выход по 4C тоже

CleverMouse 31 мая 2011 в 20:51

Код вполне может быть на fasm или nasm, где offset нет. BareMetal, к слову, использует nasm. lea вообще имеет смысл только когда mov'ом обойтись нельзя. Выход по ret из COM-программ совершенно законен, 4C — это расширенный вариант, в нагрузку заполняющий код завершения программы.

Siddthartha 31 мая 2011 в 22:05

может он имеет в виду что байткод короче будет?

CleverMouse 1 июн 2011 в 13:04

Не, простейший helloworld не оставляет много места для фантазии, тут только различия синтаксисов в разных ассемблерах обсуждаемы.

mark_ablov 1 июн 2011 в 05:36

lea имеет смысл использовать в 2х случаях:
1. вычисления адреса для косвенной адресации через регистры — lea eax, [ebp-4].
2. ускорения вычислений, например можно быстро умножить регистр на 5 — lea eax, [eax + eax * 4].

CleverMouse 1 июн 2011 в 13:02

Да, всё правильно, в этих случаях mov'ом обойтись нельзя. Я ещё добавлю, что lea любят использовать в качестве длинных nop'ов, типа lea esi, [esi+0], что в 32-битном режиме имеет 2-, 3- и 6-байтную формы.

VolCh 31 мая 2011 в 16:51

В 64-бит режиме — думаю больше :)

KAdot 31 мая 2011 в 13:35

Еще одна 64-битная ОС, написанная на ассемблере — http://www.menuetos.net/.

+11

vitroot 31 мая 2011 в 14:08

Ну менует уж куда раньше появился — еще на первом курсе с ней игрался и на fasm'е коротюльки писал. И все на одной дискете мвесте с исходниками

icoder 31 мая 2011 в 13:42

>Цель этого проекта — избавиться от неэффективного машинного кода, который генерируют компиляторы высокоуровневых языков вроде C/C++

Спасибо, посмеялся :)

+18

int03e 31 мая 2011 в 13:48

Написать вручную на асме — и код будет более быстрый, если делать все с умом. Другое дело, что это непомерные усилия, которые в 99% случаев не стоят того. Но в принципе они правы, компиляторы не идеальны.

+10

icoder 31 мая 2011 в 14:03

Уже давно современные C++ компиляторы генерируют более эффективный код, чем это может сделать человек. Точно также, как калькуляторы давно умножают быстрее и точнее человека. Просто потому, что человек не может удержать в голове огромнейшее количество мелких деталей, которые влияют на производительность связанных с архитектурой процессора, шины данных, структурой программы, и пр. Далее, компиляторы делают очень хитрые оптимизации, которые крайне тяжело делать вручную, такие как размотки циклов.

+28

homm 31 мая 2011 в 14:13

Написать-то быстрее можно, особенно используя SSE и MMX, просто есть еще одна проблема: в процессорах полно ошибок («неточностей»), когда очень редкий набор данных и команд в каком-то процессоре работает не так, как ожидается. Учесть все их человеку невозможно, а тестировать программу на всех существующих процессорах крайне проблематично.

-7

TL1 31 мая 2011 в 14:23

Ну у этой штуки нету такой проблемы. Основной юскейс — это сделать тот же вычислительный кластер на заданном железе. Чтобы софт работал у миллионов различных пользователей на всём зоопарке железа — такого не нужно.

icoder 31 мая 2011 в 14:30

Практика показывает, что компилятор C++ лучше человека справляется с использованием MMX и SSE.

TL1 31 мая 2011 в 14:33

Когда компилятор знает, как векторизовать алгоритм, он справляется чуть-чуть лучше. Но есть один нюанс: нетривальные алгоритмы они пока не умеют векторизовывать.

icoder 31 мая 2011 в 14:37

Проще в этом случае помочь компилятору разобраться.

TL1 31 мая 2011 в 14:42

Внушить что-то компилятору не проще, особенно если их 3 штуки для сборки под разные платформы, да ещё пара из них зафиксированы SDK и никуда не прыгнешь. Вот на интринсиках написать — вариант.

НЛО прилетело и опубликовало эту надпись здесь

DustCn 1 июн 2011 в 00:28

Вы будете смеяться, но если написать подряд
a1 = b1*c1;
a2= b2*c2;
…
ax=bx*cx;

То компилятор может сам сделать из этих строчек цикл и векторизовать его.
Эта оптимизация называется loop materialization

НЛО прилетело и опубликовало эту надпись здесь

DustCn 1 июн 2011 в 16:58

>И получаем снижение производительности

Вы слишком рано плюнули…
В первом варианте достаточно было добавить прагму ivdep

НЛО прилетело и опубликовало эту надпись здесь

bruce 1 июн 2011 в 07:50

Решается ассемблерной вставкой на 5-10 строчек или intrinsics.

Писать ВСЮ программу на asm — бессмысленное упражнение. Во-первых благодаря эмпирическому правилу 90-10 (90% времени расходуется в 10% кода). Во-вторых, программист на ассемблере все равно не будет тратить свое время на тчащетельную ручную оптимизацию каждого блока кода, так что большая часть программы все равно будет написана не лучше, чем это сделает компилятор.

beeruser 31 мая 2011 в 14:50

>> Уже давно современные C++ компиляторы генерируют более эффективный код, чем это может сделать человек.

Забудьте эти глупости, которыми пичкают в университетах.
Чтобы код получался быстрым, его нужно долго и мучительно выпиливать драчёвым напильником.
В реальности компиляторы не могут сделать и 10% от того что может вменяемый программист.
Посмотрите MKL какой-нибудь и сравните с голой С-версией.
Компилятор не изменит формат данных в памяти на более оптимальный, не изменит порядок обхода данных или алгоритм в зависимости от микроархитектурных деталей или наличия SIMD.
Польза от компилятора в том, что он превращает всю программу во вменяемый код под таргет-платформу (особенно полезно если их несколько). Человек фокусируется на хот-спотах.
Можно попытаться писать быстрый код — профайлить и пытаться выжать из компилятора что-то вменяемое. Но часто на это уходит больше времени чем на асм-версию.

>> Далее, компиляторы делают очень хитрые оптимизации, которые крайне тяжело делать вручную, такие как размотки циклов.

Ну не смешите. Нет ничего сложного в размотке циклов =)
При оптимизации под in-order процессоры, мало какой компилятор может делать modulo sheduling,
а это примитивнейшая техника, которая позволяет ускорить выполнение циклов в разы. Например, на ЗЫ3 есть специальный ассемблер, который помогает делать modulo sheduling и переупорядочивает инструкции для эффективной загрузки пайплайна — снимая бОльшую часть груза с плеч программиста.

+10

gribozavr 31 мая 2011 в 15:05

> Посмотрите MKL какой-нибудь и сравните с голой С-версией.
Вы сравнивали? Я вот на своих задачах сравнил. Пока что моя C-версия выигрывает. Без SIMD.

DustCn 31 мая 2011 в 22:16

Код в студию.
Кстати МКЛь не пишут на ассемблере.

-1

gribozavr 31 мая 2011 в 22:34

pastebin.com/NpffQwdy

Это аналог mkl_dcsrsymv. На матрице n=500K, nnz=7.5M, CPU i5-750 мой вариант 56 мс, MKL 63 мс. Причём тут ещё префетч не оптимально выставлен (чтобы было оптимально, нужно развернуть цикл на 8 шагов — 1 префетч на 8 итераций, так как длина строки кеша 64 байта). Но я этого делать не стал, так как вопрос был в том, насколько можно обогнать MKL тупым кодом.

DustCn 31 мая 2011 в 23:04

Разговор интересный, возьму пока на анализ.
С этой функцией не сталкивался, возможно что она вообще не оптимизирована руками — т.е. собрали интеловским компилятором и все. А компилятор на х86 префетчи не вставляет (если очень не попросить).
Но тривиальный код с интринсиками — вы перегнули палку =)

Если у вас это хотспот — можно засабмитить баг и получить пофикшенный мкль.

НЛО прилетело и опубликовало эту надпись здесь

kashey 31 мая 2011 в 15:15

сидим, отмечаем на бамашке использованные регистры, на стене пишем в столбик оффсеты на глобальные переменные.
Эх, прям молодость вспомнил

Colobock 31 мая 2011 в 19:10

Увы, я не программист, но на Speccy набирал простенькие BASIC-программки, набирая их на слух — щелчок клавиши был слышен, а видео на тот момент подключить было банально некуда.

a97 1 июн 2011 в 11:12

На Speccy, если меня не подводит память, была куча префиксных клавиш — так что ошибиться при вводе вслепую это как два байта переслать.
С другой стороны до сих пор с ностальгией вспоминаю логичность DEC-овского машкода. При некотором навыке можно было набить небольшой кусок сразу в нем.

Colobock 1 июн 2011 в 11:41

Да, значение клавиши зависело от состояния курсора. После ввода оператора, курсор переключался автоматически в режим ввода операнд.

esil 31 мая 2011 в 17:22

этот ваш шедулинг по зависимым данным — это почти тривиальная и хорошо изученная вещь, которая была реализована во многих компиляторах. В современных компиляторах ей почти не уделяется внимание, потому что на x64 шедулинг нужен только для помощи распределителю регистров, а эти самые

> in-order процессоры

фактически мертвы.

beeruser 31 мая 2011 в 20:49

>>это почти тривиальная и хорошо изученная вещь, которая была реализована во многих компиляторах
А потом, что? Вдруг пропала?
FYI Ни один консольный компилятор не умеет такого (VC/GCC/etc)

>> фактически мертвы.
Слухи о смерти сильно преувеличены.
Консоли, 95% мобильных устройств, сервера на Sparc, Power6.
На самом деле in-order на порядки больше чем OoO процессоров.
В каждом современном PC есть несколько ARM ядер.

А остальные оптимизации остались практически на уровне 90х.

-1

DustCn 31 мая 2011 в 22:19

Шедулинг для х86 неактуален — поэтому и не делают.
Это не Итаниум.

>А остальные оптимизации остались практически на уровне 90х.
Зуб дадите?

kmeaw 31 мая 2011 в 22:32

> В каждом современном PC есть несколько ARM ядер.
Не расскажите ли, где они там? Или может быть подскажите несколько ключевых слов…

beeruser 3 июн 2011 в 22:02

HDD, WIFI, скоро будет в видяхах

-1

esil 1 июн 2011 в 00:45

> А потом, что? Вдруг пропала?
шедулинг живёт почти в каждом более-менее старом бэкенде, но обычно никак не тестируется и не дорабатывается, и не факт, что вообще работает, ибо для x86/x64 не актуален, а под другие мало кто тестирует.

> FYI Ни один консольный компилятор не умеет такого (VC/GCC/etc)
Вам именно modulo scheduling? «gcc -fmodulo-sched». Разработан, кстати, похоже IBMом в двухтысячных, опять же, потому что никому нафиг не сдался.

> сервера на Sparc
мертво

> Power6
почти мертво

> Консоли, 95% мобильных устройств
На самом деле единственный, кто тут может представлять интерес, это ARM. IBM с ppc в последние годы пытается вырваться за счёт консолей, но это мало что значит. Раньше playstation была на MIPS, но это не помешало MIPS умереть, вместе с SGI и SiCortex.

Всякие mips и ppc уходят в прошлое, суперкомпьютеры строятся на интелах и вообще видеокартах, с точки зрения высокопроизводительных вычислений мало что представляет интерес, кроме x64.

Vilko 1 июн 2011 в 16:38

ы…
MIPS — 90% роутеров малого и среднего звена. Хотите сказать, там производительность непринципиальна?

ppc, sparc… ну, наверно я в пьяном бреду ставил и ставлю десятки промышленных решений (в частности, Documentum) именно на данные архитектуры. И доля интеловых процов в подобных решениях существенно ниже, чем sparc и ppc.

-1

DustCn 1 июн 2011 в 16:59

Точно, а еще в холодильники АРМ ставят.
Только вы к чему это?

-1

Vilko 1 июн 2011 в 17:09

к заявлению, что перечисленные архитектуры мертвы и оптимизация там бессмысленна

DustCn 3 июн 2011 в 03:20

Оптимизация холодильников?
Эк вы махнули…

esil 2 июн 2011 в 16:17

> MIPS — 90% роутеров малого и среднего звена. Хотите сказать, там производительность непринципиальна?

Непринципиальна. Много вы роутеров знаете на mips64? Попробуйте найти компилятор или собрать кросс-компилятор gcc для mips64el. Будете «приятно» удивлены.

> ppc, sparc… ну, наверно я в пьяном бреду ставил и ставлю…
это всё пережитки прошлого, оставшиеся по инерции у корпоративных монстров

beeruser 3 июн 2011 в 23:10

>> шедулинг живёт почти в каждом более-менее старом бэкенде
Я говорил конкретно о способе оптимизации циклов

>> ибо для x86/x64 не актуален, а под другие мало кто тестирует.
Вы наверное разработчик gcc или icc?
instruction scheduling актуален всегда. Под x86-OoO процессоры есть много нюансов расположения команд. В т.ч. переупорядочивания обращений памяти несмотря на наличие в интеловских процах спекулятивного load-а.
Вобщем тут огромный простор для микрооптимизаций.
Опять же вы забываете про Atom.

>>Вам именно modulo scheduling? «gcc -fmodulo-sched»
Если бы он ещё и работал, было бы совсем хорошо.
В важных местах я делаю MS руками. Тупому оптимизатору GCC
веры нет (что подкрепляется дизассемблером и профайлером).
Хотя в простых местах можно поэкспериментировать.
Давненько я её не включал =)

>>потому что никому нафиг не сдался.
Ну да, увеличение производительности в разы никому не нужно.
Кроме бедолаг типа меня.

Логика из серии «мне не надо — значит и другим не надо» провальна изначально.
Рынок х86 в количественном соотношении относительно небольшой.
Одних только ARM-ов в год выпускается в 20 раз больше.

>> сервера на Sparc
>мертво
>> Power6
>почти мертво
Ловко вы ярлыки навешиваете

IBM то чай с пауеров и SystemZ наваривает некисло

>> не помешало MIPS умереть
Опять же рано хороните. В китае свои MIPS процы разрабатываются под господдежкой

>>это всё пережитки прошлого, оставшиеся по инерции у корпоративных монстров
Ага. Всякие там RAS features и прочее — пустой звук.
Наш выбор — атлоны с местного овощного рынка!
Слышь? Пакупай! Кароший працессар. Будит работать как пэрсик. Мамой клянусь

-1

esil 5 июн 2011 в 11:55

> instruction scheduling актуален всегда. Под x86-OoO процессоры есть много нюансов расположения команд. В т.ч. переупорядочивания обращений памяти несмотря на наличие в интеловских процах спекулятивного load-а.

Шедулинг с точки зрения зависимости по данным никого не интересует в условиях:
1) нехватки регистров
2) двухадресных инструкций
3) наличия сложных режимов адресации
4) наличия инструкций, использующих фиксированные регистры (сдвиги, cmpxchg, mul, etc)

Любые перестановки инструкций будут делаться исходя из соображений минимизации количества используемых регистров. И в случае x86 это зависит не только от области жизни переменных, потому что в зависимости от порядка инструкций могут появляться возможности для:
1) использования более «удобного» режима адресации
2) уменьшения количества пересылок (или даже числа используемых регистров, а значит и возможных чтений/записей в память), которые требуются из-за двухадресности инструкций
3) уменьшения количества пересылок и дополнительных регистров (и чтений/записей в память) из-за инструкций, которым необходим один и тот же фиксированный регистр.

Кому вообще нужна мифическая возможность поэкспериментировать с влиянием переупорядочивания обращений к памяти на OoO процессор, если это переупорядочивание может легко привести к добавлению дополнительных операций с памятью? Можно конечно делать переупорядочивание уже после того, как код сгенерирован, только вряд ли там что-либо получится сильно попереставлять.

> Если бы он ещё и работал, было бы совсем хорошо.
Так он не нужен похоже никому, потому никто об этом и не заботится.

> Логика из серии «мне не надо — значит и другим не надо» провальна изначально.
А я такой логикой не пользуюсь. Я просто смотрю на существующие компиляторы и вижу, что бэкенды и оптимизации для архитектур, отличных от x86, плохо поддерживаются, мало разрабатываются, и генерируют поганый код. Тут может быть два варианта: вселенский заговор, или это не интересует почти никого.

> IBM то чай с пауеров и SystemZ наваривает некисло
SGI на своих MIPSах и SGI OS тоже наваривали…

beeruser 6 июн 2011 в 15:44

>> Кому вообще нужна мифическая возможность поэкспериментировать с влиянием >> переупорядочивания обращений к памяти на OoO процессор
Тем кто заинтерисован в производительности.

en.wikipedia.org/wiki/Memory_disambiguation
Тот же AMD k8-k10 не умеет такого, что его сильно тормозит

>Так он не нужен похоже никому, потому никто об этом и не заботится.

Не говорите за всех. Мне нужен и ещё куче инженеров, работающих с высокопроизводительным кодом.

>> Я просто смотрю на существующие компиляторы и вижу, что бэкенды и оптимизации для архитектур, отличных от x86,

Мир компиляторов не ограничивается GCC, VC.

esil 6 июн 2011 в 18:00

> Тем кто заинтерисован в производительности.
Тем, кто заинтересован в производительности, нужна в первую очередь минимизация количества операций с памятью. Очень удобно наверное выдернуть из трёх абзацев одну фразу и обсуждать её.

> Мир компиляторов не ограничивается GCC, VC.
Ну так покажите нам крутые компиляторы, которые рожают высокопроизводительный код для ARM, MIPS, PPC

НЛО прилетело и опубликовало эту надпись здесь

CleverMouse 31 мая 2011 в 16:02

Тем не менее, библиотека GMP — которую сами по себе используют компиляторы и на которой основана MPFR, которую в свою очередь использует куча калькуляторов www.mpfr.org/#mpfr-sw — для функций нижнего уровня использует ассемблерные версии. Возрастающая сложность поддержки кода для многих архитектур вполне оправдывается возрастающей скоростью.

Среднестатистический код человека-ассемблерщика действительно скорее всего проиграет по скорости коду, который генерирует хороший компилятор с максимальной оптимизацией. Но делать отсюда вывод, что человек в принципе не может, вылизывая небольшой участок, соревноваться с компилятором, несколько странно — как минимум потому, что человек может написать любой код, в том числе идентичный сгенерированному компилятором, а компилятор может сгенерировать не любой код.

НЛО прилетело и опубликовало эту надпись здесь

wolf13h 31 мая 2011 в 14:29

Сразу вспоминаю случай когда Линус на С написал более быструю имплементацию хеш алгоритма чем чуваки которые ее писали на асм.

+23

Albom 1 июн 2011 в 12:23

Согласен. Я считаю, что хороший программист на ассемблере напишет код лучше, чем сгенерирует хороший компилятор ЯВУ. Но в то же время скорее всего плохой программист на ассемблере напишет код хуже, чем сгенерирует плохой компилятор ЯВУ.

avrfun 31 мая 2011 в 13:50

Идея очень здравая, зря Вы так,
единственное, чему нужно уделить большое внимание — тестированию и тщательной отладке.
Писать на асме очень не легко, но и цена велика, если можно добиться в разы большей скорости

icoder 31 мая 2011 в 13:54

У Вас, видимо, есть успешный опыт, как вы однажды написали на ассемблере и в разы обогнали ICC? Ну или хотя бы MS C++?

Поделитесь!
А то я уже многих таких смелых видел :)

avrfun 31 мая 2011 в 14:09

Я писал код для AVR контроллеров как на асме, так и на gcc.
Разница ощутима не только в размере, но и в производительности.
Поэтому поддерживаю данную разработку, тем более

Разработчики из канадской компании Return Infinity специализируются на низкоуровневом программировании и экспериментальных разработках

что они специализировано занимаются асмом в экспериментальных разработках в том числе.
Молодцы, что сказать :)!

icoder 31 мая 2011 в 14:11

AVR контроллер и прочая экзотика — это не интересно. Backend для gcc для него видимо слабый.

-11

avrfun 31 мая 2011 в 14:23

Ничего себе экзотика :)
Одно из самых популярных семейств 8-ми битных контроллеров.

+12

icoder 31 мая 2011 в 14:41

Все относительно. Ну хорошо, могу согласиться, что для AVR ассемблер бывает эффективнее

esil 31 мая 2011 в 17:25

Ну вот писали бы ОС для AVR на ассемблере — было бы нормально, а под x64 с компиляторами меряться — гиблое дело.

TL1 31 мая 2011 в 14:39

C SSE успешно обгонял MSC и GCC почти в 4 раза, потому что компиляторы не смогли векторизовать алгоритм. Правда, я использовал интринсики, а не асм — куда читабельнее и портируемо.
Другой пример, который видел в жизни, asm уделал MSC на ARM — за счёт использования инструкций, которые он почему-то не использует.
А насчёт ускорения просто за счёт ассемблерности — не встречалось.

Zealint 31 мая 2011 в 20:29

Например, алгоритм перемножения матриц, скомпилированный исключительно icc работает более чем в 5 раз хуже аналогичного с ассемблерными вставками в нужных местах. Вот пример в одном из моих конкурсов. Там в конце поста таблица результатов. Чисто на icc работает 55 секунд, с ассемблером 11. С некоторыми оптимизациями ещё быстрее. Компиляторы умеют оптимизировать то, что буквально написано, но они не всегда понимают, что это и как сделать код быстрее, вникая в контекст задачи, учитывая тонкости алгоритма.

С другой стороны, весь код писать на ассемблере не всегда хорошо. Долго и трудно.

Так что у каждого подхода свои плюсы. Не надо начинать очередной холивар на пустом месте.

esil 1 июн 2011 в 01:31

Посмотреть бы ещё код без ассемблерных вставок, а то я например попытался восстановить цикл в Sub, и gcc-4.5 сгенерил такой же код, как в ассемблерной вставке.

Zealint 1 июн 2011 в 07:23

Если бы код был одинаковым, время работы тоже было бы одинаковым. Но это не так.

esil 1 июн 2011 в 13:20

Спасибо, кэп. Я и говорю, что нужен код без вставок, и список опций, с которыми всё это собиралось, а то может там с -O1 собирали, кто его знает.

Zealint 1 июн 2011 в 14:21

Код Вам уже никто сейчас не найдет. Можете написать свой если хотите проверить. Опции я применял все, что были, ни одна не давала ничего хорошего.

Если в чём-то сомневаетесь, напишите свою программу без ассемблерных вставок (любым способом) и компилируйте любыми ключами. Потом расскажите что получилось. Кое-кто в конкурсе использовал intrinsics, но это уже почти то же, что ассемблер, однако даже от этого пришлось отказаться, так как intrinsics оказался не оптимальным.

DustCn 1 июн 2011 в 02:31

Целочисленное перемножение? Ну вы и нашли тест…

-2

Zealint 1 июн 2011 в 07:27

Во-первых, было предложено привести пример успешного опыта. Во-вторых, чем Вам целые числа не угодили? Они что, не используются? В-третьих, с вещественными числами будет почти то же самое, только разрыв будет меньше. Перемножение в MKL работает на матрице порядка 5000 около 28 секунд (там ассемблер), а ручная версия будет около 100 секунд (раза в два дольше целочисленной). Можете сами проверить, если не верите.

DustCn 1 июн 2011 в 17:01

Почитал я ваш тест. Мне больше всего понравилась ваша идея номер один — транспонировать матрицу входящих данных. Отличное решение — но при чем тут компилятор? Думаете он может позволить себе такие фокусы?

-2

Zealint 1 июн 2011 в 20:13

Нет не может, но эта оптимизация не имеет отношения к обсуждаемой теме. Речь идёт о том, что компилятор самое быстрое что смог выдавить — только 55 секунд, а ассемблерные вставки, учитывающие особенность задачи (о которой компилятор не знает) обгоняют даже intrinsics.

Еще раз говорю: я просто привёл пример. Попросили привести пример, когда ручной ассемблер в разы обгоняет компилятор. Я привёл, и все.

DustCn 3 июн 2011 в 03:26

Вы давайте ставьте одинаковые условия.
Ваши изыски не относятся к компилятором.
Иначе резултьтатом теста будет простой printf() — вы ведь уже знаете правильный ответ?

Компилятор вынужден работать с общими данными — выровненность, возможные ограничения на входные данные — он оперирует ими используя возможности исходящие из стандартов. И ассемблер тут вообщем то непричем — то же можно и на С написать, а прагмами и ключами сделать такой код, который вам нужен — отключая разнообразные ограничения и проверки одну за другой.

А предварительное транспонирование матрицы — это вообще алгоритмическая оптимизация. Это как бы вы победили компилятор собирая на С пузырьковую сортировку, а на асме написать квиксорт.

Zealint 3 июн 2011 в 06:55

А предварительное транспонирование матрицы — это вообще алгоритмическая оптимизация. Это как бы вы победили компилятор собирая на С пузырьковую сортировку, а на асме написать квиксорт.

Вы не правы. Компилятору на вход подавалась максимально оптимизированная программа, в том числе с транспонированной матрицей. Я ещё раз говорю: хватит писать всякие домыслы, особенно по поводу printf, — это вы чушь полную написали. Если у вас какие-то сомнения, напишите свою программу, расскажите потом сколько секунд работала.

Zealint 3 июн 2011 в 08:02

По поводу printf поясню на всякий случай (не все читают содержание темы): программа тестируется на нескольких десятках тестов, заранее неизвестных участникам. Даже точное количество тестов заранее неизвестно.

Если вы имеете ещё какие-то несостоятельные возражения, то прежде чем их выкладывать, напишите программу любым способом с ЛЮБЫМИ алгоритмическими оптимизациями и скормите её компилятору, если она будет работать меньше 7 секунд на матрице порядка 5000, я приму ваши возражения. А так нечего тут больше обсуждать.

DjOnline 1 июн 2011 в 12:23

Предлагаю отписать в Intel и добавить в MKL самую быструю реализацию за 7 секунд, раз текущая сейчас работает 28 секунд.

Zealint 1 июн 2011 в 14:16

Ни в коем случае! в MKL же универсальный решатель, который для вещественных чисел как раз работает очень даже хорошо. В нашем конкурсе были целые числа, причём ограниченные числом 600 по модулю (чтобы не переполнялось при умножении). Это совершенно разные задачи.

DjOnline 1 июн 2011 в 14:19

Сколько именно эта задача с целыми числами считалась бы на MKL? 28 секунд?

Zealint 1 июн 2011 в 14:23

В MKL нет функции перемножения для длинных чисел. По крайней мере, я её не нашел. Нужно переводить в вещественные, перемножать и переводить обратно, да это было бы 28 секунд на одном ядре 3 ГГц процессора Core 2 Duo. Думаю, если бы им было надо, они бы такую функцию для маленьких целых чисел сами написали. Но раз не написали, значит это мало кому надо.

DjOnline 1 июн 2011 в 15:19

Интересно превратить эти секунды в Гигафлопсы, а потом сравнить с реализацией на GPU, например:
www.gpgpu.ru/articles/sgemm-7.html
forum.beyond3d.com/showthread.php?t=54842

НЛО прилетело и опубликовало эту надпись здесь

Zealint 8 авг 2011 в 07:15

Думаю, что нужно не сомневаться, а проверить и сказать точно.

goodbear 1 июн 2011 в 13:14

Как то однажны, в студенчестве, поспорил что мой ассемблерный код обгонит c/c++, писали быструю сортировку. В соревновании использовались TASM и MS VC 6. Выйграл без проблем. Сейчас не проверял, но тогда VC компилировал весьма средненько с точки зрения оптимальности.

bormotov 31 мая 2011 в 14:06

+1 как-то давно, я почти целые выходные изучал чего генерирует gcc -O3 из всякого сишного кода. На мой вкус, бороться именно с компилятором смысла нет.

Есть смысл бороться за простоту архитектуры системы и алгоритмы реализации.

Си давно уже стал portable assmebler.

Vladson 31 мая 2011 в 14:21

В узких задачах да, идея супер. В больших проектах увы выигрыш скорости перебивается временем (читай стоимостью) разработки

k06a 5 июн 2011 в 00:43

Кажется, проще было написать свой компилятор с «крутыми» оптимизациями. С переупорядочиванием инструкций, размоткой циклов, SSE и т.д.

Bacardi 31 мая 2011 в 13:49

Стоит ли ожидать полноценной ОС, написанной так?

KAdot 31 мая 2011 в 13:53

В MenuetOS, ссылку на которую дал выше, уже есть браузер, портирована libc, и есть еще много чего, хотя это всё скорее just for fun, нежели попытка написать полноценную ОС.

vitroot 31 мая 2011 в 14:16

пару лет назад где-то читал про организации, которые держат на платном менуэте сервера.

hx0 31 мая 2011 в 17:35

Есть также и KolibriOS, основанная на старой версии MenuetOS, и она та вроде ещё дальше продвинулась.

naum 31 мая 2011 в 13:54

Зачем?

-1

Bacardi 31 мая 2011 в 14:02

В статье делается акцент, что такая ОС будет компактнее и быстрее. Если это так, то это перспективно, если не для обычного пользователя, то для военных или производителей железа.

Или я чего не понимаю?

onk 31 мая 2011 в 14:07

железо как-раз с каждым годом дешевле и мощнее
да и с энергопотреблением тоже получше становится

-3

megabrain 31 мая 2011 в 14:13

Только это не дает права так лениться при создании кода, как это многие сейчас делают. Скорость разработки, конечно, характеристика важная, но то, что многие программы, которые выполняют почти ту же функциональность, что и их аналоги десяти и даже двадцатилетней давности, ведут себя даже на топовых машинах странно, если не сказать безобразно… это раздражает. Потому как понимаешь, что люди больше не ученые, люди даже не специалисты. Они просто хорошо научились складывать из кубиков картины, похожие внешне на шедевры, но это иллюзия. Программирования как такового не осталось.

Есть еще жизнь на встраиваемых системах. Того же Эдама Данкелса следует вспомнить с его Contiki.

Ведь можно и на Си и на многих других языках писать эффективный код, оптимизировать. Но погоня за сверхприбылями, клиентами, все это имеет место быть.

+15

onk 31 мая 2011 в 14:18

в том-то и проблема, что эффективность кода на уровне алгоритмов частенько намного больше ухудшает производительность и размер программы, чем не очень качественный оптимизатор компилятора

naum 31 мая 2011 в 14:08

У этой ОС исключительно embedded перспективы, имхо. Никакие затраты на разработку assembler'ом десктопной ОС никогда себя не оправдают. Ближайшее будущее за Singularity OS и аналогами.

Igor1024 31 мая 2011 в 14:21

Да, тяжело это, на асме. Но на поприще встраиваемых им самое место.

Mansiper 31 мая 2011 в 16:40

Почти родная Колибри.

Volfram 31 мая 2011 в 13:50

Return Infinity to devlopment time!

Volfram 31 мая 2011 в 13:50

*development

santeri 31 мая 2011 в 13:51

640 килобайт хватит всем

-27

naum 31 мая 2011 в 14:09

Утомили, хватит уже.

+17

onk 31 мая 2011 в 14:00

нужно поставлять с машиной времени
иначе в реальные сроки написать что-либо сколько-нибудь значительное просто не реально

TL1 31 мая 2011 в 14:31

Почему же? На C/С++ написать всю обвязку, а вычислительный блок на асме. Ну и ядро ОС на асме. Для многих задач это даже не удвоит время на разработку.

onk 31 мая 2011 в 14:55

зато может увеличить затраты на сопровождение — нужны разные специалисты для разных модулей

в некоторых случаях такое решение вполне может быть востребовано, но imho в довольно специфических

megabrain 31 мая 2011 в 14:39

Вообще странно, так много людей из года в год пишут, что на ассемблере писать долго, что это сложно. Хотя на деле язык ассемблера настолько прост, и настолько прозрачен,… мало того, в том же fasm есть очень хороший макроязык (if, else, ...), есть структуры и «отображение» структур в заданные участки памяти (ключевое слово virtual). Естественно, писать на языке ассемблера всю логику — не слишком большое удовольствие. Но и создавать нечто лишь на нем не такое мучение, как может показаться на первый взгляд.

Если говорить о ядре, то в данном случае, это просто набор статически собранных процедур по работе с памятью, формированию пула потоков, вводу-выводу, синхронизации. Ну поддержка FAT и простой сетевой карточки в ту же кучу. Даже если и на ассемблере — объем работы не такой большой, особенно если на современном его диалекте.

onk 31 мая 2011 в 14:47

1. см habrahabr.ru/blogs/asm/120298/?reply_to=3943209#comment_3943137
2. макросы это замечательно. вот только их нужно либо написать, что тоже требует времени, либо взять чужие (качество неизвестно)

ЗЫ в отдельных случая оптимизация кода, в том числе с использованием ассемблера необходима/возможна. но таких случаев, в моей практике, было всего несколько. При этом оптимизацией приходилось заниматься скорей из-за бедности — организация не могла на тот момент использовать более мощное железо

megabrain 31 мая 2011 в 14:01

Ребята молодцы, наиболее привлекательная часть проекта, которая родилась у них не так давно, если верить публичным источникам, — BareMetal Node. Да, пусть простой Ethernet внизу лежит (никаких TCP/IP, чисто канальный уровень), да задачи пока сугубо тестовые, но ведь это шаг к облаку! И оно работает.

Что касается самого ядра и того чуда, что их сподвигло к его написанию (я о MikeOS): очень милые системы, особенно для того чтобы показать, как это просто, написать ОС. Организация внутри очень няшная. Другое дело, что от таковой организации многое страдает.

На текущий момент BareMetal идет по пути "Nick Stacky", что неплохо конечно, но они не будут расти в сторону ОС общего назначения, почти уверен в этом. Лишь углубят тот успех, что есть. Вычислительные задачи (по потоку на ядро), коммуникация по сети, параллельные вычисления. Вот, собственно, и все. А больше и не надо. Зачем бороться с гигантами, стабильно засевшими в десктопах и серверах? Можно делать что-то свое, но делать это хорошо.

Архитектура простая и смелая (дальше своих узких целей не уползут, но в их рамках будут чувствовать себя хорошо). Только родной Long Mode, монозадачность, многопоточность, монолитность, ассемблер. Ну что же, удачи!

smind 31 мая 2011 в 14:07

>Если изначально писать на ассемблере, то код получается более производительным и компактным.
автор забыл добавить … и непереносимым а так да… круто… :)

Andrewus 31 мая 2011 в 14:07

Вот когда добавят TCP/IP, да появится веб-сервер, можно будет с большим интересом это дело потестировать.
Revolution is coming…

-2

megabrain 31 мая 2011 в 14:27

Вот как запустится на ней хоть какой-то HTTP-сервер, так сразу найдутся люди — форкнут проект и подадут заявку на гос. финансирование, как приоритетной отечественной разработки в рамках формирования национальной программной платформы.

Andrewus 31 мая 2011 в 14:38

Странно тогда, что Nginx уже не подан под 10 разными именами на госфинансирование…

megabrain 31 мая 2011 в 14:41

Ну, упустили-упустили… Что теперь поделать, деньги ушли на другие «отечественные» разработки, наверное.

mcdb 31 мая 2011 в 14:09

Пойду сайты перепишу на ASM.

-4

pnick 31 мая 2011 в 14:13

Не надо сравнивать несравнимое.

vanxant 31 мая 2011 в 14:12

Какой-то детский наброс, если честно.
Со времен первых пентиумов скорость выполнения команд процессором зависит от других выполняемых в этот момент команд. Удержать в голове все эти зависимости нереально, не говоря уже о том, что для разных процессоров они разные. А вот компилятору это под силу. Поэтому генераторы машинного кода в 99% случаев уделывают человека без шансов. Да, есть редкие ситуации, когда человек может применить «грязный трюк», не заложенный в компилятор. Но на таких трюках большую программу не напишешь.
Что же касается оптимизации вообще, то сначала нужно оптимизировать архитектуру, а затем алгоритмы.

+15

levap 31 мая 2011 в 14:13

Полный бред. Даже для мелких контроллеров, где каждый байт на счету, на асме пишутся только самые критические части, иначе получится жестко привязанное к платформе, не поддающееся нормальному сопровождению чудовище.

AxisPod 31 мая 2011 в 14:20

Ну и пусть на асме, а стоит ли овчинка выделки, да и видимо разработчики не в курсе как умеют оптимизировать современные компиляторы.

В современном мире чаще выгоднее чуть побольше заплатить за железо, чем тратить в разы больше времени на разработку и поддержку.

gcc 31 мая 2011 в 16:47

Я думаю, они всё же изучали вопрос и должны быть в курсе.

Когда на RIT++ Дмитрия Завалишина после презентации его PhantomOS спросили «а зачем, собственно?», он ответил, что для написания «велосипеда» одна причина. Его внуки когда-нибудь спросят деда, какие у него были мечты в жизни, которые он осуществил, и чтобы не мямлить в ответ «ну вот у меня была идея написать такую классную ОС, которая бы..., но я как-то не стал, побоялся», он сел писать свою ОС, чтобы потом, даже если проект провалится, ответить внукам, что он честно пытался.

Кто знает, чем руководствуются разработчики сабжа.

AxisPod 31 мая 2011 в 17:37

С этим согласен, у меня есть мечта написать компилятор, пусть не лучший, но свой, пишу :-)

alman 2 июн 2011 в 15:13

Где можно посмотреть на этот компилятор? Каков формат создаваемых объектных файлов?

AxisPod 2 июн 2011 в 17:46

Да пока и негде смотреть, изучаю мат.часть, потихоньку начал писать лексический анализатор, мечта написать все это без привлечения каких-либо сторонних разнаботок, так что быстро не закончу, лишь бы терпения хватило.

alman 2 июн 2011 в 17:58

Удачи! В наше время не так много людей, мечтающих написать свой компилятор.

DustCn 3 июн 2011 в 03:29

Не нужно писать компилятор с нуля — это непрофессиональный подход.
Существуют инструменты для генерации тех же анализаторов — этого вполне достаточно чтобы сделать ЯВУ.
Кодогенератор правда придется покодировать…
Для общего понимания принципов работы — вполне достаточно… А так вас засосет рутина.

esil 5 июн 2011 в 11:59

> Кодогенератор правда придется покодировать…
Уже нет. Берёте LLVM и базовый компилятор готов. После этого уже можно заниматься «крутыми оптимизациями».

rwz 31 мая 2011 в 14:22

Никому не нужена сверхскоростная ось, которая умеет загружаться и все. Никому ну нужен Hello World, даже если он весит 31 байт.

Сегодня намного важнее модульность, расширяемость и гибкость. В реальном мире, где решаются реальные задачи, никто не станет писать на асме, кроме разве что совсем специфичных случаях. Вычислительная мощность в большинстве случаев дешевле труда программиста.

TL1 31 мая 2011 в 14:28

А кому нужно это всё для построения, например, числогрызки (возможно, кластерной), которая всю жизнь будет решать одну задачу, или, например компа, который работает контроллером какого-то девайса?

gnomeby 31 мая 2011 в 14:32

Врядли ему для перечисленных целей понадобится именно 64-ая операционная система на ассемблере.

TL1 31 мая 2011 в 14:34

Ну если не понадобится, то просто замечательно! Как же быть тому, кому понадобится? :)

gnomeby 31 мая 2011 в 14:46

В современном мире μClinux поместится на любое кастрированное железо.

64-ая операционная система на ассемблере нужна только если каждый будет носить электронные часы из китая, куда он не поместится, но будет возможность при этом использовать вычислительную мощность часов (хе-хе, даже самому смешно).

В общем я не вижу реального оборудования, где использование сабжа более оправдано, чем μClinux.

megabrain 31 мая 2011 в 14:54

Дело в том, что сабж запускается только на современных процессорах с архитектурой x86. Никакими часами тут и не пахнет. А за счет реализации на языке ассемблера, увидеть ее на чем-то еще пока невозможно (не переносим код).

TL1 имеет ввиду случаи, когда те же персоналки используются для управления, скажем, станком каким, при этом они тихо себе работают, исполняя только им известное колдовство, принимая изредка команды через Ethernet или COM-порт. И вот стоит этот компьютер такой одинокий, совсем даже без терминала, но делает свою работу, потому что если не будет делать, то подведет своих хозяев, ой как подведет.

Причем, порой, найти на предприятии персоналку для таких целей проще, чем разработать решение на базе микроконтроллера или специальной платформы. Да и дешевле.

А 64Bit и Long Mode… просто ребята поняли, что это уже стандартный режим. И давно пора на него переходить, полностью, а не совмещая с Legacy Mode, как это сейчас везде работает. И они правы. Ни реальный, ни режим защищенный (тот самый режим совместимости) уже в прошлом. Первый вообще не нужен, в принципе, только в целях совместимости держат, а второй больно монструозный.

megabrain 31 мая 2011 в 14:59

>> Ни реальный, ни режим защищенный (тот самый режим совместимости) уже в прошлом.

Следует читать так:
Ни реальный, ни режим защищенный (тот самый режим совместимости) не нужны, уже в прошлом.

gnomeby 31 мая 2011 в 15:38

Ой. Не заметил, что это для x86. Ну тогда это вообще нафиг не нужно. Ибо стабильней оно работать не будет. А писать 20-30 утилит для обслуживания програмного кода, которые уже давно реализованы для linux не нужно.

uSasha 31 мая 2011 в 23:27

боюсь что портировать этот код на другой проц будет дороже покупки дешевой отладки и библиотеки + рабочего времени программиста

Honeyman 1 июн 2011 в 01:28

числогрызки (возможно, кластерной), которая всю жизнь будет решать одну задачу,

А эта кластерная числогрызка будет работать на каком чипсете? Сколько у одного узла ядер и сколько процессоров? Через какую сетевую карту она будет соединяться с кластером? И по какому протоколу, да? А всякие GPU она для ускорения расчётов не будет использовать? Откуда, с какого устройства она будет принимать входные данные, и куда будет выводить результаты?..

ofigenn 31 мая 2011 в 21:27

Черт побери, Билл Гейтс был прав на счёт 640Кб.

-4

impass 1 июн 2011 в 00:32

очередные бесполезные игрушки красноглазиков :)
лучше бы Linux пилили

-4

Halt 1 июн 2011 в 06:59

Очередной бесполезный коммент. Лучше бы делом занялись

Methos 24 июл 2011 в 10:36

6 лет назад написал программу для win32 полностью на ассемблере e-ivanov.ru/exactmouse/
Работала намного быстрее существующих аналогов на высокоуровневых языках, да и весила в 10 раз меньше.

Сейчас, с 2 Ггц процессорами и 4 Гб памяти, это незаметно, поэтому и неважно. Железо дешевле.

daylight_warrior 30 сен 2011 в 15:08

Вы правы, но это если учитывать только одну маленькую программу, а Вы представьте, если каждую такую программу оптимизируют, и в том числе операционную систему — разница будет серьезная.

Methos 30 сен 2011 в 15:19

С этим я тоже согласен, раньше вообще был очень серьёзным сторонником ассемблера и не признавал ЯВУ (языки высшего уровня).

Но сейчас удобнее разрабатывать программы на ЯВУ, например, на том же js. Компиляторы стали быстрые, в том числе и интерпретаторы.

А ассемблер и машинные коды — удел драйверов и других узких мест. Писать интерфейс работы с кнопкой, который будет работать раз в час по клику пользователя на машинных кодах — маразм и лишняя потеря времени.

daylight_warrior 30 сен 2011 в 15:33

Вы правы! Однако я, например, не уверен что та же работа с кнопкой максимально оптимизирована. Я считаю, что из уже имеющихся инструментов, библиотек, фреймворков нужно выжать максимум. Это очень долгий процесс, но если все делать постепенно, то результаты будут колоссальны. А новая операционная система как фундамент таким изменениям — это очень большой плюс!

Methos 30 сен 2011 в 15:51

К сожалению, пока вы будете копаться в машинных кодах и экономить биты, прогресс уйдёт так далеко, что вам эти биты покажутся смешными.

Даже уже сейчас память компьютера стоит 1 тыр за 4 Гбайта.

А ведь когда то Билли сказал, что 640 кбайт хватит всем.

Вам никто не запрещает писать маленькие программы, но рынок есть рынок. Рынок драйверов и маленьких программ для каких-нибудь микроконтроллеров в холодильнике и т.п. — отличное приложение таланта высококвалифицированных специалистов, коих я считаю всех тех, кто понимает и разбирается в ассемблере.

Хотя сейчас компиляторы С++ так развиты, что позволяют писать эффективные программы не хуже чем на ассемблере (как в скорости работы программы, так и в скорости разработки и дальнейшей поддержки).

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время