Обновить

Комментарии 9

Либо генератор картинок подрос, либо автор наконец-то нашел живую модель :)

Эта причина называется отладкой

Отлаживать краши ассемблера проще, регистры и переменные соответствуют исходнику. use-after-free, фрагментация и протечки памяти встречаются гораздо реже, т.к часто используются пулы памяти. Хорошим тоном считается проверять границы региона чтения и переполнение стэка в рекурсивных функциях.
Имхо, код на ассемблере более прямолинейный и надежный.

Кроссплатформенных и без зависимостей. На чистом С и ассемблере.

Да, особенно 6502, очень кросплатформенный, самое-то в продашен xD

То ли автор криво написал (про "кроссплатформенный ассемблер"), то ли я чего-то не понимаю. o_O

Что это значит?

Спасибо, почитал. Пойду на лоукодю какой нибудь дичи

А можно попросить картинку с рабочего стола...?

У него их там аж на 4 поста набралось: один, два, три, четыре. Просто на днях как раз зачитывался его блогом.

Если выкинуть обработку разных кодировок и прочие фишки XML, то парсер (особенно SAX) там тривиальный. У меня тоже своя либа в один файл с минимумом зависимостей и весьма бодрой скоростью (правда только для 8бит кодировки). Как-то надо было быстро читать файлы по 100М+

К сожалению утерял линк на проект, посвященный обработке именно сверхбольших файлов, но 100Мб это фигня на нынешние времена.

Большой размер это 100Гб и выше одним файлом, чаще всего это выгрузки - экспорт из MS SQL или еще каких систем, реализованный в виде одного огромного XML.

Мы лично делали обработку для современного ФИАС, где 3-4Гб XML в порядке вещей.

Я делал тоже не сейчас. Лет 15 назад было. В целом у меня SAX, по этому размер значения не имеет особо. Главное было - скорость на обычной офисной машине. У меня она ограничена, по сути, скоростью чтения с диска. Избавился даже ото всех выделений памяти. Тупо байты пишутся в кольцевой буфер и размечаются за один проход. В смысле - в отдельны массив пишутся просто смещения начала каждого имени|значения, а в буфере им добавляется завершающий \0 вместо кавычки. Дальше просто работа с массивом строк.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации