Comments / Profile of Nemoumbra / Habr

Во-вторых, не смог сходу найти статей про конкретно Boost.Regex от John Maddock, в которых бы демонстрировался ReDOS. Одну обзорную статью нашёл, в которой было много движков разобрано, там приводился конкретный пример, но я не смог воспроизвести атаку: ImHex отработал очень быстро.

Вот все места, где у нас используется standalone Boost.Regex

По-моему, если пользователь введёт дурной паттерн, то он имеет шанс самостоятельно закопаться, уж такова природа работы с неизвестными данными. Он с тем же успехом может не рассчитать, хватит ли у него оперативы для какой-нибудь другой тяжёлой операции, и прогореть. Если ReDOS страшнее, чем это, надо будет подумать.

В-третьих, Re2 тащит за собой Abseil (кучу либ, дополнующий стандартную либу плюсов), т.е. наступает на грабли самого Буста.

C++26 — встреча ISO в Хагенберге

Nemoumbra Feb 20 at 13:55

Да фиг бы с ними - с компайл-тайм регулярками... std::regex тупо небезопасен - мэтчинг по конечному автомату реализован рекурсивно, а не итеративно, поэтому на некоторых входах оно просто сегфолтит из-за stackoverflow, роняя всё приложение. Этот баг был замечен в gcc ещё в 2010х годах, но его не починили, как я понял, из-за ABI. Итеративный regex есть в boost, но... Процитирую автора ImHex:

Oh yeah, boost regex depends on:
assert
concept_check
config
container_hash
core
integer
mpl
predef
smart_ptr
static_assert
throw_exception
type_traits

Нет, бывает и больше зависимостей...

Впрочем, какие-то энтузиасты смогли переписать бустовый regex, чтобы он полагался только на стандартную либу, так что мы перешли на эту standalone версию. Вариант "не пихать туда непроверенный ввод" не годится, т.к. ImHex делает поиск в файле, который открывает пользователь.

C++26 — встреча ISO в Хагенберге

Nemoumbra Feb 20 at 13:40

Так, ничего не понимаю. Если релокацию планируют писать внутри мувающего оператора присваивания, то откуда компилятор должен вытащить информацию, как реализован этот мув? А ему придётся это узнать, чтобы решить - вставлять ли на выходе из скоупа деструктор локальной переменной или нет. А вдруг std::relocate вызывается только в какой-то ветке, что тогда делать компилятору?

C++26 — встреча ISO в Хагенберге

Nemoumbra Feb 20 at 00:22

И что, он вызовет мув-оператор копирования / мув-конструктор? Я именно про мув говорю.

C++26 — встреча ISO в Хагенберге

Nemoumbra Feb 19 at 17:06

Бедный assume[[expression]] (since C++23)... Контракты полностью его функционал покрывают (а он покрывает компайл-тайм фичи контрактов).

Вопрос - а у нас есть возможность в C++26 мувнуть куда-то локальный std::unique_ptr таким образом, чтобы компилятор понял, что вставлять вызов деструктора уже не надо? Ну или какой-нибудь другой класс, который либо владеет ресурсом, либо не владеет, скажем, std::any?

Как узнать email любого владельца YouTube-канала

Nemoumbra Feb 14 at 11:52

Хотелось бы что-то в духе Авито, который не раскрывает телефоны продавцов покупателям, но может их соединить через себя (именно звонок, а не чат). Т.е. раскрывать почту или нет - всё-таки дело автора канала.

PPSSPP или всё же psp? Смотрим баги в коде из прошлого

Nemoumbra Feb 2 at 13:07

Верно, можете посмотреть мой вклад: https://github.com/hrydgard/ppsspp/pulls/Nemoumbra

PPSSPP или всё же psp? Смотрим баги в коде из прошлого

Nemoumbra Feb 1 at 00:08

Предположим даже, что обёртка MIPSOpcode , которая представляет из себя Memory::Opcode всегда будет иметь значения из того же диапазона, что и uint32_t, а переменные a и b , которые удачно объявлены как int, никогда не будут отрицательными.

Сейчас вообще не понял)

Ну, Memory::Opcode олицетворяет 4 байта, в которых закодирована команда процессору (RISC, всё такое, удобно), конечно, он будет принимать значения, как и то, что у него под капотом - uint32_t. А как объявлены переменные a и b, неважно, т.к. мы срезаем битовыми масками по степени двойки в каждом случае.

Что же касается рефакторинга... Ну, у нас есть тесты. Их мы гоняем на каждый PR, чтобы сравнить, не перестали ли мы походить на реальную PSP. Да-да-да, покрытия идеального не бывает, избыточность тестирования... Это всё ясно, но лучше варианта нет. Те же статические анализаторы могут ошибаться, как мы видим.

Что касается dummyThreadHackAddr, я его просто ещё не отрефакторил. Месяц назад я вытащил код, относящийся к системе AdhocMatching, в отдельные файлы, а потом почистил hadouken codestyle. На очереди AdhocCtl как раз, просто руки не дошли.

PPSSPP или всё же psp? Смотрим баги в коде из прошлого

Nemoumbra Jan 31 at 20:06

С Int_VecDo3 разве не ошибка в анализаторе? Смотрите, GetNumVectorElements возвращает числа из множества {0, 1, 2, 3, 4}. Если n >= 1 , то проблемы с n + n - 2 нет. Значит, беда будет в случае n == 0.
Это бывает, если аргумент GetNumVectorElements, полученный в строке VectorSize sz = GetVecSize(op);, не лежит во множестве {V_Single, V_Pair, V_Triple, V_Quad} == {1, 2, 3, 4}. Хорошо, а что же такое GetVecSize?

static inline VectorSize GetVecSize(MIPSOpcode op) {
	int a = (op >> 7) & 1;
	int b = (op >> 14) & 2;
	return (VectorSize)(a + b + 1);  // Safe, there are no other possibilities
}

MIPSOpcode - просто обёртка над uint32_t. Как видим, здесь вычисляются a и b. Первое - либо 0, либо 1. Второе - либо 0, либо 2. Поэтому их сумма принадлежит множеству {0, 1, 2, 3}. Докидывая в сумму единичку, получаем {1, 2, 3, 4}, т.е. sz всегда корректно, а значит, n тоже.

Зачем Яндекс.Браузеру эти данные?

Nemoumbra Jan 31 at 11:37

Почему-то с Амиго ни разу не столкнулся, а вот агрессивную рекламу ЯБ заметил ещё много лет назад и тогда зарёкся его ставить из-за этого. Причём аж дважды чуть не установил (шло "в комплекте" с какой-то прогой).

YouTube начал показывать пользователям с блокировщиками рекламы многочасовую рекламу, которую нельзя пропустить

Nemoumbra Jan 26 at 20:39

Я как-то пропустил момент, когда пользователи стали уходить с дурилок на три буквы.

Быстрый старт в мир Python окружений с uv

Nemoumbra Jan 24 at 01:25

А я запутался, кстати! Уж было хотел написать гневный комментарий, что в виртуальном окружении не должно быть файлов проекта, а потом увидел создание .venv...

Похищаем CheatEngine на C++ с нуля. Часть 0 — Введение

Nemoumbra Jan 12 at 18:45

В целом, идея хорошая. Мне очень хотелось бы посмотреть на плюсовый CE со всеми графами указателей, сканнерами, etc.

Только вот это вот: 😜😋🙊 - надо бы за борт, извините.

Похищаем CheatEngine на C++ с нуля. Часть 0 — Введение

Nemoumbra Jan 12 at 18:41

Наверное, чтобы увеличить расширяемость/взламываемость (hacking) приложения. Вот кто сходу из присутствующих сможет набросать в форке CE новую фичу? Я на Паскале не прогал с начала 10 класса, наверное. Сейчас на 4 курсе вуза уже, мой мозг принял плюсы, Питон и ±шарпы. Оно и неприятно уже немного - спускаться в эти дебри нестандартного синтаксиса...

Представлен проект удалённого выполнения кода на уровне прошивки на синтезаторе Yamaha PSR-E433 через MIDI-сообщения

Nemoumbra Jan 8 at 18:45

Блин, рекурсивное определение... А что это за фраза такая?

Nemoumbra Jan 7 at 01:26

А что значит "тортную"?

Системные ошибки в преподавании иностранных языков

Nemoumbra Jan 4 at 19:02

Латинский тоже по кусочкам изучают. Ну, я изучал так в своей гимназии.

Сначала первое склонение, первое спряжение... Потом второе и четвёртое спряжения, второе склонение мужского рода... Третье спряжение, средний род, прилагательные первого-второго склонения... Причастие настоящего времени, имперфект, местоимения, повелительное наклонение, простенький пассивный залог. Это был пятый класс у меня. Потом уже пошли более сложные штуки (перфект, PPP, футурум, все три вида третьего склонения, четвёртое и пятое склонение, accusativus cum infinitivo, nominativus cum infinitivo, ablativus absolutus, функции падежей, конъюнктив, плюсквамперфект, сложные предложения).

Вот так к концу 8 класса всё и изучил.

1 2 3 4

6 7

Information

Specialization