Pull to refresh

Comments 29

Pусскoязычногo прогрaммиста будeт обмaнуть всe же нe так легkо (нaвернякa мнoгиe стaлкивались с тeм, что клaвиша русскoй «с» совпадаeт c английской «c»).
У вас ус отклеился Mimic в комментарии основательно похозяйничал.
Это вы по «k» догадались и решили проверить остальной текст? :)
Да, на «k» mimic спалился(хотя предполагаю это специально сделано в качестве подсказки, т.к. заменена только одна буква) — английская и русская визуально слегка отличаются.
Решил проверить — есть ли еще подмены? И оказалось что почти половина букв в комментарии заменена на омоглифы.
Да, специально. Правда mimic не использовал, все сделал вручную.
Почти как:
— капс отпусти
— А Я ЕГО НЕ НАЖИМАЛ! С ШИФТОМ — ТАК ЯРОСТИ БОЛЬШЕ!

ярости больше :)
Mimic умеет работать с системой контроля версий (например git)? Иначе как-то скучно получается.
Тоже подумал, что самым подлым будет, если скрипты на pull / push будут работать. Это самое скрытное и незаметное место.
Может для sublime есть плагин, который подсвечивает разным цветом кириллицу и латинские символы?
Так мне не искать, а заметить случайную опечатку.
Использовал это для предотвращения xss. В запрещённых тэгах символы менялись как раз на русские, что вызывало множество часов праведного гнева тех кто пытался эти атаки провести. Весь код вроде на месте, а не работает.
На одном из рабочих мест:
— Обнаруживал в строковых литералах безразмерные юникодные символы (т.о литерал который выглядит так-же, не равнялся исходному), из-за чего выборка из словаря по такому-же литералу не давала результата.

— Чуть более весёлым был момент, из-за которого текстовый файл (C# исходник) гит воспринимал как бинарный — в конце одной из строк оказался нулевой байт.
Нашли чем пугать программеров, антимимик пишется за день, который вернет все назад.
Как задать условие? Если (спецсимвол № 24423) немного похож на (символ N), то меняем одно на другое?
Все проще. Ищем символы, которые выходят за диапозон ASCII, затем смотрим предварительно составленный словарь перекодировки ";" => ";". Для этого также можно пройтись по тексту и найти все странные символы, после чего составить словарь. Если в коде есть русский или любой другой язык, то диапозн этих символов также исключаем, как и ASCII.
В каких-то случаях достаточно выполнить декомпозицию по NFKC Unicode.
Ещё проще — если символ выпадает за рамки стандартных языковых — забиваем на него. Если в слове буквы на разных языках и можно легко привести их в нормальный вид (русская\английская с), то делаем это. Если нельзя, то выкидываем слово из полнотекстового индекса или помечаем этот кусок и отправляем его тому от кого он пришел с требованием исправить.
Менеджеры тоже не пропадут — распечатать, отсканировать, распознать
Распознавание различает I и l? Двойной апостроф и прямые кавычки?
Да, в отдельных случаях I и l различает по словарю.
Идеально для защиты скаченных курсовых от автоплагиатдетекторов :)
Вообще нормальные системы антиплагиата умеют такое детектить.
Многолетний трюк по обходу фильтров матершины нашел практическое применение?
Если заказчик вдруг решил посмотреть код до оплаты, то такой вот замимимированный код он тоже вполне может посмотреть.
Да тогда проще уж скринами его отправлять
Когда-то во времена DOS был вирус, заменявший в русском тексте, отправленном на принтер, некоторые прилагательные на матерные.
Sign up to leave a comment.

Articles