Pull to refresh

О том, как мы ворпсиманием теcкт

Reading time 4 min
Views 171K
Помните, в интернете, году этак в 2003, проходила картинка, в которой сообщалось, что неважно в каком порядке идут буквы в слове, лишь бы первая и последняя были на местах, а остально мозг сам скомпонует и вычленит смысл. Вот оригинальный текст:

По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт занчнеия, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все-рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы чиатем не кдаужю бкуву по отдльенотси, а все солво цликеом.


В английском варианте это звучало так:
Arocdnicg to rsceearch at Cmabrigde Uinervtisy, it deosn’t mttaer in waht oredr the ltteers in a wrod are, the olny iprmoatnt tihng is taht the frist and lsat ltteer are in the rghit pcale. The rset can be a toatl mses and you can sitll raed it wouthit pobelrm. Tihs is buseace the huamn mnid deos not raed ervey lteter by istlef, but the wrod as a wlohe.


Попытка поэкспериментировать с разными текстами показала, что с русским языком все не так безоблачно, как с английским и алгоритм эффективного и readable-перемешивания все-таки немного другой.



Cсылаются на труды некого Matt Davis, который в свою очередь, отсылает к Rawlinson, G. E. аж 1976 года (summary).

Я не поленился и написал простенькую программу, которая обрабатывает тексты. Откуда выяснил, что не совсем так, как заявлялось, но истина где-то рядом.

Так вот, если менять середину слов совсем произвольно, то получится следующее:

На Оклисмпйиих играх ссяоислтоь жскиене коныандме срнноваовеия по сооипвртнй гмксинатие Зутолою медлаь Игр золвавеаа сранобя США соеабощт оалцьифниый сйат Оалпимиды Втооре мтесо зяални птеьртлиадисцнвеы роскосисйй кдаомны котраоя вриыгала для ннаьиоцонлай сбнроой вротое срербео среребо сонобрй Риосси пнслриеа теактлотжлеяа Свлтнаеа Цавакреуа Брвооунзю нарадгу пиучолли ринскымуе гксаминти.


В принципе, понятно, но стоит взять слова подлиннее, как текст становится плохоузнаваемым:

Влртачеси писунрак в Калокагнсидрним мосрком рынбом потру коротый в эти дни очмател 65-леите. В честь пкардниза порт пдерепнос падорок калидингнацрам и риршазел снобывдой пхород на торритерию. Все жищеюлае смогли посетить Кзерушнретн. Такая возтонжосмь вадепаыт не чатсо. Как праливо посьятдня на борт Кзреуншртена пинусрака мугот гости морнудежадных мирксох праднзиков в инанртосных потрах а желити Каланинргида.


Зато если взять за правило сохранять позиции согласных и гласных букв, свободно меняя между собой отдельно гласные и согласные, то результат получается слегка более читаемым и понятным при том же хаосе:

На Окислийпмих играх сяссоотиль жикнсее кыдоннмае совинроневая по снирповтой гимнастике Зотолую мадель Игр залаовева сборная США сообщеат олиьиацнфый сайт Олампииды Второе метсо заняли пцидвларетеьнситы рискоссйой кадомны которая ваилрыга для наьоонинлцай сронбой второе серербо себерро снорбой России псинелра тотелаеклятжа Стевлана Цавураека Бвонзорую надрагу почулили рунимскые гиснатмки.


и для второго текста

Влрчасети писанрук в Кигидонрнасклам моксром рыбном порту который в эти дни отмачел 65-литее. В четсь пкинзрада порт ппедорнес пародок кагиданнларцим и разширел сдывонбой проход на торриритею. Все жалиещюе сголми писетоть «Кзерушнретн». Такая вотмонзосжь вапедаыт не часто. Как пвиларо пяьсоднтя на борт пикарсуна мугот готси мырдожанундех мирскох пзанрдиков в инантронсых партох а желити Каниларгдина видят мачты «Кзерушнрента» токьло через огдару потра.


Теперь сделаем еще небольшое изменение — добавим максимальное расстояние между переставляемыми символами в 3 символа, чтобы согласная с начала слова не улетала в его конец. Также добавляем учет того, что более одного раза символы переносить нельзя. В итоге выходит текст, из которого уже почти все понятно:

Всртечали пасурник в Калиниргнаксдом мосрком рыбном порту котырой в эти дни отмечал 65-телие. В четсь пзардника прот преподнес подарок киналигнрадцам и рарзешил свободный пхород на тертирорию. Все желюащие сгомли посетить Крунезштерн. Такая возможнотсь выпадеат не чатсо. Как пвирало подняться на борт парусника могут гости междуронандых морских пзардников в инотсранных потрах, а жилтеи Киналигнрдаа видят мачты Кзерутшнерна тоьлко через оргаду порта.


В итоге выходит, что для русского языка не все так безоблачно, как для английского, с его короткими словами. Но если немного поменять алгоритм, общая идея все-таки работает.

Интересно, есть ли возможность внести еще шума в середину слова с сохранением читабельности и понятности?

UPDATE:
torkve пишет:
Мне кажется, правильнее попробовать сделать что-то вроде Вашего последнего алгоритма, только немножко развить идею:

1. Фиксируем первый и последний символы слова.
2. Из оставшихся берём первые три символа, произвольно перемешиваем.
3. Из полученной новой тройки фиксируем первые два.
4. Повторяем пункт 2, пока незафиксированные символы не кончатся.


Я практически так и сделал, но фиксировать в п. 3 стоит не первые два, а первые три. Иначе одна буква может пропутешествовать до конца слова. Вот что получилось:

Врстаечли парусинк в Клаининагрдском мсроком рбыном потру ктоорый в эти дни отемачл 65-лтеие. В чтсеь пазрдника порт ппредонес паодрок киалнинргацдам и рзраиешл сбовондый проход на трретоиирю. Все желающие сгомли поестить Кзрушенетрн. Ткаая взомжностоь впыааедт не чатсо. Как парвило пдонтьяся на брот пруаинска моугт гстои междунадроных мосрикх праздинков в инсотранных протах, а жтиели Калииннагрда вядит мачты Курзнештерна тльоко через ограду пртоа.


Выходит ничего так.

UPDATE2. Решил проверить, что будет, если убрать практически все гласные — не трогать начала и концы слов. Ведь в том же арабском или иврите их практически нет — обходятся согласными. Вот что выходит с произвольного текста из «Дворянского гнезда» Тургенева:

Мрья Дмтриевна в млдсти пльзвлсь рптцией млнькой блнднки; и в птьдст лт чрты ее не бли лшны приятнсти, хтя нмнго рспхли и спллсь. Она бла блее чвствтльна, нжли дбра, и до зрлх лт схрнла инстттские змшки; она изблвла сбя, лгко рздржлсь и дже плкла, кгда нршлсь ее првчки; зто она бла очнь лсква и лбзна, кгда все ее жлния исплнлсь и нкто ей не пркслвл. Дм ее прндлжл к чслу приятнейшх в грде. сстояние у ней бло всьма хршее, не стлько нслдствнное, склько блгприобртнное мжм. обе дчри жли с нею; сн всптвлся в однм из лчшх кзннх звдний в птрбрге.


Удивительно, но без гласных понятно абсолютно все. Причем текст ужался на 34 процента.
Tags:
Hubs:
+89
Comments 86
Comments Comments 86

Articles