Pull to refresh

Comments 38

Каждому Йода мастер с форума такого поможет и бессилен продукт будет сей.

А вообще довольно интересное исследование, которое в очередной раз заставляет каждого задуматься о своей «анонимности» в сети.
да что уж тут гвооитрь, мжоно портсо бкувы прееаствялть и не паильтся
Если так будете делать только вы, то очень даже палевно.
Делаешь разные методики маскировки на всех сайтах, где желательно остаться анонимным.
А вы думали, nanotime предлагает одинаково переставлять буквы и на имиджбордах, и на сайте гос. услуг?
Прогоните нужный текст через гуглопереводчик и обратно)
Выполнить необходимый текст и обратно через gugloperevodchik

DONE
Ну и… результат этой программы можно будет использовать как улику в суде или в чем смысл вообще?
Такие методы использовали для поиска автора Bitcoin — кого-то одного нашли, который открещивался, естественно, от своей причастности. (Об этом писали на Хабре в соответствующих темах в одной статье. Ализар, скорее всего, подскажет точную ссылку.)
В оперативно-розыскных мероприятиях — почему бы и нет? Из 50 подозреваемых найти одного, нагрянуть к нему с обыском, а там обнаружить и вполне адекватные улики, признаваемые судом. Санкцию на обыск одного человека получить проще.
UFO just landed and posted this here
«Маргарита отступила и с достоинством ответила:
— Пошел ты к чертовой матери. Какая я тебе Клодина? Ты смотри, с кем разговариваешь, — и, подумав мгновение, она прибавила к своей речи длинное непечатное ругательство. Все это произвело на легкомысленного толстяка отрезвляющее действие.»

Вы про такие обороты?
напомнило спам несколько летней давности, туда в начале письма вставлялась шутка, анекдот или цитата.
Я обычено после прочтения этого позитива письмо удалял, не читая. даже спамопапку проверял
Вывод: Нужно больше читать разнообразной литературы (особенно художественной), тем самым увеличивая количество вариантов часто используемых выражений и оборотов.
На фоне серых посредственностей ваше разнообразие сразу же бросится следователям в глаза :-)
В какой-то момент окажется что с вероятностью 95% такое количество речевых оборотов не использует никто кроме вас:)
Подозреваю, что алгоритм сломается на определенной прослойке населения, общающейся на 90% сленгом и его словоформами, так как разнообразием он (сленг) не отличается.
«В результате работы программы было выявлено, что автор текста — один из пользователей ВКонтакте»
Покажусь банальным, но тогда всеми любимый Президент, будет первым фигурантом у такой программы.
Его вычеслят по количеству «сортиров» в тексте.
UFO just landed and posted this here
UFO just landed and posted this here
У него могут быть подражатели.
Если захотят, так сделают анонимность незаконной. Примеры Китай(соцсети по паспортам, там недавно закон ввели, что даже в интернет кафе перед использованием интернета надо сфотографироваться), КНДР(интернет есть только у высоких чиновников, у остальных только доступ к интрасети).
Оба примера объединяет то, что им предшествовало практически полное отсутствие интернета в соответствующих обществах. Благодаря чему эти общества удается до сих пор водить за нос и убеждать, что так и надо. В западной же стране быстро поднимут шум и деанонимизация не пройдет. Она, как и цензура, не просто незаконна, а нелегитимна — то есть, больше не воспринимается самим обществом как что-то положительное и нужное. Или скорее так: общество обладает богатым и успешным опытом противостояния попыткам ее ввести.
Автороведческий анализ — тема довольно старая (например, кто написал «Луку Мудищева»).

Эти ребята, скорее всего, просто автоматизируют процесс с помощью компьютера.
UFO just landed and posted this here
В этом случае вполне вероятно, что отклоняться не только программы, но и все остальные.
как было на самом деле
В таком случае уж слишком велика вероятность, что собьются не только программы, но и все остальные.
==>
In this case too it is likely that stray not only programs but also all the others.
UFO just landed and posted this here
Вспоминается словарь Эллочки Людоедочки, да и современная публика Вконтакте надежно защищена от таких проверок.
Тема известна давно. Ещё лет 20 назад на кафедре была то ли курсовая, то ли дипломная работа, по сравнению текстов, с применением к подвтерждению авторства Тихого Дона.
Иногда в сети используется умышленное искажение лингвистического «почерка», с ошибками, албанским и т.п.
Ну да, определят они, что текст писал Легион Анонимусов или луркофаг. И что, например? :)
О. немецкие студенты узнали про цепи Маркова?
Такие статистические анализаторы авторства, тематики или плагиата строятся и уходят в небытие пачками.
Определить авторство чистого текста — ДА, легко.
Но если автор захочет скрыть факт авторства — он обойдет любой анализатор. Хотя бы поручив переработать текст своей подружке.
Сколько существует общеупотребимых слов и основанных на них фраз для выражения связи между предметами? По-моему, сильно ограниченное количество и велика вероятность найти несколько сотен, или десятков тысяч близнецов.
За собой заметил, что даже за год сильно меняется манера писать.
Когда-то увлекался албанским, теперь равнодушен.
Меняется не только словарный запас, но и способы построения предложений, особенно когда сознательно меняешь текст («нафиг написал столько буков, это никто читать не будет, запишу лучше покороче»)

Таким образом, посты автора в каком-то старом ЖЖ будут малоприменимы для анализа сегодняшних текстов.
Ну почему все сконцентрировались вокруг хакеров? Ведь авторам текстов, новостным сайтам это вообще незаменимый инструмент!
> Эти же ребята трудятся и над другим инструментом — Anonymouth, который должен позволить «шифровать» сообщения, вводя в них нехарактерные речевые обороты

Как-то странно получается. А потом они будут улучшать свой распознователь с учетом алгоритмов применяемых в анонимайзере? После чего новая версия анонимайзера который обходит новые фичи распознователя? Итак до бесконечности? Похоже, ребята продумали бизнес-план на пару десятилетий вперед. Похоже на историю с Касперским которого одно время обвиняли что он сам пишет вирусы
Sign up to leave a comment.

Articles